C++并发:线程管控
1 线程基本管控
每个C++程序都含有至少一个线程,即运行main()的线程,它由C++运行时系统启动。随后程序可以发起更多线程,它们以别的函数作为入口。这些新线程连同起始线程并发运行。当main()返回时,程序就会退出;同样,当入口函数返回时,对应的线程随之终结。如果借std::thread对象管控线程,即可选择等他结束。
1.1 发起线程
线程通过构造std::thread对象而启动,该对象指明线程要运行的任务。
void do_some_work();
std::thread myThread(do_some_work);
任何可调用类型都适用于std::thread。所以,作为代替,可以设计一个带有函数调用操作符的类(应当是下面的operator)
class background_task
{
public:
void operator() () const
{
do_something();
do_something_else();
}
};
background_task f;
std::thread my_thread(f);
f被复制到属于新线程的存储空间中,在那里被调用,由新线程执行。
1.1.1 与函数声明进行区分
如果传入std::thread的是临时变量,不是具名变量,那么调用构造函数的语法有可能与函数声明相同。这种情况,编译器会将其解释成函数声明。
声明为函数:函数名为my_thread,只接收一个参数,返回std::thread对象
std::thread my_thread(background_task());
可以通过多用一对圆括号或使用新式的统一初始化语法
std::thread my_thread((background_task()));
std::thread my_thread{background_task()};
还可以使用lambda表达式
std::thread my_thread([]{
do_something();
do_something_else();
});
1.2 汇合与分离
在启动线程后,需要明确是要等待他结束(也就是汇合)还是任由他独立运行(也就是分离)。如果等到std::thread销毁的时候还没有决定好,那么std::thread的析构函数将调用std::terminate()终止整个程序。
如果选择了分离,且分离时新线程还未运行结束,那将继续运行,甚至在std::thread对象销毁很久之后依然运行,它只有最终从线程函数返回时才会结束运行。
假设程序不等待线程结束,那么在线程运行结束前,我们要保证它所访问的外部数据始终正确,有效。由于使用多线程,所以我们可能会经常面临对象生存期的问题。比如下面的案例:
struct func
{
int& i;
func(int& i_):i(i_){}
void operator() ()
{
for (unsigned j=0; j<1000000; ++j)
{
do_something(i); 隐患:可能访问悬空引用
}
}
};
void oops()
{
int some_local_state=0;
func my_func(some_local_state);
std::thread my_thread(my_func);
my_thread.detach(); 不等待新线程结束
新线程可能仍运行,而主线程的函数却已经结束
}
主线程 | 新线程 |
构造my_func对象,引用局部变量some_local_state | |
通过my_thread对象启动新线程 | |
新线程启动 | |
调用func::operator() | |
分离新线程my_thread | 运行func::operator(); 调用do_something()函数, 进而引用局部变量some_local_state |
销毁局部变量some_local_state | 仍在运行 |
退出oops() | 继续运行func::operator(); 调用do_something()函数, 进而引用some_local_state, 导致未定义行为 |
因此:以下做法不可取:意图在函数中创建线程,并让线程访问函数的局部变量。除非线程肯定会在该函数退出前结束。或者是汇合新线程,此举可以保证在主线程的函数退出前,新线程执行完毕。
1.2.1 join—等待线程完成
若需等待线程完成,那么可以在与之关联的std::thread实例上,通过调用成员函数join()实现。对于上面的代码,就是把detach换成join。就能够保证在oops退出前,新线程结束。
对于一个线程,join仅能被调用一次,被调用后线程不再可汇合,成员函数joinable将返回false。
要注意,如果线程启动后有异常抛出,而join尚未执行,该join调用会被略过。
使用thread_guard保证在抛出异常时,退出路径的先后顺序与不抛出异常时一致。
也就是在析构函数中调用join
class thread_guard {
std::thread& t;
public:
explicit thread_guard(std::thread& t_) : t(t_)
{}
~thread_guard() {
if (t.joinable()) {
t.join();
}
}
thread_guard(thread_guard const&)=delete;
thread_guard& operator=(thread_guard const&)=delete;
};
struct func {
int& i;
explicit func(int& i_) : i(i_) {};
void operator() () {
for (unsigned j = 0; j < 1000000; ++j) {
do_somthing();
}
}
};
void f() {
int some_local_state=0;
func my_func(some_local_state);
std::thread t(my_func);
thread_guard g(t);
do_something_in_current_thread();
}
1.2.2 detach—在后台运行线程
会令线程在后台运行,因此与之无法直接通信。其归属权和控制权都交给了C++运行时库,由此保证,一旦线程退出,与之关联的资源都会被正确回收。
只有在joinable返回true时,才能调用detach。
2 向线程函数传递参数
直接向std::thread的构造函数增添更多参数即可。需要注意的是,线程具有内部存储空间,参数会按照默认方式先复制到该处,新创建的执行线程才能直接访问它们。然后,这些副本被当成临时变量,以右值的形式传给新线程上的函数或可调用对象。即便函数相关参数按设想应该是引用,上述过程依然会发生。
void f(int i, std::string const& s);
std::thread t(f, 3, "hello");
void f(int i, std::string const& s);
void oops(int some_param)
{
char buffer[1024];
sprintf(buffer, "%i", some_param);
std::thread t(f, 3, buffer);
// std::thread t(f, 3, std::string(buffer));
t.detach();
}
但是上述例子将字符串的引用复制到了thread的存储空间,当调用thread的外层函数销毁时,buffer将不存在,无法访问这个引用。可以使用注释里的方法,先转换成std::string对象(buffer相当于一个指针)
void update_data_for_widget(widget_id w, widget_data& data);
void oops_again(widget_id w)
{
widget_data data;
std::thread t(update_data_for_widget, w, data);
display_status();
t.join();
process_widget_data(data);
}
根据update_data_for_widget函数的声明,第二个参数会以引用的方式传入update_data_for_widget,但是std::thread的构造函数并不知情,会直接复制提供的值。随后线程库内部会把参数副本当成move-only(只移型别),以右值的形式传递。最终,update_data_for_widget会收到右值,因为update_data_for_widget预期接受非const引用,我们不能向他传递右值。
解决方法是,按照如下方式改写(std::ref)
std::thread t(update_data_for_widget, w, std::ref(data));
这样就保证了传入update_data_for_widget函数的不是变量data的临时副本,而是指向变量data的引用,因此能够编译成功。
2.2 调用对象的方法
若要调用一个对象对应的方法,则需要传递方法地址和对象地址,第三个参数作为该方法的第一个入参。
class X {
public:
void do_lengthy_work();
};
X my_x;
std::thread t(&X::do_lengthy_work, &my_x);
上述代码调用对象my_x的do_lengthy_work方法。