Linux线程_线程互斥_线程同步
一.线程互斥
1.进程线程间的互斥相关概念
临界资源:多线程执行流共享的资源就叫做临界资源
临界区:每个线程内部,访问临界资源的代码,就叫做临界区
互斥:任何时刻,互斥保证有且只有一个执行流进入临界区,访问临界资源,通常对临界资源起保护作用
原子性:不会被任何调度机制打断的操作,该操作只有两态,要么完成,要么未完成。
有多个线程对临界资源num=10000进行--操作 直到num==0。如果不进行保护,num为什么会<0?
1.num--操作并不是原子性的,实际上分为三部 1.把数据从内存存入CPU的寄存器 2.数据-- 3.再把寄存器的数据写回内存
2.if(num>0) 也不是原子性的,分为读取和比较操作。如果刚读取完num==1,条件符合,线程1进入,还没进行--就被切换,线程2读取 条件仍符合,线程2进入。这样就可能会放入多个线程进入。
3.让线程尽可能的切换
线程什么时候会被切换?
1.时间片用完
2.高优先级线程抢占当前线程3.当前线程进入阻塞状态(等待 I/O 或资源)
sleep会让当前线程进入等待队列,并切换其它线程进行调度。等到sleep结束,从内核态转为用户态,会检测时间片是否结束,结束进行切换其它线程。
因此根本原因就在于if(num>0)不是原子性的,让多个线程进入判断内部,导致num<0
2.互斥锁函数
解决上面的问题,就要完成在判断内部也就是临界区内只有一个线程执行。
对临界区进行加锁就可以保证临界区内只有一个线程执行。
下面我们看一下锁的用法
1.PTHREAD_MUTEX_INITIALIZER宏初始化
有两种初始化锁的方法,这是用宏对锁静态初始化。
pthread_mutex_t lock=PTHREAD_MUTEX_INITIALIZER
定义的时候就完成初始化,通常用于声明全局或静态的互斥锁。
初始化好锁后,怎么用呢?
1.进入临界区前 加锁
pthread_mutex_lock()
#include <pthread.h> int pthread_mutex_lock(pthread_mutex_t *mutex);
mutex指向要进行加锁操作的锁 成功返回0 失败返回错误码
2.出临界区后 解锁
pthread_mutex_unlock()
int pthread_mutex_unlock(pthread_mutex_t *mutex);
mutex指向要进行解锁操作的锁 成功返回0 失败返回错误码
2.pthread_mutex_init()函数初始化
先定义锁,再用函数初始化。适用于局部变量、需要在运行时初始化的互斥锁。
可以传递锁的属性。需要在使用完后调用 pthread_mutex_destroy 销毁。
#include <pthread.h> pthread_mutex_t mutex; // 声明但不初始化 void *thread_func(void *arg) { pthread_mutex_lock(&mutex); // 加锁 // 访问共享资源 pthread_mutex_unlock(&mutex); // 解锁 } int main() { pthread_t thread1, thread2; // 动态初始化互斥锁 pthread_mutex_init(&mutex, NULL); // 初始化互斥锁 pthread_create(&thread1, NULL, thread_func, NULL); pthread_create(&thread2, NULL, thread_func, NULL); pthread_join(thread1, NULL); pthread_join(thread2, NULL); pthread_mutex_destroy(&mutex); // 销毁互斥锁 return 0; }
pthread_mutex_init()
int pthread_mutex_init(pthread_mutex_t *mutex, const pthread_mutexattr_t *attr);
mutex 指向要初始化的锁 attr锁的属性
pthread_mutex_destroy()
int pthread_mutex_destroy(pthread_mutex_t *mutex);
mutex指向要销毁的锁
每次进出临界区的时候都要进行加锁 解锁操作,有什么办法可以自动对临界区进行加锁 解锁?
#pragma once #include <iostream> #include <pthread.h> namespace LockModule { class Mutex { public: Mutex(const Mutex&) = delete; const Mutex& operator = (const Mutex&) = delete; Mutex() { int n = ::pthread_mutex_init(&_lock, nullptr); (void)n; } ~Mutex() { int n = ::pthread_mutex_destroy(&_lock); (void)n; } void Lock() { int n = ::pthread_mutex_lock(&_lock); (void)n; } void Unlock() { int n = ::pthread_mutex_unlock(&_lock); (void)n; } private: pthread_mutex_t _lock; }; class LockGuard { public: LockGuard(Mutex &mtx):_mtx(mtx) { _mtx.Lock(); } ~LockGuard() { _mtx.Unlock(); } private: Mutex &_mtx; }; }
定义一个Mutex类,它的构造函数就是初始化成员变量_block锁,析构函数是销毁锁。有解锁 加锁的函数。再定义一个以Mutex类对象为成员变量的LockGuard类,构造函数进行加锁操作,析构函数进行解锁操作。这样创建一个LockGuard对象就完成了加锁,销毁时就完成了解锁操作。
我们把临界区单独放在一个作用域里面,在临界区的作用域里面一开始创建LockGuard对象自动调用构造函数完成加锁,等到出作用域自动调用析构函数,完成解锁。
3.互斥量实现原理
pthread_mutex_lock()到底怎么完成只让一个线程进入临界区,实现互斥操作的呢?
为了实现互斥锁操作,大多数体系结构都提供了 swap 或 exchange 指令,该指令 的作用是把寄存器和内存单元的数据相交换,由于只有一条指令,保证了原子性,即使 是多处理器平台,访问内存的 总线周期也有先后,一个处理器上的交换指令执行时另 一个处理器的交换指令只能等待总线周期。 现在我们把 lock 和 unlock 的伪代码改一下。
在内存中互斥锁mutex可以理解成一个计数器,默认为1,代表没有线程在临界区,可以进入。为0代表有线程在临界区不能进入。
进入lock函数:
1.move $0 %al 把0值写入寄存器
2.xchgb 把寄存器数据0和内存mutex数据交换(原子性)
3.如果寄存器内数据>0 代表没有线程在临界区,可以进入。
==0 有线程在临界区,进入等待队列。等待结束后再重新执行lock函数 直到>0返回
unlock函数:
把1写入mutex中 (原子性),退出临界区,表示允许线程进入临界区。
二.线程同步
1.同步概念
互斥可以保证只有一个线程进入临界区访问临界资源,但多个线程竞争同一份临界资源,如果有一个线程总是能访问到,而其它线程一直在等待,这就造成了饥饿问题。怎么才能解决线程间资源的竞争呢?
同步:在保证数据安全的前提下,让线程能够按照某种特定的顺序访问临界资源,从而有效避免饥饿问题,叫做同步。
同步的机制有 互斥锁(确保每次只有一个线程能访问临界区,防止并发访问同一资源)
条件变量 (让线程在某个条件满足之前挂起,直到其他线程通知它继续执行)
信号量 (用于控制访问共享资源的线程数量)
条件变量可以协调线程的执行顺序。
2.条件变量函数
初始化
1.PTHREAD_COND_INITIALIZER宏
一般用于初始化全局条件变量
pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
2.int pthread_cond_init()
int pthread_cond_init(pthread_cond_t *cond, const pthread_condattr_t *attr);
cond:指向要初始化的条件变量的指针。
attr:用于设置条件变量的属性,一般传入 NULL,表示使用默认属性。
返回值:成功时返回 0,失败时返回错误码。
pthread_cond_destroy()销毁
int pthread_cond_destroy(pthread_cond_t *cond);
pthread_cond_wait() 等待条件变量
int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex);
cond:条件变量。
mutex:互斥锁,在调用 pthread_cond_wait 时必须持有该锁。调用 wait 会解锁,并使当前线程阻塞,直到条件变量被通知。
返回值:成功时返回 0,失败时返回错误码。
注意:pthread_cond_wait 会解锁并使当前线程阻塞,直到条件变量收到通知,线程被唤醒后,重新加锁。
pthread_cond_signal() 通知一个线程
int pthread_cond_signal(pthread_cond_t *cond);
cond:条件变量,通知一个等待该条件变量的线程。
返回值:成功时返回 0,失败时返回错误码。
pthread_cond_broadcast() 通知所有线程
int pthread_cond_broadcast(pthread_cond_t *cond);
cond:条件变量,通知所有等待该条件变量的线程。
返回值:成功时返回 0,失败时返回错误码。
3.生产消费者模型
1.什么是生产消费者模型
互斥锁和条件变量怎么搭配使用呢?
先讲一个场景,生产消费者模型。有多个工厂向超市放资源,超市存入资源且大小有限,消费者从超市拿资源。
可以理解为有多个线程向临界区存入资源,有多个线程从临界区取资源。在此过程中要保证临界区的安全,还有保证高效。
在此场景中有三种关系:
1.生产者和生产者 两个生产者可以同时进入超市吗?不能,如果超市刚好差一个资源就满,那么就不能保证资源安全。
所以生产者和生产者关系为:互斥
2.消费者和消费者 两个消费者可以同时进入超市吗?不能,超市有只有一个资源的情况
所以消费者和消费者关系为:互斥
3.消费者和生产者 一个消费者和一个生产者可以同时进入吗?不能,消费者在取资源时怎么知道生产者有没有放资源,消费者先取发现没有,回去说里面没有资源,生产者再放,回去说里面有资源,造成二义性。
所以消费者和生产者关系为:互斥
消费者发现超市没有资源,就回去,等一段时间再访问有没有资源,不停循环访问。这样虽然合理,但不高效。如果能什么时候有资源了,就通知一声消费者再让它过来就可以了,
那么谁知道什么时候有资源呢?生产者,因为相互互斥,等生产者出来的时候一定有资源,让生产者通知消费者取资源就可以了。反过来,消费者也知道什么时候资源没满,消费者出来的时候,再通知生产者存入资源就可以了。
所以消费者和生产者关系为:互斥+同步
下面我们用代码模拟上述场景,多个线程分别当作生产者 消费者,用阻塞队列当作有资源上线的超市。(当队列为空时,消费者线程会被阻塞,直到队列中有元素可以消费;当队列满时,生产者线程会被阻塞,直到队列中有空位可以插入新的元素。阻塞队列常用于多线程环境中的生产者-消费者问题等场景。)
2.代码模拟
#pragma once
#include<iostream>
#include<cstdio>
#include<queue>
#include "Mutex.hpp"
#include "Cond.hpp"
using namespace LockModule;
using namespace CondModule;
namespace BlockQueueModule
{
static const int gcap = 10;
template<typename T>
class BlockQueue
{
private:
bool IsFull(){return _cap==_q.size();}
bool IsEmpty(){return _q.empty();}
public:
BlockQueue(int cap=gcap):_cap(cap)
{
// pthread_mutex_init(&_mutex,nullptr);
// pthread_cond_init(&_p_cond,nullptr);
// pthread_cond_init(&_c_cond,nullptr);
}
void Pop(int*data)
{
//pthread_mutex_lock(&_mutex);
LockGuard lockguard(_mutex);
//1.队列不能为空
while(IsEmpty())
{
_c_nums++;
//pthread_cond_wait(&_c_cond,&_mutex);
_c_cond.Wait(_mutex);
_c_nums--;
}
*data=_q.front();
_q.pop();
//if(_p_nums) pthread_cond_signal(&_p_cond);
if(_p_nums) _c_cond.Notify();
//pthread_mutex_unlock(&_mutex);
}
void Equeue(const int&data) //生产者
{
//pthread_mutex_lock(&_mutex);
LockGuard lockguard(_mutex);//初始化自动上锁 出作用域解锁
//1.放入数据前队列不能为满
while(IsFull())
{
//2.为满就让该线程释放锁 进入等待队列
_p_nums++;// 等待生产者线程+1
//pthread_cond_wait(&_p_cond,&_mutex);//wait的时候 有锁的话 会导致消费线程申请不到锁 导致一直在等待
_p_cond.Wait(_mutex);
_p_nums--;
//3.等待结束唤醒线程 并申请锁(因为在临界区内,pthread_cond_wait会自动申请锁)
}
//4.到此时肯定未满 生产者存入数据
_q.push(data);
//5.此时肯定有数据
//if(_c_nums) pthread_cond_signal(&_c_cond); //有等待的消费者线程就唤醒一个
if(_c_nums) _p_cond.Notify();
//6.唤醒线程要在解锁前还是解锁后?
//signal通知线程 线程被唤醒后还要申请到锁才能继续执行
//(1)在解锁前唤醒它 它申请不到锁 就会阻塞在申请锁的队列中 直到申请到锁
//(2)如果被其它进程申请到了锁 就继续阻塞在申请锁的队列中
//7.如果生产者只生成了1个资源,但broadcast()唤醒了等待队列的所有线程会怎么样?
//会发生伪唤醒。第一个申请到锁的线程获取了资源。现在没有资源了,可是第二个申请到锁的线程还是会在临界区内继续执行
//解决方法:if()改为while()判断 在线程被唤醒后,重新检查条件是否满足,并在不满足时重新进入等待状态。
//(即重新看是否满足while的判断,满足就重新进入等待队列,不满足退出while循环)
//pthread_mutex_unlock(&_mutex);
}
~BlockQueue()
{
// pthread_mutex_destroy(&_mutex);
// pthread_cond_destroy(&_p_cond);
// pthread_cond_destroy(&_c_cond);
}
private:
std::queue<T> _q;//队列
int _cap; //队列数据上限
Mutex _mutex; //互斥
Cond _p_cond; //生产者条件变量
Cond _c_cond; //消费者条件变量
int _c_nums=0; //等待的消费者线程
int _p_nums=0; //等待的生产者线程
};
}
对条件变量的封装
#pragma once
#include "Mutex.hpp"
using namespace LockModule;
namespace CondModule
{
class Cond
{
public:
Cond()
{
int n=pthread_cond_init(&_cond,nullptr);
(void)n;
}
void Wait(Mutex&mutex)
{
int n=pthread_cond_wait(&_cond,mutex.LockPtr());
(void)n;
}
void Notify()
{
int n=pthread_cond_signal(&_cond);
(void)n;
}
void NotifyAll()
{
int n=pthread_cond_broadcast(&_cond);
(void)n;
}
~Cond()
{
int n=pthread_cond_destroy(&_cond);
(void)n;
}
private:
pthread_cond_t _cond;
};
}
对锁的封装
#pragma once
#include <iostream>
#include <pthread.h>
namespace LockModule
{
class Mutex
{
public:
Mutex(const Mutex&) = delete;
const Mutex& operator = (const Mutex&) = delete;
Mutex()
{
int n = ::pthread_mutex_init(&_lock, nullptr);
(void)n;
}
~Mutex()
{
int n = ::pthread_mutex_destroy(&_lock);
(void)n;
}
void Lock()
{
int n = ::pthread_mutex_lock(&_lock);
(void)n;
}
pthread_mutex_t *LockPtr()
{
return &_lock;
}
void Unlock()
{
int n = ::pthread_mutex_unlock(&_lock);
(void)n;
}
private:
pthread_mutex_t _lock;
};
class LockGuard
{
public:
LockGuard(Mutex &mtx):_mtx(mtx)
{
_mtx.Lock();
}
~LockGuard()
{
_mtx.Unlock();
}
private:
Mutex &_mtx;
};
}
上层接口
#include"BlcokQueue.hpp"
#include<pthread.h>
#include<unistd.h>
using namespace BlockQueueModule;
void* Consumer(void*args)
{
BlockQueue<int>*bq=static_cast<BlockQueue<int>*>(args);
int data;
while (true)
{
sleep(2);
//1.从队列中获取数据
bq->Pop(&data);
//2.处理数据
printf("消费者获取数据:%d\n",data);
}
}
void* Productor(void*args)
{
BlockQueue<int>*bq=static_cast<BlockQueue<int>*>(args);
//1.从外部获取数据
int data=10;
while(true)
{
//2.把数据输入队列中
bq->Equeue(data);
printf("生产者存入数据:%d\n",data);
data++;
}
}
int main()
{
BlockQueue<int>* bq=new(BlockQueue<int>);
pthread_t c,p;
pthread_create(&c,nullptr,Consumer,(void*)bq);
pthread_create(&p,nullptr,Productor,(void*)bq);
pthread_join(p,nullptr);
pthread_join(c,nullptr);
delete bq;
}
3.生产消费者模型高效在哪里?
生产消费者模型,三种关系生产者和生产者 消费者和消费者 生产者和消费者都是互斥的,在临界区内都是串行的,有一个线程在内,其它线程都不能进来,怎么就高效了呢?
想一想,当其中一个线程在临界区内,其它线程呢?
1.生产者在从外部获取数据,不需要等待消费者处理完数据。消费者在处理数据,不需要等待生产者生成数据。
通过这种方式,生产者和消费者可以并行运行,避免了阻塞和等待,从而提高了资源的利用率。2.临界区可以当作缓冲区,调节生产与消费的速度。
如果生产者的生产速度快于消费者的消费速度,缓冲区会存储数据,生产者可以继续生产而不会被阻塞。
如果消费者的消费速度快于生产者的生产速度,缓冲区中的数据会被快速消费,生产者有更多的时间来生产新数据。