C++中智能指针的使用及其原理 -- RAII,内存泄漏,shared_ptr,unique_ptr,weak_ptr
目录
1.智能指针的使用场景分析
2.RAII和智能指针的设计思路
3.C++标准库智能指针的使用
4.智能指针的原理以及模拟实现
5.2weak_ptr的原理和部分接口
5.3weak_ptr的简单模拟实现
7.C++11和boost中智能指针的关系
8.内存泄漏
8.1内存泄漏的定义及其危害
8.2如何避免内存泄漏
1.智能指针的使用场景分析
下⾯程序中我们可以看到,new了以后,我们需要delete,但是因为抛异常导致后⾯的delete没有得到执⾏,所以就内存泄漏了。所以我们需要new以后捕获异常,捕获到异常后delete掉申请的内存,再把异常重新抛出,但是因为new本⾝也可能抛异常,连续的两个new和下⾯的Divide都可能会抛异常,让我们处理起来很⿇烦。
#include <iostream>
using namespace std;
double Divide(int a, int b)
{
// 当b == 0时抛出异常
if (b == 0)
{
throw "Divide by zero condition!";
}
else
{
return (double)a / (double)b;
}
}
void Func()
{
// 如果array2 = new int[10] 的时候抛异常就还需要套⼀层捕获释放逻辑,这⾥更好解决⽅案是智能指针
int* array1 = new int[10];
int* array2 = new int[10];
try
{
int len, time;
cin >> len >> time;
cout << Divide(len, time) << endl;
}
catch(...)
{
//捕获到异常之后也要释放申请的空间
cout << "抛出异常后的delete []" << array1 << endl;
cout << "抛出异常后的delete []" << array2 << endl;
delete[] array1;
delete[] array2;
throw; //异常重新抛出到外层
}
cout << "没有抛异常的delete []" << array1 << endl;
delete[] array1;
cout << "没有抛异常的delete []" << array2 << endl;
delete[] array2;
}
int main()
{
try
{
Func();
}
catch (const char* errmsg)
{
cout << errmsg << endl;
}
catch (const exception& e) //捕捉标准库中的异常
{
cout << e.what() << endl;
}
catch (...)
{
cout << "Unkown Exception" << endl;
}
return 0;
}
2.RAII和智能指针的设计思路
RAII是Resource Acquisition Is Initialization的缩写,是⼀种管理资源的类的设计思想,本质是⼀种利⽤对象⽣命周期来管理获取到的动态资源,避免资源泄漏,这⾥的资源可以是内存、⽂件指针、⽹络连接、互斥锁等等。RAII在获取资源时把资源委托给⼀个对象,接着控制对资源的访问,资源在对象的⽣命周期内始终保持有效,最后在对象析构的时候释放资源,这样保障了资源的正常释放,避免资源泄漏问题。
智能指针类除了满⾜RAII的设计思路,还要⽅便资源的访问,所以智能指针类还会像迭代器类⼀样,重载 operator*/operator->/operator[] 等运算符,方便访问资源。
下面代码演示用智能指针类创建对象来管理申请的资源:
#include <iostream>
using namespace std;
template<class T>
class SmartPtr
{
public:
SmartPtr(T* ptr)
:_ptr(ptr)
{}
~SmartPtr()
{
cout << "delete[] " << _ptr << endl;
delete[] _ptr;
}
//重载运算符,模拟指针的行为,方便访问资源
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
T& operator[](size_t i)
{
return _ptr[i];
}
private:
T* _ptr;
};
double Divide(int a, int b)
{
// 当b == 0时抛出异常
if (b == 0)
{
throw "Divide by zero condition!";
}
else
{
return (double)a / (double)b;
}
}
void Func()
{
// 这⾥使⽤RAII的智能指针类管理new出来的数组
SmartPtr<int> sp1 = new int[10];
SmartPtr<int> sp2 = new int[10];
for (size_t i = 0; i < 10; i++)
{
sp1[i] = sp2[i] = i;
}
int len, time;
cin >> len >> time;
cout << Divide(len, time) << endl;
}
int main()
{
while (1)
{
try
{
Func();
}
catch (const char* errmsg)
{
cout << errmsg << endl;
}
catch (const exception& e)
{
cout << e.what() << endl;
}
catch (...)
{
cout << "Unknow exception" << endl;
}
}
return 0;
}
上述代码不管是否抛出异常,都会在Func()函数结束的时候对内部的对象进行销毁,这样的话就会自动调用智能指针类的析构函数,对其指向的资源进行释放。
3.C++标准库智能指针的使用
1.C++标准库中的智能指针都在<memory>这个头⽂件下面。智能指针有好⼏种,除了weak_ptr以外,其他的智能指针都符合RAII和像指针⼀样访问的⾏为,原理上主要是解决智能指针拷⻉时的思路不同。
2.auto_ptr是C++98时设计出来的智能指针,他的特点是拷⻉时把被拷⻉对象的资源的管理权转移给拷⻉对象,这是⼀个⾮常糟糕的设计,因为它会使被拷⻉对象悬空,访问时会报错,C++11设计出新的智能指针后,强烈建议不要使⽤auto_ptr。其实C++11出来之前很多公司也是明令禁⽌使⽤这个智能指针。
这里先给出一个日期类的简单实现,后续的测试都使用这个类进行测试。
struct Date
{
int _year;
int _month;
int _day;
Date(int year = 1, int month = 1, int day = 1)
:_year(year)
,_month(month)
,_day(day)
{}
~Date()
{
cout << "~Date()" << endl;
}
};
使用auto_ptr指针进行拷贝构造,则使得被拷贝的对象悬空,访问时会报错。
int main()
{
auto_ptr<Date> ap1(new Date);
//拷贝时,管理权限转移,被拷贝对象ap1悬空
auto_ptr<Date> ap2(ap1);
cout << ap1->_year << endl;;
return 0;
}
3.unique_ptr是C++11设计出来的智能指针,翻译出来是唯⼀指针,他的特点是不⽀持拷⻉,只⽀持移动。如果不需要拷⻉的场景就非常建议使⽤他。
int main()
{
unique_ptr<Date> up1(new Date);
//不支持拷贝
//unique_ptr<Date> up2(up1);
//支持移动,但是移动后up1也悬空,所以使用移动要谨慎
//一般移动的都是将亡值,而不是对左值进行move
unique_ptr<Date> up3(move(up1));
return 0;
}
这里本质上只有一个Date对象被创建,所以只析构了一次。
4.shared_ptr也是C++11设计出来的智能指针,翻译出来是共享指针,他的特点是⽀持拷⻉,也⽀持移动。如果需要拷⻉的场景就需要使⽤他了。底层是用引用计数的方式实现的。
int main()
{
shared_ptr<Date> sp1(new Date);
//支持拷贝
shared_ptr<Date> sp2(sp1);
shared_ptr<Date> sp3(sp2);
cout << sp1.use_count() << endl;
sp1->_year++;
cout << sp1->_year << endl;
cout << sp2->_year << endl;
cout << sp3->_year << endl;
return 0;
}
注:shared_ptr也支持移动,移动之后被移动的智能指针对象也会被悬空,所以使用移动要谨慎。
5.weak_ptr是C++11设计出来的智能指针,翻译出来是弱指针,他完全不同于上⾯的智能指针,他不⽀持RAII,也就意味着不能⽤它直接管理资源,weak_ptr的产⽣本质是要解决shared_ptr的⼀个循环引⽤导致内存泄漏的问题。这个在后面第五节进行介绍。
6.智能指针析构时默认是进⾏delete释放资源,这也就意味着如果不是new出来的资源,交给智能指针管理,析构时就会崩溃。智能指针支持在构造时给⼀个删除器,删除器本质就是⼀个可调用对象,这个可调用对象中实现你想要的释放资源的方式,当构造智能指针时,给了定制的删除器,在智能指针析构时就会调用删除器去释放资源。因为new[]经常使⽤,所以为了简洁⼀点,unique_ptr和shared_ptr都特化了⼀份[]的版本。
下列用智能指针管理 new 类型[] 申请的资源在析构的时候会报错:
int main()
{
//智能指针析构的时候默认进行delete释放资源,如果是new出来的数组
//智能指针析构的时候就会崩溃
unique_ptr<Date> up1(new Date[10]);
shared_ptr<Date> sp1(new Date[10]);
return 0;
}
解决方法1:因为new[]经常使⽤,所以unique_ptr和shared_ptr实现了⼀个特化版本,这个特化版本析构时⽤的delete[]。
解决方法2: 使用一个可调用对象作为删除器,智能指针在析构的时候调用删除器按你想要的方式进行析构。
综上所述:当unique_ptr需要使用删除器进行资源的释放时,推荐还是使用仿函数作为其删除器。
下列代码表示实现其他资源管理的删除器:
7.shared_ptr 除了⽀持⽤指向资源的指针构造,还⽀持 make_shared ⽤初始化资源对象的值直接构造。用make_shared构造出shared_ptr的好处是可以把资源的空间和引用计数开的空间开到一段连续的空间上,这样可以有效的防止内存碎片的问题。
int main()
{
shared_ptr<Date> sp1(new Date(2024, 11, 20));
//make_shared方式进行构造shared_ptr对象
shared_ptr<Date> sp2 = make_shared<Date>(2024, 11, 25);
return 0;
}
8.shared_ptr 和 unique_ptr 都⽀持了operator bool的类型转换,如果智能指针对象是⼀个空对象没有管理资源,则返回false,否则返回true,意味着我们可以直接把智能指针对象给if判断是否为空。
9.shared_ptr 和 unique_ptr 构造函数都使⽤explicit 修饰,防⽌普通指针隐式类型转换成智能指针对象。不支持使用 " = "的方式进行拷贝构造。
// 报错
shared_ptr<Date> sp5 = new Date(2024, 9, 11);
unique_ptr<Date> sp6 = new Date(2024, 9, 11);
4.智能指针的原理以及模拟实现
下面模拟实现auto_otr和unique_ptr的核心功能,这两个智能指针的实现比较简单,了解即可。auto_ptr的思路是拷贝时转移资源管理权,但是不建议使用。unique_ptr的思路是不支持拷贝。
namespace xiaoc
{
template<class T>
class auto_ptr
{
public:
auto_ptr(T* ptr)
:_ptr(ptr)
{}
//拷贝构造 -- 简单的值拷贝
auto_ptr(auto_ptr<T>& ap)
:_ptr(ap._ptr)
{
//管理权转移
ap._ptr = nullptr;
}
auto_ptr<T>& operator=(auto_ptr<T>& ap)
{
//检查是否为自己给自己赋值
if (this != &ap)
{
//释放当前对象中的资源
if (_ptr)
delete _ptr;
//转移sp中的资源到当前对象中
_ptr = ap._ptr;
ap._ptr = nullptr;
}
return *this;
}
~auto_ptr()
{
if (_ptr)
{
cout << "auto_ptr() delete:" << _ptr << endl;
}
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
private:
T* _ptr;
};
template<class T>
class unique_ptr
{
public:
explicit unique_ptr(T* ptr)
:_ptr(ptr)
{}
//不支持拷贝,所以没有拷贝构造和拷贝赋值
unique_ptr(const unique_ptr<T>& up) = delete;
unique_ptr<T>& operator=(const unique_ptr<T>& up) = delete;
//支持移动构造和移动赋值
unique_ptr(unique_ptr<T>&& up)
:_ptr(up._ptr)
{
up._ptr = nullptr;
}
unique_ptr<T>& operator=(unique_ptr<T>&& up)
{
delete _ptr;
_ptr = up._ptr;
up._ptr = nullptr;
}
~unique_ptr()
{
if (_ptr)
{
cout << "unique_ptr() delete:" << _ptr << endl;
delete _ptr;
}
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
private:
T* _ptr;
};
}
重点是shared_ptr的模拟实现,尤其是引用计数的设计。这里一份资源就需要一个引用计数的变量来记录该资源被多少个shared_ptr管理。引用计数的本质就是记录一份相同的资源被多少个智能指针进行管理。
错误实现1:在shared_ptr中添加一个int变量_count来记录次数,假如现在有一个shared_ptr对象sp1,管理一块资源,sp2是通过sp1拷贝构造生成的,拷贝构造的时候sp1中的_count先++然后拷贝到sp2中,这时候sp1和sp2中的_count都是2,现在析构sp2时,sp2._count为2,不释放空间,再析构sp1时,sp1._count也是2,这时两个对象都析构了,但是都没有释放空间,所以这样的实现也是不可取的。
错误实现2:如果使用静态成员的方式实现引用计数,则两个shared_ptr分别管理两个不同的资源的时候,这时候期待的是每个shared_ptr中的引用计数为1,由于是静态成员变量,所以实际都是2,不符合期待的要求。
正确实现:share_ptr对象中添加一个int*类型的指针pcount,在构造智能指针对象的时候在堆上开辟4个字节的空间,用来存放引用计数的数值,初始化为1。每个shared_ptr都用pcount指针指向这个空间,在拷贝构造或者拷贝赋值的时候,就执行(*pcount)++即可。析构shared_ptr的时候先判断count是否为1,不为1,则将(*pcount)--,为1则释放资源。
这里直接给出简单的模拟实现的代码,重点关注拷贝构造和拷贝赋值以及析构调用的release()函数,具体细节看代码中的注释。
#include <functional>
namespace xiaoc
{
template<class T>
class shared_ptr
{
public:
explicit shared_ptr(T* ptr = nullptr)
:_ptr(ptr)
,_pcount(new int(1))
{}
//带有删除器的版本
template<class D>
shared_ptr(T* ptr, D del)
:_ptr(ptr)
,_pcount(new int(1))
,_del(del)
{}
shared_ptr(const shared_ptr<T>& sp)
:_ptr(sp._ptr)
, _pcount(sp._pcount)
, _del(sp._del)
{
//将原来的引用计数拷贝过来,然后再++
++(*_pcount);
}
void release()
{
//如果只有一个智能指针进行管理,释放资源
//如果不止一个智能指针进行管理
//if判断时就把*_pcount减1即可
if (--(*_pcount) == 0)
{
cout << "shared_ptr() delete:" << _ptr << endl;
_del(_ptr);
delete _pcount;
_ptr = nullptr;
_pcount = nullptr;
}
}
shared_ptr<T>& operator=(const shared_ptr<T>& sp)
{
//这里一定要判断是否是自己对自己进行赋值
//如果不判断,当引用计数为1的时候进入release函数
//先把资源释放掉,sp._ptr指向的资源为空,然后
//自己再给自己赋值,这样最后自己就变成了空
if (_ptr != sp._ptr)
{
//先释放掉之前管理的资源
release();
_ptr = sp._ptr;
_pcount = sp._pcount;
++(*_pcount);
_del = sp._del;
}
return *this;
}
~shared_ptr()
{
release();
}
T* get() const
{
return _ptr;
}
int use_count() const
{
return *_pcount;
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
private:
T* _ptr;
int* _pcount;
function<void(T*)> _del = [](T* ptr) {delete ptr; };
};
}
这里的function是一个包装器,将其仿函数,函数指针,lambda表达式包装成一个可调用的对象,具体可以参考:
C++11语法介绍(2) -- 可变参数模板,default和delete,final和override,lambda表达式,包装器
int main()
{
xiaoc::shared_ptr<Date> sp1(new Date);
sp1 = sp1; //检测当引用计数为1时,自己给自己赋值是否出错
// ⽀持拷⻉
xiaoc::shared_ptr<Date> sp2(sp1);
xiaoc::shared_ptr<Date> sp3(sp2);
cout << sp1.use_count() << endl;
sp1->_year++;
cout << sp1->_year << endl;
cout << sp2->_year << endl;
cout << sp3->_year << endl;
return 0;
}
5.shared_ptr循环引用问题和weak_ptr
5.1shared_ptr循环引用问题
shared_ptr⼤多数情况下管理资源⾮常合适,⽀持RAII,也⽀持拷⻉。但是在循环引⽤的场景下会导致资源没得到释放而内存泄漏,所以要认识循环引⽤的场景和资源没释放的原因,并且⽤weak_ptr解决这种问题。
如下图所述场景,用智能指针n1管理一个双链表的节点,用智能指针n2管理另一个双链表的节点,然后这两个节点连接起来,智能指针中的引用计数就会变为2。
右边的节点什么时候释放呢,左边节点中的_next(一个shared_ptr对象)管着,_next析构后,右边的节点就释放了。_next什么时候析构呢,_next是左边节点的的成员,左边节点释放,_next就析构了。左边节点什么时候释放呢,左边节点由右边节点中的_prev管着呢,_prev析构后,左边的节点就释放了。_prev什么时候析构呢,_prev是右边节点的成员,右边节点释放,_prev就析构了。⾄此逻辑上形成回旋镖似的循环引⽤,谁都不会释放就形成了循环引⽤,导致内存泄漏。
struct ListNode
{
int _data;
shared_ptr<ListNode> _next;
shared_ptr<ListNode> _prev;
// 这⾥改成weak_ptr,当n1->_next = n2;绑定shared_ptr时
// 不增加n2的引⽤计数,不参与资源释放的管理,就不会形成循环引⽤了
/*std::weak_ptr<ListNode> _next;
std::weak_ptr<ListNode> _prev;*/
~ListNode()
{
cout << "~ListNode()" << endl;
}
};
int main()
{
shared_ptr<ListNode> n1(new ListNode);
shared_ptr<ListNode> n2(new ListNode);
cout << n1.use_count() << endl;
cout << n2.use_count() << endl;
n1->_next = n2;
n2->_prev = n1;
cout << n1.use_count() << endl;
cout << n2.use_count() << endl;
return 0;
}
这里程序结束,析构shared_ptr对象时,并没有调用ListNode的析构函数。
main()函数也可以看作一个函数,当一个函数结束的时候会自动调用内部对象的析构函数,所以这里main()函数结束,调用了shared_ptr对象的析构函数,但是shared_ptr中没有调用ListNode的析构函数,所以这两个节点是没有释放的,导致内存泄漏。
注:main()函数与其他函数的区别是main()函数结束之后,这个程序就结束了,程序结束就会自动回收内部申请的资源,所以内存泄漏是对于运行中的程序来说的。
这里用原生指针不行,因为一个shared_ptr对象不能赋值给ListNode*指针,用shared_ptr又会导致循环引用的问题。所以把ListNode结构体中的_next和_prev改成weak_ptr,weak_ptr绑定到shared_ptr时不会增加它的引⽤计数,_next和_prev不参与资源释放管理逻辑,就成功打破了循环引用。下列是使用weak_ptr的结果:
5.2weak_ptr的原理和部分接口
weak_ptr不⽀持RAII,也不⽀持访问资源,所以weak_ptr构造时不⽀持绑定到资源,只⽀持绑定到shared_ptr,绑定到shared_ptr时,不增加shared_ptr的引⽤计数,那么就可以解决上述的循环引⽤问题。
weak_ptr也没有重载operator*和operator->等,因为他不参与资源管理,那么如果他绑定的shared_ptr已经释放了资源,那么他去访问资源就是很危险的。
weak_ptr⽀持expired检查指向的资源是否过期,如果已过期,则返回true,没过期则返回false。use_count也可获取shared_ptr的引⽤计数,weak_ptr想访问资源时,可以调⽤lock返回⼀个管理资源的shared_ptr,如果资源已经被释放,返回的shared_ptr是⼀个空对象,如果资源没有释放,则通过返回的shared_ptr访问资源是安全的。
int main()
{
shared_ptr<string> sp1(new string("xiaoc"));
shared_ptr<string> sp2(sp1);
weak_ptr<string> wp = sp1;
cout << wp.expired() << endl;
cout << wp.use_count() << endl;
cout << endl;
sp1 = shared_ptr<string>(new string("1111"));
cout << wp.expired() << endl;
cout << wp.use_count() << endl;
cout << endl;
sp2 = shared_ptr<string>(new string("2222"));
cout << wp.expired() << endl;
cout << wp.use_count() << endl;
cout << endl;
return 0;
}
5.3weak_ptr的简单模拟实现
namespace xiaoc
{
template<class T>
class weak_ptr
{
public:
weak_ptr()
{}
//支持用shared_ptr进行构造
weak_ptr(const shared_ptr<T>& sp)
:_ptr(sp.get())
{}
weak_ptr<T>& operator=(const shared_ptr<T>& sp)
{
_ptr = sp.get();
return *this;
}
private:
T* _ptr = nullptr;
};
}
6. shared_ptr的线程安全问题
shared_ptr的引⽤计数对象在堆上,如果多个shared_ptr对象在多个线程中,进⾏shared_ptr的拷⻉析构时会访问修改引⽤计数,就会存在线程安全问题,所以shared_ptr引⽤计数是需要加锁或者原⼦操作保证线程安全的。
shared_ptr指向的对象也是有线程安全的问题的,但是这个对象的线程安全问题不归shared_ptr管,它也管不了,应该由外层使⽤shared_ptr的⼈进⾏线程安全的控制。
7.C++11和boost中智能指针的关系
Boost库是为C++语⾔标准库提供扩展的⼀些C++程序库的总称,Boost社区建⽴的初衷之⼀就是为C++的标准化⼯作提供可供参考的实现。在Boost库的开发中,Boost社区也在这个⽅向上取得了丰硕的成果,C++11及之后的新语法和库有很多都是从Boost中来的。
C++ boost给出了更实⽤的scoped_ptr/scoped_array和shared_ptr/shared_array和weak_ptr等。C++ 11,引⼊了unique_ptr和shared_ptr和weak_ptr。需要注意的是unique_ptr对应boost的scoped_ptr。并且这些智能指针的实现原理是参考boost中的实现的。
8.内存泄漏
8.1内存泄漏的定义及其危害
内存泄漏指因为疏忽或错误造成程序未能释放已经不再使⽤的内存,⼀般是忘记释放或者发⽣异常释放程序未能执⾏导致的。内存泄漏并不是指内存在物理上的消失,⽽是应⽤程序分配某段内存后,因为设计错误,失去了对该段内存的控制,因⽽造成了内存的浪费。
内存泄漏的危害:普通程序运⾏⼀会就结束了出现内存泄漏问题也不⼤,进程正常结束,⻚表的映射关系解除,物理内存也可以释放。⻓期运⾏的程序出现内存泄漏,影响很⼤,如操作系统、后台服务、⻓时间运⾏的客⼾端等等,不断出现内存泄漏会导致可⽤内存不断变少,各种功能响应越来越慢,最终卡死。
8.2如何避免内存泄漏
1.⼯程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要智能指针来管理才有保证。
2.尽量使⽤智能指针来管理资源,如果⾃⼰场景⽐较特殊,采⽤RAII思想⾃⼰造个轮⼦管理。
3.定期使⽤内存泄漏⼯具检测。
解决⽅案分为两种:1、事前预防型。如智能指针等。2、事后查错型。如泄漏检测⼯具。