【C++】模拟实现vector
在上篇中我们已经了解过的vector各种接口的功能使用,接下来我们就试着模拟实现一下吧!
注意:我们在此实现的和C++标准库中实现的有所不同,其目的主要是帮助大家大概理解底层原理。
我们模拟vector容器的大致框架是:
template<class T>
class vector
{
public:
typedef T* iterator; //普通迭代器
typedef const T* const_iterator; //const迭代器
//...
private:
iterator _start = nullptr; //指向容器起始位置(第一个有效数据)
iterator _finish = nullptr; //指向容器最后一个有效数据的下一个位置
iterator _end_of_storage = nullptr; //指向容器所开空间的最后一个位置的下一个位置
};
注意这里要与string类进行区别,我们在模拟string类时它有3个成员变量,其中,2个内置类型分别表示数据个数和容量大小,还有1个指针,指向空间起始位置,在这里我们换成了3个指针,它可以间接表示数据个数和容量大小,它和之前写的差别不大,只是形式上略有不同。
inerator是参数模板T类型的指针,容器中数据元素的类型是T。
我们本篇以实现为主,不再细讲各个函数功能介绍。
如果大家对各个成员函数还不太了解其功能时,可以去先看一下这篇文章->vector容器的基本使用
一、成员函数
1、size()
//返回vector容器元素个数
size_t size() const
{
return _finish - _start;
}
2、capacity()
//返回vector容器容量大小
size_t capacity() const
{
return _end_of_storage - _start;
}
3、empty()
//判断容器中元素是否为空,若为空返回true,否则返回false
bool empty()
{
return _start == _finish;
}
4、clear()
//清空容器中的数据,容量不变
void clear()
{
_finish = _start;
}
4、operator[]
//返回下标为i位置上的值
T& operator[](size_t i)
{
assert(i < size()); //若i>=size(),说明越界了,程序就会发生断言错误
return _start[i];
}
空间是在堆上开辟的,所以可以传引用返回,传引用范围的目的是:(1)若T是自定义类型就可以减少一次拷贝构造。(2)方便我们修改对应下标的值。
如果对象被const修饰,也就是禁止修改对应的值,我们可以再写一个重载函数:
const T& operator[](size_t i) const
{
assert(i < size());
return _start[i];
}
5、reserve()
//预留n个元素的空间
void reserve(size_t n)
{
if (n > capacity())
{
//扩容
T* tmp = new T[n]; //新开一段空间
memcpy(tmp, _start, sizeof(T) * size()); //旧空间的值赋给新空间
delete[] _start; //释放旧空间
_start = tmp; //获得新空间
_finish = _start + size(); //改变_finish
_end_of_storage = _start + n; //改变_end_of_storage
}
}
当n大于capacity时,我们将扩容,当n小于capacity时,C++标准明确不缩容,所以我们什么也不做。
扩容的逻辑就是新开一段空间,将原有的空间中的值拷贝给新空间,然后释放旧的空间,将我们新开的空间作为现在的空间。
6、resize()
//改变元素个数
void resize(size_t n, T val = T())
{
if (n < size()) //如果n小于size()就更新_finish
{
_finish = _start + n;
}
else //否则就需要扩容
{
reserve(n); //reserve会检查,大于capacity才会扩容,如果扩容,不多扩,要多大给多大
while (_finish < _start + n)
{
*_finish = val; //初始化新添加的元素值为val
++_finish;
}
}
}
一些函数参数有缺省值,但在此之前见到的缺省值一般都是内置类型,这里却不同,因为在模板被调用之前T的类型是未知的,它有可能是自定义类型,若是自定义类型,就不能单纯的给内置类型的缺省值,所以我们这里给的是T类型的默认构造参数。
那如果T是内置类型,这样行吗?内置类型也有构造函数?
我们暂且可以认为内置类型有构造函数,我们可以看几个例子:
int main()
{
int a = int();
int b = int(1);
int c(10);
cout << "a:" << a << endl;
cout << "b:" << b << endl;
cout << "c:" << c << endl;
return 0;
}
运行结果:
从代码的写法风格和结果上,我们可以认为内置类型有构造函数。
利用resize我们可以直接初始化:
vector<int> v;
v.resize(10,1); //初始化为10个1
我们写一段代码来测试一下:
在主函数中调用test_vector0():
void test_vector0()
{
vector<int> v;
v.resize(10, 1);
print_container(v);
v.reserve(20); //初始空间给20
cout << v.size() << endl;
cout << v.capacity() << endl;
cout << "------------------" << endl;
//1、size() < n < capacity()
v.resize(15, 2);
print_container(v);
cout << v.size() << endl;
cout << v.capacity() << endl;
cout << "------------------" << endl;
//2、n > capacity()
v.resize(30, 100);
print_container(v);
cout << v.size() << endl;
cout << v.capacity() << endl;
cout << "------------------" << endl;
//3、n < size()
v.resize(5);
print_container(v);
cout << v.size() << endl;
cout << v.capacity() << endl;
}
运行结果:
这里的print_container()是我们自己写的通用容器的打印方法,大家在下面的9(3)可以看到。
7、push_back()
它的功能是在尾部插入一个元素。
//尾插,在最后一个有效元素后插入一个新元素
void push_back(const T& x)
{
if (_finish == _end_of_storage)
{
//扩容
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
*_finish = x;
++_finish;
}
插入前,先判断需不需要扩容,若需要就先扩容,之后再进行尾插并更新_finish指针。
我们写完了尾插可以先测试一下,看看功能是否正确:
在主函数中调用test_vector1():
void test_vector1()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
for (size_t i = 0;i < v.size();++i)
cout << v[i] << " ";
}
运行结果:
程序崩溃了,这是什么原因导致的呢?
在插入数据时,首先要判断是否扩容,我们首次尾插,_strat和_finish是相同的,所以要扩容。问题就出在这扩容上。经过调试:
我们发现,扩容后_finish竟然还是空指针,那一会插入数据必然报错,空指针不可以解引用的。
所以,问题的根本是在_finish = _start + size();这行代码。_start因该是没问题的,它不再是空指针了,而是一个新的值,最终定位,问题出在size()上。
此时的size()中,_finish是扩容前的,_start是扩容后的,而_finish = _start + size()中的_strat也是扩容后的,所以抵消掉就是_finish = _finish,扩容前的_finish我们默认给的就是nullptr。所以问题出在这里。
我们可以对reserve()进行简单的修改:
void reserve(size_t n)
{
if (n > capacity())
{
//扩容
T* tmp = new T[n]; //新开一段空间
memcpy(tmp, _start, sizeof(T) * size()); //旧空间的值赋给新空间
delete[] _start; //释放旧空间
_finish = tmp + size(); //先修改_finish
_start = tmp; //再修改_start
_end_of_storage = _start + n; //改变_end_of_storage
}
}
这样size()中的_finish和_start都是扩容前的了,这样就解决了问题。但不难免有些人会感觉看着别扭,万一有些人有强迫症,就要先写_start = tmp 再写 _finish = tmp + size(); 那程序就还是会崩溃。有没有方法既可以看着舒服,又可以使程序正常运行呢?
答案是有的。
void reserve(size_t n)
{
if (n > capacity())
{
size_t old_size = size(); //扩容前先记录数据个数
//扩容
T* tmp = new T[n]; //新开一段空间
memcpy(tmp, _start, sizeof(T) * old_size); //旧空间的值赋给新空间
delete[] _start; //释放旧空间
//都用tmp,这样可以随便调整它们3个的位置
_start = tmp; //获得新空间
_finish = tmp + old_size; //改变_finish
_end_of_storage = tmp + n; //改变_end_of_storage
}
}
我们在扩容前,定义一个old_size就解决问题啦,它用于记录扩容前数据个数。
8、pop_back()
//尾删,删除最后一个有效元素
void pop_back()
{
assert(!empty());
--_finish;
}
9、迭代器
(1)begin()
普通迭代器:
iterator begin()
{
return _start;
}
const迭代器:
const_iterator begin() const
{
return _start;
}
(2)end()
普通迭代器:
iterator end()
{
return _finish;
}
const迭代器:
const_iterator end() const
{
return _finish;
}
(3)print_container()
我们在类外面来写一个通用的,打印容器中数据的函数。
template<class Container>
void print_container(const Container& v)
{
//vector<T>::const_iterator表达含义不清淅,这种写法既可以将const_iterator看作静态成员变量,也可以将它看作类型
//规定--不能在没有实例化的类模板里面取东西。因为编译器不能区分这里的
//const_iterator是类型还是静态成员变量,如果不加typename在语法上就会报错
//如果加了typename编译器就知道了这是类型而不是静态成员变量,编译器认为在语法上没问题,所以不会报错
//typename Container::const_iterator it = v.begin();
auto it = v.begin(); //简单起见,我们可以直接用auto来让编译器自动帮我们识别类型
while (it != v.end())
{
cout << *it << " ";
++it;
}
cout << endl;
//for(auto e : v)
//{
// cout << e << " ";
//}
//cout << endl;
}
我们知道,编译器在编译代码时是从上到下进行编译的,当编译到 print_container这个函数模板时,类模板还没有实例化,如果贸然从中取到东西,就可能导致出现许多问题,就比如这里的const_iterator,所以我们规定不要在没有实例化的类模板里面取东西,这里我们明确知道了const_iterator是一个类型名,要想在语法上过的去,就必须加上typename关键字。
假设这里的const_iterator是静态成员变量,那么编译器只会认为你加了typename,是个类型,it的类型是const_iterator,这样定义语法上不会出错,别的它可就不管啦。但实际上语法虽然可以通过,但const_iterator是静态成员变量,运行时绝对会出问题的。
如果它本身就是静态成员变量,我们可以不加typename,因为静态变量我们在书写时就不会以这种方式去写vector<T>::const_iterator it。
如果不加typename,编译器就会按照静态成员变量去识别了。
10、insert()
//在pos位置前插入新元素x
void insert(iterator pos,const T& x)
{
//判断是否需要扩容
if (_finish == _end_of_storage)
{
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
//end指向最后一个有效数据的位置
iterator end = _finish - 1;
while (end >= pos) //依次挪动数据
{
*(end + 1) = *end;
--end;
}
*pos = x; //pos位置上赋值
++_finish; //更新_finish
}
代码写起来很容易,那我们来测试一下:
在主函数中调用test_vector2():
void test_vector2()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
print_container(v);
//在下标为0的位置上插入100
v.insert(v.begin() + 0, 100);
print_container(v);
}
运行结果:
结果没有任何问题。
在这段代码中,我们在push_back之前,容量是4,而我们插入了5个数据,所以会扩容,在扩容后,我们调用insert进行插入数据,运行结果也没有任何问题。
接下来我们修改一下测试代码:
void test_vector2()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
print_container(v);
//在下标为0的位置上插入100
v.insert(v.begin() + 0, 100);
print_container(v);
}
我将这段代码的第5个push_back给注释了,其目的是在调用insert时再扩容,看看会发生什么情况?
运行结果:
这段代码已经崩了。
这里就出现了问题,而这个问题就是迭代器失效。
我们来分析一下,我们让insert插入时扩容,就导致了问题,画个图让大家能更好的理解:
扩容后,原先的空间就被释放了,但pos指向的还是原来空间的位置, 在insert中依次挪动数据时就会导致出现问题,这就是迭代器失效的一个例子,此时的pos就是野指针。
为了解决这个问题,我们可以在扩容之前记录一下pos与_satrt的相对位置,扩容后,再更新pos。
void insert(iterator pos,const T& x)
{
if (_finish == _end_of_storage)
{
size_t len = pos - _start; //记录相对位置
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len; //更新pos
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
}
运行结果:
这样就解决了问题。
我们接下来再来实现一个小功能:
输入一个值,然后用查找算法看看这个值是否在vector中存在。
在主函数中调用test_vector3():
void test_vector3()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
print_container(v);
int x;
cin >> x;
auto p = std::find(v.begin(), v.end(), x); //利用库中的find函数在两个迭代区间进行查找
if (p != v.end())
{
v.insert(p, 2000); //如果找到,就在该位置上插入2000
print_container(v);
}
else
{
cout << "不存在:" << x << endl;
}
}
其中,find是定义在<algorithm>这个头文件中的,它是一个函数模板,支持所有容器在一段区间中查找相应元素。它大概是这样的:
template<class InputIterator, class T>
InputIterator find (InputIterator first, InputIterator last, const T& val)
{
while (first!=last) {
if (*first==val) return first;
++first;
}
return last;
}
它是在[first,last)这个区间去找val,注意是左闭右开。
test_vector3()运行结果:
我们输入的x值为3,结果并没有任何错误。
现在,我们让查找到的pos位置上的值乘100:
void test_vector3()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
print_container(v);
int x;
cin >> x;
auto p = std::find(v.begin(), v.end(), x); //利用库中的find函数在两个迭代区间进行查找
if (p != v.end())
{
v.insert(p, 2000); //如果找到,就在该位置上插入2000
(*p) *= 100;
print_container(v);
}
else
{
cout << "不存在:" << x << endl;
}
}
运行结果:
我们本意是让3乘以100,而不是让2000乘以100,这也是一种迭代器失效。p的意义发生了改变,它的本意是指向3,然而插入了2000,它的指向由3变为2000,这时对p指向的数据进行操作就会发生迭代器失效。虽然语法上没有报错,但它也是迭代器失效的一种情况。 这在vs2019下调用标准库中的vector会进行强制检查,若访问失效的迭代器就会报错。这种不扩容的场景,在Linux(g++)下不会报错。
那如果我将第5个push_back给注释呢?
void test_vector3()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
print_container(v);
int x;
cin >> x;
auto p = std::find(v.begin(), v.end(), x); //利用库中的find函数在两个迭代区间进行查找
if (p != v.end())
{
v.insert(p, 2000); //如果找到,就在该位置上插入2000
(*p) *= 100;
print_container(v);
}
else
{
cout << "不存在:" << x << endl;
}
}
运行结果:
发现这时2000也没有乘100,这就奇了怪了?
我们把第5个push_back注释掉的结果是在调用insert时扩容。我们传的第一个参数p,reserve进行接收,但形参改变不会影响实参,在reserve内部,pos(形参)确实是更新了,但外部的p(实参)却不会更新,所以在一块被释放的空间上进行操作是没用的,也就是2000还是2000,它不会乘100。
有人可能就会想,insert函数的第一个参数改为引用不就行了?这是不行的,我们在调用insert时传的第一个参数是临时变量(p),临时变量具有常性,如果insert函数的第一个参数(pos)是引用,那就是典型的权限放大,那如果再加一个const呢(const iterator& pos )?那也不行,如果insert中要更新pos,那就不能加const。
实际中,我们调用insert后,到底扩不扩容是不清楚的,所以尽量不要对p"动手脚"。
在扩容的情况下,Linux也不会报错。
总结一下:insert后p就失效了,不要访问!
当然,也可以有另外一种处理方式,就是将pos作为返回值:
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
修改测试代码:
void test_vector3()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
print_container(v);
int x;
cin >> x;
auto p = std::find(v.begin(), v.end(), x);
if (p != v.end())
{
//insert后p就失效,不要直接访问,要访问就要更新这个失效的迭代器的值
p = v.insert(p, 2000); //更新p
(*(p + 1)) *= 100;
print_container(v);
}
else
{
cout << "不存在:" << x << endl;
}
}
运行结果:
这样就可以解决问题了。
11、erase()
通常情况下,删除数据后,容量是不会变的。
//删除pos位置上的数据
void erase(iterator pos)
{
assert(pos >= _start && pos < _finish);
auto it = pos + 1; //记录要删除位置的下一位置
while (it != end()) //依次覆盖
{
*(it - 1) = *it;
++it;
}
--_finish; //更新_finish
}
删除pos位置上的数据后,pos的意义发生了改变,这也是迭代器失效。
我们来测试一下:
在主函数中调用test_vector4():
void test_vector4()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
print_container(v);
//删除所有的偶数
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
v.erase(it);
++it; //it的意义发生了改变
}
print_container(v);
}
运行结果:
从结果上看,满足了要求。
修改一下测试代码:
void test_vector4()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(4); //多插入一个4
v.push_back(5);
print_container(v);
//删除所有的偶数
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
v.erase(it);
++it;
}
print_container(v);
}
再看运行结果:
没删除干净?
这很容易理解,我们在删除一个偶数后,会++it,如果我们删除的偶数后面紧跟着一个偶数,在删除第一个偶数的时候,所有数据往前挪,那么第一个偶数的位置就会被第二个偶数所取代,这时++it,就会跳过对第二个偶数的判断,导致漏删。
这段代码还会出现一个问题:
如果最后一个数是偶数的话,erase在删除数据时,会--_finish,删除后,在测试代码中的while循环中还会++it,然后进行while循环条件判断,发现条件为真(这时就出问题了),此时如果if条件为假就是死循环,如果if条件为真,调用erase就会发生断言错误。
在Linux下,运行该代码时,它会和我们产生一样的效果。如果在vs2019下,这3种情况都跑不通。
这里如果解决迭代器失效带来的问题,我们可以把删除位置的下一位置作为返回值进行返回:
iterator erase(iterator pos)
{
assert(pos >= _start && pos < _finish);
auto it = pos + 1;
while (it != end())
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
修改测试代码:
void test_vector4()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(2);
v.push_back(3);
v.push_back(4);
print_container(v);
//删除所有的偶数
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
it = v.erase(it); //用返回值更新it
else
++it; //加一个else,这样就能删除干净,且不会发生最后一个是偶数时程序报错的问题。
}
print_container(v);
}
运行结果:
这样就可以解决问题啦。
二、析构函数
~vector()
{
delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
三、拷贝构造
抛弃以往的写法,我们现在换一种写法:
vector(const vector<T>& v)
{
reserve(v.capacity()); //提前开好空间,就不需要频繁扩容了
for (const auto& e : v)
push_back(e);
}
这里的v有可能是自定义类型,所以我在范围for中加了一个引用,防止多次构造,我们这里只是赋值,不修改,所以又加了一个const。
我们来测试一下:
在主函数中调用test_vector5():
void test_vector5()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
print_container(v1);
vector<int> v2 = v1; //拷贝构造
print_container(v2);
}
运行结果:
四、赋值重载
1、传统写法
vector<T>& operator=(const vector<T>& v)
{
if (this != &v)
{
//方式1
clear();
reserve(v.capacity());
for (const auto& e : v)
push_back(e);
//方式2
//delete[] _start;
//_start = new T[v.capacity()];
//memcpy(_start, v._start, sizeof(T) * v.size());
_finish = _start + v.size();
_end_of_storage = _start + v.capacity();
}
return *this;
}
2、现代写法
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
vector<T>& operator=(vector<T> v) //这里不能用引用,假设v1 = v2,我们不能改变v2
{
swap(v);
return *this;
}
额外说明一点,在类中,类名可以替代类型。比如:
vector<int> 可以直接写成 vector
我们写一段代码测试一下:
在主函数中调用test_vector6():
void test_vector6()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
print_container(v1);
cout << v1.size() << endl;
cout << v1.capacity() << endl;
vector<int> v3;
v3.push_back(10);
v3.push_back(20);
v3.push_back(30);
print_container(v3);
cout << v3.size() << endl;
cout << v3.capacity() << endl;
v1 = v3;
print_container(v1);
cout << v1.size() << endl;
cout << v1.capacity() << endl;
}
运行结果:
五、构造函数
1、默认构造
vector(){}
虽然我们只写了框架,没有实质内容,但编译器依然会去走初始化列表,用缺省值进行初始化。
在C++11中,还有另外一种表示方法:
//C++11 强制生成默认构造
vector() = default;
2、迭代器区间构造(通用)
注意:类模板中还可以定义函数模板。
template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
while (first != last)
{
push_back(*first);
++first;
}
}
我们将它定义为函数模板的好处是,它不仅可以用vector容器类型的迭代器区间初始化,还可以用其他类型容器的迭代器区间初始化,提高了复用性。 但有一个要求是类型需要匹配,比如我这个容器是vector里面数据类型是int,你传过来的容器是list里面的数据类型是string,这是不匹配的。要保证传过来的容器中的数据类型是int,或者能隐式类型转换为int。
我们写一段代码测试一下迭代器区间初始化:
在主函数中调用test_vector7():
void test_vector7()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
print_container(v1);
//用迭代器区间初始化,从下标为1的位置开始到下标为2的位置结束(左闭右开)
vector<int> v2(v1.begin() + 1, v1.begin() + 3);
print_container(v2);
}
运行结果:
3、用n个m初始化
vector(size_t n, const T& val = T())
{
reserve(n);
for (size_t i = 0;i < n;++i)
{
push_back(val);
}
}
我们来测试一下:
在主函数中调用test_vector8():
void test_vector8()
{
//用n个m初始化
vector<string> v1(10, "1111111");
print_container(v1);
vector<int> v2(10);
print_container(v2);
}
运行结果:
运行结果没有任何问题。
我们修改一下测试数据:
void test_vector8()
{
vector<int> v3(10, 1);
print_container(v3);
}
运行结果:
这里会报错,非法的间接寻址。 它这里是匹配到迭代器区间构造上了,将InputIterator推导为int类型,它里面中的while循环里的*first是对int类型解引用,所以会产生非法间接寻址。
原因是,编译器在处理时只会找最匹配的函数进行调用,我们传的是10和1,它们的默认类型是int,调用函数模板时推出两个InputIterator都为int,挺合适的,我传的是int类型,如果调用vector(size_t n, const T& val = T())这个函数,那么我还需要隐式转换一下(将int转换为size_t),这没第一种舒服,所以编译器去调用了函数模板,这就导致出现了问题。
解决方法1:
void test_vector8()
{
vector<int> v3(10u, 1);
print_container(v3);
}
在参数10后面添加一个u,代表无符号整形(size_t)。
解决方法2:
修改构造函数,将第一个参数指定为int类型:
vector(int n, const T& val = T()) //第一个参数指定为int类型
{
reserve(n);
for (int i = 0;i < n;++i)
{
push_back(val);
}
}
六、浅拷贝问题
我们先来看一段代码:
void test_vector9()
{
vector<string> v;
v.push_back("11111111111111111");
v.push_back("11111111111111111");
v.push_back("11111111111111111");
v.push_back("11111111111111111");
print_container(v);
}
在主函数中调用test_vector9()运行结果:
结果没问题,正常打印。
现在我们修改一下测试代码的内容:
void test_vector9()
{
vector<string> v;
v.push_back("11111111111111111");
v.push_back("11111111111111111");
v.push_back("11111111111111111");
v.push_back("11111111111111111");
print_container(v);
v.push_back("11111111111111111");
print_container(v);
}
再看运行结果:
结果出现乱码了,这可不是我们期望的结果。
我们在添加第5个push_back时出现了问题,说明问题出现在扩容的地方。其实是memset这里出现了问题,我画个图来帮助大家理解:
扩容前:
扩容后:
在reserve函数中,当值复制拷贝完后,要对原来的空间(_start)进行释放,问题就出在释放身上,我们使用memcpy拷贝时,memcpy是一个字节一个字节的进行拷贝(浅拷贝),每个string中都有一个指针,指向对应的空间,memcpy拷贝给tmp时,tmp中的每个string中的指针跟旧的空间(_start)中每个string中的指针一模一样(一个字节一个字节),所以当释放旧的空间(_start)时,tmp中的string中的指针指向的空间也被释放了,这就导致了问题所在,即打印乱码。
大致就是这样一张图(画的不太好,见谅):
总结:
-
memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中。
-
如果拷贝的是内置类型的元素,memcpy既高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因memcpy是浅拷贝,可能会引起内存泄漏和程序崩溃。
如何解决这种浅拷贝带来问题呢?
当然是用深拷贝啦,请看代码:
void reserve(size_t n)
{
if (n > capacity())
{
size_t old_size = size(); //扩容前先记录数据个数
//扩容
T* tmp = new T[n]; //新开一段空间
//用for循环进行深拷贝
for (size_t i = 0;i < old_size;++i)
{
tmp[i] = _start[i]; //赋值重载,如果是内置类型也可以直接赋值
}
delete[] _start; //释放旧空间
_start = tmp; //获得新空间
_finish = _start + old_size; //改变_finish
_end_of_storage = _start + n; //改变_end_of_storage
}
}
七、源码
1、vector.h
#pragma once
#include <iostream>
#include <algorithm>
#include <assert.h>
#include <vector>
#include <string>
using namespace std;
namespace blue
{
template<class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
~vector()
{
delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
//拷贝构造
vector(const vector<T>& v)
{
reserve(v.capacity());
for (const auto& e : v)
push_back(e);
}
//赋值重载,方式1
//vector<T>& operator=(const vector<T>& v)
//{
// if (this != &v)
// {
// //方式1
// clear();
// reserve(v.capacity());
// for (const auto& e : v)
// push_back(e);
// //方式2
// //delete[] _start;
// //_start = new T[v.capacity()];
// //memcpy(_start, v._start, sizeof(T) * v.size());
// _finish = _start + v.size();
// _end_of_storage = _start + v.capacity();
// }
// return *this;
//}
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
//赋值重载,方式2
//vector<T>& operator=(vector<T> v)
//在类里面可以用类名替代类型
vector& operator=(vector v)
{
swap(v);
return *this;
}
//默认构造
//vector()
//{}
//C++11 强制生成默认构造
vector() = default;
//迭代器区间构造
//类模板的成员函数还可以继续是函数模板
template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
while (first != last)
{
push_back(*first);
++first;
}
}
//用n个m初始化构造,方式1(弃)
/*vector(size_t n, const T& val = T())
{
reserve(n);
for (size_t i = 0;i < n;++i)
{
push_back(val);
}
}*/
//用n个m初始化构造,方式2
vector(int n, const T& val = T())
{
reserve(n);
for (int i = 0;i < n;++i)
{
push_back(val);
}
}
//返回vector容器元素个数
size_t size() const
{
return _finish - _start;
}
//返回vector容器容量大小
size_t capacity() const
{
return _end_of_storage - _start;
}
//判断容器中元素是否为空,若为空返回true,否则返回false
bool empty()
{
return _start == _finish;
}
//清空容器中的数据,容量不变
void clear()
{
_finish = _start;
}
//返回下标为i位置上的值
T& operator[](size_t i)
{
assert(i < size()); //若i>=size(),说明越界了,程序就会发生断言错误
return _start[i];
}
void reserve(size_t n)
{
if (n > capacity())
{
size_t old_size = size(); //扩容前先记录数据个数
//扩容
T* tmp = new T[n]; //新开一段空间
//memcpy(tmp, _start, sizeof(T) * old_size); //旧空间的值赋给新空间
for (size_t i = 0;i < old_size;++i)
{
tmp[i] = _start[i];
}
delete[] _start; //释放旧空间
_start = tmp; //获得新空间
_finish = _start + old_size; //改变_finish
_end_of_storage = _start + n; //改变_end_of_storage
}
}
void resize(size_t n, T val = T())
{
if (n < size())
{
_finish = _start + n;
}
else
{
reserve(n);
while (_finish < _start + n)
{
*_finish = val;
++_finish;
}
}
}
//尾插
void push_back(const T& x)
{
if (_finish == _end_of_storage)
{
//扩容
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
*_finish = x;
++_finish;
}
//尾删
void pop_back()
{
assert(!empty());
--_finish;
}
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish;
}
//void insert(iterator pos,const T& x)
//{
// if (_finish == _end_of_storage)
// {
// size_t len = pos - _start; //记录相对位置
// reserve(capacity() == 0 ? 4 : capacity() * 2);
// pos = _start + len; //更新pos
// }
// iterator end = _finish - 1;
// while (end >= pos)
// {
// *(end + 1) = *end;
// --end;
// }
// *pos = x;
// ++_finish;
//}
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
--end;
}
*pos = x;
++_finish;
return pos;
}
/*void erase(iterator pos)
{
assert(pos >= _start && pos < _finish);
auto it = pos + 1;
while (it != end())
{
*(it - 1) = *it;
++it;
}
--_finish;
}*/
iterator erase(iterator pos)
{
assert(pos >= _start && pos < _finish);
auto it = pos + 1;
while (it != end())
{
*(it - 1) = *it;
++it;
}
--_finish;
return pos;
}
private:
iterator _start = nullptr;
iterator _finish = nullptr;
iterator _end_of_storage = nullptr;
};
//通用的,打印容器中数据
template<class Container>
void print_container(const Container& v)
{
//规定--不能在没有实例化的类模板里面取东西,因为编译器不能区分这里的const_iterator是类型还是静态成员变量,如果加了typename编译器就知道了这是类型而不是静态成员变量,所以编译器认为语法上没问题,所以不会报错
//typename Container::const_iterator it = v.begin();
auto it = v.begin();
while (it != v.end())
{
cout << *it << " ";
++it;
}
cout << endl;
/*for(auto e : v)
{
cout << e << " ";
}
cout << endl;*/
}
void test_vector0()
{
vector<int> v;
v.resize(10, 1);
print_container(v);
v.reserve(20); //初始空间给20
cout << v.size() << endl;
cout << v.capacity() << endl;
cout << "------------------" << endl;
//1、size() < n < capacity()
v.resize(15, 2);
print_container(v);
cout << v.size() << endl;
cout << v.capacity() << endl;
cout << "------------------" << endl;
//2、n > capacity()
v.resize(30, 100);
print_container(v);
cout << v.size() << endl;
cout << v.capacity() << endl;
cout << "------------------" << endl;
//3、n < size()
v.resize(5);
print_container(v);
cout << v.size() << endl;
cout << v.capacity() << endl;
}
void test_vector1()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
for (size_t i = 0;i < v.size();++i)
cout << v[i] << " ";
}
//void test_vector2()
//{
// vector<int> v;
// v.push_back(1);
// v.push_back(2);
// v.push_back(3);
// v.push_back(4);
// v.push_back(5);
// print_container(v);
// //在下标为0的位置上插入100
// v.insert(v.begin() + 0, 100);
// print_container(v);
//}
void test_vector2()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//v.push_back(5);
print_container(v);
//在下标为0的位置上插入100
v.insert(v.begin() + 0, 100);
print_container(v);
}
//void test_vector3()
//{
// vector<int> v;
// v.push_back(1);
// v.push_back(2);
// v.push_back(3);
// v.push_back(4);
// print_container(v);
// int x;
// cin >> x;
// auto p = std::find(v.begin(), v.end(), x); //利用库中的find函数在两个迭代区间进行查找
// if (p != v.end())
// {
// v.insert(p, 2000); //如果找到,就在该位置上插入2000
// print_container(v);
// }
// else
// {
// cout << "不存在:" << x << endl;
// }
//}
//void test_vector3()
//{
// vector<int> v;
// v.push_back(1);
// v.push_back(2);
// v.push_back(3);
// v.push_back(4);
// v.push_back(5);
// print_container(v);
// int x;
// cin >> x;
// auto p = std::find(v.begin(), v.end(), x); //利用库中的find函数在两个迭代区间进行查找
// if (p != v.end())
// {
// v.insert(p, 2000); //如果找到,就在该位置上插入2000
// (*p) *= 100;
// print_container(v);
// }
// else
// {
// cout << "不存在:" << x << endl;
// }
//}
//void test_vector3()
//{
// vector<int> v;
// v.push_back(1);
// v.push_back(2);
// v.push_back(3);
// v.push_back(4);
// //v.push_back(5);
// print_container(v);
// int x;
// cin >> x;
// auto p = std::find(v.begin(), v.end(), x); //利用库中的find函数在两个迭代区间进行查找
// if (p != v.end())
// {
// v.insert(p, 2000); //如果找到,就在该位置上插入2000
// (*p) *= 100;
// print_container(v);
// }
// else
// {
// cout << "不存在:" << x << endl;
// }
//}
void test_vector3()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
print_container(v);
int x;
cin >> x;
auto p = std::find(v.begin(), v.end(), x);
if (p != v.end())
{
//insert后p就失效,不要直接访问,要访问就要更新这个失效的迭代器的值
p = v.insert(p, 2000); //更新p
(*(p + 1)) *= 100;
print_container(v);
}
else
{
cout << "不存在:" << x << endl;
}
}
//void test_vector4()
//{
// vector<int> v;
// v.push_back(1);
// v.push_back(2);
// v.push_back(3);
// v.push_back(4);
// v.push_back(5);
// print_container(v);
// //删除所有的偶数
// auto it = v.begin();
// while (it != v.end())
// {
// if (*it % 2 == 0)
// v.erase(it);
// ++it; //it的意义发生了改变
// }
// print_container(v);
//}
//void test_vector4()
//{
// vector<int> v;
// v.push_back(1);
// v.push_back(2);
// v.push_back(3);
// v.push_back(4);
// v.push_back(4); //多插入一个4
// v.push_back(5);
// print_container(v);
// //删除所有的偶数
// auto it = v.begin();
// while (it != v.end())
// {
// if (*it % 2 == 0)
// v.erase(it);
// ++it;
// }
// print_container(v);
//}
void test_vector4()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(2);
v.push_back(3);
v.push_back(4);
print_container(v);
//删除所有的偶数
auto it = v.begin();
while (it != v.end())
{
if (*it % 2 == 0)
it = v.erase(it); //用返回值更新it
else
++it; //加一个else,这样就能删除干净,且不会发生最后一个是偶数时程序报错的问题。
}
print_container(v);
}
void test_vector5()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
print_container(v1);
vector<int> v2 = v1; //拷贝构造
print_container(v2);
}
void test_vector6()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
print_container(v1);
cout << v1.size() << endl;
cout << v1.capacity() << endl;
vector<int> v3;
v3.push_back(10);
v3.push_back(20);
v3.push_back(30);
print_container(v3);
cout << v3.size() << endl;
cout << v3.capacity() << endl;
v1 = v3;
print_container(v1);
cout << v1.size() << endl;
cout << v1.capacity() << endl;
}
void test_vector7()
{
vector<int> v1;
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
print_container(v1);
//用迭代器区间初始化,从下标为1的位置开始到下标为2的位置结束(左闭右开)
vector<int> v2(v1.begin() + 1, v1.begin() + 3);
print_container(v2);
}
//void test_vector8()
//{
// //用n个m初始化
// vector<string> v1(10, "1111111");
// print_container(v1);
// vector<int> v2(10);
// print_container(v2);
//}
//void test_vector8()
//{
// vector<int> v3(10, 1);
// print_container(v3);
//}
void test_vector8()
{
vector<int> v3(10u, 1);
print_container(v3);
}
//void test_vector9()
//{
// vector<string> v;
// v.push_back("11111111111111111");
// v.push_back("11111111111111111");
// v.push_back("11111111111111111");
// v.push_back("11111111111111111");
// print_container(v);
//}
void test_vector9()
{
vector<string> v;
v.push_back("11111111111111111");
v.push_back("11111111111111111");
v.push_back("11111111111111111");
v.push_back("11111111111111111");
print_container(v);
v.push_back("11111111111111111");
print_container(v);
}
}
2、Test.h
#include "vector.h"
int main()
{ //blue::test_vector0();
//blue::test_vector1();
//blue::test_vector2();
//blue::test_vector3();
//blue::test_vector4();
//blue::test_vector5();
//blue::test_vector6();
//blue::test_vector7();
//blue::test_vector8();
//blue::test_vector9();
return 0;
}
这里用了一个命名空间blue其目的是为了防止和C++标准库中的vector发生冲突,在类模板中的大型函数可以在类内声明类外定义(这里没有分开),小型函数可以直接在类内定义。
八、结语
本篇到这里就结束了,主要讲了vector是怎么模拟实现的,希望对大家有些许帮助,祝大家天天开心!