当前位置：首页 > article >正文

C++：模拟实现vector

article 2025/1/18 15:47:51

成员变量与迭代器

size

capacity

empty

迭代器有关函数

实现默认成员函数的前置准备

reserve

编辑

push_back

构造函数

无参构造

迭代器区间构造

n个val来进行构造

析构函数

拷贝构造函数

赋值重载

增删查改

clear

resize

pop_back

insert

erase

重载[]

print_Container

成员变量与迭代器

我们还是需要在一个命名空间里模拟实现vector，防止和标准库里的起冲突。

namespace zh
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

    private:
	    iterator _start = nullptr;
	    iterator _finish = nullptr;
	    iterator _end_of_storage = nullptr;
    };
}

解释说明：

1.vector是一个非常通用的容器，是一个动态大小的数组，可以存储任意类型的元素，并且能够自动调整大小以适应元素的添加和删除。所以我们的模拟实现要写成类模板。

2.vector可以看做顺序表的升级，但是模拟实现vector跟我们以往实现顺序表有所不同，顺序表是使用一个动态开辟的数组、数组有效元素个数size和数组容纳最大有效数据的个数capacity维护的，而模拟实现vector需要三个（模板参数）T* 类型的指针，而vector的迭代器功能恰恰又和T*类型指针类似，所以干脆把T*封装成迭代器。当然迭代器需要有两个版本，普通版本和const版本。

3.参数的含义

_start指向数组首元素，_finish指向最后一个有效元素的下一个位置， _end_of_storage指向数组空间末尾。

通过三个指针也可以模拟出size和capacity的功能。

size

返回有效数据个数的函数。

size_t size() const
{
	return _finish - _start;
}

capacity

返回数组最大容纳有效数据个数（容量大小）的函数。

size_t capacity() const
{
	return _end_of_storage - _start;
}

empty

判断数组是否为空，判断_start与_finish是否相等即可。

bool empty() const
{
	return _finish == _start;
}

迭代器有关函数

主要实现begin函数和end函数。

iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

const_iterator begin() const
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

实现默认成员函数的前置准备

reserve

用于vector数组空间不足时扩容的函数（扩容成n个空间）。

void reserve(size_t n)
{
	if (n > capacity())                        //n大于数组容量才扩容
	{
		size_t oldsize = size();               //用oldsize避免新_start和老_finish的问题
                                                
		T* tmp = new T[n];
		//memcpy(tmp, _start, size() * sizeof(T));  //这里是浅拷贝，如果是内置类型，没问题 
                                                    //如果vector存的是自定义类型，就是大坑
		for (size_t i = 0; i < oldsize; ++i)
		{
			tmp[i] = _start[i];
		}
		delete _start;                 //这里delete_start，_finish 和_end_of_storage是野指针

		//更新成员变量
		_start = tmp;
		_finish = tmp + oldsize;               
		_end_of_storage = tmp + n;
	}
}

reserve有几个问题需要注意：

1.开空间的时候要使用new而不要用malloc，因为malloc只是去开空间，不会去调用构造函数。

2.新_start和_finish的问题。

错误示范。

将原有数据拷贝到新空间后，释放了旧空间的资源，_strat指向了新的空间，但是_finish和_end_of_storage还是指向旧空间，这两个指针就变成野指针了。而最关键的是_finish不能被正确赋值。

3.memcpy浅拷贝问题

memcpy(tmp, _start, size() * sizeof(T));

memcpy是浅拷贝，如果vector存的是内置类型，那么浅拷贝就没有问题，如果存的是自定义类型，那浅拷贝就是个大坑。假如vector存的是string类型，那么扩容时，将数据从旧空间拷贝到新空间时，因为是浅拷贝，所以两个空间里的string的_str是同一个地址，释放旧空间的时候就连带这把新空间的资源也释放了。

这样就扩容失败了，因为你把原空间的数据丢失了，而且搞不好有可能程序还会崩溃。

要解决这个问题，我们就得手动实现深拷贝，因为new出来的空间如果是自定义类型的话就自动调用构造函数初始化了，所以这里走的是赋值重载来实现深拷贝。

push_back

用于在数组末尾尾插一个元素的函数。

void push_back(const T& x)
{
	//插入之前先判断空间是否足够
    if (_finish == _end_of_storage)
	{
		reserve(capacity() == 0 ? 4 : 2 * capacity());
	}

    //插入元素，更新_finish
	*_finish = x;
	_finish++;
}

构造函数

vector的构造函数我们实现无参构造、迭代器区间构造和n个val构造。

无参构造

无参构造其实我们并不需要写，因为已经在成员变声明时给了缺省值，编译器自动生成的无参构造函数走初始化列表满足需求了。但是由于我们写了其他构造函数，编译器就不自动生成了。

这里时候可以自己写无参构造，也可以用default强制编译器生成（C++11的用法）。

//构造
/*vector()
{}*/

//c++11 强制生成构造
vector() = default;

迭代器区间构造

//类模板的成员函数，还可以继续是函数模版
template<class InputIerator>
vector(InputIerator first, InputIerator last)
{
	while (first != last)
	{
		push_back(*first);	
		++first;
	}
}

这里给这个函数再套一层模板是为了让vector不仅能用vector的迭代器区间构造，还能用其他容器（list、string等）的迭代器来进行构造。

这里又有个问题，就是while循环判断条件的!=不能改成<，因为<对于vector的迭代器时可以的，但是对于其他容器的迭代器，如list，last不一定比first要大。

n个val来进行构造

vector(size_t n, const T& val = T())
{
	//先开好空间
	reserve(n);
	for (size_t i = 0; i < n; ++i)
	{
		push_back(val);
	}
}

使用的时候val可能不传参，所以要给缺省值。

因为val的类型不确定，可能是内置类型，也可能是自定义类型。

在不传参使用缺省值时

对于自定义类型，比如strng，先调用构造函数构造一个匿名对象，再拷贝构造给val。（编译器会优化，直接对val进行构造），这样val就有了缺省值。

对于内置类型，本来是没有构造函数的说法的，但是为了适应这里，也支持类似类那种使用构造函数初始化的方式。

int a = int();
int b = int(2);
int c(3);
cout << a << endl;
cout << b << endl;
cout << c << endl;

析构函数

直接delete就可以了，把三个迭代器置空。

//析构
~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage = nullptr;
	}
}

拷贝构造函数

先开好空间，然后尾插就可以了。

//拷贝构造
vector(const vector<T>& v)
{
	reserve(v.size());
	for (auto& e : v)
	{
		push_back(e);
	}
}

赋值重载

首先实现一个交换函数，然后传值调用，将两个对象交换即可。

//void swap(vector& v) 可以这样写
void swap(vector<T>& v) 
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

增删查改

clear

不需要真的删除，直接将更改_finish的值即可。

void clear()
{
	_finish = _start;
}

resize

控制有效数据个数。

若n < size，直接将_finish更改为_start + n即可。
若_size < n < capacity或者n > capacity，直接扩容成n个空间（空间足够就不会扩容），从_finish拷贝足够数量的val即可。

void resize(size_t n, T val = T())
{
	if (n < size())
	{
		_finish = _start + n;
	}
	else
	{
		reserve(n);
		while (_finish != _start + n)           
		{
			*_finish = val;
			++_finish;
		}
	}
}

pop_back

先判断数组是否为空，尾删一个元素，_finish-- 即可。

void pop_back()
{
	//判断下数组是否为空
	assert(!empty());
	--_finish;
}

insert

在pos位置插入一个元素。

iterator insert(iterator pos, const T& x) //pos不会为0，因为是有效的迭代器
{
	assert(pos >= _start);
	assert(pos <= _finish);

	if (_finish == _end_of_storage)                   //涉及到扩容，pos会失效，pos指向原来的空间
	{
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : 2 * capacity());
		pos = _start + len;
	}
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		--end;
	}

	//插入元素，更新
	*pos = x;
	++_finish;
	return pos;
}

注意的问题：

1.如果插入涉及到了扩容，要提前把pos相对于首元素的相对长度记录下来，扩容完毕后，更新pos。因为扩容会导致pos失效。

2.插入之后要返回新元素的迭代器。（这里其实也算迭代器是失效了，因为pos指向的元素发生了更改，迭代器失效了就不要在使用了。）

erase

删除pos位置的元素，删除完后返回删除元素下一位置的迭代器。

iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);

	iterator it = pos + 1;
	while (it != end())
	{
		*(it - 1) = *it;
		++it;
	}
	--_finish;

	return pos;
}

抛出一个问题，利用迭代器删除vector中所有的偶数。

错误做法

auto it = v.begin();
while (it != v.end())
{
	if (*it % 2 == 0)
	{
		it = v.erase(it);
	}
    
	it++；		
}

删完一个偶数后，it已经是下一元素的迭代器了，it不需要++了。

正确做法

auto it = v.begin();
while (it != v.end())
{
	if (*it % 2 == 0)
	{
		it = v.erase(it);
	}
	else
	{
		++it;
	}
}

重载[]

为了方便访问和修改数组中的元素。

T& operator[](size_t i)
{
	assert(i < size());
	return _start[i];
}

const T& operator[](size_t i) const
{
	assert(i < size());
	return _start[i];
}

print_Container

通用打印容器函数，套一层模板即可。

注意：


template<class Container>
void print_Container(const Container& v)
{
	//typename vector<T>::const_iterator it = v.begin();   //typename标定为类型                          
    //从没有实例化的类模板取出来的可能是类型或者成员变量，编译器无法区分
	auto it = v.begin();                       

	while (it != v.end())
	{
		cout << *it << ' ';
		++it;
	}
	cout << endl;

	/*for (auto num : v)
	{
		cout << num << ' ';
	}
	cout << endl;*/
}

从未实例化的类取出来的有可能是类型或者成员变量，要加关键字typename告诉编译器是类型，不加的话会发生编译错误。

当然直接用auto更方便。

拜拜，下期再见😏

摸鱼ing😴✨🎞