string模拟实现-C++
一、目标
string函数是C++中常用的库函数,在string中有许多操作函数,对于一些常用的操作函数,我们可以自己模拟实现一下。
实现的操作有:
迭代器
构造函数
拷贝构造函数
析构函数
赋值运算符重载
c_str()
size()
[ ]运算符重载
reserve(size_t n)
resize(size_t n)
push_back(char ch)
append(const char* str)
+=运算符重载
insert(size_t pos, size_t n, char ch)
erase(size_t pos, size_t len = npos)
find(char ch, size_t pos = 0)
substr(size_t pos = 0, size_t len = npos)
clear()
比较运算符重载
流插入和流输出运算符重载
二、模拟实现代码
对于string的模拟实现,我们需要自己定义一个域,然后在域中定义一个string类,接着在类里面我们需要的内置成员函数有:_size 、 _capacity 、_str 这里我先带大家看一下总体代码。
#pragma once
#include <assert.h>
namespace lwf
{
class string
{
public:
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
//迭代器左闭右开原则
//end指向字符串尾部的下一位置'\0'
iterator end()
{
return _str + _size;
}
const_iterator begin()const
{
return _str;
}
//迭代器左闭右开原则
//end指向字符串尾部的下一位置'\0'
const_iterator end()const
{
return _str + _size;
}
//构造函数
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity+1];
memcpy(_str, str, _size + 1);
}
//拷贝函数
string(const string& s1)
{
_size = s1._size;
_capacity = s1._capacity;
_str = new char[_capacity + 1];
memcpy(_str, s1._str, _size + 1);
}
模拟实现string-赋值运算符重载--老式写法
//string& operator=(const string& s)
//{
// //判断是否是给自身赋值
// if (this != &s)
// {
// char* tem = new char[s._capacity+1];
// memcpy(tem, s._str, s._size + 1);
// delete[] _str;
// _str = tem;
// _size = s._size;
// _capacity = s._capacity;
// }
// return *this;
//}
//赋值运算符重载--现代写法
void swap(string& s)
{
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
string& operator=(string tmp)
{
swap(tmp);
return *this;
}
//析构函数
~string()
{
delete[] _str;
_str = nullptr;
_size = 0;
_capacity = 0;
}
//模拟实现string- c_str()
const char* c_str()const
{
return _str;
}
// 模拟实现string - size()
size_t size()const
{
return _size;
}
//模拟实现string - []运算符重载
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
//模拟实现string - reserve(size_t n)
void reserve(size_t n)
{
if (n > _capacity)
{
cout << "reserve()->" << n << endl;
char* tmp = new char[n + 1];
memcpy(tmp, _str, _size + 1);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
//模拟实现string - resize(size_t n)
void resize(size_t n,char ch='\0')
{
if (n < _size)
{
_size = n;
_str[_size] = '\0';
}
else
{
reserve(n);
for (size_t i = _size; i < n; i++)
{
_str[i] = ch;
}
_size = n;
_str[_size] = '\0';
}
}
//模拟实现string - push_back(char ch)
void push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
//模拟实现string - append(const char* str)
void append(const char* str)
{
size_t len = strlen(str);
if (len + _size > _capacity)
{
//至少扩容到len+_size
reserve(len + _size);
}
memcpy(_str + _size, str, len);
_size = len + _size;
}
//模拟实现string - +=运算符重载
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(const char* str)
{
append(str);
return *this;
}
//模拟实现string - insert(size_t pos, size_t n, char ch)
void insert(size_t pos, size_t n, char ch)
{
assert(pos <= _size);
if (_size + n > _capacity)
{
reserve(_size + n);
}
//挪动数据
//强类型转换方法
/*int end = _size;
while (end >= (int)pos)
{
_str[end + n] = _str[end];
--end;
}*/
// 无符号整数由0减到-1是为最大整数
//当pos为0时会一直进行循环若不加入end != npos判断条件
size_t end = _size;
while (end >= pos && end != npos)
{
_str[end + n] = _str[end];
--end;
}
for (size_t i = 0; i < n; i++)
{
_str[pos + i] = ch;
}
_size += n;
}
void insert(size_t pos, const char* str)
{
assert(pos <= _size);
if (_size + strlen(str) > _capacity)
{
reserve(_size + strlen(str));
}
//挪动数据
// 无符号整数由0减到-1是为最大整数
//当pos为0时会一直进行循环若不加入end != npos判断条件
size_t end = _size;
while (end >= pos && end != npos)
{
_str[end + strlen(str)] = _str[end];
--end;
}
for (size_t i = 0; i < strlen(str); i++)
{
_str[pos + i] = str[i];
}
_size += strlen(str);
}
//模拟实现string - erase(size_t pos, size_t len = npos)
void erase(size_t pos, size_t len = npos)
{
assert(pos <= _size);
if (len == npos || pos + len >= _size)
{
_size = pos;
_str[_size] = '\0';
}
else
{
size_t begin = pos + len;
while (begin<=_size)
{
_str[pos++] = _str[begin++];
}
_size -= len;
}
}
//模拟实现string - find(char ch, size_t pos = 0)
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (int i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* str, size_t pos = 0)
{
assert(pos < _size);
int n = 0;
for (int i = pos; i < _size; i++)
{
n = 0;
for(int j=0;j<strlen(str);j++)
{
if (_str[i+j] == str[j])
{
++n;
if (n == strlen(str))
{
return i;
}
}
else
{
break;
}
}
}
return npos;
}
//模拟实现string - substr(size_t pos = 0, size_t len = npos)
string substr(size_t pos = 0, size_t len = npos)
{
assert(pos < _size);
size_t n=len;
if (len == npos || len + pos >= _size)
{
n = _size - pos;
}
string tmp;
tmp.reserve(n);
for (int i = 0; i < n; i++)
{
tmp += _str[pos + i];
}
return tmp;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
bool operator<(const string& s) const
{
int ret = memcmp(_str, s._str, _size < s._size ? _size : s._size);
// "hello" "hello" false
// "helloxx" "hello" false
// "hello" "helloxx" true
return ret == 0 ? _size < s._size : ret < 0;
}
bool operator==(const string& s) const
{
return _size == s._size
&& memcmp(_str, s._str, _size) == 0;
}
bool operator<=(const string& s) const
{
return *this < s || *this == s;
}
bool operator>(const string& s) const
{
return !(*this <= s);
}
bool operator>=(const string& s) const
{
return !(*this < s);
}
bool operator!=(const string& s) const
{
return !(*this == s);
}
private:
size_t _size;
size_t _capacity;
char* _str;
public:
const static size_t npos;
};
//无符号整数-1时为可取到的最大整数
const size_t string::npos = -1;
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch = in.get();
// 处理前缓冲区前面的空格或者换行
while (ch == ' ' || ch == '\n')
{
ch=in.get();
}
//in>>ch
char buff[128]="0";
int i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[i] = '\0';
s += buff;
i = 0;
}
//in>>ch
ch = in.get();
}
if (i != 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
};
迭代器
string函数主要用于字符串所以我们需要的是char* 类型因为迭代器常用 iterator 来表示所以这里我们建议用 typedef 来重命名一下char*,除此之外迭代器还需考虑const类型,因此我们这里也需要重定义一下const char*类型。
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
//迭代器左闭右开原则
//end指向字符串尾部的下一位置'\0'
iterator end()
{
return _str + _size;
}
const_iterator begin()const
{
return _str;
}
//迭代器左闭右开原则
//end指向字符串尾部的下一位置'\0'
const_iterator end()const
{
return _str + _size;
}
因为迭代器执行的是左闭右开原则,所以这里我们的begin()返回的是字符串的首地址置,end()返回的则是字符串尾部的下一个位置,即字符串后 ‘ \0 ’ 所在的位置。
构造函数
构造函数这里我们可以给一个默认缺省值空字符串,这里通过运用C语言的memcpy拷贝来实现构造函数。
//构造函数
string(const char* str = "")
{
_size = strlen(str);
_capacity = _size;
_str = new char[_capacity+1];
memcpy(_str, str, _size + 1);
}
拷贝构造函数
通过运用C语言的memcpy拷贝来实现。
//拷贝函数
string(const string& s1)
{
_size = s1._size;
_capacity = s1._capacity;
_str = new char[_capacity + 1];
memcpy(_str, s1._str, _size + 1);
}
析构函数
//析构函数
~string()
{
delete[] _str;
_str = nullptr;
_size = 0;
_capacity = 0;
}
赋值运算符重载
这个操作有两种形式的写法,一种是老式写法:通过memcpy拷贝来实现,一种是现代写法通过std库中的swap()函数来实现。
老式写法:
//模拟实现string-赋值运算符重载--老式写法
string& operator=(const string& s)
{
//判断是否是给自身赋值
if (this != &s)
{
char* tem = new char[s._capacity+1];
memcpy(tem, s._str, s._size + 1);
delete[] _str;
_str = tem;
_size = s._size;
_capacity = s._capacity;
}
return *this;
}
现代写法:
//赋值运算符重载--现代写法
void swap(string& s)
{
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
string& operator=(string tmp)
{
swap(tmp);
return *this;
}
现代写法这里巧妙的结合了拷贝构造函数来实现。
c_str()
主要作用是将sting类型转为C语言中的字符串类型来实现一些C上的操作
//模拟实现string- c_str()
const char* c_str()const
{
return _str;
}
size()
// 模拟实现string - size()
size_t size()const
{
return _size;
}
[ ]运算符重载
该函数的功能是返回pos位置的值.
//模拟实现string - []运算符重载
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[pos];
}
reserve(size_t n)
该函数的功能是重置空间大小。
//模拟实现string - reserve(size_t n)
void reserve(size_t n)
{
if (n > _capacity)
{
cout << "reserve()->" << n << endl;
char* tmp = new char[n + 1];
memcpy(tmp, _str, _size + 1);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
resize(size_t n)
该函数的功能是重置字符串大小,并且在赋值的n>_size是可以为后面的空间赋初始值。
//模拟实现string - resize(size_t n)
void resize(size_t n,char ch='\0')
{
if (n < _size)
{
_size = n;
_str[_size] = '\0';
}
else
{
reserve(n);
for (size_t i = _size; i < n; i++)
{
_str[i] = ch;
}
_size = n;
_str[_size] = '\0';
}
}
push_back(char ch)
该函数的功能是在字符串后新插入一个字符。
//模拟实现string - push_back(char ch)
void push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
++_size;
_str[_size] = '\0';
}
append(const char* str)
该函数的功能是在字符串后新插入一个字符串。
//模拟实现string - append(const char* str)
void append(const char* str)
{
size_t len = strlen(str);
if (len + _size > _capacity)
{
//至少扩容到len+_size
reserve(len + _size);
}
memcpy(_str + _size, str, len);
_size = len + _size;
}
+=运算符重载
该运算符重载是结合了上面两个函数来实现的。
//模拟实现string - +=运算符重载
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(const char* str)
{
append(str);
return *this;
}
insert(size_t pos, size_t n, char ch)
该函数的功能是在字符串的摸个位置插入一个字符或字符串。
//模拟实现string - insert(size_t pos, size_t n, char ch)
void insert(size_t pos, size_t n, char ch)
{
assert(pos <= _size);
if (_size + n > _capacity)
{
reserve(_size + n);
}
//挪动数据
//强类型转换方法
/*int end = _size;
while (end >= (int)pos)
{
_str[end + n] = _str[end];
--end;
}*/
// 无符号整数由0减到-1是为最大整数
//当pos为0时会一直进行循环若不加入end != npos判断条件
size_t end = _size;
while (end >= pos && end != npos)
{
_str[end + n] = _str[end];
--end;
}
for (size_t i = 0; i < n; i++)
{
_str[pos + i] = ch;
}
_size += n;
}
void insert(size_t pos, const char* str)
{
assert(pos <= _size);
if (_size + strlen(str) > _capacity)
{
reserve(_size + strlen(str));
}
//挪动数据
// 无符号整数由0减到-1是为最大整数
//当pos为0时会一直进行循环若不加入end != npos判断条件
size_t end = _size;
while (end >= pos && end != npos)
{
_str[end + strlen(str)] = _str[end];
--end;
}
for (size_t i = 0; i < strlen(str); i++)
{
_str[pos + i] = str[i];
}
_size += strlen(str);
}
erase(size_t pos, size_t len = npos)
该函数的功能是删除pos位置后长度为len的字符串如果pos+len>_size,则删除pos位置后的所有字符,若不赋len值的话默认删除pos后的所有字符。
//模拟实现string - erase(size_t pos, size_t len = npos)
void erase(size_t pos, size_t len = npos)
{
assert(pos <= _size);
if (len == npos || pos + len >= _size)
{
_size = pos;
_str[_size] = '\0';
}
else
{
size_t begin = pos + len;
while (begin<=_size)
{
_str[pos++] = _str[begin++];
}
_size -= len;
}
}
find(char ch, size_t pos = 0)
该操作的功能是从pos位置(默认值为0)后查找第一个出现 ch 的字符 或字符串str 的位置。
//模拟实现string - find(char ch, size_t pos = 0)
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (int i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* str, size_t pos = 0)
{
assert(pos < _size);
int n = 0;
for (int i = pos; i < _size; i++)
{
n = 0;
for(int j=0;j<strlen(str);j++)
{
if (_str[i+j] == str[j])
{
++n;
if (n == strlen(str))
{
return i;
}
}
else
{
break;
}
}
}
return npos;
}
substr(size_t pos = 0, size_t len = npos)
该函数的功能是返回从位置开始向后len个字符的字符串。
//模拟实现string - substr(size_t pos = 0, size_t len = npos)
string substr(size_t pos = 0, size_t len = npos)
{
assert(pos < _size);
size_t n=len;
if (len == npos || len + pos >= _size)
{
n = _size - pos;
}
string tmp;
tmp.reserve(n);
for (int i = 0; i < n; i++)
{
tmp += _str[pos + i];
}
return tmp;
}
clear()
将字符串置为空。
void clear()
{
_str[0] = '\0';
_size = 0;
}
比较运算符重载
这里的实现采用的是memcmp比较两个字符串,取两个字符串之间长度小的作为比较长度的大小。用ret来接收memcmp返回的值,若ret为0则只需比较两字符串的大小即可若不为0则判断ret<0是否是真即可。
bool operator<(const string& s) const
{
int ret = memcmp(_str, s._str, _size < s._size ? _size : s._size);
// "hello" "hello" false
// "helloxx" "hello" false
// "hello" "helloxx" true
return ret == 0 ? _size < s._size : ret < 0;
}
bool operator==(const string& s) const
{
return _size == s._size
&& memcmp(_str, s._str, _size) == 0;
}
bool operator<=(const string& s) const
{
return *this < s || *this == s;
}
bool operator>(const string& s) const
{
return !(*this <= s);
}
bool operator>=(const string& s) const
{
return !(*this < s);
}
bool operator!=(const string& s) const
{
return !(*this == s);
}
流插入和流输出运算符重载
流输出通过迭代器来实现即可。
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
流插入首先需要清空原字符串,然后这里通过in.get()来处理前缓冲区前面的空格或者换行的操作问题。
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch = in.get();
// 处理前缓冲区前面的空格或者换行
while (ch == ' ' || ch == '\n')
{
ch=in.get();
}
//in>>ch
char buff[128]="0";
int i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[i] = '\0';
s += buff;
i = 0;
}
//in>>ch
ch = in.get();
}
if (i != 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
三、结语
上述内容,即是我个人对string模拟实现的个人见解。若有大佬发现哪里有问题可以私信或评论指教一下。非常感谢各位uu们的点赞,关注,收藏,还望各位多多关照,让我们一起进步吧!