C++初阶—string类
第一章:为什么要学习string类
1.1 C语言中的字符串
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
1.2 面试题
在OJ中,有关字符串的题目基本以string类的形式出现,而且在常规工作中,为了简单、方便、快捷,基本都使用string类,很少有人去使用C库中的字符串操作函数。
第二章:标准库中的string类
2.1 string类
- 字符串是表示字符序列的类
- 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。
- string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
- string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
- 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
- string是表示字符串的字符串类
- 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
- string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator> string;
- 不能操作多字节或者变长字符的序列。
在使用string类时,必须包含#include头文件以及using namespace std;
2.2 string类的常用接口说明
1. string类对象的常见构造
函数名称 | 功能说明 |
string() (重点) | 构造空的string类对象,即空字符串 |
string(const char* s) (重点) | 用C-string来构造string类对象 |
string(size_t n, char c) | string类对象中包含n个字符c |
string(const string&s) (重点) | 拷贝构造函数 |
2. string类对象的容量操作
函数名称 | 功能说明 |
size(重点) | 返回字符串有效字符长度 |
length | 返回字符串有效字符长度 |
capacity | 返回空间总大小 |
empty (重点) | 检测字符串释放为空串,是返回true,否则返回false |
clear (重点) | 清空有效字符 |
reserve (重点) | 为字符串预留空间** |
resize (重点) | 将有效字符的个数该成n个,多出的空间用字符c填充 |
注意:
- size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()。
- clear()只是将string中有效字符清空,不改变底层空间大小。
- resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
- reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。
3. string类对象的访问及遍历操作
函数名称 | 功能说明 |
operator[] (重点) | 返回pos位置的字符,const string类对象调用 |
begin+ end | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器 |
rbegin + rend | begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器 |
范围for | C++11支持更简洁的范围for的新遍历方式 |
4. string类对象的修改操作
函数名称 | 功能说明 |
push_back | 在字符串后尾插字符c |
append | 在字符串后追加一个字符串 |
operator+= (重点) | 在字符串后追加字符串str |
c_str(重点) | 返回C格式字符串 |
find + npos(重点) | 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置 |
rfind | 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置 |
substr | 在str中从pos位置开始,截取n个字符,然后将其返回 |
注意:
- 在string尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般情况下string类的+=操作用的比较多,+=操作不仅可以连接单个字符,还可以连接字符串。
- 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。
5. string类非成员函数
函数 | 功能说明 |
operator+ | 尽量少用,因为传值返回,导致深拷贝效率低 |
operator>> (重点) | 输入运算符重载 |
operator<< (重点) | 输出运算符重载 |
getline (重点) | 获取一行字符串 |
relational operators (重点) | 大小比较 |
string类内部就是char*,为什么不直接用char*而是要封装成string类。
为了适应不同的编码(UTF-8、UTF-16、UTF-32等),从而表示不同国家的文字
接口示例
#include <iostream>
#include <string>
#include <list>
using namespace std;
void test_string1() {
string s1;
string s2("hello");
//输入 输出
cin >> s1;//C++可以按需提取,C语言只能使用固定大小的数组
cout << s1 << endl;
cout << s2 << endl;
//拼接字符串
//相比strcat,可读性更强;strcat空间不够,不能自动扩容;
//strcat要先找\0,如果字符串较长,消耗时间
string ret1 = s1 + s2;//s1+s1也可以,两个s1的内容拷贝到ret1(对象+对象)
cout << ret1 << endl;
string ret2 = s1 + "我来了";//对象+字符串
cout << ret2 << endl;
}
void test_string2() {
string s1("hello world");//直接调用构造函数
string s2 = "hello world";//构造+拷贝构造+优化,本质是隐式类型转换(单参数构造函数支持隐式类型转换)
//遍历string
for (size_t i = 0; i < s1.size(); i++)
cout << s1[i] << " ";//读
cout << endl;
for (size_t i = 0; i < s1.size(); i++)
s1[i]++;//写
cout << s1 << endl;//ifmmp!xpsme
//遍历的第二种方式:迭代器
string::iterator it = s1.begin();//iterator是在string这个类里面定义的,所以需要加string类域
while (it != s1.end()) { //end指向最后一个有效字符的后一个位置,即\0
cout << *it << " ";//读
++it;
}
cout << endl;
it = s1.begin();
//while (it < s1.end()) //这里可以改为<,但不建议
//因为迭代器是通用的,string空间是连续的,但其他数据结构不一定,比如list
while (it != s1.end()) {
*it = 'a';//写
++it;
}
cout << s1 << endl;//aaaaaaaaaaa
//链表示例
list<int> lt;
lt.push_back(1);
lt.push_back(2);
lt.push_back(3);
lt.push_back(4);
list<int>::iterator lit = lt.begin();
while (lit != lt.end()) { //链表只能用!=,不能用<
cout << *lit << " ";
++lit;
}
cout << endl;
}
void test_string3() {
string s1("hello world");
//正向遍历
string::iterator it = s1.begin();//iterator是在string这个类里面定义的,所以需要加string类域
while (it != s1.end()) { //end指向最后一个有效字符的后一个位置,即\0
cout << *it << " ";//读
++it;
}
cout << endl;
//反向遍历
//string::reverse_iterator rit = s1.rbegin();
auto rit = s1.rbegin();//rbegin的返回值就是反向迭代器,所以可以使用auto
while (rit != s1.rend()) {
cout << *rit << " ";//d l r o w o l l e h
++rit;//这里++是从后向前倒着走
}
cout << endl;
//原理:编译时编译器替换成迭代器
//读
for (auto ch : s1) //范围for不支倒序遍历。如果想修改需要引用
cout << ch << " ";
cout << endl;
//写
for (auto& ch : s1)
ch++;
cout << s1 << endl;
}
//void func(string s) //不推荐传值传参,会调用拷贝构造
void func(const string& s) {
//string::iterator it = s.begin();//迭代器支持读写,但参数有const修饰,所以报错
//string::const_iterator it = s.begin();
auto it = s.begin();
while (it != s.end()) {
//const迭代器不支持写
//*it = 'a';
cout << *it << " ";
++it;
}
cout << endl;
//string::const_reverse_iterator rit = s.rbegin();
auto rit = s.rbegin();
while (rit != s.rend()) {
cout << *rit << " ";
++rit;
}
cout << endl;
}
void test_string4() {
string s1("hello worldxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx");
func(s1);
string s2(s1);//拷贝构造
string s3(s1, 6, 5);//从下标6位置开始取5个字符
cout << s3 << endl;//world
//npos 是一个静态成员常量值,无符号整形-1(即最大值),表示“直到字符串的末尾”。
string s4(s1, 6);//从从下标6位置开始取到结束。最后一个是缺省参数npos
cout << s4 << endl;
//不使用缺省参数,也可以计算
string s5(s1, 6, s1.size() - 6);//size是字符串长度
cout << s5 << endl;
string s6(10, 'a');//用10个a初始化
cout << s6 << endl;
string s7(++s6.begin(), --s6.end());//用迭代器区间初始化
cout << s7 << endl;//aaaaaaaa
//三种赋值方法
string s8;
s8 = s7;
s8 = "xxx";
s8 = 'y';
}
void test_string5() {
string s1("hello world");
cout << s1.size() << endl;//11 size具有通用性
cout << s1.length() << endl;//11
cout << s1.capacity() << endl;//15
s1.clear();//仅清除数据,不释放空间
cout << s1.size() << endl;//0
cout << s1.capacity() << endl;//15
//为什么结尾是\0
//需要兼容C语言,而且有些场景只能调C的接口
//文件示例
string filename;
cin >> filename;
FILE* fout = fopen(filename.c_str(), "r");//fopen函数第一个参数是字符串
//const char* c_str() const; 返回一个指向数组的指针,该数组包含以 null 结尾的字符序列(即 C 字符串),表示字符串对象的当前值。
}
void test_string6() {
string s;
size_t old = s.capacity();
cout << "初始" << s.capacity() << endl;
for (size_t i = 0; i < 100; i++) {
s.push_back('x');
if (s.capacity() != old) {
cout << "扩容:" << s.capacity() << endl;
old = s.capacity();
}
}
//初始15
//扩容:31
//扩容:47
//扩容:70
//扩容:105
string s1;
//reserve价值,确定大概要多少空间,提前开辟,减少扩容,提高效率
s1.reserve(100);//申请100字符空间,但vs编译器会多开
size_t old1 = s1.capacity();
cout << "初始" << s1.capacity() << endl;
for (size_t i = 0; i < 100; i++) {
s1.push_back('x');
if (s1.capacity() != old1) {
cout << "扩容:" << s1.capacity() << endl;
old1 = s1.capacity();
}
}
//初始111
s1.reserve(10);//一般不会减小,但STL没规定。文档说明是一个不具有约束力的缩小请求
cout << s1.size() << endl;
}
void test_string7() {
string s1("hello world");
cout << s1.size() << endl;//11
cout << s1.capacity() << endl;//15
//原size < resize < 原capacity (11<13<15)
//s1.resize(13);//仅修改size
s1.resize(13, 'x');
cout << s1 << endl;//hello worldxx
cout << s1.size() << endl;//13
cout << s1.capacity() << endl;//15
//原capacity < resize (15<20)
s1.resize(20, 'x');
cout << s1 << endl;//hello worldxxxxxxxxx
cout << s1.size() << endl;//20
cout << s1.capacity() << endl;//31
//resize < 原size (5<20)
s1.resize(5);
cout << s1 << endl;//hello
cout << s1.size() << endl;//5
cout << s1.capacity() << endl;//31
//resize在string里用的并不多,这里主要为了保持接口一致性
//实际中可能遇到的示例
string s2;
s2.resize(10, '#');//开辟10字符,并用#初始化
cout << s2 << endl;//##########
cout << s2.size() << endl;//10
cout << s2.capacity() << endl;//15
s2[0]++;//越界终止程序,但更常用
s2.at(0)++;//越界可以捕获异常,程序继续执行
}
void test_string8() {
string s;
s.push_back('#');//只能插入一个字符
cout << s << endl;
s.append("hello");//append用于插入字符串
cout << s << endl;
string ss("world");
s.append(ss);
cout << s << endl;
//但+=更常用,既可以插入字符,也可以插入字符串
s += '#';
s += "world";
s += ss;
//尽量使用+=,因为+是传值返回
string ret1 = ss + '#';
string ret2 = ss + "hello";
}
void test_string9() {
string str;
string base = "The quick brown fox jumps over a lazy dog.";
str.assign(base);//将base的数据赋值给str,如果str有数据直接覆盖
cout << str << endl;
str.assign(base, 5, 10);//从下标5开始取10个字符 赋值
cout << str << endl;
}
void test_string10() {
// insert/erase/replace尽量不用,因为涉及挪动数据,效率不高
//接口设计复杂,需要时查看文档
string str("hello world");
str.insert(0, 1, 'x');//在下标0插入1个字符 x
str.insert(str.begin(), 'x');//头插
//string& erase(size_t pos = 0, size_t len = npos);
//第一个参数是下标,第二个参数是删除个数。默认参数npos表示结束
str.erase(5);//从下标5开始删到结束
string s1("hello world");
s1.replace(5, 1, "20%");//将下标5开始,后1个字符替换为20%
cout << s1 << endl;//hello20%world
//空格替换为20%
//思路:创建一个新string对象s3,遍历原string对象s2
//如果s2的字符不是空就添加到s3中,是空就添加20%
string s2("The quick brown fox jumps over a lazy dog.");
string s3;
for (auto ch : s2) {
if (ch != ' ')
s3 += ch;
else
s3 += "20%";
}
cout << s3 << endl;
//如果要求输出的是s2
s2 = s3;
s2.assign(s3);
//swap效率最差,3次深拷贝,2次赋值
//但标准库里专门为string准备了一个全局的swap(永远不会调用到需要拷贝和赋值的那个swap),所以和下方s2.swap(s3)一样
swap(s2, s3);
printf("s2:%p\n", s2.c_str());//s2:01155288
printf("s3:%p\n", s3.c_str());//s3:01153F80
s2.swap(s3);//最好的方式。该方式为交换s2和s3的指向
printf("s2:%p\n", s2.c_str());//s2:01153F80
printf("s3:%p\n", s3.c_str());//s3:01155288
}
void test_string11() {
string s1("test.cpp");
//读取文件后缀
//size_t find(char c, size_t pos = 0) const;
//找到第一个指定字符,并返回位置,第二个缺省参数0表示从头开始
//如果未找到匹配项,该函数将返回 string::npos。
size_t i = s1.find('.');
//从pos位置取len个字符
//string substr (size_t pos = 0, size_t len = npos) const;
//npos表示取到结束
string s2 = s1.substr(i);//从i位置取剩余字符
cout << s2 << endl;//.cpp
string s3("test.cpp.tar.zip");
//rfind找到倒数第一个指定字符
size_t j = s3.rfind('.');
string s4 = s3.substr(j);
cout << s4 << endl;//.zip
string s5("https://legacy.cplusplus.com/reference/string/string/rfind/");
string sub1, sub2, sub3;
size_t i1 = s5.find(':');
if (i1 != string::npos)//npos 是一个静态成员常量值,无符号整形-1(即最大值)
sub1 = s5.substr(0, i1);//协议
else
cout << "i1没有找到" << endl;
size_t i2 = s5.find('/', i1 + 3);
if (i2 != string::npos)
sub2 = s5.substr(i1 + 3, i2 - (i1 + 3));//域名 (左闭右开,右-左就是个数)
else
cout << "i2没有找到" << endl;
sub3 = s5.substr(i2 + 1);//资源名
cout << sub1 << endl;//https
cout << sub2 << endl;//legacy.cplusplus.com
cout << sub3 << endl;//reference/string/string/rfind/
}
void test_string12() {
//find_first_of 在字符串中搜索与其参数中指定的任何字符匹配的第一个字符。
string str("Please, replace the vowels in this sentence by asterisks.");
size_t found = str.find_first_of("aeiou");
while (found != string::npos) {
str[found] = '*';
found = str.find_first_of("aeiou", found + 1);
}
cout << str << endl;//Pl**s*, r*pl*c* th* v*w*ls *n th*s s*nt*nc* by *st*r*sks.
//find_first_not_of 在字符串中搜索与参数中指定的任何字符都不匹配的第一个字符。
//find_last_of 在字符串中搜索与参数中指定的任何字符匹配的最后一个字符。
}
课堂练习
1. 917. 仅仅反转字母 - 力扣(LeetCode)
class Solution {
public:
bool isLetter(char ch) {
if (ch >= 'a' && ch <= 'z')
return true;
if (ch >= 'A' && ch <= 'Z')
return true;
return false;
}
string reverseOnlyLetters(string s) {
int begin = 0, end = s.size() - 1;
while (begin < end) {
//下方while循环如果没有begin < end条件,
//且遇到没有字母的情况就会一直++
while (begin < end && !isLetter(s[begin]))//begin从左往右找字母
++begin;
while (begin < end && !isLetter(s[end]))//end从右往左找字母
--end;
swap(s[begin], s[end]);
++begin;
--end;
}
return s;
}
};
2. 387. 字符串中的第一个唯一字符 - 力扣(LeetCode)
class Solution {
public:
int firstUniqChar(string s) {
// 使用计数排序思路
//额外创建一个映射数组
int countA[26] = {0};//只有26个小写字母,用0-25映射a-z
//统计次数
for (auto ch : s)//遍历数组
countA[ch - 'a']++;//相对映射
//字符存储都是用ASCII码值,用当前字符-字符a得到差值恰好映射数组下标
//再遍历一遍,查看s数组中哪些字符在计数数组中只出现1次
for (int i = 0; i < s.size(); ++i)
//遇到计数数组存储1的第一个下标处即第一个不重复的字符
//s[i] - 'a'是s数组的字符在计数数组中的位置
if (countA[s[i] - 'a'] == 1)
return i;
return -1;
}
};
3. 字符串最后一个单词的长度_牛客题霸_牛客网
#include <cstddef>
#include <iostream>
#include <string>
using namespace std;
int main() {
string str;
getline(cin, str);//该方法遇到换行才结束
// cin >> str;//该方法的问题:只能读取到第一个空格
size_t i = str.rfind(' ');//从后往前找到第一个空格,后面的部分就是最后一个单词
if (i != string::npos)
cout << str.size() - (i + 1) << endl;//i指向空格,size指向\0;左开又开=左-(右+1);
else
cout << str.size() << endl;
}
4. 415. 字符串相加 - 力扣(LeetCode)
class Solution {
public:
string addStrings(string num1, string num2) {
int end1 = num1.size() - 1, end2 = num2.size() - 1;//size是个数,end是下标,所以size-1
string str; // 新结果字符串
int next = 0; // 进位变量
while (end1 >= 0 || end2 >= 0) {
// 不能这么取,因为上方循环条件可能出现某个end<0的情况
// int x1 = num1[end1] - '0';
int x1 = end1 >= 0 ? num1[end1] - '0' : 0; // 大于等于0才取最后字符,否则用0代替,因为加0不影响结果
int x2 = end2 >= 0 ? num2[end2] - '0' : 0;
// 新结果字符串每次循环的最后一位=原来两个老字符串最后一位+进位
int ret = x1 + x2 + next;
// 每次要调整进位
next = ret / 10; // 如果新结果>10,要进位
ret = ret % 10; // 新结果要保留的值是小于10,
//头插法
//每次得到新的结果都要插入到新字符串最前面
// str.insert(0, 1, '0' + ret);//头插要挪动数据,是N^2的算法
//用尾插加逆置提高效率
str += ('0' + ret);
--end1;
--end2;
}
// //头插法
// if (next == 1)
// str.insert(0, 1, '1');
//尾插+逆置
if (next == 1)
str += '1';
reverse(str.begin(), str.end());
return str;
}
};
第三章:string类的模拟实现
3.1 string类的模拟实现
string.h
#pragma once
#include <assert.h>
//该.h文件没有包含任何头文件也可以编译成功,
//因为.h文件是在.cpp文件中展开,而该.h文件在.cpp文件中靠后位置,并且.cpp文件中已经包含头文件
namespace bit {
class string {
public:
//模拟实现迭代器
typedef char* iterator;
typedef const char* const_iterator;
iterator begin() {
return _str;
}
iterator end() { //end指向\0,_size是字符串长度
return _str + _size;
}
const_iterator begin() const {
return _str;
}
const_iterator end() const {
return _str + _size;
}
无参构造函数
//string()
// :_str(nullptr)//这种方式会导致对空指针解引用
// ,_size(0)
// ,_capacity(0)
//{}
//下方两种初始化方式都可以
//string()
// :_str(new char[1])
// ,_size(0)
// ,_capacity(0)
//{
// _str[0] = '\0';
//}
//string()
// :_str(new char[1]{'\0'})
// , _size(0)
// , _capacity(0) {}
//带参构造函数
//string(const char* str)
// //初始化列表顺序是按照声明顺序,所以下方会先初始化_str,但此时_capacity还没有初始化,是随机值
// :_size(strlen(str))
// ,_capacity(_size)
// ,_str(new char[_capacity+1])
//{
// strcpy(_str, str);
//}
//正确版本
//string(const char* str)
// :_size(strlen(str))
// ,_capacity(_size)
//{
// _str = new char[_capacity + 1];
// strcpy(_str, str);
//}
//构造函数最理想方式是全缺省参数
//string(const char* str = '\0')//这种方式类型不匹配,\0是char类型
双引号的形式才是字符串类型,但这种方式不规范
因为C语言规定常量字符串结尾默认有\0,这样就有2个\0
//string(const char* str = "\0")
string(const char* str = "")//不要加空格,加空格_str就会有空格
//如果使用缺省参数,strlen是0;申请空间时开辟了1个字节,strcpy会把\0拷贝过去
:_size(strlen(str))
, _capacity(_size)
{
_str = new char[_capacity + 1];
strcpy(_str, str);
}
传统写法
s2(s1)
//string(const string& s) {
// _str = new char[s._capacity + 1];
// strcpy(_str, s._str);
// _size = s._size;
// _capacity = s._capacity;
//}
s2 = s3
//string& operator=(const string& s) {
// //不考虑s2空间大小,相当于让s2指向新空间
// if (this != &s) {
// char* tmp = new char[s._capacity + 1];
// strcpy(tmp, s._str);
// delete[] _str;//释放s2
// _str = tmp;//s2指向新空间
// _size = s._size;
// _capacity = s._capacity;
// }
// return *this;
//}
//现代写法
void swap(string& s) {
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
//s2(s1)
string(const string& s)
//有些编译器不会初始化内置类型,this指向的内置类型变量就有可能是随机值,
// 交换给tmp后,出了作用域,tmp要销毁,也就是调用析构函数,这个时候就会出问题
//所以需要初始化
:_str(nullptr)
, _size(0)
, _capacity(0) {
string tmp(s._str);
swap(tmp);
}
现代写法
s2 = s3
//string& operator=(const string& s) {
// //不考虑s2空间大小,相当于让s2指向新空间
// if (this != &s) {
// string tmp(s);
// swap(tmp);//this->swap(tmp)
// //s2换给个了tmp,tmp出了作用域要销毁(即调用析构函数)
// }
// return *this;
//}
//进一步优化
//s2 = s3
string& operator=(string tmp) {
//上方是传引用传参,所以还要手动调用一次拷贝构造
//这里直接传值传参解决该问题,即传参时就拷贝构造tmp
swap(tmp);
return *this;
}
~string() {
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
char& operator[](size_t pos) {
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos) const { //只读版本
assert(pos < _size);
return _str[pos];
}
size_t capacity() const {
return _capacity;
}
size_t size() const {
return _size;
}
const char* c_str() const {
return _str;
}
void reserve(size_t n) { //插入数据需要扩容,并且还可以给外部提供开辟空间的接口
if (n > _capacity) { //这里需要检查,因为外部也可能调用该函数
char* tmp = new char[n + 1];//需要多开1个空间存\0
strcpy(tmp, _str);//将原数据拷贝到新空间(strcpy会拷贝\0)
delete[] _str;//释放原数据的空间
_str = tmp;//_str指向新空间
_capacity = n;//更新新容量
}
}
void resize(size_t n, char ch = '\0') {
//分三种情况
//1. n < _size 删除
//2. _size < n < _capacity 插入
//3. n > _capacity
//1.n小于等于原字符串长度
if (n <= _size) {
_str[n] = '\0';
_size = n;
}
else { //2.n大于原字符串长度
reserve(n);//用reserve调整_capacity
while (_size < n) { //_size是字符串长度,当_size作为下标时,最后一个元素的下标是_size-1,_size指向\0
_str[_size] = ch;
++_size;
}
_str[_size] = '\0';
}
}
size_t find(char ch, size_t pos = 0) { //查找字符
for (size_t i = pos; i < _size; i++)
if (_str[i] == ch)
return i;
return npos;
}
size_t find(const char* str, size_t pos = 0) { //查找字符串
const char* p = strstr(_str + pos, str);
if (p) //如果p不为空,说明找到了
return p - _str;//用找到子串的指针(子串起始位置)减去整个字符串的起始位置就是下标
else
return npos;
}
string substr(size_t pos, size_t len = npos) {
string s;
size_t end = pos + len;
//取到结束
//如果取的len太大,超过原字符串结尾,需要对len处理
if (len == npos || pos + len >= _size) {
len = _size - pos;//这里是因为len长度太大,
end = _size;
}
s.reserve(len);
for (size_t i = pos; i < end; i++)
s += _str[i];
return s;
}
void push_back(char ch) {
//检查扩容
if (_size == _capacity)
//reserve(_capacity * 2);//如果_capacity是0,乘2还是0
reserve(_capacity == 0 ? 4 : _capacity * 2);
//尾插字符
_str[_size] = ch;
_size++;
_str[_size] = '\0';
}
void append(const char* str) {
//先计算追加字符串的长度
size_t len = strlen(str);
if (_size + len > _capacity)//等于不需要扩容,说明空间恰好满足
reserve(_size + len);
//尾插字符串
strcpy(_str + _size, str);
_size += len;
}
//追加字符和字符串更常用的还是+=
string& operator+=(char ch) {
push_back(ch);
return *this;
}
string& operator+=(const char* str) {
append(str);
return *this;
}
该版本头插有bug
//void insert(size_t pos, char ch) {
// //插入数据前要判断容量
// assert(pos <= _size);
// if (_size == _capacity)
// reserve(_capacity == 0 ? 4 : _capacity * 2);
// size_t end = _size;
// //插入数据需要挪动数据,最先从最后位置(即\0)
// //两个变量都是无符号整型,当end减到-1时其实是最大整型值,依然满足条件,从而越界
// //将end修改为int也不行,因为循环条件end >= pos这里会发生类型提升
// while (end >= pos) {
// _str[end + 1] = _str[end];
// --end;
// }
// _str[pos] = ch;
// _size++;//更新_size
//}
//正确版本-插入字符
void insert(size_t pos, char ch) {
//插入数据前要判断容量
assert(pos <= _size);
if (_size == _capacity)
reserve(_capacity == 0 ? 4 : _capacity * 2);
size_t end = _size + 1;//让end指向\0的后一位置,即插入字符后新字符串最后字符的位置
while (end > pos) { //如果是头插,end最终指向第二个元素
_str[end] = _str[end - 1];//end前一位置的值赋值给end位置
--end;
}
_str[pos] = ch;
_size++;//更新_size
}
该版本头插有bug,参考上方插入字符函数
//void insert(size_t pos, const char* str) {
// assert(pos < _size);
// size_t len = strlen(str);
// if (_size + len > _capacity) //先判断是否需要扩容
// reserve(_size + len);
// //挪动数据
// size_t end = _size;
// while (end >= pos) { //end==pos时,还会再--,等于-1时其实是最大整型值,依然满足条件,从而越界
// _str[end + len] = _str[end];
// --end;
// }
// strncpy(_str + pos, str, len);//被插入字符串拷贝进原字符串。不能用strcpy,会拷贝\0
// _size += len;
//}
//正确版本-插入字符串
void insert(size_t pos, const char* str) {
assert(pos < _size);
size_t len = strlen(str);
if (_size + len > _capacity) //先判断是否需要扩容
reserve(_size + len);
//挪动数据
size_t end = _size + len;//end指向插入字符串后,新字符串最后字符的位置
while (end > pos) {
_str[end] = _str[end - len];//end-len就是原字符串最后字符位置
--end;
}
strncpy(_str + pos, str, len);//被插入字符串拷贝进原字符串。不能用strcpy,会拷贝\0
_size += len;
}
void erase(size_t pos, size_t len = npos) {
assert(pos < _size);
//1.如果指定位置开始删除的长度等于字符串结尾 or 长度等于默认值npos
if (len == npos || pos + len >= _size) {
_str[pos] = '\0';
_size = pos;
}
else {
size_t begin = pos + len;//begin指向删除部分的后一字符
while (begin <= _size) { //从begin位置开始,把之后的字符向前挪动,包括_size指向的\0
_str[begin - len] = _str[begin];//begin-len就是pos位置
begin++;
}
_size -= len;
}
}
//运算符重载
bool operator<(const string& s) const {
return strcmp(_str, s._str) < 0;
}
bool operator==(const string& s) const {
return strcmp(_str, s._str) == 0;
}
bool operator<=(const string& s) const {
return *this < s || *this == s;
}
bool operator>(const string& s) const {
return !(*this <= s);
}
bool operator>=(const string& s) const {
return !(*this < s);
}
bool operator!=(const string& s) const {
return !(*this == s);
}
void clear() {
_str[0] = '\0';
_size = 0;
}
private:
char* _str;
size_t _size;
size_t _capacity;
public:
const static size_t npos;
//const static size_t npos = -1;//const静态整型变量可以在这里初始化,其他类型都不可以
};
const size_t string::npos = -1;
//流插入、流提取不是一定要写成友元。写成友元的目的是访问私有
ostream& operator<<(ostream& out, const string& s) {
这里还不能使用范围for,因为string对象被const修饰,所以需要有const修饰的迭代器
//for (size_t i = 0; i < s.size(); i++)
// out << s[i];
//return out;
//添加有const修饰的迭代器后,可以使用范围for
for (auto ch : s)
out << ch;
return out;
}
该版本需要多次扩容
//istream& operator>>(istream& in, string& s) {
// s.clear();//接收数据前,要清理原对象中的数据,这样才和库里面实现的一致
// char ch;
// //in >> ch;//cin和scanf一样获取不到空格和换行,所以导致下方就没有空格和换行导致死循环
// ch = in.get();//istream提供的get类似于C语言的getchar
// while (ch != ' ' && ch != '\n') {
// s += ch;
// //in >> ch;
// ch = in.get();
// }
// return in;
//}
//该版本输入多少就开辟多少
istream& operator>>(istream& in, string& s) {
s.clear();
char buff[129];
size_t i = 0;
char ch;
ch = in.get();
while (ch != ' ' && ch != '\n') {
buff[i++] = ch;
if (i == 128) { //129个元素,下标是0~128
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i != 0) {
buff[i] = '\0';
s += buff;
}
return in;
}
void test_string1() {
string s1("hello world");
cout << s1.c_str() << endl;
string s2;
cout << s2.c_str() << endl;
//三种遍历方式
//1.[]运算符重载
for (size_t i = 0; i < s1.size(); i++)
cout << s1[i] << " ";
cout << endl;
//2.迭代器
string::iterator it = s1.begin();
while (it != s1.end()) {
cout << *it << " ";
++it;
}
cout << endl;
//3.范围for (范围for的底层就是迭代器)
for (auto ch : s1)//ch的改变不影响s1,如果要ch改变能影响到s1,那么ch就要引用
cout << ch << " ";
cout << endl;
}
void test_string2() {
string s1("hello world");
cout << s1.c_str() << endl;//hello world
s1.push_back(' ');
s1.append("hello bit");
cout << s1.c_str() << endl;//hello world hello bit
s1 += '#';
s1 += "**********";
cout << s1.c_str() << endl;//hello world hello bit#**********
}
void test_string3() {
string s1("hello world");
cout << s1.c_str() << endl;//hello world
s1.insert(5, '%');
cout << s1.c_str() << endl;//hello% world
s1.insert(0, '%');
cout << s1.c_str() << endl;//%hello% world
}
void test_string4() {
string s1("hello world");
string s2("hello world");
cout << (s1 >= s2) << endl;//1
s1[0] = 'z';
cout << (s1 >= s2) << endl;//1
cout << s1 << endl;
cin >> s1;
cout << s1 << endl;
}
void test_string5() {
string s1("hello world");
s1.insert(5, "abc");
cout << s1 << endl;//helloabc world
s1.insert(0, "xxx");
cout << s1 << endl;//xxxhelloabc world
s1.erase(0, 3);
cout << s1 << endl;//helloabc world
s1.erase(5, 100);
cout << s1 << endl;//hello
s1.erase(2);
cout << s1 << endl;//he
}
void test_string6() {
string s1("hello world");
s1.resize(5);
cout << s1 << endl;
s1.resize(15, 'x');
cout << s1 << endl;
}
void test_string7() {
string s1("test.cpp");
string s5("https://legacy.cplusplus.com/reference/string/string/rfind/");
string sub1, sub2, sub3;
size_t i1 = s5.find(':');
if (i1 != string::npos)//npos 是一个静态成员常量值,无符号整形-1(即最大值)
sub1 = s5.substr(0, i1);//协议
else
cout << "i1没有找到" << endl;
size_t i2 = s5.find('/', i1 + 3);
if (i2 != string::npos)
sub2 = s5.substr(i1 + 3, i2 - (i1 + 3));//域名 (左闭右开,右-左就是个数)
else
cout << "i2没有找到" << endl;
sub3 = s5.substr(i2 + 1);//资源名
cout << sub1 << endl;//https
cout << sub2 << endl;//legacy.cplusplus.com
cout << sub3 << endl;//reference/string/string/rfind/
}
void test_string8() {
string s1("hello world");
string s2 = s1;//这里是拷贝构造
cout << s1 << endl;
cout << s2 << endl;
string s3("xxxxxxxxx");
s2 = s3;
cout << s2 << endl;
cout << s3 << endl;
}
void test_string9() {
string s1;
cin >> s1;
cout << s1 << endl;
cout << "size " << s1.size() << endl;
cout << "capacity " << s1.capacity() << endl;
}
}
string.cpp
#include <iostream>
#include <vector>
#include <list>
#include <string>
using namespace std;
#include "string.h"
int main() {
//bit::test_string1();
//bit::test_string2();
//bit::test_string3();
//bit::test_string4();
//bit::test_string5();
//bit::test_string6();
//bit::test_string7();
//bit::test_string8();
//bit::test_string9();
string s1;
cout << s1.capacity() << endl;//15
string s2("hello world");
cout << s2.capacity() << endl;//15
cout << sizeof(s1) << endl;//28
cout << sizeof(s2) << endl;//28
//标准库设计
//小于16,字符串存到buff数组里面
//大于等于16,存在_str指向的空间
//这种设计避免碎片空间
//_buff[16]
//_str
//_size
//_capacity
return 0;
}
3.2 浅拷贝
浅拷贝:也称位拷贝,编译器只是将对象中的值拷贝过来。如果对象中管理资源,最后就会导致多个对象共享同一份资源,当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该资源已经被释放,以为还有效,所以当继续对资源进项操作时,就会发生发生了访问违规。
3.3 深拷贝
如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。
int main() {
//浅拷贝问题
//1.析构两次
//解决方案:使用引用计数,记录有几个对象指向这块空间
//拷贝的时候要++引用计数
//析构的时候要--引用计数,引用计数减到0时,说明是最后一个对象,再释放。
//2.一个修改数据会影响另一个
//引用计数写时拷贝,延迟拷贝。(写的时候才拷贝,且需要修改引用计数)
return 0;
}
3.4 写时拷贝
写时拷贝就是一种拖延症,是在浅拷贝的基础之上增加了引用计数的方式来实现的。
引用计数:用来记录资源使用者的个数。在构造时,将资源的计数给成1,每增加一个对象使用该资源,就给计数增加1,当某个对象被销毁时,先给该计数减1,然后再检查是否需要释放资源,如果计数为1,说明该对象时资源的最后一个使用者,将该资源释放;否则就不能释放,因为还有其他对象在使用该资源。