当前位置: 首页 > article >正文

★ C++基础篇 ★ string类的实现

Ciallo~(∠・ω< )⌒☆ ~ 今天,我将继续和大家一起学习C++基础篇第五章下篇----string类的模拟实现 ~

上篇:★ C++基础篇 ★ string类-CSDN博客

C++基础篇专栏:★ C++基础篇 ★_椎名澄嵐的博客-CSDN博客

目录

一 基础结构

二 迭代器

三 各种接口

3.1 功能接口

3.2 插入相关接口

3.3 删除相关接口

3.4 查找相关接口

3.5 拷贝构造(深拷贝)& 赋值

3.6 其他接口


一 基础结构

首先,浅写一个基本的string类,但会有几个问题~

// string.h
namespace zmcl
{
	class string
	{
	public:
		string() // 无参构造
			:_str(nullptr)   // 问题2
			,_size(0)
			,_capacity(0)
		{}

		string(const char* str) // 带参构造
		{
			_size = strlen(str);
			_capacity = _size; // _capacity不包含'/0'
			_str = new char[_capacity + 1];
			strcpy(_str, str);
		}

        const char* c_str() // 获取字符串
        {
	        return _str;
        }

        ~string() // 析构
        {
	        delete[] _str;
	        _str = nullptr;
	        _size = _capacity = 0;
        }

	private:
		char* _str;
		size_t _size;
		size_t _capacity;
	};

    void test_string1()     // 问题1
    {
	    string s1;
	    string("hello zmcl");
    }
}
// string.cpp
#include"string.h"
//.....

//test.cpp
#include"string.h"
int main()
{
	zmcl::test_string1();

	return 0;
}

问题1:以上程序在运行时会报一个链接错误

因为头文件会在两个.cpp文件中分别展开,类中的函数会因为内联,不会放入符号表中,不会报错。但类外的全局函数test_string1,会在两个cpp文件中各有一份,导致重定义。

两个解决方法:

  • 改为static void test_string1()
  • 声明定义分离

问题2:

void test_string1()
{
	string s1;
	string s2("hello zmcl");
	cout << s1.c_str() << endl;
	cout << s2.c_str() << endl;
}

此时程序会报错,因为类中的无参构造用了初始化列表,_str为空指针,并没有自带 '\0' ,而在获取字符串的时候,遇到' \0' 才会返回,所以,无参构造应该为:

string()
	:_str(new char[1] {'\0'})
	, _size(0)
	, _capacity(0)
{}

那~可不可以把有参和无参构造合并一下呢~

string(const char* str = "") // 给空会自带 \0
{
	_size = strlen(str);
	_capacity = _size; // _capacity不包含'/0'
	_str = new char[_capacity + 1];
	strcpy(_str, str); // 先拷贝后判断,\0也会拷贝
}

最后的基本结构为~~

namespace zmcl
{
	class string
	{
	public:
		string(const char* str = "") // 给空会自带 \0
		{
			_size = strlen(str);
			_capacity = _size; // _capacity不包含'/0'
			_str = new char[_capacity + 1];
			strcpy(_str, str); // 先拷贝后判断,\0也会拷贝
		}

		const char* c_str()
		{
			return _str;
		}

		size_t size() const
		{
			return _size;
		}

		size_t capacity() const
		{
			return _capacity;
		}

		char& operator[](size_t pos)
		{
			assert(pos < _size);
			return _str[pos];
		}

		const char& operator[](size_t pos) const
		{
			assert(pos < _size);
			return _str[pos];
		}

		~string()
		{
			delete[] _str;
			_str = nullptr;
			_size = _capacity = 0;
		}

	private:
		char* _str;
		size_t _size;
		size_t _capacity;
	};
}

二 迭代器

class string
{
public:
	typedef char* iterator;
	typedef const char* const_iterator;

	iterator begin()
	{
		return _str;
	}

	iterator end()
	{
		return _str + _size;
	}

	const_iterator begin() const
	{
		return _str;
	}

	const_iterator end() const
	{
		return _str + _size;
	}

	//...
}

有了迭代器,就可以使用迭代器遍历和范围for遍历了~

三 各种接口

3.1 功能接口

  • reserve
void string::reserve(size_t n)
{
	if (n > _capacity)
	{
		char* tmp = new char[n + 1]; //开新数组
		strcpy(tmp, _str); // 拷贝原数组
		delete[] _str; // 删除原数组
		_str = tmp; // 指向新数组
		_capacity = n;
	}
}

3.2 插入相关接口

  • push_back 尾插字符
void string::push_back(char ch)
{
	if (_size == _capacity) // 扩容
	{
		reserve(_capacity == 0 ? 4 : _capacity * 2);
	}
	_str[_size] = ch;
	++_size;
    _str[_size] = '\0'; // 兼容C
}

空扩4,非空扩2倍~

最后位置要加 \0 ,不然会出现乱码~

  • append 尾插字符串
void string::append(const char* str)
{
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{
		// 大于2倍开多少给多少   不够2倍按2倍开
		reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
	}
	strcpy(_str + _size, str);
	_size += len;
}

  • operator+= 尾插
string& string::operator+=(char ch)
{
	push_back(ch);
	return *this;
}

string& string::operator+=(const char* str)
{
	append(str);
	return *this;
}

测试一下~

  • insert 指定位置插字符
void string::insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size == _capacity) // 扩容
	{
		reserve(_capacity == 0 ? 4 : _capacity * 2);
	}
	// 挪数据
	size_t end = _size;
	while (end >= pos)// pos~end位置的值往后移一格
	{
		_str[end + 1] = _str[end];
		--end;
	}
	_str[pos] = ch;
}

上程序在头插时会出大问题,end作为一个无符号整数,和另一个无符号整数pos比较时,end 不会减到负数,就算end改为int类型,比较时也会隐式类型转换,变为无符号整数。

两个解决方法:

  • 比较时强转
while (end >= (int)pos)
  • 使end指向\0后一个位置
void string::insert(size_t pos, char ch)
{
	assert(pos <= _size);
	if (_size == _capacity) // 扩容
	{
		reserve(_capacity == 0 ? 4 : _capacity * 2);
	}
	// 挪数据
	size_t end = _size + 1; // 使end指向\0后一个位置
	while (end > pos) // pos~end-1 位置的值往后移一格
	{
		_str[end] = _str[end - 1];
		--end;
	}
	_str[pos] = ch;
}

  • insert 指定位置插字符串
void string::insert(size_t pos, const char* str)
{
	assert(pos <= _size);
	size_t len = strlen(str);
	if (len == 0) // 0直接返回
		return; 
	// 扩容
	if (_size + len > _capacity)
	{
		// 大于2倍开多少给多少   不够2倍按2倍开
		reserve(_size + len > 2 * _capacity ? _size + len : 2 * _capacity);
	}
	// 挪数据
	size_t end = _size + len;
	while (end > pos + len - 1)
	{
		_str[end] = _str[end - len];
		--end;
	}
	// 填数据
	for (size_t i = 0; i < len; i++)
	{
		_str[pos + i] = str[i];
	}
	_size += len;
}

3.3 删除相关接口

  • erase 删除一段
// string.h
// 声明时给默认
void erase(size_t pos, size_t len = npos);
static const size_t npos;

// string.cpp
const size_t string::npos = -1;
// 定义时给不给默认
void string::erase(size_t pos, size_t len)
{
	if (len > _size - pos)// pos后全删
	{
		_str[pos] = '\0';
		_size = pos;
	}
	else // 删了中间一段
	{
		for (size_t i = pos + len; i < _size; i++) // 往前调
		{
			_str[i - len] = _str[i];
		}
		_size -= len;
		_str[_size] = '\0';
	}
}

3.4 查找相关接口

  • find 查找字符或字符串
// string.h 声明
size_t find(char ch, size_t pos = 0);
size_t find(const char* str, size_t pos = 0);
// string.cpp 定义
size_t string::find(char ch, size_t pos)
{
	for (size_t i = 0; i < _size; i++)
	{
		if (_str[i] == ch)
			return i;
	}
	return npos;
}
size_t string::find(const char* str, size_t pos)
{
	assert(pos < _size);
	const char* ptr = strstr(_str + pos, str);
	if (str == nullptr)
		return npos;
	else
		return ptr - _str;
}

  • substr 查找子串
// string.h 声明
string substr(size_t pos = 0, size_t len = npos);
// string.cpp 定义
string string::substr(size_t pos, size_t len)
{
	assert(pos < _size);
	if (len > _size - pos) // 取到结尾的情况
	{
		len = _size - pos; // len大于剩余字符长度,更新len
	}
	string sub;
	sub.reserve(len);
	for (size_t i = 0; i < len; i++)
	{
		sub += _str[pos + i];
	}
	return sub;
}

我们小测一下这三个查找接口~

void test_string()
{
	string s("zmcl.cpp.zip");
	size_t pos = s.find(".");
	string suffix = s.substr(pos);
	cout << suffix.c_str() << endl;
}

报错了了了!!!>_<

此时因为没有手写拷贝构造编译器使用了浅拷贝,sub出函数会销毁,release版本下进行了优化suffix直接充当了sub,故不会报错~

但是程序还需要改进~(加拷贝构造~

3.5 拷贝构造(深拷贝)& 赋值

以下程序使用了浅拷贝在debug 和 release版本下都会崩~

void test_string()
{
	string s("zmcl.cpp.zip");
	string copy(s);
	cout << copy.c_str() << endl;
}

  • 手写深拷贝~
// s2(s1) s2-this s1-s
string(const string& s)
{
	_str = new char[s._capacity + 1];
	strcpy(_str, s._str);
	_size = s._size;
	_capacity = s._capacity;
}

加完以后就不会报错辣~

当然还有更简单的写法!直接创一个新的,再交换给this~

void swap(string& s)
{
	std::swap(_str, s._str);
	std::swap(_size, s._size);
	std::swap(_capacity, s._capacity);
}
// s2(s1) s2-this s1-s
string(const string& s)
{
	string tmp(s._str);
	swap(tmp);
}

此时s为空会出现随机值,需要在类里给初始值~

private:
	char* _str = nullptr;
	size_t _size = 0;
	size_t _capacity = 0;

  • 赋值

不手动写赋值也会出问题,甚至会发生内存泄漏~

// s2 = s1 s2-this s1-s
string& operator=(const string& s)
{
	if (this != &s) // 防止自己给自己赋值,直接返回~
	{
		delete[] _str; // 预防浪费空间,直接删除原空间
		_str = new char[s._capacity + 1]; // 开辟新空间
		strcpy(_str, s._str);
		_size = s._size;
		_capacity = s._capacity;
	}
	return *this;
}

赋值也可以使用现代写法~让tmp当黑奴()

// s2 = s1 s2-this s1-s
string& operator=(const string& s)
{
	if (this != &s)
	{
		string tmp(s);
		swap(tmp);
	}
	return *this;
}

 甚至还能再简化~

string& operator=(string tmp)
{
	swap(tmp);
	return *this;
}

3.6 其他接口

  • operator 比较 

operator 系列写两个,其他复用~ 

bool operator<(const string& s1, const string& s2)
{
	return strcmp(s1.c_str(), s2.c_str()) > 0;
}
bool operator>(const string& s1, const string& s2)
{
	return !(s1 <= s2);
}
bool operator<=(const string& s1, const string& s2)
{
	return s1 < s2 || s1 == s2;
}
bool operator>=(const string& s1, const string& s2)
{
	return s1 > s2 || s1 == s2;
}
bool operator==(const string& s1, const string& s2)
{
	return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool operator!=(const string& s1, const string& s2)
{
	return !(s1 == s2);
}
  •  io流 
ostream& operator<<(ostream& out, const string& s)
{
	for (auto ch : s)
	{
		out << ch;
	}
	return out;
}
istream& operator>>(istream& in, string& s)
{
	s.clear();// 防止s中本来有数据
    // 防止扩容过度
	const int N = 256;
	// buff是临时数组,不会永久存在,并且栈中开空间很快
	char buff[N]; 
	int i = 0;

	char ch;
	in >> ch;
	while (ch != ' ' && ch != '\n')
	{
		// 先传到buff数组,满了则+=到s并重置i
		buff[i++] = ch;
		if (i == 255)
		{
			buff[i] = '\0';
			s += buff;
			i = 0;
		}
		// in >> ch; 这样写遇到空格不会停止
		ch = in.get();
	}
	// 若buff中还有内容
	if (i > 0)
	{
		buff[i] = '\0';
		s += buff;
	}
	return in;
}

~完~


http://www.kler.cn/a/306128.html

相关文章:

  • 一些elasticsearch重要概念与配置参数
  • JVM对象分配内存如何保证线程安全?
  • VLM--CLIP作分类任务的损失函数
  • LabVIEW电机控制中的主动消抖
  • JVM性能优化一:初识内存泄露-内存溢出-垃圾回收
  • 安装milvus以及向量库增删改操作
  • Python实现pdf转图片、转文字、去水印
  • 房产销售系统开发:SpringBoot技术要点
  • 避免 PyCharm 将该 Python 脚本作为测试运行
  • 串口数据波形显示工具对比
  • k8s service如何实现流量转发
  • Python 课程10-单元测试
  • 基于 TDMQ for Apache Pulsar 的跨地域复制实践
  • 2024.9.14 Python与图像处理新国大EE5731课程大作业,马尔可夫随机场和二值图割,校正立体图像的深度
  • 攻击者如何在日常网络资源中隐藏恶意软件
  • rust + bevy 实现小游戏 打包成wasm放在浏览器环境运行
  • Vue3使用Websocket进行跨页面通信
  • 2024年金九银十最新版Java面试题及答案整理(持续更新)
  • 从单体到微服务:FastAPI ‘挂载’子应用程序的转变
  • AI在医学领域:医学AI的安全与隐私全面概述
  • 【iOS】ViewController的生命周期
  • Linux06(vi/vim)
  • 【Python机器学习】循环神经网络(RNN)——超参数
  • 什么是Java 语法糖?
  • ARM驱动学习之8 动态申请字符类设备号
  • sqli-labs Basic Challenge Less_1 通关指南