当前位置：首页 > article >正文

[原创](Modern C++)现代C++的关键性概念: std::span, 低内存开销的方式来操作大数据.

article 2025/2/24 1:42:59

[作者]
常用网名: 猪头三
出生日期: 1981.XX.XX
企鹅交流: 643439947
个人网站: 80x86汇编小站
编程生涯: 2001年~至今[共24年]
职业生涯: 22年
开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python
开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder
技能种类: 逆向驱动磁盘文件
研发领域: Windows应用软件安全/Windows系统内核安全/Windows系统磁盘数据安全/macOS应用软件安全
项目经历: 磁盘性能优化/文件系统数据恢复/文件信息采集/敏感文件监测跟踪/网络安全检测

[序言]
在现代C++编程中, 特别是在处理大数据集时, 如何高效地管理内存是一个不可忽视的问题. 假设需要处理一个包含上千万个浮点数的数据列, 传统的做法可能是通过new关键字动态分配一块内存来存储这些数据. 然而, 当希望利用现代C++的特性——如STL容器或算法——对这些数据进行后续操作时, 通常需要将数据转移到新的容器中, 比如std::vector. 这个过程往往伴随着额外的内存分配和数据拷贝, 不仅增加了内存开销, 还可能显著降低程序的性能, 尤其是在数据量巨大的情况下. 幸运的是, C++20引入了一个轻量级的工具——std::span, 提供了一种低内存开销的解决方案. std::span本质上是一个非拥有的视图, 它可以引用一块连续的内存（例如数组或动态分配的内存）, 而无需复制数据或管理内存的生命周期. 它的出现使得开发者能够以现代C++的方式操作大数据集, 同时保持高效的内存使用. 无论是直接访问数据、循环遍历, 还是结合STL算法进行处理, std::span都能在不引入额外内存开销的前提下, 满足这些需求. 这种特性使其成为大数据分析和高效编程中的重要工具.

[代码演示]

int main()
{

	// 用 new 分配内存，并用 unique_ptr 管理，50 个 float
	// 注意：为了演示方便，这里仅使用50个float，实际应用中可能是上千万个
	std::unique_ptr<float[]> ptr_Data(new float[50]);

	// 创建 std::span 来管理这块内存
	std::span<float> span_Manage(ptr_Data.get(), 50);

	// 现在可以以更加现代的方式修改、循环、提取数据
	span_Manage[0] = 0.8f;

	// 示例：遍历并打印前5个元素
	std::cout << "前5个元素: ";
	for (size_t i = 0; i < 5 && i < span_Manage.size(); ++i) {
		std::cout << span_Manage[i] << " ";
	}
	std::cout << std::endl;

	return 0;

}

[代码作用]
内存分配: 代码中使用new动态分配了一块包含50个float的内存, 并通过std::unique_ptr管理这块内存, 确保资源在作用域结束时自动释放.

创建std::span: 通过std::span<float> span_Manage(ptr_Data.get(), 50), 创建了一个std::span对象, 它引用了ptr_Data指向的内存块. std::span不拥有这块内存, 仅作为一个视图存在.

操作数据: 可以像操作数组一样直接访问和修改span_Manage中的元素(例如span_Manage[0] = 0.8f), 也可以通过循环遍历数据.这种灵活性得益于std::span提供的现代化接口.

[总结]
std::span是C++20提供的一种轻量级、非拥有的内存视图. 通过std::span可以直接操作动态分配的内存块无需将其复制到其他容器中而显著降低了内存开销并提升了性能. 无论是对大数据集进行简单访问是结合STL算法执行复杂操作td::span都展现了其灵活性和高效性. 它的设计理念体现了现代C++对高效内存管理和现代化编程的支持.

查看全文

http://www.kler.cn/a/558271.html