当前位置：首页 > article >正文

Rust编程的作用域与所有权

article 2025/2/22 23:40:22

【图书介绍】《Rust编程与项目实战》-CSDN博客

《Rust编程与项目实战》(朱文伟，李建英)【摘要书评试读】- 京东图书 (jd.com)

Rust编程与项目实战_夏天又到了的博客-CSDN博客

在学习C/C++时，老师经常出某变量被分配在栈上还是堆上的题目，几乎每次都有很大一批同学在这种题目上失手。栈和堆都是代码在运行时可供使用的内存，但是它们的结构不同。栈是一种后进先出（Last In First Out，LIFO）的数据结构，栈中的所有数据都必须占用已知且固定大小的内存。堆就好理解了，它是一个没有组织的结构，想怎么使用就怎么使用，只要堆够大，就可以申请一段内存空间，然后把这段内存标记为已使用，并得到指向这段内存开头的指针；当不再使用时，再将这段内存标记为未使用。当声明一个指针但并没有分配空间时，这个指针是空指针；当内存已经标记为未使用，而指针依然指向这段空间时，这个指针就是野指针。

C++中的堆和栈定义如下。

堆：由程序员手动分配和释放，完全不同于数据结构中的堆，分配方式类似于链表。由malloc或者new来分配，由free和delete来释放。若程序员不释放，则程序结束时由系统释放。
栈：由编译器自动分配和释放，存放函数的参数值、局部变量的值等。栈里面变量的内存必须是已知且固定大小的。函数调用时，参数、本地变量、指向堆的指针都压入一个栈，函数完成时退出。操作方式类似于数据结构中的栈（C和Python中也有，只要基于C的都有这个概念）。

其实分辨起来很容易，动态分配的变量就是在堆上，其他的都在栈上。

栈是一个成熟的结构，基本不会引发内存的问题，而没有组织的堆却很容易引发内存问题。垃圾回收和所有权都是为了解决堆的内存管理问题。

这就是C++相比于垃圾回收机制语言的优势，灵活高效，但是也会带来内存安全问题。

3.9.2 什么是所有权

计算机程序必须在运行时管理它们所使用的内存资源。大多数编程语言都有管理内存的功能：C/C++这样的语言主要通过手动方式管理内存，开发者需要手动申请和释放内存资源。但为了提高开发效率，只要不影响程序功能的实现，许多开发者没有及时释放内存的习惯。所以手动管理内存的方式常常造成资源浪费。

Java语言编写的程序在Java虚拟机（Java Virtual Machine，JVM）中运行，JVM具备自动回收内存资源的功能。但这种方式常常会降低运行时效率，所以JVM会尽可能少地回收资源，这样也会使程序占用较大的内存资源。

所有权对大多数开发者而言是一个新颖的概念，它是Rust语言为高效使用内存而设计的语法机制。所有权概念是为了让Rust在编译阶段更有效地分析内存资源的有用性以实现内存管理而诞生的概念。

Rust的所有权是一个跨时代的理念，是内存管理的第二次革命。较低级的语言依赖程序员分配和释放内存，一不小心就会出现空指针、野指针破坏内存；较高级的语言使用垃圾回收机制管理内存，在程序运行时不断地寻找不再使用的内存，虽然安全，却加重了程序的负担。Rust的所有权理念横空出世，通过所有权系统管理内存，编译器在编译时会根据一系列的规则进行检查，在运行时，所有权系统的任何功能都不会减慢程序，把安全的内存管理推向了零开销的新时代。

所有权概念是Rust语言的一个重要特性，因为通过它才使得Rust的“安全”“高并发”得以发挥出优势。因为它让Rust无须垃圾回收，即可保障内存安全。对于C/C++程序员来说，可能一直在跟内存安全打交道，如内存泄露、智能指针等。对于别的语言来说，会有垃圾回收机制。例如Python的垃圾回收机制，有“标记清除”“分代回收”等方式。这两种方式各有优缺点。Rust则是通过所有权和借用来保证内存安全的。很多人不理解为什么Rust是内存安全的，其实就是在默认情况下，是写不出内存不安全的代码的。

Rust的所有权并不难理解，它有且只有如下三条规则：

（1）Rust中的每个值都有一个被称为其所有者的变量（即值的所有者是某个变量）。

（2）值在任一时刻有且只有一个所有者。

（3）当所有者（变量）离开作用域时，这个值将被销毁。

这里对第三点做一些补充性的解释，所有者离开作用域会导致值被销毁，这个过程实际上是调用一个名为drop的函数来销毁数据释放内存的。在前面解释作用域规则时曾提到过，销毁的数据特指堆栈中的数据，如果变量绑定的值是全局内存区内的数据，则数据不会被销毁。例如：

fn main(){

  {

    let mut s = String::from("hello");

  } // 跳出作用域，栈中的变量s将被销毁，其指向的堆中的数据也被销毁

    // 但全局内存区的字符串字面量仍被保留

}

Rust中的每个值都有一个所有者，但这个说法比较容易产生误会。例如：

#![allow(unused)]

fn main() {

let s = String::from("hello");

}

很多人可能会误以为变量s是堆中字符串数据hello的所有者，但实际上不是。String字符串的实际数据在堆中，但是String大小不确定，所以在栈中使用一个胖指针结构来表示这个String类型的数据，这个胖指针中的指针指向堆中的String的实际数据。也就是说，变量s的值是那个胖指针，而不是堆中的实际数据。因此，变量s是那个胖指针的所有者，而不是堆中实际数据的所有者。但是，由于胖指针是指向堆中数据的，很多时候为了简化理解，简化描述方式，经常会说s是哪个堆中实际数据的所有者。但无论如何描述，都需要理解所有者和值之间的真相。