当前位置：首页 > article >正文

【JVM】JVM执行流程和内存区域划分

article 2025/3/11 15:42:38

是什么

Java 虚拟机

JDK，Java 开发工具包
JRE，Java 运行时环境
JVM，Java 虚拟机

JVM 就是 Java 虚拟机，解释执行 Java 字节码

JVM 执行流程

编程语言可以分为：

编译型语言：先将高级语言转换成二进制的机器指令，再由 CPU 去直接执行
解释型语言：一边去转换，一边去执行
这样的说法放单今天，硬件不适用了

按照上述这种经典的划分方式，可以认为 Java 属于“半编译，半解释”。Java 这么设定，最主要的目的就是为了“跨平台”。

像 C++这样的语言是直接编译成了二进制的机器指令，而不同的 CPU 支持的指令不一样，而且生成的可执行程序，在不同的系统上也有不同的格式
- Windows 可执行程序：PE 格式
- Linux 可执行程序：ELF 格式

当前看到的手机操作系统，为什么只有安卓、iOS？

因为搞一个新的系统，现有的软件不能兼容，没有生态也就没有市场
鸿蒙能直接运行安卓程序，是因为鸿蒙不是新系统，只是安卓套壳

Java 不想重新编译，而是期望能够直接执行

先通过 javac 把 .java 文件==> .class 文件（字节码文件，包含的就是 Java 字节码，Java 自己搞的一套 CPU 指令）
- 因为如果生成 CPU 直接能执行的指令的话，不同的 CPU 支持的指令就不一样，就不能在所有系统上执行
这样先把 java 代码转成对应的 java 字节码文件，然后在某个具体的系统平台上执行，此时通过 JVM 把上述的字节码转换成对应的 CPU 能识别的机器指令（JVM 就是一个翻译官的角色）

通过上述转换，我们就可以不去重新编译，也能够完成良好的跨平台。因此，我们编写和发布一个 java 程序，其实就只要发布 .class 文件就可以了，JVM 拿到 .class 文件之后，就知道如何转换

Windows 上的 JVM 就可以把 .class 转换成 Windows 上能支持的可执行指令了
Linux 上的 JVM 就可以把.class 转换成 Linux 上可以支持的可执行指令了
不同平台的局面是存在差异的，而不是同一个。对上（给 java 层面上提供的内容）是统一一致的

内存区域划分

JVM 其实也是一个进程（任务管理器中看到的 java 进程） image.png|203
进程运行过程中，要从操作系统这里车身轻一些资源（内存就是其中的典型资源），这些内存空间就支撑了后续 java 程序的执行。

比如，在 java 中定义变量（就会申请内存），内存其实就是 JVM 从系统这边申请到的内存，然后再交给具体的 java 程序去使用

JVM 从系统申请了一大块内存，这一大块内存给 java 程序使用的时候，又会根据实际的使用用途，来划分出不同的空间，这就是所谓的“区域划分” image.png|604

堆

代码中 new 出来的对象，都是在堆里。对象中持有的非静态成员变量，也都在堆里。只有一份

静态成员变量在元数据区

栈

本地方法栈/虚拟机栈。包含了方法调用关系和局部变量

在代码执行过程中，肯定会涉及到很多方法的调用，调用的关系就通过栈空间记录下来
虚拟机栈，记录了 Java 代码的调用关系，Java 代码的局部变量
本地方法栈，记录了 JVM 内部，通过 C++ 写的代码的调用关系和局部变量

一般不会关注本地方法栈，一般来说谈到栈，就默认指的是“虚拟机栈”

这里谈到的“堆“和“栈“，和数据结构中的“堆“和“栈“是不同的。这里的是两块区域

程序计数器

这个区域比较小，专门用来存储下一条要执行的 Java 指令的地址

元数据区

“元数据”是计算机中的一个常见术语（meta data），往往指的是一些辅助性质的，描述性质的属性。只有一份

比如：硬盘上不仅仅要存储数据本体，还要存储一些辅助信息：文件的大小、文件的位置、文件的拥有者、文件的修改时间、文件的权限信息… 这些辅助信息统称为“元数据”

在以前的 Java 版本中，也叫做“方法区”，从 1.8 开始改的名字

云数据区中主要保存：

类的信息
方法的信息
一个程序，有哪些类、每个类里都有哪些方法、每个方法里面都要包含哪些指令，都会记录在元数据区。

我们写的 Java 代码，if、while、for 等各种逻辑运算，这些操作都会被转换成 Java 字节码

javac 就会完成上述代码到字节码的转换
此时这些字节码在程序运行的时候就会被 JVM 加载到内存中，放到元数据区（方法区）里面
之后，当前程序要如何执行，要做哪些事情，就会按照上述元数据区里面记录的字节码一次执行了

我们所编写的代码，都会被转换成二进制指令，都会进入到内存中，然后才能执行。

类似于剧本杀

剧本杀里面给美格玩家发一个剧本，每个玩家就按照剧本上给出的要求来演
此处所谓 Java 字节码，要执行的方法的细节，就像剧本一样，需要把剧本加载到内存中，然后才能执行

堆和元数据区只有一份（所有线程共享一份），栈和程序计数器可能有 n 份（和线程相关，每个线程都有自己的程序计数器和栈（每个线程有自己的执行流））

经典笔试题

在下面代码中，t、n、m 分别处于 JVM 内存中的哪个区域？

class Test() {
	private int n;
	private static int m;
}

main() {
	Test t = new Text();
}

t 是一个局部变量（引用类型），在栈上
n 是 Test 的成员变量，new 出来的 Test 是在堆上的，所以 n 作为成员变量也是处于堆上
static 修饰的变量，称为“类属性”；static 修饰的方法，称为“类方法”
非 static 修饰的变量，称为“实例属性”；非 static 修饰的方法，称为“实例方法”
所以这里的 m 是长在类上的成员，和 new 不 new 实例没有关系。上述带有 static 修饰的变量，就是在类对象中，也就是在元数据区中（方法区）

类对象，Test.class

JVM 把 .class 文件加载到内存之后，就会把这里的信息使用对象来表示，此时这样的对象就是类对象
类对象里就包含了一系列的信息，包括但不限于：
类的名称
类继承自那个类
实现了哪些接口
都有哪些成员，都叫什么，都是什么类型，都是什么权限
都有哪些方法，都叫什么，都是什么参数，都是什么权限

.java 文件中涉及到的信息都会在 .class 中有所体现（注释是不会包含的）