【JVM】JVM执行流程和内存区域划分
是什么
Java 虚拟机
- JDK,Java 开发工具包
- JRE,Java 运行时环境
- JVM,Java 虚拟机
JVM 就是 Java 虚拟机,解释执行 Java 字节码
JVM 执行流程
编程语言可以分为:
- 编译型语言:先将高级语言转换成二进制的机器指令,再由 CPU 去直接执行
- 解释型语言:一边去转换,一边去执行
这样的说法放单今天,硬件不适用了
按照上述这种经典的划分方式,可以认为 Java
属于“半编译,半解释”。Java
这么设定,最主要的目的就是为了“跨平台”。
- 像 C++这样的语言是直接编译成了二进制的机器指令,而不同的
CPU
支持的指令不一样,而且生成的可执行程序,在不同的系统上也有不同的格式Windows
可执行程序:PE
格式Linux
可执行程序:ELF
格式
当前看到的手机操作系统,为什么只有安卓、iOS?
- 因为搞一个新的系统,现有的软件不能兼容,没有生态也就没有市场
- 鸿蒙能直接运行安卓程序,是因为鸿蒙不是新系统,只是安卓套壳
Java
不想重新编译,而是期望能够直接执行
- 先通过
javac
把.java
文件==>.class
文件(字节码文件,包含的就是Java
字节码,Java
自己搞的一套CPU
指令)- 因为如果生成
CPU
直接能执行的指令的话,不同的CPU
支持的指令就不一样,就不能在所有系统上执行
- 因为如果生成
- 这样先把
java
代码转成对应的java
字节码文件,然后在某个具体的系统平台上执行,此时通过JVM
把上述的字节码转换成对应的CPU
能识别的机器指令(JVM
就是一个翻译官的角色)
通过上述转换,我们就可以不去重新编译,也能够完成良好的跨平台。因此,我们编写和发布一个 java
程序,其实就只要发布 .class
文件就可以了,JVM
拿到 .class
文件之后,就知道如何转换
Windows
上的JVM
就可以把.class
转换成Windows
上能支持的可执行指令了Linux
上的JVM
就可以把.class
转换成 Linux 上可以支持的可执行指令了
不同平台的局面是存在差异的,而不是同一个。对上(给java
层面上提供的内容)是统一一致的
内存区域划分
JVM 其实也是一个进程(任务管理器中看到的 java 进程)
进程运行过程中,要从操作系统这里车身轻一些资源(内存就是其中的典型资源),这些内存空间就支撑了后续 java
程序的执行。
- 比如,在
java
中定义变量(就会申请内存),内存其实就是JVM
从系统这边申请到的内存,然后再交给具体的java
程序去使用
JVM
从系统申请了一大块内存,这一大块内存给 java
程序使用的时候,又会根据实际的使用用途,来划分出不同的空间,这就是所谓的“区域划分”
堆
代码中 new
出来的对象,都是在堆里。对象中持有的非静态成员变量,也都在堆里。只有一份
- 静态成员变量在元数据区
栈
本地方法栈/虚拟机栈。包含了方法调用关系和局部变量
- 在代码执行过程中,肯定会涉及到很多方法的调用,调用的关系就通过栈空间记录下来
- 虚拟机栈,记录了
Java
代码的调用关系,Java
代码的局部变量 - 本地方法栈,记录了
JVM
内部,通过C++
写的代码的调用关系和局部变量
一般不会关注本地方法栈,一般来说谈到栈,就默认指的是“虚拟机栈”
这里谈到的“堆“和“栈“,和数据结构中的“堆“和“栈“是不同的。这里的是两块区域
程序计数器
这个区域比较小,专门用来存储下一条要执行的 Java
指令的地址
元数据区
“元数据”是计算机中的一个常见术语(meta data
),往往指的是一些辅助性质的,描述性质的属性。只有一份
比如:硬盘上不仅仅要存储数据本体,还要存储一些辅助信息:文件的大小、文件的位置、文件的拥有者、文件的修改时间、文件的权限信息… 这些辅助信息统称为“元数据”
在以前的 Java 版本中,也叫做“方法区”,从 1.8 开始改的名字
云数据区中主要保存:
- 类的信息
- 方法的信息
一个程序,有哪些类、每个类里都有哪些方法、每个方法里面都要包含哪些指令,都会记录在元数据区。
我们写的 Java
代码,if
、while
、for
等各种逻辑运算,这些操作都会被转换成 Java
字节码
javac
就会完成上述代码到字节码的转换- 此时这些字节码在程序运行的时候就会被
JVM
加载到内存中,放到元数据区(方法区)里面 - 之后,当前程序要如何执行,要做哪些事情,就会按照上述元数据区里面记录的字节码一次执行了
我们所编写的代码,都会被转换成二进制指令,都会进入到内存中,然后才能执行。
类似于剧本杀
- 剧本杀里面给美格玩家发一个剧本,每个玩家就按照剧本上给出的要求来演
- 此处所谓 Java 字节码,要执行的方法的细节,就像剧本一样,需要把剧本加载到内存中,然后才能执行
堆和元数据区只有一份(所有线程共享一份),栈和程序计数器可能有 n 份(和线程相关,每个线程都有自己的程序计数器和栈(每个线程有自己的执行流))
经典笔试题
在下面代码中,t
、n
、m
分别处于 JVM 内存中的哪个区域?
class Test() {
private int n;
private static int m;
}
main() {
Test t = new Text();
}
t
是一个局部变量(引用类型),在栈上n
是Test
的成员变量,new
出来的Test
是在堆上的,所以n
作为成员变量也是处于堆上static
修饰的变量,称为“类属性”;static
修饰的方法,称为“类方法”- 非
static
修饰的变量,称为“实例属性”;非static
修饰的方法,称为“实例方法” - 所以这里的
m
是长在类上的成员,和new
不new
实例没有关系。上述带有static
修饰的变量,就是在类对象中,也就是在元数据区中(方法区)
类对象,
Test.class
JVM
把.class
文件加载到内存之后,就会把这里的信息使用对象来表示,此时这样的对象就是类对象- 类对象里就包含了一系列的信息,包括但不限于:
- 类的名称
- 类继承自那个类
- 实现了哪些接口
- 都有哪些成员,都叫什么,都是什么类型,都是什么权限
- 都有哪些方法,都叫什么,都是什么参数,都是什么权限
.java
文件中涉及到的信息都会在.class
中有所体现(注释是不会包含的)
区分一个变量在哪个内存区域中,最主要的就是看变量的形态
- 局部变量
- 成员变量
- 静态成员变量
- …