【Java】虚拟机(JVM)内存模型全解析
目录
一、运行时数据区域划分
版本的差异:
二、程序计数器
程序计数器主要作用
三、Java虚拟机
1. 虚拟机运行原理
2. 活动栈被弹出的方式
3. 虚拟机栈可能产生的错误
4. 虚拟机栈的大小
四、本地方法栈
五、堆
1. 堆区的组成:新生代+老生代
2. 堆空间的大小设置
3. 创建对象的内存分配
4. 堆区产生的错误
六、字符串常量
1. String 的两种创建方式
2. String 的intern()方法:
3. String的拼接
4. String s1 = new string("abc");这句代码创建了几个字符串对象?
JVM 虚拟机在执行 Java 程序的过程中,会把它管理的内存划分成若干个不同的区域,每个区域有各自的不同的用途、创建方式及管理方式。有些区域随着虚拟机的启动一直存在,有些区域则随着用户线程的启动和结束而建立和销毁,这些共同组成了 Java 虚拟机的运行时数据区域,也被称为JVM内存模型。
一、运行时数据区域划分
JVM 虚拟机在执行 Java 程序的过程中会把它管理的内存划分成若干个不同的数据区域。由方法区、堆区、虚拟机栈、本地方法栈、程序计数器五部分组成。
版本的差异:
JDK 1.8 之前分为:线程共享( Heap 堆区、Method Area 方法区)、线程私有(虚拟机栈、本地方法栈、程序计数器)。
JDK 1.8 以后分为:线程共享( Heap 堆区、MetaSpace 元空间)、线程私有(虚拟机栈、本地方法栈、程序计数器)。
其中虚拟机栈、本地方法栈、程序计数器是线程私有的区域,所以随着线程消亡而结束。而线程共享的 Heap 堆区、 Metaspace 元空间会随着虚拟机的启动,一直存在。
二、程序计数器
程序计数器是一块较小的内存空间,是当前线程所执行的字节码的行号指示器。
程序计数器主要作用
- 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。
- 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候,能够知道当前线程的运行位置,恢复当前线程的执行。
程序计数器是唯一一个不会出现 OutofMemoryError 的内存区域,它随着线程的创建而创建,随着线程的结束而死亡。
三、Java虚拟机
虚拟机栈是线程执行 Java 程序时,处理 Java 方法中内容的内存区域。虚拟机栈也是线程私有的区域,每个 Java方法被调用的时候,都会在虚拟机栈中创建出一个栈帧,而每个栈帧又由局部变量表、操作数栈、动态链接和方法返回四部分组成,有些虚拟机的栈帧还包括了一些附加信息。
JVM 内存区域可以粗略的区分为堆内存(Heap)和栈内存(stack)。其中栈就是 JVM Stack 虚拟机栈,或者说是虚拟机栈中局部变量表部分,局部变量表主要存放了编译期可知的各种基本数据类型变量值( boolea、byte、char、short、int、float、long、double )、对象引用(reference 类型,它不同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)。
1. 虚拟机运行原理
每一次方法调用都会有一个对应的栈帧被压入 JVM Stack 虚拟机栈,每一个方法调用结束后,代表该方法的栈帧会从 JVM Stack 虚拟机栈中弹出。虚拟机栈是线程的私有区域,并且栈帧不允许被其他线程访问,所以不存在线程安全问题,栈帧弹出后就内存就会被系统回收,所以不也存在垃圾回收问题。
在活动线程中,只有位于栈顶的帧才是有效的,称为当前活动栈帧,代表正在执行的当前方法。在 JVM 执行引擎运行时,所有指令都只能针对当前活动栈帧进行操作。虚拟机栈通过 pop 和 push 的方式,对每个方法对应的活动栈帧进行运算处理,方法正常执行结束,肯定会跳转到另一个栈帧上。
2. 活动栈被弹出的方式
Java 方法有两种返回方式,不管哪种返回方式都会导致当前活动栈帧被弹出:
- return 语句
- 抛出异常
3. 虚拟机栈可能产生的错误
Java 虚拟机栈会出现两种错误:StackOverFlowError 和OutOfMemoryError。
- StackOverFlowError:当线程请求栈的深度超过 JVM 虚拟机栈的最大深度的时候,就抛出 StackOverFlowError 错误。
- OutofMemoryError:JVM 的内存大小可以动态扩展,如果虚拟机在动态扩展栈时无法申请到足够的内存空间,则抛出 OutOfMemoryError 异常。
4. 虚拟机栈的大小
虚拟栈的大小可以通过 -Xss 参数设置,默认单位是 byte,也可以使用k,m,g作为单位(不区分大小写)。例如:-xss 1m
在不同操作系统下的 -xss 默认值不同:
- Linux:1024k
- MacOs:1024k
- Windows:默认值依赖于虚拟机的内存
四、本地方法栈
native 关键字修饰的本地方法被执行的时候,在本地方法栈中也会创建一个栈帧,用于存放该 native 本地方法的局部变量表、操作数栈、动态链接、方法出口信息。方法执行完毕后,相应的栈帧也会出栈并释放内存空间。也会出现StackOverFlowError和OutOfMemoryError 两种错误。
五、堆
Heap 堆区,用于存放对象实例和数组的内存区域。
Heap 堆区,是 JVM所管理的内存中最大的一块区域,被所有线程共享的块内存区域。堆区中存放对象实例,“几乎”所有的对象实例以及数组都在这里分配内存。
1. 堆区的组成:新生代+老生代
从垃圾回收的角度,由于现在收集器基本都采用分代垃圾收集思想,所以JVM 中的堆区往往进行分代划分,例如:新生代和老年代。目的是更好地回收内存,或者更快地分配内存。
堆区的组成分为新生代(Young Generation)、老年代(Old Generation)。新生代被分为伊甸区(Eden)和幸存者区(from+to),幸存区又被分为Survivor 0(from)和Survivor 1(to)。
新生代和老年代比例为1:2,伊甸区和s0、S1比例为 8:1:1,不同区域存放对象的用途和方式不同:
(1)伊甸区( Eden):存放大部分新创建对象。
(2)幸存区(Survivor):存放 Minor Gc 之后,Eden 区和幸存区( Survivor)本身没有被回收的对象。
(3)老年代:存放 Minor Gc 之后且年龄计数器达到 15 依然存活的对象、 Major GC 和 Full GC 之后仍然存活的对象。
2. 堆空间的大小设置
堆区的内存大小是可修改的,默认情况下,初始堆内存为物理内存的 1/64,最大为物理内存的 1/4。
- -xms:设置初始堆内存,例如:-Xms64m
- -Xmx:设置最大堆内存,例如:-Xmx64m
- -Xmn:设置新生代内存,例如:-Xmx32m
3. 创建对象的内存分配
创建一个新对象,在堆中的分配内存。
大部分情况下,对象会在Eden区生成,当den 区装填满的时候,会触发 Young Garbage collection,即 YGC 垃圾回收的时候,在 Eden 区实现清除策略,没有被引用的对象则直接回收。
依然存活的对象会被移送到 Survivor区。Survivor 区分为s0和s1 两块内存区域。每次 Gc 的时候,它们将存活的对象复制到未使用的 Survivor空间(s0 或 s1),然后将当前正在使用的空间完全清除,交换两块空间的使用状态。每次交换时,对象的年龄会加 +1。
如果 YGC 要移送的对象大于 Survivor 区容量的上限,则直接移交给老年一个对象也不可能永远呆在新生代,在中 一个对象从新生代晋升到老年代的阈值默认值是 15,可以在 Survivor 区交换 14 次之后,晋升至老年代。
4. 堆区产生的错误
堆区最容易出现的就是 OutOfMemoryError 错误,这种错误的表现形式会
有以下两种:
(1)OutOfMemoryError:Gc overhead Limit Exceeded:当JVM 花太多
时间执行垃圾回收,并且只能回收很少的堆空间时,就会发生此错误。
(2)OutofMemoryError:Java heap space:假如在创建新的对象时,堆内存
中的空间不足以存放新创建的对象,就会引发此错误。
六、字符串常量
1. String 的两种创建方式
- 第一种方式是在常量池中获取字符串对象
- 第二种方式是直接在堆内存空间创建一个新的字符串对象
2. String 的intern()方法:
检查指定字符串在常量池中是否存在?如果存在,则返回地址,如果不存在,则在常量池中创建。
3. String的拼接
String str1 = "str";
String str2 = "ing";
String str3 ="str"+"ing"; // 常量池中的新字符串对象
String str4= str1 + str2; //在堆中创建的新字符串对象
String str5 ="string"; // 常量池中的已有字符串对象
System.out.println(str3 == str4); //false
System.out.println(str3 == str5); //true
System.out.println(str4 == str5); //false
4. String s1 = new string("abc");这句代码创建了几个字符串对象?
创建 1或 2 个字符串。如果常量池中已存在字符串常量“abc ”,则只会在堆空间创建一个字符串常量“ abc ”。如果常量池中没有字符串常量“ abc”,那么它将首先在池中创建,然后在堆空间中创建,因此将创建总共2个字符串对象。