› 技术分享 › JAVA基础 › 查看内容

JVM——虚拟机栈

老高 | 发布于 2022-11-16 08:47| 浏览()| 评论() | 收藏() | 点赞() | 打印

一、概述（Stack Frame）

栈帧（Stack Frame）是用于虚拟机执行时方法调用和方法执行时的数据结构，它是虚拟栈的基本元素。每一个方法从调用到方法返回都对应着一个栈帧入栈出栈的过程。最顶部的栈帧称为当前栈帧，栈帧所关联的方法称为当前方法，定义这个方法的类称为当前类，该线程中，虚拟机有且也只会对当前栈帧进行操作。

栈帧的作用有存储数据，部分过程结果，处理动态链接，方法返回值和异常分派。

每一个栈帧包含的内容有局部变量表、操作数栈、动态链接、方法返回地址和一些额外的附加信息。在编译代码时，栈帧需要多大的局部变量表，多深的操作数栈都可以完全确定的，并写入到方法表的code属性中。

栈帧结构图：

在介绍栈帧的各个部分时，我们先来理解一下虚拟机是如何执行一个方法的，这样我们才能理解为什么栈帧需要这些部分，这些部分分别提供了什么功能。首先我们的方法被编译成了字节码，并生成了可执行的命令。通过程序计数器，虚拟机会一行一行的执行命令，直到进入一个新的方法入口，对应虚拟机栈也就是新的栈帧入栈，当前栈帧改变，又或者遇到返回指令或出现异常结束了方法，对应虚拟机也就是出栈。

Java虚拟机栈（Java Virtual Machine Stacks）是线程私有的，它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型：栈帧（Stack Frame）是用于支持Java虚拟机进行方法调用和执行的数据结构，它是虚拟机栈中的栈元素。每个方法在执行的同到都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。

在编译程序代码的时候，栈帧中需要多大的局部变量表，多深的操作数栈都已经完全确定了，并且写入到方法表的Code属性之中，因此一个栈帧需要分配多少内存，不会受到程序运行期变量数据的影响，而仅仅取决于具体的虚拟机实现。

每一个方法从调用直至执行完成的过程，就对应着一个栈帧在虚拟栈中从入栈到出栈的过程（说人话就是要执行一个方法，将该方法的栈帧压入栈顶，方法执行完成其栈帧出栈）。在JVM里面，栈帧的操作只有两种：出栈和入栈。正在被线程执行的方法称为当前线程方法，而该方法的栈帧就称为当前帧，执行引擎运行时只对当前栈帧有效。

二、局部变量表

局部标量表 是一组变量值的存储空间，用于存放 方法参数 和 局部变量。在Class 文件的方法表的 Code 属性的 max_locals 指定了该方法所需局部变量表的最大容量。

局部变量表的基本单位为变量槽（slot，下文有单独的介绍）；局部变量表存放的是方法参数和局部变量；虚拟机是通过索引定位的方式使用局部变量表。

当调用方法是非static 方法时，局部变量表中第0位索引的 Slot 默认是用于传递方法所属对象实例的引用（reference），即 “this” 关键字指向的对象。分配完方法参数后，便会依次分配方法内部定义的局部变量。

为了节省栈帧空间，局部变量表中的 Slot 是可以重用的。因为即使是一个方法内，也是存在作用域的，当离开了某些变量的作用域之后，这些变量对应的 Slot 空间就可以交给其他变量使用。但是这种机制有时候会影响垃圾回收行为，原因很简单，当离开某个作用域时，如果没有新的变量值覆盖之前作用域内的变量（指reference）空间，那么当垃圾回收时，则该引用对应的java堆中的内存则不允许被回收，因为局部变量表中还存在该引用。所以问题在于虚拟机并没有主动清理局部变量表中离开作用域的变量值，而是采用新盖旧的方法被动清理。

所以很明显，局部变量表的作用就是记录执行该方法时会使用到的变量值，它可以说这个方法的数据池，是我们方法中变量的化身，相当于把我们方法中所需要的变量整合成一个数组对象或集合对象，这个对象的名称就叫做局部变量表。

变量槽（Variable Slot）
虚拟机规范中并没有明确说明一个Slot应占用的内存空间大小，只是很有“导向性”的说一个 Slot 可以存放 boolean、byte、char、short、int、float、reference 和 returnAddress 8种类型。正常来讲以上的数据只需要用32位长度的内存空间，但是虚拟机规范并没有定死，它允许slot的长度随着处理器、操作系统或虚拟机的不同而发生变化。不过即使在64位虚拟机中使用64位长度的内存空间来实现slot，虚拟机仍要使用对齐和补白的手段让slot外观上看起来有32位虚拟机的一致

所以正常来说一个slot的占用32位的长度内存，可以存放 boolean、byte、char、short、int、float、reference 和 returnAddress 8种类型，而对于64位的 long 和 double 变量而言，虚拟机会为其分配两个连续的 Slot 空间。

三、操作数栈

操作数栈也常被称为操作栈，。在Class 文件的Code 属性的 max_stacks 指定了执行过程中最大的栈深度。Java 虚拟机的解释执行引擎称为“基于栈的执行引擎”，这里的栈就是指操作数栈。
操作数栈的每个位置上可以保存一个java虚拟机中定义的任意数据类型的值，包括long和double。
那操作数栈的作用是什么？

很明显，操作数栈是方法执行算术运算或者是调用其他的方法进行参数传递的时候时的媒介，这就是“基于栈的执行引擎”。

操作数栈中的元素类型必须与字节码指令序列严格匹配，比如不能用iadd 指令去加两个long类型的数据。当然这些基本数据类型的校验在编译期中会校验，编译是无法通过两个long类型加为int类型的代码。

当一个方法刚开始执行时，这个方法的操作数栈是空的，在方法的执行过程中，会有各种字节码指令向操作数栈中写入和提取内容，也就是入栈出栈的操作。

在概念模型中，两个栈帧是相互独立的。但是大多数虚拟机的实现都会进行优化，令两个栈帧出现一部分重叠。令下面的部分操作数栈与上面的局部变量表重叠在一块，这样在方法调用的时候可以共用一部分数据，无需进行额外的参数复制传递。

四、动态连接

每个栈帧都包含一个指向当前方法所在类型的运行时常量池的引用，持有这个引用是为了支持方法调用过程中的动态连接（Dynamic Linking）。

Class 文件中存放了大量的符号引用，字节码中的方法调用指令就是以常量池中指向方法的符号引用作为参数。这些符号引用一部分会在类加载阶段或第一次使用时转化为直接引用，这种转化称为静态解析。另一部分将在每一次运行期间转化为直接引用，这部分称为动态连接。

在Java源文件被编译成字节码文件中时，所有的变量和方法引用都作为符号引用（symbolic Refenrence）保存在class字节码文件（javap反编译查看）的常量池里。比如：描述一个方法调用了另外的其他方法时，就是通过常量池中指向方法的符号引用来表示的，那么动态链接的作用就是为了将这些符号引用（#）最终转换为调用方法的直接引用。

在JVM中，将符号引用转换为调用方法的直接引用与方法的绑定机制相关

静态链接
当一个字节码文件被装载进JVM内部时，如果被调用的目标方法在编译期可知，且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接。
动态链接
如果被调用的方法在编译期无法被确定下来，也就是说，只能够在程序运行期将调用方法的符号引用转换为直接引用，由于这种引用转换过程具备动态性，因此也就被称之为动态链接。

对应的方法的绑定机制为：早起绑定（Early Binding）和晚期绑定（Late Bingding）。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程，这仅仅发生一次。

早期绑定
早期绑定就是指被调用的目标方法如果在编译期可知，且运行期保持不变时，即可将这个方法与所属的类型进行绑定，这样一来，由于明确了被调用的目标方法究竟是哪一个，因此也就可以使用静态链接的方式将符号引用转换为直接引用。
晚期绑定
如果被调用的方法在编译期无法被确定下来，只能够在程序运行期根据实际的类型绑定相关的方法，这种绑定方式也就被称之为晚期绑定。