联博api:JVM详解之:java class文件的密码本

admin 4周前 (07-15) 科技 26 0

目录
  • 简介
  • 一个简朴的class
  • ClassFile的二进制文件
  • class文件的密码本
    • magic
    • version
    • 常量池
    • 描述符
    • access_flags
    • this_class和super_class
    • interfaces_count和interfaces[]
    • fields_count和fields[]
  • methods_count和methods[]
  • attributes_count和attributes[]
  • 总结

简介

一切的一切都是从javac最先的。从那一刻最先,java文件就从我们肉眼可分辨的文本文件,变成了冷冰冰的二进制文件。

变成了二进制文件是不是意味着我们无法再深入的去领会java class文件了呢?谜底是否认的。

机械可以读,人为什么不能读?只要我们掌握java class文件的密码表,我们可以把二进制转成十六进制,将十六进制和我们的密码表举行对比,就可以轻松的解密了。

下面,让我们最先这个激动人心的历程吧。

一个简朴的class

为了深入明白java class的寄义,我们首先需要界说一个class类:

public class JavaClassUsage {

    private int age=18;

    public void inc(int number){
        this.age=this.age+ number;
    }
}

很简朴的类,我想不会有比它更简朴的类了。

在上面的类中,我们界说了一个age字段和一个inc的方式。

接下来我们使用javac来举行编译。

IDEA有没有?直接打开编译后的class文件,你会看到什么?

没错,是反编译过来的java代码。然则这次我们需要深入领会的是class文件,于是我们可以选择 view->Show Bytecode:

固然,照样少不了最质朴的javap下令:

 javap -verbose JavaClassUsage

对比会发现,实在javap展示的更清晰一些,我们暂时选用javap的效果。

编译的class文件有点长,我一度有点不想都列出来,然则又一想只有对才气讲述得更清晰,照样贴在下面:

public class com.flydean.JavaClassUsage
  minor version: 0
  major version: 58
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #2.#3          // java/lang/Object."<init>":()V
   #2 = Class              #4             // java/lang/Object
   #3 = NameAndType        #5:#6          // "<init>":()V
   #4 = Utf8               java/lang/Object
   #5 = Utf8               <init>
   #6 = Utf8               ()V
   #7 = Fieldref           #8.#9          // com/flydean/JavaClassUsage.age:I
   #8 = Class              #10            // com/flydean/JavaClassUsage
   #9 = NameAndType        #11:#12        // age:I
  #10 = Utf8               com/flydean/JavaClassUsage
  #11 = Utf8               age
  #12 = Utf8               I
  #13 = Utf8               Code
  #14 = Utf8               LineNumberTable
  #15 = Utf8               LocalVariableTable
  #16 = Utf8               this
  #17 = Utf8               Lcom/flydean/JavaClassUsage;
  #18 = Utf8               inc
  #19 = Utf8               (I)V
  #20 = Utf8               number
  #21 = Utf8               SourceFile
  #22 = Utf8               JavaClassUsage.java
{
  public com.flydean.JavaClassUsage();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: aload_0
         5: bipush        18
         7: putfield      #7                  // Field age:I
        10: return
      LineNumberTable:
        line 7: 0
        line 9: 4
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      11     0  this   Lcom/flydean/JavaClassUsage;

  public void inc(int);
    descriptor: (I)V
    flags: ACC_PUBLIC
    Code:
      stack=3, locals=2, args_size=2
         0: aload_0
         1: aload_0
         2: getfield      #7                  // Field age:I
         5: iload_1
         6: iadd
         7: putfield      #7                  // Field age:I
        10: return
      LineNumberTable:
        line 12: 0
        line 13: 10
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      11     0  this   Lcom/flydean/JavaClassUsage;
            0      11     1 number   I
}
SourceFile: "JavaClassUsage.java"

ClassFile的二进制文件

慢着,上面javap的效果似乎并不是二进制文件!

对的,javap是对二进制文件举行领会析,利便程序员阅读。若是你真的想直面最最底层的机械代码,就直接用支持16进制的文本编译器把编译好的class文件打开吧。

你准备好了吗?

来吧,展示吧!

上图左边是16进制的class文件代码,右边是对16进制文件的适当剖析。人人可以隐约的看到一点点熟悉的内容。

是的,没错,你会读机械语言了!

class文件的密码本

若是你要领会class文件的结构,你需要这个密码本。

若是你想剖析class文件,你需要这个密码本。

学好这个密码本,走遍天下都......没啥用!

下面就是密码本,也就是classFile的结构。

ClassFile {
    u4             magic;
    u2             minor_version;
    u2             major_version;
    u2             constant_pool_count;
    cp_info        constant_pool[constant_pool_count-1];
    u2             access_flags;
    u2             this_class;
    u2             super_class;
    u2             interfaces_count;
    u2             interfaces[interfaces_count];
    u2             fields_count;
    field_info     fields[fields_count];
    u2             methods_count;
    method_info    methods[methods_count];
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

其中u2,u4示意的是无符号的两个字节,无符号的4个字节。

java class文件就是根据上面的花样排列下来的,根据这个花样,我们可以自己实现一个反编译器(人人有兴趣的话,可以自行研究)。

我们对比着上面的二进制文件一个一个的来明白。

magic

首先,class文件的前4个字节叫做magic word。

看一下十六进制的第一行的前4个字节:

CA FE BA BE 00 00 00 3A 00 17 0A 00 02 00 03 07 

0xCAFEBABE就是magic word。所有的java class文件都是以这4个字节开头的。

来一杯咖啡吧,baby!

何等有诗意的画面。

version

这两个version要连着讲,一个是主版本号,一个是次版本号。

00 00 00 3A

对比一下上面的表格,我们的主版本号是3A=58,也就是我们使用的是JDK14版本。

常量池

接下来是常量池。

首先是两个字节的constant_pool_count。对比一下,constant_pool_count的值是:

00 17

换算成十进制就是23。也就是说常量池的巨细是23-1=22。

这里有两点要注意,第一点,常量池数组的index是从1最先到constant_pool_count-1竣事。

第二点,常量池数组的第0位是作为一个保留位,示意“不引用任何常量池项目”,为某些特殊的情况下使用。

接下来是不定长度的cp_info:constant_pool[constant_pool_count-1]常量池数组。

常量池数组中存了些什么器械呢?

字符串常量,类和接口名字,字段名,和其他一些在class中引用的常量。

详细的constant_pool中存储的常量类型有下面几种:

联博api:JVM详解之:java class文件的密码本 第1张

每个常量都是以一个tag开头的。用来告诉JVM,这个到底是一个什么常量。

好了,我们对比着来看一下。在constant_pool_count之后,我们再取一部门16进制数据:

联博api:JVM详解之:java class文件的密码本 第2张

上面我们讲到了17是常量池的个数,接下来就是常量数组。

0A 00 02 00 03

首先第一个字节是常量的tag, 0A=10,对比一下上面的表格,10示意的是CONSTANT_Methodref方式引用。

CONSTANT_Methodref又是一个结构体,我们再看一下方式引用的界说:

CONSTANT_Methodref_info {
    u1 tag;
    u2 class_index;
    u2 name_and_type_index;
}

从上面的界说我们可以看出,CONSTANT_Methodref是由三部门组成的,第一部门是一个字节的tag,也就是上面的0A。

第二部门是2个字节的class_index,示意的是类在常量池中的index。

第三部门是2个字节的name_and_type_index,示意的是方式的名字和类型在常量池中的index。

先看class_index,0002=2。

常量池的第一个元素我们已经找到了就是CONSTANT_Methodref,第二个元素就是跟在CONSTANT_Methodref后面的部门,我们看下是什么:

07 00 04

一样的剖析步骤,07=7,查表,示意的是CONSTANT_Class。

我们再看下CONSTANT_Class的界说:

CONSTANT_Class_info {
    u1 tag;
    u2 name_index;
}

可以看到CONSTANT_Class占用3个字节,第一个字节是tag,后面两个字节是name在常量池中的索引。

00 04 = 4, 示意name在常量池中的索引是4。

然后我们就这样一起找下去,就得到了所有常量池中常量的信息。

这样找起来,眼睛都花了,有没有什么简朴的设施呢?

固然有,就是上面的javap -version, 我们再回首一下输出效果中的常量池部门:

Constant pool:
   #1 = Methodref          #2.#3          // java/lang/Object."<init>":()V
   #2 = Class              #4             // java/lang/Object
   #3 = NameAndType        #5:#6          // "<init>":()V
   #4 = Utf8               java/lang/Object
   #5 = Utf8               <init>
   #6 = Utf8               ()V
   #7 = Fieldref           #8.#9          // com/flydean/JavaClassUsage.age:I
   #8 = Class              #10            // com/flydean/JavaClassUsage
   #9 = NameAndType        #11:#12        // age:I
  #10 = Utf8               com/flydean/JavaClassUsage
  #11 = Utf8               age
  #12 = Utf8               I
  #13 = Utf8               Code
  #14 = Utf8               LineNumberTable
  #15 = Utf8               LocalVariableTable
  #16 = Utf8               this
  #17 = Utf8               Lcom/flydean/JavaClassUsage;
  #18 = Utf8               inc
  #19 = Utf8               (I)V
  #20 = Utf8               number
  #21 = Utf8               SourceFile
  #22 = Utf8               JavaClassUsage.java

以第一行为例,直接告诉你常量池中第一个index的类型是Methodref,它的classref是index=2,它的NameAndType是index=3。

而且直接在后面展示出了详细的值。

描述符

且慢,在常量池中我似乎看到了一些不一样的器械,这些I,L是什么器械?

这些叫做字段描述符:

联博api:JVM详解之:java class文件的密码本 第3张

上图是他们的各项寄义。除了8大基础类型,另有2个引用类型,分别是工具的实例,和数组。

access_flags

常量池后面就是access_flags:接见描述符,示意的是这个class或者接口的接见权限。

先上密码表:

联博api:JVM详解之:java class文件的密码本 第4张

再找一下我们16进制的access_flag:

联博api:JVM详解之:java class文件的密码本 第5张

没错,就是00 21。 参照上面的表格,似乎没有21,然则别怕:

21是ACC_PUBLIC和ACC_SUPER的并集。示意它有两个access权限。

this_class和super_class

接下来是this class和super class的名字,他们都是对常量池的引用。

00 08 00 02

this class的常量池index=8, super class的常量池index=2。

看一下2和8都代表什么:

   #2 = Class              #4             // java/lang/Object
   #8 = Class              #10            // com/flydean/JavaClassUsage

没错,JavaClassUsage的父类是Object。

人人知道为什么java只能单继续了吗?由于class文件内里只有一个u2的位置,放不下了!

interfaces_count和interfaces[]

接下来就是接口的数目和接口的详细信息数组了。

00 00

我们没有实现任何接口,以是interfaces_count=0,这时候也就没有interfaces[]了。

fields_count和fields[]

然后是字段数目和字段详细的数组信息。

这里的字段包罗类变量和实例变量。

每个字段信息也是一个结构体:

field_info {
    u2             access_flags;
    u2             name_index;
    u2             descriptor_index;
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

字段的access_flag跟class的有点不一样:

联博api:JVM详解之:java class文件的密码本 第6张

这里我们就不详细对比注释了,感兴趣的小伙伴可以自行体验。

methods_count和methods[]

接下来是方式信息。

method结构体:

method_info {
    u2             access_flags;
    u2             name_index;
    u2             descriptor_index;
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

method接见权限符号:

联博api:JVM详解之:java class文件的密码本 第7张

attributes_count和attributes[]

attributes被用在ClassFile, field_info, method_info和Code_attribute这些结构体中。

先看下attributes结构体的界说:

attribute_info {
    u2 attribute_name_index;
    u4 attribute_length;
    u1 info[attribute_length];
}

都有哪些attributes, 这些attributes都用在什么地方呢?

联博api:JVM详解之:java class文件的密码本 第8张

其中有六个属性对于Java虚拟机准确注释类文件至关主要,他们是:
ConstantValue,Code,StackMapTable,BootstrapMethods,NestHost和NestMembers。

九个属性对于Java虚拟机准确注释类文件不是至关主要的,然则对于通过Java SE Platform的类库准确注释类文件是至关主要的,他们是:

Exceptions,InnerClasses,EnclosingMethod,Synthetic,Signature,SourceFile,LineNumberTable,LocalVariableTable,LocalVariableTypeTable。

其他13个属性,不是那么主要,然则包罗有关类文件的元数据。

总结

最后留给人人一个问题,java class中常量池的巨细constant_pool_count是2个字节,两个字节可以示意2的16次方个常量。很明显已经够大了。

然则,万一我们写了跨越2个字节巨细的常量怎么办?迎接人人留言给我讨论。

本文链接:http://www.flydean.com/jvm-class-file-structure/

最通俗的解读,最深刻的干货,最简练的教程,众多你不知道的小技巧等你来发现!

迎接关注我的民众号:「程序那些事」,懂手艺,更懂你!

联博api:JVM详解之:java class文件的密码本 第9张

,

联博API接口

www.326681.com采用以太坊区块链高度哈希值作为统计数据,联博以太坊统计数据开源、公平、无任何作弊可能性。联博统计免费提供API接口,支持多语言接入。

皇冠体育声明:该文看法仅代表作者自己,与本平台无关。转载请注明:联博api:JVM详解之:java class文件的密码本

网友评论

  • (*)

最新评论

文章归档

站点信息

  • 文章总数:649
  • 页面总数:0
  • 分类总数:8
  • 标签总数:1093
  • 评论总数:276
  • 浏览总数:8209