Java-class文件结构
一、概述
我们都知道我们现在写的源代码计算机是不认识的,我们需要根据指定的编译器进行编译-连接-执行,这样才是我们想要的结果,所以计算机只能认识0或者1 ,那么如何与操作系统或者机器指令无关的程序能执行,那么在操作系统以及机器指令之上的那就是虚拟机了,这样我们编写的代码不再是最终形成二进制本地指令代码,而是一种在操作系统和机器指令之上的虚拟机规定的文件格式。这也说明了java是一次编写到处运行的由来,但是并不是到处运行的,运行的前提是虚拟机是否此操作系统支持。那么我们的JVM也要所规定class文件的格式,它不管你是什么语言编写并编译出来的class文件,必须严格符合JVM定义的格式,否则JVM不会进行加载的。也有点像我们做TCP UDP定义的消息格式: (比如:我们定义tcp消息格式为:消息头4个字节+不定长度的消息体) 。
class文件是一组以8位字节为基础单位二进制流,各个数据项严格按照顺序紧凑的排列在class文件中,中间不添加任何空格。这样看起来整个class文件中的所有数据都是运行数据,没有空隙存在。如果遇到占用大于8位字节以上的空间的数据项的时候,会以8位字节为单位高位在前低位在后的顺序排列进行存储。class文件结构采用类似c语言伪结构来存储 这种伪结构有两种数据类型:无符号数和表 ,解析都是根据这两个数据类型来解析的。
二、class 文件魔数和版本号
每个class文件的头都包含有4个字节的魔数 他是唯一作用是为了确定这个文件是否确定被JVM所接受,也就是身份识别的作用。 魔数值为:0XCAFEBABE (四个字节) 紧接着是:第五个和第六个字节为次版本号 第七和第八个字节为主版本号比如: 0XCAFEBABE00000032 次版本为0 主版本号为java1.7
jdk1.0 从45.0开始的 具体版本号查看文档。
三、常量池
在紧跟着版本号后跟着常量池的入口,常量池的u2类型的数据代表池容量计数值
0XCAFEBABE 00000032 0017
0017 偏移量不是从0开始的而是从1开始的 0x0017 十进制为23 代表有 22个常量,索引从1~22 第0个做特殊处理。常量池中两类常量:字面量和符号引用
字面量:字符别声明为final的常量值等 。
符号引用:
1、 类或者接口的全限定名
2、 方法的签名
3、 字段的签名
这样虚拟机运行的时候会从常量池中获取对应的符号引用。
我们接着往后继续分析class文件内部结构,常量池中的每一项开始都包含有一个u1的tag + 对应数据项,在常量池中一共包含有11中常量项类型:
我们开始分析常量池中的第一项 tag 一个u1 为0x07 十进制为7 代码类型为7的Class_info
class_info 项 为:一个u1 的tag + 一个u2的指向第几个常量项
0X0002 指的是第二项, 第二项tag为 0x01 为类型为1的UTF8_INFO utf8_info 类型为
一个u1的tag 一个u2的bytelength + length 个u1的数据区
往后面常量池数据项的对照着类型表依次分析这样太麻烦了。我们可以通过java 中自带的命令进行分析 在jdk中的bin目录下包含有javap 命令 格式为:javap -verbose xxx.class
我们首先写个java类进行测试
package clazz; public class MyClazz { private String name; private int age; public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } public void say(String name) { System.err.println("name"); } public String getSay(String name) { return name; } }
执行命令 javap -verbose MyClazz.class
D:\work\ewp\test\bin\clazz>javap -verbose MyClazz.class Classfile /D:/work/ewp/test/bin/clazz/MyClazz.class Last modified 2015-11-24; size 1017 bytes MD5 checksum 1899fd38b93905c461f55b955076f985 Compiled from "MyClazz.java" public class clazz.MyClazz SourceFile: "MyClazz.java" minor version: 0 major version: 51 flags: ACC_PUBLIC, ACC_SUPER Constant pool: #1 = Class #2 // clazz/MyClazz #2 = Utf8 clazz/MyClazz #3 = Class #4 // java/lang/Object #4 = Utf8 java/lang/Object #5 = Utf8 name #6 = Utf8 Ljava/lang/String; #7 = Utf8 age #8 = Utf8 I #9 = Utf8 <init> #10 = Utf8 ()V #11 = Utf8 Code #12 = Methodref #3.#13 // java/lang/Object."<init>":()V #13 = NameAndType #9:#10 // "<init>":()V #14 = Utf8 LineNumberTable #15 = Utf8 LocalVariableTable #16 = Utf8 this #17 = Utf8 Lclazz/MyClazz; #18 = Utf8 getName #19 = Utf8 ()Ljava/lang/String; #20 = Fieldref #1.#21 // clazz/MyClazz.name:Ljava/lang/String; #21 = NameAndType #5:#6 // name:Ljava/lang/String; #22 = Utf8 setName #23 = Utf8 (Ljava/lang/String;)V #24 = Utf8 getAge #25 = Utf8 ()I #26 = Fieldref #1.#27 // clazz/MyClazz.age:I #27 = NameAndType #7:#8 // age:I #28 = Utf8 setAge #29 = Utf8 (I)V #30 = Utf8 say #31 = Fieldref #32.#34 // java/lang/System.err:Ljava/io/PrintStream #32 = Class #33 // java/lang/System #33 = Utf8 java/lang/System #34 = NameAndType #35:#36 // err:Ljava/io/PrintStream; #35 = Utf8 err #36 = Utf8 Ljava/io/PrintStream; #37 = String #5 // name #38 = Methodref #39.#41 // java/io/PrintStream.println:(Ljava/lang/S #39 = Class #40 // java/io/PrintStream #40 = Utf8 java/io/PrintStream #41 = NameAndType #42:#23 // println:(Ljava/lang/String;)V #42 = Utf8 println #43 = Utf8 getSay #44 = Utf8 (Ljava/lang/String;)Ljava/lang/String; #45 = Utf8 SourceFile #46 = Utf8 MyClazz.java { public clazz.MyClazz(); flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #12 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 3: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lclazz/MyClazz; public java.lang.String getName(); flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: getfield #20 // Field name:Ljava/lang/String; 4: areturn LineNumberTable: line 13: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lclazz/MyClazz; public void setName(java.lang.String); flags: ACC_PUBLIC Code: stack=2, locals=2, args_size=2 0: aload_0 1: aload_1 2: putfield #20 // Field name:Ljava/lang/String; 5: return LineNumberTable: line 17: 0 line 18: 5 LocalVariableTable: Start Length Slot Name Signature 0 6 0 this Lclazz/MyClazz; 0 6 1 name Ljava/lang/String; public int getAge(); flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: getfield #26 // Field age:I 4: ireturn LineNumberTable: line 21: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this Lclazz/MyClazz; public void setAge(int); flags: ACC_PUBLIC Code: stack=2, locals=2, args_size=2 0: aload_0 1: iload_1 2: putfield #26 // Field age:I 5: return LineNumberTable: line 25: 0 line 26: 5 LocalVariableTable: Start Length Slot Name Signature 0 6 0 this Lclazz/MyClazz; 0 6 1 age I public void say(java.lang.String); flags: ACC_PUBLIC Code: stack=2, locals=2, args_size=2 0: getstatic #31 // Field java/lang/System.err:Ljava/io/Pr 3: ldc #37 // String name 5: invokevirtual #38 // Method java/io/PrintStream.println:(Lj 8: return LineNumberTable: line 30: 0 line 31: 8 LocalVariableTable: Start Length Slot Name Signature 0 9 0 this Lclazz/MyClazz; 0 9 1 name Ljava/lang/String; public java.lang.String getSay(java.lang.String); flags: ACC_PUBLIC Code: stack=1, locals=2, args_size=2 0: aload_1 1: areturn LineNumberTable: line 35: 0 LocalVariableTable: Start Length Slot Name Signature 0 2 0 this Lclazz/MyClazz; 0 2 1 name Ljava/lang/String; } D:\work\ewp\test\bin\clazz>
从结果上看 我们可以看到 46个常量项 与我们在前面算的一个 0X2F 十进制为47 0项不算 1~46 正好
对应。
常量池后面仅接着是访问修饰下面是对应修饰表
我们的public +jdk1.2之后 0x0020 | 0x001 那结果就是 0x0021
和我们用javap 命令查看的一样
flags: ACC_PUBLIC, ACC_SUPER
接着修饰后面的是类索引 + 父索引 + 接口集合索引
类索引 this_class 一个u2 指向常量池中class_info项的引用地址
java 是只允许单继承不允许多继承的 一个u2的父类索引 指向常量池中class_info项的引用地址
下面是this_class 和父类索引 指向图
0x001 指向常量池中第一项 0X003 指向常量池中的第三项 (注意他们都是指向class_info 类型)
接口集合索引是一组u2的集合
在此class中 0X0000 此接口集合索引为0
跟在后面的是 字段表集合
字段描述包括是类级别还是实例级别、作用域、是否为安全的、是否修饰为static 是否可变等
字段表结构
比如: private String name,sex; 定义
attr = 2
都是指向常量池中的引用地址
相关推荐
1、打开一个或者多个*.class文件,XJad反编译后,重命名为*.java文件, 保存至当前文件夹,并在编辑器中打开查看; 2、打开一个文件夹,XJad将该文件夹下所有*.class文件进行反编译,并保存至该文件夹下, 依据包...
java class的文件结构,java class文件结构是基于字节流的,用unicode进行编码,下面说说java Class文件内部结构分析
JavaClassViewer-2.0.4, 用于理解Class文件结构。 解析出class结构,以及十六进制的表示,特别方便。 原下载地址: http://www.softpedia.com/get/Programming/File-Editors/Java-Class-Viewer.shtml。另外也可以参考...
上海计算所分析的关于java字节码的结构组成
这个是个压缩包,里面包含了从各个地方收集来的关于JAVA_CLASS的文件结构的分析。东西都不是我的,自然也不敢说收版权费。所以就小小地收收体力费好了。...(内含五篇,包括:《JavaClass文件的结构分析及其校验》)
JavaClass文件加密专家通过分析Class文件的结构,将Class二进制代码中耗时较多的部份抽出并替换为Native C代码, 并且使用1024位加密算法将Class文件数据加密,任何Java反编译工具均不可能对加密后的文件...
Java虚拟机中的class类文件的知识,个人整理大的class类文件结构.xmind,有什么问题及时反馈。
java Class文件分析及其解析执行是分析JVM的重要部分,通过实例对Class文件的结构进行了详细分析,并初步实现了Class文件的解析执行。
java反编译项目工程,可以将class 文件 进行 修改 重新导包 生成修改后的jar 步骤 1、将需要修改的 jar 包 放入 lib 目录下,并加入项目中 ,选中 jar 右击 选择 add a libray这个时候会看到 jar 的 目录 结构 2、...
一个简单的分析工具,用于分析”.class/.cap/.exp”格式的Java文件。 对于CAP文件,支持version 2.1 and 2.2. 适用于JCVM的学习。 使用工具时,需保证“C:\Program Files\WinZip\WINZIP32.EXE”存在,用于解压CAP...
今天把之前在Evernote中的笔记重新整理了一下,发上来供对java class 文件结构的有兴趣的同学参考一下
我们都知道,Java程序最终是转换成class文件执行在虚拟机上的,那么class文件是个怎样的结构,虚拟机又是如何处理去执行class文件里面的内容呢,这篇文章带你深入理解Java字节码中的结构。 1.Demo源码 首先,编写一...
}属性属性(Attributes)在 Class 文件格式中的 ClassFile结构、 field_info结构,method_info结构和 Code_at
以思维导图的方式概括了java class文件的结构。其中用位置描述了各个结构出现的顺序。为JVM的一个分支。
class文件是由8bits的字节流组成,全部字节构成了15个有意义...随着Java技术的发展,class文件的格式会发生变化。版本号的作用在于使得虚拟机能够认识当前加载class的文件格式。从而准确的提取class文件信息。 3.co
了解Class文件的结构组成,对于我们后续的JVM以及Java原理深入学习是很有帮助的,因为Class文件帮我们默默的做了很多事,比如、为什么对象方法中可以直接使用this变量?!本文将带领大家,一步步,从开头到结尾,...
java反编译工具,能把.class的文件 编译成.java的文件,在开发中用到的一些第三方插件包的时候,也许你想看看其内部结构怎么写的,就可以把.jar 的转换成.java来看,很好的
Class文件结构明细,各种详细的指标,以java1.8版本为例。
NULL 博文链接:https://bolinyang.iteye.com/blog/1830472