信息发布软件,b2b软件,广告发布软件

标题: 深入Java对象及元素的存储区域和实例教程 [打印本页]

作者: 信息发布软件    时间: 2016-10-18 12:34
标题: 深入Java对象及元素的存储区域和实例教程

在JAVA平台上开发应用程序的时候,有一个很大的特点就是其是在应用程序运行的时候才建立对象。换句话说,在程序运行的时候,才会最终确定对象的归属,即对象应该存储在什么地方。由于存储在不同的区域,其在性能上会有所不同。为此作为Java程序开发人员需要了解各个存储区域的特点以及对性能的影响。然后再根据需要来调整应用程序的区域分配。总的来说,在操作系统中有五个地方可以用来保存应用程序运行中的数据。这类区域的特点以及对性能的影响分析如下。

    存储区域一:寄存器

    虽然同在内存中,但是不同的区域由于用途不同,其性能也有所不同。如就拿Java应用程序来说,寄存器由于其处于处理器的内部,为此这个区域存取数据最快。跟内存中的其他存储区域有着天壤之别。那么我们把所有对象都放到这个区域内,不就可以提高Java应用程序的性能了吗?理论上是如此,但是在现实中是行不通的。因为这个寄存器的数量是非常有限的。在内存中的寄存器区域是由编译器根据需要来分配的。我们程序开发人员不能够通过代码来控制这个寄存器的分配。所以说,这第一个存储区域寄存器,我们只能够看看,而不能够对其产生任何的影响。

    存储区域二:堆栈

    对象的创建有两种方式,一是在应用程序开发的过程中就创建对象;二是在程序运行的过程中要用到对象的时候再来创建对象。前者比后者性能要高,而后者比前者要灵活。这主要是因为前者创建对象的时候,就是这个堆栈中创建的。虽然其创建的对象没有保存在寄存器中,但是通过这个对象的推栈指针可以直接从处理器哪里获得相关的支持。如堆栈指针往上移动的时候,则释放原有对象占用的内存;如堆栈指针向下移动时,则为对象分配新的内存。所以,如果把对象存放在这个堆栈中,虽然性能没有像存放在寄存器中那么理想,但是仍然比存储在其他地方要好的多。

    由于Java程序是在程序运行过程中才根据需要来创建对象。为此对象就不能够保存在这个堆栈中。不过Java应用程序也不能够白白的浪费这个宝贵的空间。为此虽然Java对象本身没有保存在这个堆栈中(不是不保存而是这里没有他的容身之地),但是还是应该把一些可以放的内容放到这个堆栈中,以提高应用程序的性能。如可以把一些对象引用存放在这个堆栈中。

    另外对于一些基本的数据类型对象,Java程序也往往把他们放置在堆栈中,以提高数据处理的性能。如一些整数型、字符型的数据对象,这些对象有些共同的特点,如对象比较小、是Java程序提供的标准对象等等。对于这些对象由于每个应用程序基本上都需要用到,而且我们程序开发人员只能够引用这些对象,而不能够对其进行更改。为此Java程序在处理的时候,往往一开始就创建了对象(即直接在堆栈中创建对象并保存),而不像其他对象一样,在需要的时候才创建。只所以在堆栈中创建这些对象,还有一个重要的原因。因为如果在堆栈中创建对象的话,Java编辑器必须知道存储在堆栈内所有数据的确切大小和生命周期。为了得到这些信息,必须产生相关的代码来获得这些信息,以便其操作堆栈指针。普通的对象大小、生命周期等等难以预先获得,为此在堆栈中创建普通的对象,对于Java应用程序来说并不是很合适。相反,这些Java编译器预定义的对象大小并不会随着机器硬件架构的变化和用户需求的变化而变化;而且这些对象往往从始之终都会存在的,所以也不存在生命周期的问题。所以把这些对象放置在堆栈中是合理的,也是可实现的。如此处理,不仅不会影响到对象的灵活性,而且还可以提供比较好的性能。

    存储区域三:堆

    堆虽然跟堆栈一样,都是随机访问存储器中的区域,但是两者有很大的不同。因为在堆中,没有堆栈指针,为此也就无法直接从处理器那边获得支持。为此其性能跟堆栈比起来,就有一定的差距。通常情况下,除上面所说的一些预定义对象之外,其他的对象都是保存在这个堆中的。或者说,利用new关键字创建的对象都是保存在堆中的。保存在堆中其好处也是显而易见的。如Java编译器不需要知道从堆里需要分配多少存储区域,也不必知道存储的数据在堆里会存活多长时间。所以在堆里分配存储有很大的灵活性。当需要对象时,我们可以使用New关键字建立一个对象。然后系统会自动给这个对象在堆中分配一个区域让其作为归宿。不过其最大的不足之处,就是在堆中创建对象与分配存储区域,要比在堆栈中慢许多。鱼与熊掌不能兼得呀。

    存储区域四:静态存储区域与常量存储区域

    在Java对象中有一些特殊的元素。如有些元素是比较特别的(如利用关键字Static定义的变量)。这些变量对于其他对象来说,可能就是静态的。为了更好的管理这些变量,Java在内存中专门划分了一个静态存储区域来管理这些元素。这里的静态存储区域就是指在固定的位置存放应用程序运行时一直存在的数据。这里需要明确的一点就是,Java对象是不保存在这个地方的,而只是把对象中的一些特殊元素放置这里。由于位置固定,所以下次调用的时候就省去了查找的麻烦。为此其对于提供应用程序的性能是有利的。作为我们程序开发人员来说,在书写代码的时候,就需要灵活应用Static这个关键字。笔者的意见是,能用则用;不能用的时候也要想着法儿用。特别是有些元素用不用Static关键字时对于程序功能没有影响,此时我们要理直气壮的在元素前面加上Static关键字。

    在Java对象中还有一类特殊的元素,我们叫做常量。由于常量的值是稳定不变的,如圆周率。为此把他们放在代码的内部是可行的。不过有些时候,在进行一些嵌入式系统开发的时候,我们往往不这么做。而是会把常量元素跟代码分开来保存。如我们会根据情况把常量的值存放在一些只读存储器中。这主要是为了一些特殊的功能考虑的。如出于版权控制的需要。如在打印机上为了保护原装耗材的版权,往往把常量跟代码分开存放。

    存储区域五:非RAM存储

    有时候,有些程序运行所需要的数据我们还会放置在其他地方。如在一些系统中需要用到流对象,这个对象的数据并没有保存在上面所谈到的任何一个存储区域,这个对象直接被转为为字节流,发送到其他的主机上去了。另外有一种叫做持久化的对象,其是被存储在硬盘中的。这些对象平时在应用程序开发过程中用到的并不是很多,大家只需要了解有这些对象的存在即可。等到需要用到的时候,再去深入研究也不迟。

    从上面的分析中我们可以看到,对象的归属我们程序开发人员很难控制。寄存器是编译器来管理的。而堆与堆栈又基本上受到开发平台的限制,我们程序人员也没有这个能耐来干涉他们。其实我们主要能够调整与控制的就是第四个存储区域,即静态存储与常量存储。笔者的建议是,对于非嵌入式程序,能够利用静态存储来实现的,就尽量采用静态存储。而对于常量来说,需要根据需要实现的功能来判断是否需要把常量存储在只读存储器中。有时候对于版权的保护等等需要用到这个只读存储器。



作者: 信息发布软件    时间: 2016-10-18 12:35

我们经常看到这个句话:

Java里存放的容器只能是1个对象.



一. 值类型和对象类型.

实际上, java里的变量可以分为两种类型, 一种是值类型. 一种是对象类型.



1.1 值类型变量

所谓值类型的变量就是内容(值)直接保存在stack(栈区)或静态区的变量.


例如


[java] view plain copy






这个i就是值类型变量.   这个变量的内容(值)存放在内存的栈区.

深入Java对象及元素的存储区域和实例教程 b2b软件


如上图, 红色部分就是值类型变量i所占的内存, 共4个字节.


在java中, 一共有八种值类型. 它们分别是

byte, short, int, long, float, double, char, boolean

可以见这些值类型变量的值要么是数字, 要么就是字符(char)

也就是说, 这8中类型之类的变量都是对象类型.




1.2 对象类型变量所谓对象类型变量的内容存(成员的值)放在heap(堆区)(String对象除外), 然后在stack区或static区保存这个对象内容heap区内存的地址.

假如Student是1个类, 它有两个成员id 和 age.

那么实例化1个对象


[java] view plain copy




上面的s就是1个对象类型的变量.

它的数据是这样存放在内存中的.

1.它成员Id 和 name 的值会存放在heap区.

2.变量s本身会存放1个地址, 这个地址就是它的成员在heap区内存的头部地址.  


如下图:

紫色的部分才是对象型变量s的真正内容,

而变量s本身存放的是其真正内容在heap区内存的地址.

深入Java对象及元素的存储区域和实例教程 b2b软件





二. 为什么java容器只存放对象类型.

2.1 c语言数组只能存放单种元素


我们知道, Java是c/c++ 发展而来的.

我们回忆一下C语言对于数组的特性.

1. 数组在连续的一块内存空间内存储

2. 数组内的元素必须是相同类型的.


例如 int[] 数组只存放int 类型元素,  char[] 数组只存放char类型元素.

为什么呢.


原因很简单, 因为在c语言数组连续的内存中,

如果要判断数组内的其中1个地址内存是属于第几个元素的,

则:

1. 知道数组第1块内存的地址.

2. 计算当前地址与第1块内存地址的距离

3. 知道每1个元素所占的内存长度.

4.利用内存除以单个元素内存长度则可以求出当前内存属于第几个元素.


也就是说, 数组内的每个元素所占的内存必须是一样的.  这样才可以求出数组的某个地方属于第几个元素.



2.2 Java的数组可以存放多种属于不同类的对象

而Java里的数组为何能存放多种种类的元素呢?

例如下面代码是合法的:


[java] view plain copy




上面代码在1个数组容器内添加了3个对象.

这3个对象分别属于Student, School 和City类,  这3个对象明显不是属于同1个类,而且所占的内存大小很明显是不同的.

但是能存放在同1个数组容器中.


原因就是

上面三个对象的内容(成员的值)所占的内存是不同的,  这些内存都存放在Heap区内.

但是, 数组容器并不是直接存放上面3个对象的内容, 而只是保存这3个对象内容在Heap区的头部地址.


而无论这个三个对象所占的heap区内存相差多大, 它们的头部地址所占的长度都是一样的4byte(32位系统)

所以实际上数组内的元素都是同1种类型, 就是内存地址类型, 它们的长度都一样啊.

如下图:

深入Java对象及元素的存储区域和实例教程 b2b软件



上图3块红色内存就是连续的, 它们都属于存放在数组Arr内.


所以我们讲: Java里的容器只存放对象类型元素, 但是实际上是存放对象内容的头部地址.



三. 自动装箱(boxing) 和 自动拆箱(unboxing)

但是实际上, 我们往往在容器里直接添加值类型变量.

例如下面的代码是合法的:


[java] view plain copy




上面我们直接往1个ArrayList容器添加了值类型对象123 和 "Jack"? 不是跟上面所说的矛盾吗?



3.1 "Jack" 是1个字符串对象类型, 而不是值类型.

本文在上面提过, java只有8中值类型.

而"Jack" 是1个字符串常量,  它的内容保存在static区,  它是1个对象而不是值类型.

其实对象类型和值类型的最大区别就是, 对象类型具有成员.

可以通过 ".属性名" 或 ".方法名()"来调用对象的属性or方法.

下面的代码就是合法的, 它输出了1个字符串常量对象的长度:


[java] view plain copy








3.2 什么是装箱(boxing)

虽然我们执行了代码

arr.add(123);

但是如果数组内直接存放数值123的值就违反了java容器只存放对象的原则了.


实际上, java里, 对于值类型来讲, 都有1个对应的对象类型.

例如 int是1个整形值类型,  而Interger是1个整形类


Interger里有1个成员属性, 用于存放1个整形值类型的值.

还包含很多对整形值操作的方法.


而int 整形类型本身是没有任何成员方法的.

所以有时我们会用1个Integer对象将1个int变量包起来.

例如


[java] view plain copy




上面的i就是1个整形值类型变量

而io就是1个Integer对象.

这个过程就叫做装箱.


对于容器来讲,

如果将1个值类型直接放入容器, java会将其装箱后再放入容器.

这个过程就叫做自动装箱.

所以下面两句代码是等价的.


[java] view plain copy




所以实际上并没有违反java容器只存放对象的原则.



3.3 什么是拆箱

这个也很简单, 就是基于1个对象类型返回1个值类型就是拆箱了.

例如:


[java] view plain copy




上面代码中我们用值类型变量i 获得 Integer对象io所存放的值, 这个过程就是拆箱


如果我们利用容器的get()方法来返回1个值类型.

例如:


[java] view plain copy




我们知道容器里存放的都是对象, 但是java会先将其拆箱再返回给1个值类型变量,

这个过程那个就是自动拆箱了.







作者: 信息发布软件    时间: 2016-10-18 12:41
Java对象内存结构
鉴于我之前学习C/C++,Java中有一件事始终困扰着我,就是Java中缺少一个计算对象占用内存大小的方法。C++提供了sizeof运算符让你能计算基本类型和一个给定类型的对象占用内存的大小。这个操作符在C和C++中对于像指针运算,内存拷贝和IO这类操作都非常有用。

Java没有类似的操作符。实际上,Java并不需要这样的操作符。在Java中基本类型的大小是语言描述的,而在C和C++中是与平台相关的。Java有它自己的一套为序列化而设计的IO体系结构。而且Java没有指针运算和大内存拷贝,因为Java就没有指针这个概念。

即便如此,Java开发人员有时候还是好奇一个Java对象到底占用了多大的内存。事实证明,答案并不那么简单。

首先需要弄清楚的是“浅大小”和“深大小”的区别。一个对象的“浅大小”是指这个对象本身所占用内存空间的大小,并不考虑它所关联对象的大小。另一方面,“深大小”不仅考虑了这个对象的“浅大小”还把这个对象所有引用的对象的大小迭代的计算在内。大部分情况下,你都希望知道一个对象的“深大小”,但是为了知道它,你得首先先学会怎么计算“浅大小”,这正是我在这儿要讨论的。

现在有一个复杂的情况就是Java对象在运行时的内存结构并没有在虚拟机中被严格的规范,这也就意味着不同的虚拟机提供者可以根据他们自己的意愿去实现虚拟机。这样造成的后果就是你定义的同一个类型的实例在不同的虚拟机中会占用不同的内存空间。然而普遍的,包括我自己在内,使用的都是Sun HtoSpot虚拟机,这使得事情变得简单。剩余部分的讨论都是针对32位的Sun JVM。我将列出几个规则来说明Java虚拟机在内存中怎么组织对象的布局。

没有实例属性的类的内存布局

在Sun JVM中,所有的对象(除了数组)都有两个字的头部,第一个字包含对象的标识,哈希码以及一些标志信息,比如锁的状态,年龄(注:经过了几次gc)。第二个字是指向该对象类型的应用。另外任何对象都对齐到一个8字节的粒度。这也就是第一个规则或者说对象内存布局:

规则一:所有的对象都对齐到一个8字节的粒度。

现在我知道了如果调用new Object(),我们只需要将堆里面的8个字节分配给对象的头部,因为Object类没有任何的属性。

继承Object的类的内存布局

在8个字节的头部之后紧接着是类的属性。属性总是根据它们自己类型的大小进行对齐。举个例子,int被对齐到一个4字节的粒度,long被对齐到一个8字节的粒度。这样做是出于效率的原因:通常如果字被对齐到一个4字节的粒度,那么从内存中读取一个4字节的字到处理器的寄存器中将会很高效。

为了节省一些内存,Sun JVM没有按照属性在类中声明的顺序进行布局,而是按照下面的顺序在内存中进行组织的:

这个策略能很好的优化内存的使用。例如,假设你定义了下面的一个类:
class MyClass {    byte a;    int c;    boolean d;    long e;    Object f;        }

如果Java虚拟机没有调整属性的顺序,对象的内存布局会是如下所示:
[HEADER:  8 bytes]  8[a:       1 byte ]  9[padding: 3 bytes] 12[c:       4 bytes] 16[d:       1 byte ] 17[padding: 7 bytes] 24[e:       8 bytes] 32[f:       4 bytes] 36[padding: 4 bytes] 40

注意到,因为需要对其,14个字节的空间被浪费了,这个对象将使用40个字节的内存空间。如果安装上面的规则重新调整属性的顺序,对象的内存布局就会变成:
[HEADER:  8 bytes]  8[e:       8 bytes] 16[c:       4 bytes] 20[a:       1 byte ] 21[d:       1 byte ] 22[padding: 2 bytes] 24[f:       4 bytes] 28[padding: 4 bytes] 32

这个时候仅仅只需要6个字节用来填充,而且对象总共只需要32个字节的内存空间。

这就是对象内存布局的规则二

规则二:类的属性按照这样的数序进行排序:首先是long和double,然后int和float,然后char和short,然后byte和boolean,最后是引用。每个属性都按照它们自己的粒度进行对其。

现在我们知道了怎么计算一个直接继承自Object的类的对象占用内存的大小。一个实际的例子是java.lang.Boolean类。下面是它的内存布局:
[HEADER:  8 bytes]  8 [value:   1 byte ]  9[padding: 7 bytes] 16

一个Boolean类的实例占用了16个字节的内存!是不是很惊讶?(注意最后填充的字节是为了对齐8字节粒度)

其他类的子类的内存布局

接下来对于那些继承了父类的类java虚拟机有三个规则来组织其内存结构。对象内存布局的规则三如下:

规则三:属于不同类层次的字段永远不要混合在一起。父类的字段放在第一位,遵守规则二,其次是子类的字段。

举例如下:
class A {   long a;   int b;   int c;}class B extends A {   long d;}

B的一个实例在内存中的布局如下:
[HEADER:  8 bytes]  8[a:       8 bytes] 16[b:       4 bytes] 20[c:       4 bytes] 24[d:       8 bytes] 32

如果父类的字段不满足4字节的粒度,下面的规则将被使用。内容如下:

规则四:在父类的最后一个字段和子类的第一个字段之间必须填充对齐到4字节边界。

举例如下:
class A {   byte a;}class B {   byte b;}[HEADER:  8 bytes]  8[a:       1 byte ]  9[padding: 3 bytes] 12[b:       1 byte ] 13[padding: 3 bytes] 16

注意字段a后面的3个字节的填充是为了对齐到4字节的粒度。填充的空间会丢失而且不能被B类的字段所使用。

如果子类的第一个字段是long或者double并且父类没有对齐到8字节的边界,最后的这个规则将被使用来节省空间。

规则五:如果子类的第一个字段是long或者double并且父类没有对齐到8字节的边界,Java虚拟机将打破规则二并且尝试按照:首先int,然后short,然后byte,最后引用的顺序将字段放到子类内存空间开始的地方,直到填充整个空白。

举例如下:
class A {  byte a;}class B {  long b;  short c;    byte d;}

内存布局如下:
[HEADER:  8 bytes]  8[a:       1 byte ]  9[padding: 3 bytes] 12[c:       2 bytes] 14[d:       1 byte ] 15[padding: 1 byte ] 16[b:       8 bytes] 24

在第12个字节处,A类结束,Java虚拟机打破规则二将一个short和一个byte放在了long的前面,从而节省了可能会浪费的三四个字节。


数组的内存布局


与普通对象不同,数组有一个额外的头部,该头部用来储存数组的长度。接着是数组的元素,数组作为一个对象,同样也需要对齐到一个8字节的粒度。

下面是包含3个元素的字节数组的内存布局:
[HEADER:  12 bytes] 12[[0]:      1 byte ] 13[[1]:      1 byte ] 14[[2]:      1 byte ] 15[padding:  1 byte ] 16

下面是包含3个元素的长整型数组的内存布局:
[HEADER:  12 bytes] 12[padding:  4 bytes] 16[[0]:      8 bytes] 24[[1]:      8 bytes] 32[[2]:      8 bytes] 40

内部类的内存布局

非静态内部类有一个额外的“隐藏”字段用来保存指向外部类的引用。这个字段是一个普通的引用,它遵从引用类型的内存布局的规则。所以,内部类会有额外的4个字节的代价。






欢迎光临 信息发布软件,b2b软件,广告发布软件 (http://postbbs.com/) Powered by Discuz! X3.2