引用类型 基本类型

在Java性能优化系列中,内存管理是一个要优先考虑的关键因素。而说到内存分配,就必然会涉及到基本类型和引用类型。所以我们今天就先来介绍一下这两种类型在性能方面各自有什么奥妙。

名词定义

  先明确一下什么是基本类型,什么是引用类型。简单地说,所谓基本类型就是Java语言中如下的8种内置类型: boolean、char、byte、short、int、long、float、double。而引用类型就是那些可以通过new来创建对象的类型 (基本上都是派生自Object) 。



  ★两种类型的存储方式



  这两种类型的差异,首先体现在存储方式上。在Java中,引用类型是存储在堆 (Heap) 上的;而基本类型是存储在栈 (Stack) 上。可能有同学会小声问: 堆和栈有啥区别捏?要说堆和栈的差别,那可就大了去了。如果你对这两个概念还是不太明白或者经常混淆,建议先找本操作系统的书拜读一下。



  ★堆和栈的性能差异



  堆和栈在性能方面是有很大差别滴。堆相对进程来说是全局的,能够被所有线程访问;而栈是线程局部的,只能本线程访问。打个比方,栈就好比个人小金库,堆就好比国库。你从个人小金库拿钱去花,不需要办什么手续,拿了就花,但是钱数有限;而国库里面的钱虽然很多,但是每次申请花钱要打报告、盖图章、办N多手续,耗时又费力。



  同样道理,由于堆是所有线程共有的,从堆里面申请内存要进行相关的加锁操作,因此申请堆内存的复杂度和时间开销比栈要大很多;从栈里面申请内存,虽然又简单又快,但是栈的大小有限,分配不了太多内存。



  ★为什么这样设计?



  可能有同学又问了,干嘛把两种类型分开存储,干嘛不放到一起捏?这个问题问得好!下面我们就来揣测一下,当初Java为啥设计成这样。

当年Java它爹 (James Gosling) 设计语言的时候,对于这个问题有点进退两难。如果把各种东西都放置到栈中,显然不现实,一来栈是线程私有的 (不便于共享) ,二来栈的大小是有限的,三来栈的结构也间接限制了它的用途。那为啥不把各种东西都放置到堆里面捏?都放堆里面,倒是能绕过上述问题,但是刚才也提到了,申请堆内存要办很多手续,太繁琐。如果仅仅在函数中写一个简单的"int n = 0”,也要到堆里面去分配内存,那性能就大大滴差了 (要知道Java是1995年生出来的,那年头我家的PC配4兆内存就属豪华配置了) 。

左思右想之后,Java它爹只好做了一个折中: 把类型分为基本类型和引用类型;引用类型 (Object派生) 的对象存放到堆里面;把基本类型 (非Object派生) 的值存放到栈里面。所以,你从Java语法上也可以看出两者的差别: 引用类型可以用new创建对象 (对于某些单键,表面上没用new,但是在getInstance()内部也还是用的new) ;而基本类型则不需要用new来创建。

这样设计的弊端

顺便跑题一下,斗胆评价Java它爹这种设计的弊端 (希望Java Fans不要跟我急) 。我个人认为: 这个折中的决策,带来了许多深远的影响,随手举出几个例子:

  1. 由于基本类型不是派生自Object,因此不能算是纯种的对象。这导致了Java的"纯面向对象"招牌打了折扣。
  2. 由于基本类型不是派生自Object,出于某些场合 (比如容器类) 的考虑,不得不为每个基本类型加上对应的包装类 (比如Integer、Byte等) ,使得语言变得有点冗余。

结论 从上述的介绍,我们应该明白,使用new创建对象的开销是不小的。在程序中能避免就应该尽量避免。另外,使用new创建对象,不光是创建时开销大,将来垃圾回收时,销毁对象也是有开销的。

http://program-think.blogspot.com/2009/03/java-performance-tuning-1-two-types.html http://www.ibm.com/developerworks/cn/java/praxis/pr8.html

下表列出了原始类型以及它们的对象封装类。

原始类型和封装类

  原始类型



  封装类





  boolean



  Boolean





  char



  Character





  byte



  Byte





  short



  Short





  int



  Integer





  long



  Long





  float



  Float





  double



  Double

引用类型和原始类型的行为完全不同,并且它们具有不同的语义。例如,假定一个方法中有两个局部变量,一个变量为 int 原始类型,另一个变量是对一个 Integer 对象的对象引用:

  int i = 5;                       // 原始类型

Integer j = new Integer(10); // 对象引用

这两个变量都存储在局部变量表中,并且都是在 Java 操作数堆栈中操作的,但对它们的表示却完全不同。 (本文中以下部分将用通用术语 _堆栈_代替操作数堆栈或 局部变量表。) 原始类型 int 和对象引用各占堆栈的 32 位。 (要表示一个 int 或一个对象引用,Java 虚拟机实现至少需要使用 32 位存储。) Integer 对象的堆栈项并不是对象本身,而是一个对象引用。

Java 中的所有对象都要通过对象引用访问。对象引用是指向对象存储所在堆中的某个区域的指针。当声明一个原始类型时,就为类型本身声明了存储。前面的两行代码表示如下:

引用类型和原始类型具有不同的特征和用法,它们包括: 大小和速度问题,这种类型以哪种类型的数据结构存储,当引用类型和原始类型用作某个类的实例数据时所指定的缺省值。对象引用实例变量的缺省值为 null,而原始类型实例变量的缺省值与它们的类型有关。

许多程序的代码将同时包含原始类型以及它们的对象封装。当检查它们是否相等时,同时使用这两种类型并了解它们如何正确相互作用和共存将成为问题。程序员必须了解这两种类型是如何工作和相互作用的,以避免代码出错。

例如,不能对原始类型调用方法,但可以对对象调用方法:

  int j = 5;

j.hashCode(); // 错误 //… Integer i = new Integer(5); i.hashCode(); // 正确

使用原始类型无须调用 new,也无须创建对象。这节省了时间和空间。混合使用原始类型和对象也可能导致与赋值有关的意外结果。看起来没有错误的代码可能无法完成您希望做的工作。例如:

  import java.awt.Point;

class Assign { public static void main(String args[]) { int a = 1; int b = 2; Point x = new Point(0,0); Point y = new Point(1,1); //1 System.out.println(“a is " + a); System.out.println(“b is " + b); System.out.println(“x is " + x); System.out.println(“y is " + y); System.out.println(“Performing assignment and " + “setLocation…"); a = b; a++; x = y; //2 x.setLocation(5,5); //3

System.out.println("a is "+a);
System.out.println("b is "+b);
System.out.println("x is "+x);
System.out.println("y is "+y);

} }

这段代码生成以下输出:

  a is 1

b is 2 x is java.awt.Point[x=0,y=0] y is java.awt.Point[x=1,y=1] Performing assignment and setLocation… a is 3 b is 2 x is java.awt.Point[x=5,y=5] y is java.awt.Point[x=5,y=5]