关于String的不可变性关于String的不可变性

0 概述

众所周知，java中String为不可变的，即一旦一个String对象在内存中被创建出来就无法被修改。
具体表现为，String类的所有方法都没有改变字符串本身的值，而是返回了一个新的对象。
比如以下代码：

String str = "a"; str ="b";

文章图片
image.png 事实上，内容为"a"的字符串对象并没有改变，只是str指向的对象地址发生了改变。
1 String的不可变性是如何保证的 JDK源码中，存放String内容的实际上是char数组，这个数组是final类型的，一经初始化就不能改变。

/** The value is used for character storage. */ private final char value[];

但是，char数组是引用类型，final类型只能保证value的地址不可变，不能保证value数组的内容不能变化。即完全可以通过以下方式改变value的内容：

final char[] value = https://www.it610.com/article/{'a','b','c'}； value[0] = 'd';

所以，重点是字符数组为private访问权限，所以只有SUN的工程师可以拿到这个字符数组。而SUN的工程师在所有方法中都没有改变该字符数组的值。另外，String被定义为Final类型，也防止了通过继承之后破坏不可变性。
2 String为什么设计为不可变？ Sring设计为不可变，显然是优点要大于缺点。优点主要是效率高，安全性高。我们先看优点有哪些：
2.1 优点
1 效率效率主要体现在，基于Sting不可变，可以缓存字符串以及Hashcode，节省时间和空间。

String intern pool（字符串保留池）
基于Sting不可变，我们就可以用缓存池将String对象缓存起来，同时把一个String对象的地址赋值给多个String引用，这样可以安全保证多个变量共享同一个对象。如果Java中的String对象可变的话，一个引用操作改变了对象的值，那么其他的变量也会受到影响。
Java语法中专门给String类型设计有String intern pool，当程序员构造一个新的字符串时（只适用String str = "abc"的场景，不适用new String("abc")的场景），会优先在池子中查找是否已经存在内容相同的String对象，如果有则直接返回该对象的地址引用，没有就会构造一个新对象，放进池子，再返回地址引用。因此，构造一万个string x = "abc"，实际上得到都是同一个引用，避免很多不必要的空间开销。
【关于String的不可变性】缓存Hashcode

String对象内的hashCode()方法实际上只需执行一次计算过程（惰性计算），计算后把结果缓存到一个内部私有变量 int hash中,再次调用hashCode()方法时了，直接返回hash。例如，HashMap以Srting为key，需要频繁读取访问任意键值对时，能够节省很多的cpu计算开销。

2 安全性

线程安全

不可变对象在物理上是绝对性的线程安全。由于不可变对象不可能被修改，因此能够在多线程中被任意自由访问而不导致线程安全问题，不需要多余的同步操作。即在并发场景下，多个线程同时读一个资源，并不会引发竞态条件，只有对资源进行读写才有危险。不可变对象不能被写，所以线程安全。

其它地方使用安全

String被广泛用于网络连接、文件IO等多种Java基础类的参数中，如果String内容可变的话，将潜在地带来多种严重安全隐患，例如链接地址被暗中更改等。

下面是截取的一个示例，用不可变的String与可变的StringBuilder作为对比。

文章图片
image.png 在例子中，客户端可以拿到String参数s和StringBuilder参数sb，不能改变原始的s，却能改变sb。如果String可变，不安全性就体现在这里。
2.1 缺点
1 丧失了部分灵活性我们平时使用的大部分都是可变对象，如果内容变化，只需要setValue()更新一下就可以了，不需要重新创建一个对象。当然，我们完全可以使用StringBuilder来弥补这个缺点。
3 脆弱的不可变性

任何东西都可以靠JNI改变。一旦有调用C语言，你将在很多方面打破很多事情我甚至无法数清…
使用纯java，通过反射改变String对象也很容易。

public class StringModifier { public static void main(String[] str){ try { String test1="aaaa"; String test2 =test1; String test3 = new String(test1); String test4 = new String(test1.toCharArray()); Field values = String.class.getDeclaredField("value"); values.setAccessible(true); char[] ref = (char [])values.get(test1); ref[0] = 'b'; System.out.println("aaaa"); System.out.println(test1+" "+test2+" "+test3+" "+test4); } catch (NoSuchFieldException|SecurityException| IllegalArgumentException|IllegalAccessException ex) { } } }

代码输出可能出乎你的意料：

文章图片
image.png 我们知道，test1、test2同一String对象的引用。test3虽然持有的引用和test1的String对象不一样，但是value[]数组是同一个。而test4的初始化方式，会生成新的数组并且拷贝每个元素，并创建新的String对象，所以不受影响。而System.out.println("aaaa")最终会调用到println(String s)，栈中的s和test1同样指向同一地址。
详情可以参考String类源码中的初始化方式：http://www.jianshu.com/p/e5461012dcea
3 总结总的来说，String作为Java中使用最为广泛的一个类，设计为不可变，是出于效率与安全性方面考虑。