Java基础-集合比较-集合之间的区别和联系

Java工程师知识树 / Java基础
ArrayList/LinkList/Vector的联系 ArrayList/LinkList/Vector这三者都是实现集合框架中的List,也就是所谓的有序集合,因此具体功能也比较近似,比如都提供按照位置进行定位、添加或者删除的操作,都提供迭代器以遍历其内容等。
ArrayList/LinkList/Vector的区别

  • 1 底层实现方式
    • ArrayList内部用数组来实现;
    • LinkedList内部采用双向链表实现;
    • Vector内部用数组实现。
  • 【Java基础-集合比较-集合之间的区别和联系】2 读写机制
    • LinkedList在插入元素时,须创建一个新的Entry对象,并更新相应元素的前后元素的引用;在查找元素时,需遍历链表;在删除元素时,要遍历链表,找到要删除的元素,然后从链表上将此元素删除即可。
    • ArrayList在执行插入元素是超过当前数组预定义的最大值时,数组需要扩容,扩容过程需要调用底层System.arraycopy()方法(native方法)进行大量的数组复制操作;在删除元素时并不会减少数组的容量(如果需要缩小数组容量,可以调用trimToSize()方法);在查找元素时要遍历数组,对于非null的元素采取equals的方式寻找。
    • Vector与ArrayList在插入元素时容量扩充机制不一致。Vector与ArrayList默认创建一个大小为10的Object数组,并将capacityIncrement设置为0;对于Vector,当插入元素数组大小不够时,如
      capacityIncrement大于0,则将Object数组的大小扩大为现有size+capacityIncrement;如果capacityIncrement<=0,则将Object数组的大小扩大为现有大小的2倍。
      而ArrayList如果超出数组容量,默认分配大小为原数组的1.5倍。
      Vector与ArrayList如果分配的数组过大(超过Integer.MAX_VALUE - 8,一般都不会那么大),则调用hugeCapacity静态方法 ,如果minCapacity介于Integer.MAX_VALUE - 8Integer.MAX_VALUE,则直接分配一个Integer.MAX_VALUE大小的数组,否则抛出OutOfMemoryError。一般情况下是不会数组中是不会存那么多元素的,这个机制是为了在程序异常时报错中断程序。
  • 3 读写效率
    ArrayList对元素的增加和删除都会引起数组的内存分配空间动态发生变化。因此,对其进行插入和删除速度较慢,但检索速度很快。ArrayList对元素在链表开头与结尾部分的插入和删除操作其实和LInkedList相差无几的,所以在有些场景下,LinkedList增加删除较快也是没有那么严谨。
    LinkedList由于基于链表方式存放数据,增加和删除元素的速度较快,但是检索速度较慢。
  • 4 线程安全性
    ArrayList、 LinkedList为非线程安全; Vector是基于 synchronized 实现的线程安全的ArrayList。
    需要注意的是:单线程应尽量使用ArrayList, Vector因为同步会有性能损耗;即使在多线程环境下,我们可以利用Collections这个类中为我们提供的synchronizedList(List list)方法返回一个线程安全的同步列表对象。
HashMap/HashTable/TreeMap的联系 Hashtable、 HashMap、 TreeMap都是最常见的一些Map实现,是以键值对的形式存储和操作数据的容器类型。而且三个Map接口实现的Key不能有重复的键,一个Key键最多只能映射一个值。
HashMap/HashTable/TreeMap的区别 首先先看下HashMap/HashTable的区别:
  • 1 元素特性
    HashTable中的key、 value都不能为null; HashMap中的key、 value可以为null,很显然只能有一个key为null的键值对,但是允许有多个值为null的键值对; TreeMap中当未实现
    Comparator 接口时, key 不可以为null;当实现 Comparator 接口时,若未对null情况进行判断,则key不可以为null,反之亦然。
  • 2 顺序特性
    HashTable、 HashMap具有无序特性。 TreeMap是利用红黑树来实现的(树中的每个节点的值,都会大于或等于它的左子树种的所有节点的值,并且小于或等于它的右子树中的所有节点的
    值),实现了SortMap接口,能够对保存的记录根据键进行排序。所以一般需要排序的情况下是选择TreeMap来进行,默认为升序排序方式(深度优先搜索),可自定义实现Comparator接口
    实现排序方式。
  • 3 初始化与增长方式
    初始化时: HashTable在不指定容量的情况下的默认容量为11,且不要求底层数组的容量一定要为2的整数次幂; HashMap默认容量为16,且要求容量一定为2的整数次幂。
    扩容时: Hashtable将容量变为原来的2倍加1; HashMap扩容将容量变为原来的2倍。
  • 4 线程安全性
    HashTable其方法函数都是同步的(采用synchronized修饰),不会出现两个线程同时对数据进行操作的情况,因此保证了线程安全性。也正因为如此,在多线程运行环境下效率表现非常低下。因为当一个线程访问HashTable的同步方法时,其他线程也访问同步方法就会进入阻塞状态。
    比如当一个线程在添加数据时候,另外一个线程即使执行获取其他数据的操作也必须被阻塞,大大降低了程序的运行效率,在新版本中已被废弃,不推荐使用。
    HashMap不支持线程的同步,即任一时刻可以有多个线程同时写HashMap; 可能会导致数据的不一致。
    如果需要同步:
    • (1)可以用 Collections的synchronizedMap方法;
    • (2)使用ConcurrentHashMap类,相较于HashTable锁住的是对象整体, ConcurrentHashMap基于lock实现锁分段技术。首先将Map存放的数据分成一段一段的存储方式,然后给每一段数据分配一把锁,当一个线程占用锁访问其中一个段的数据时,其他段的数据也能被其他线程访问。 ConcurrentHashMap不仅保证了多线程运行环境下的数据访问安全性,而且性能上有长足的提升。
然后再看下HashMap/TreeMap的区别:
  • 1、HashMap中元素是没有顺序的;TreeMap中所有元素都是有某一固定顺序的,具体顺序可以由指定的Comparator来决定,或者根据键的自然顺序来判断。。
  • 2、HashMap继承AbstractMap类,是基于hash表实现的;TreeMap继承SortedMap类,是基于红黑树实现的。

    推荐阅读