1、前言

1.1 由来

Java 是面向对象的语言,我们在编程的时候自然需要存储对象的容器,数组可以满足这个需求,但是数组初始化时长度是固定的,但是我们往往需要一个长度可变化的容器,因此,集合出现了。

1.2 集合与数组的区别

(1)长度区别:集合长度可变,数组长度不可变

(2)内容区别:集合可存储不同类型元素,数组存储只可单一类型元素

(3)元素区别:集合只能存储引用类型元素,数组可存储引用类型,也可存储基本类型

1.3 集合概述

Java 集合框架图:

注:上图中粉红色的为接口,紫色的和蓝色框为实现类。

Java 集合要从两大接口说起,一为 Collection 接口,二为 Map 接口,它们是同一个层次的。

Collection 接口被 List 接口和 Set 接口继承;

List 接口有三个实现类,ArrayList,LinkedList,Vector;

Set 接口被 HashSet 类实现,被 SortedSet 接口继承,同时 TreeSet 类实现 SortedSet 接口,LinkedHashSet 类继承 HashSet 类;

Map 接口有两个实现类,HashMap,HashTable,同时 Propertise 类继承 HashTable;

Map 接口被 SortedMap 接口继承,同时 TreeMap 类实现了 SortedMap 接口;

2、详述

2.1Collection 接口(单列集合)

Collection 接口是单列集合的最顶层接口,定义了一些通用的方法。

add(E e) 添加元素;  clear() 清空元素;  remove(E e) 移除元素;  size() 元素数量;

toArray() 集合转数组;  contains(E e) 判断元素是否存在;  isEmpty() 判断集合是否为空;

2.1.1List 接口

特点:有索引,精准操作元素;

元素有序,存储及取出时顺序一致;

元素可重复,通过. equals() 比较是否重复。

它利用索引 (index),定义了一些特殊方法:

get(int index,E e) 获取指定位置的元素;remove(int index) 移除指定位置的元素; 

add(int index,E e) 将元素添加到指定位置;set(int index,E e) 用元素替换指定位置的元素;

2.1.1.1ArrayList 实现类

数据结构:数组; 

特点:查询快,增删慢,主要用于查询遍历数据,为最常用集合之一;

底层分析:数组结构是有序的元素序列,在内存中开辟一段连续的空间,在空间中存放元素,每个空间都有编号,通过编号可以快速找到相应元素,因此查询快;数组初始化时长度是固定的,要想增删元素,必须创建一个新数组,把源数组的元素复制进来,随后源数组销毁,耗时长,因此增删慢。

2.1.1.2LinkedList 实现类

数据结构:双向链表;

特点:查询慢,增删快;

底层分析:链表分为单向和双向,就是一条链子和两条链子的区别;多出的那条链子记录了元素的顺序,因此单向链表结构无序,双向链表结构有序;链表结构没有索引,因此查询慢;链表的增删只需在原有的基础上连上链子或切断链子,因此增删快。

特有方法:getFirst()  返回开头元素;  getLast()  返回结尾元素;

pop() 从所在堆栈中获取一个元素;  push(E e)  将元素推入所在堆栈;

addFirst(E e)  添加元素到开头,头插; addLast(E e) 添加元素到结尾,尾插;

2.1.1.3Vector 实现类 (基本不用)

数据结构:数组; 

特点:查询快,增删慢

底层分析:和 ArrayList 一样,都是数组实现,因此具有相似的特性,它们之间的区别在于 Vector 是线程安全的,效率低,ArrayList 是线程不安全的,但效率高。

ps:Vector 在 JDK1.0 就出现了,在 JDK1.2 集合出现的时候,Vector 就归为 List 的实现类之一,这时候 ArrayList 才出现。Vector 是一个古老的集合,《Java 编程思想》中提到了它有一些遗留的缺点,因此不建议使用。

2.1.2Set 接口

特点:元素不可重复;

元素无序,存储及取出时顺序不一致;

没有索引,因此不能使用普通 For 循环遍历;

Set 与 Collection 接口中的方法基本一致,没有进行功能上的扩充;

2.1.2.1HashSet 实现类

数据结构:JDK1.8 之前:哈希表(数组 + 单向链表);JDK1.8 之后:哈希表(数组 + 单向链表 + 红黑树),当链表长度超过阈值(8)时,链表将转换为红黑树。

特点:查询快,元素无序,元素不可重复,没有索引;

底层分析:哈希表底层用数组 + 单向链表实现,即使用链表处理冲突,同一 Hash 值的元素都存储在一个链表里,但是当位于一个链表中的元素较多,即 Hash 值相等的元素较多,通过 key 值依次查找的效率降低。JDK1.8 之后,哈希表底层采用数据 + 单向链表 + 红黑树实现,当链表长度超过阈值(8)时,链表将转换为红黑树,极大缩短查询时间。

ps:哈希值是一个十进制的整数,是对象的地址值,是一个逻辑地址,不是实际存储的物理地址,由系统随机给出。Object 类的 int hashCode() 方法,可以获取对象的哈希值。

2.1.2.2LinkedHashSet 实现类

数据结构:JDK1.8 之前:哈希表(数组 + 双向链表);JDK1.8 之后:哈希表(数组 + 双向链表 + 红黑树),当链表长度超过阈值(8)时,链表将转换为红黑树。

特点:查询快,元素有序,元素不可重复,没有索引;

底层分析:作为 HashSet 的子类,只是比它多了一条链表,这条链表用来记录元素顺序,因此 LinkedHashSet 其中的元素有序。

2.1.2.3TreeSet 实现类

数据结构:红黑树     

特点:查询快,元素有序,元素不可重复,没有索引;

底层分析:TreeSet 实现了继承于 Set 接口的 SortedSet 接口 ,它支持两种排序方法,自然排序和定制排序,自然排序的意思就是放入元素 “a”,“b”,a 会自然地排在 b 前面,其中还有几个特有方法。

first() 返回第一个元素; last() 返回最后一个元素;comparator() 返回排序比较器;

2.2Map 接口(双列集合)

特点:元素包含两个值(key,value)即键值对, key 不允许重复,value 可以重复, key 与 value 是一一对应的。元素无序;

Map 接口是双列集合的最顶层接口,定义了一些通用的方法。

put(key , value) 添加元素; remove(key) 删除 key 对应元素;

containsKey(key) 判断是否存在 key 对应元素;get(key) 获取 key 对应元素;

KeySet() 获取所有的 key,存到 Set 集合中;entrySet() 获取所有的元素,存到 Set 集合中;

ps:Map 集合必须保证保证 key 唯一,作为 key,必须重写 hashCode 方法和 equals 方法,以保证 key 唯一。

2.2.1HashMap 实现类

数据结构:JDK1.8 之前:哈希表(数组 + 单向链表);JDK1.8 之后:哈希表(数组 + 单向链表 + 红黑树),当链表长度超过阈值(8)时,链表将转换为红黑树。

特点:查询快,元素无序,key 不允许重复但可以为 null,value 可以重复。

底层分析:和 HashSet 底层相类似,不赘述。

2.2.2LinkedHashMap 实现类

数据结构:JDK1.8 之前:哈希表(数组 + 双向链表);JDK1.8 之后:哈希表(数组 + 双向链表 + 红黑树),当链表长度超过阈值(8)时,链表将转换为红黑树。

特点:查询快,元素有序,key 不允许重复但可以为 null,value 可以重复。

底层分析:和 LinkedHashSet 底层相类似,不赘述。

2.2.3HashTable 实现类(基本不用)

数据结构:哈希表

特点:查询快,元素无序,key 不允许重复并且不可以为 null,value 可以重复。

底层分析:HashTable 和 Vector 一样是古老的集合,有遗留缺陷,在 JDK1.2 之后 被更先进的集合取代了;HashTable 是线程安全的,速度慢,HashMap 是线程不安全的,速度快;

ps:Hashtable 的子类 Properties 现在依然活跃,Properties 集合是一个唯一和 IO 流结合的集合。

2.2.3TreeMap 实现类

数据结构:红黑树

特点:查询快,元素有序,key 不允许重复并且不可以为 null,value 可以重复。

底层分析:和 TreeSet 底层相类似,不赘述。