提到数据结构 + 算法的学习,有两个问题是不可避免的,一个是时间复杂度,可以理解为算法的运行时间,如果算法运行时间太长,那这个算法就没法用;另一个是算法的空间复杂度,可以理解为把算法存储在计算机中需要多大的空间,如果需要空间太大,那这个算法也没法用。因此,需要对一个算法的时间复杂度和空间复杂度进行分析,来确定该算法的可行性。
时间复杂度的分析,一般有两种方法:
- 事后统计法
- 事前分析法
事后统计法是用测试程序和数据来运行已编写好的算法,对其执行时间进行比较。这种方法看似可以精确的计算算法的执行时间,但存在一些不足:
- 使用事后统计法的一个前提是,算法已编写好,而编写算法需要大量时间和精力,同时测试程序和数据的准备也是耗时巨大的,这就会出现算法编写好了,测试之后发现用不了的情况,白白浪费大量时间和精力。
- 算法的运行依赖计算机硬件和软件因素。同一个算法在不同的计算机上执行时间是不一样的。在不确定这个算法会用在什么样的计算机上时,少量的测试结果不具备可靠性。
- 算法的执行时间受数据规模的影响。比如对于几个数字的排序,不论是使用选择排序还是插入排序,亦或是快速排序,其执行耗时的差异基本没有。
事前分析法是不依赖具体的测试程序和数据,根据统计方法对算法执行效率进行分析的方法。
目录:
- 时间复杂度大 O 记法
- 时间复杂度分析
- 常见时间复杂度
- 最好、最坏、平均情况时间复杂度
- 均摊时间复杂度
- 空间复杂度
1、时间复杂度大 O 记法
那么,如何在不运行代码的情况下对代码的执行效率进行分析呢?来看一个例子。
public void calculateSum(int n) {
int sum = 0; // 执行一次
for(int i = 0; i < n; i++) { // 循环执行n次
int base = i; // 循环执行n次
for(int j = 0; j < n; j++) { // 循环执行n*n次
sum += base + j; // 循环执行n*n次
}
}
}
假设每个代码语句每执行一次的耗时是一样的,记为 unitTime,所有代码的执行时间,记作 T(n)。基于此,上述代码的执行总耗时为 T(n)=(1+n+n+nn+nn)unitTime=(2n²+2n+1)unitTime。
根据 T(n)=(2n²+2n+1)unitTime,可以得出结论:对于一个算法来说,其所有代码的执行总时间 T(n) 与其每行代码的执行次数 n 成正比。
对于 T(n)=(2n²+2n+1)unitTime 来说,由于 unitTime 表示代码中一条语句执行一次的耗时,在这里要分析的是代码执行总时间 T(n) 和代码执行次数 n 之间的关系,因此可以不考虑 unitTime。此外,2n²+2n+1 表示的代码语句的执行总次数,可以将其抽象为 f(n)=2n²+2n+1。也就是说,我们用 f(n) 来抽象表示一个算法的执行总次数。因此可以推导出所有代码的执行总时间 T(n) 和每行代码的执行次数 n 之间的关系是:
T(n)=O(f(n))
公式中的 O 表示代码的执行总时间 T(n) 和其执行总次数 f(n) 成正比。这种表示法,称之为大 O 记法。大 O 记法 T(n)=O(f(n)),表示随问题规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同,表示的是算法的渐近时间复杂度,简称时间复杂度。
2、时间复杂度分析
时间复杂度分析有一个基本的法则,就是四则运算法则。
- 加法法则,如果算法的代码是平行增加的,那么就需要加上相应的时间复杂度。
- 乘法法则,如果算法的代码增加的是循环内的嵌套或者函数的嵌套,那么就需要乘上相应的时间复杂度。
如下代码是我们在推导大 O 记法时用到的,最后推导出其时间复杂度是 T(n)=O(2n²+2n+1),在推导过程就用到了加法法则和乘法法则。
public void calculateSum(int n) {
int sum = 0; // 执行一次
for(int i = 0; i < n; i++) { // 循环执行n次
int base = i; // 循环执行n次
for(int j = 0; j < n; j++) { // 循环执行n*n次 乘法法则
sum += base + j; // 循环执行n*n次 乘法法则
}
}
}
第二行代码的时间复杂度是 T2(n)=1;第三行、第四行代码的时间复杂度分别是 T3(n)=O(n),T4(n)=O(n);第五行和第六行代码它们本身会执行 n 次,但由于是在循环内,所以根据乘法法则,其时间复杂度分别是 T5(n)=O(n²),T6(n)=O(n²)。
最后根据加法法则,整段代码的时间复杂度就是: T(n)=T2(n)+T3(n)+T4(n)+T5(n)+T6(n)=O(1)+O(n)+O(n)+O(n²)+O(n²)=O(2n²+2n+1)
- 减法法则,如果是去掉算法中平行的代码,就需要减掉相应的时间复杂度。
- 除法法则,如果是去掉嵌套内的循环或函数,就需要除去相应的时间复杂度。
对于减法法则和除法法则就不做具体示例说明了,接着我们看下时间复杂度分析另外几个常用的结论:
- 加法常数项可以忽略
- 除去最高阶项,其它次项可以忽略
- 与最高次项相乘的常数可以忽略
接着依次解释下。
加法常数项可以忽略
如下图,算法 B 与算法 A 相比,在不同的执行次数下,算法 B 都是劣于算法 A 的。在将算法 B 的加法常数项 1 和算法 A 的加法常数项 3 去掉后,得到算法 B1 和算法 A1,但此时,在不同的执行次数下,算法 B1 还是劣于算法 A1。由此可知,加法常数项对算法的复杂度几乎无影响。
除去最高阶项,其它次项可以忽略
如下图,算法 B 相比于算法 A,少了加法常数项 2 和次低项 2n。但是,随着执行次数 n 的增大,算法 A 的执行效率越来越趋近与算法 B。
因此,在进行算法的时间复杂度分析时,应主要关注最高阶项。
与最高次项相乘的常数可以忽略
如下图,随着执行次数 n 的增加,算法 A 开始劣于算法 B。在将与算法 A 和算法 B 的高阶项相乘的常数去掉后,得到算法 A1 和算法 B1。
对于算法 A1 和算法 B1 来说,随着执行次数 n 的增加,算法 A1 的执行效率还是劣于算法 B1 的执行效率。也就是说,在进行算法的时间复杂度分析时,与最高次项相乘的常数并不重要。
3、常见时间复杂度
常见时间复杂度主要有以下几种:
常数阶 O(1)
如下代码共有三行,每行代码都是只执行一次,因此这段代码的运行次数函数是 f(n)=3。那么,按照大 O 记法,其时间复杂度是不是要记作 T(n)=O(3) 呢?
public void sum(int n) {
int sum = 0; // 执行一次
sum = n*2; // 执行一次
System.out.println(sum); // 执行一次
}
不是的,原因是大 O 记法中,有一个基本法则:**用常数 1 取代运行时间中的所有加法常数。**因此,这段代码的时间复杂度是 T(n)=O(1)。
一般来说,对于这种与问题规模 n 无关,执行时间恒定的算法,其时间复杂度都记作 O(1),又称之为常数阶。
对数阶 O(logn)
如下代码所示,其时间复杂度是多少呢?
public void logarithm(int n) {
int count = 1; // 执行一次
while (count <= n) { // 执行logn次
count = count*2; // 执行logn次
}
}
该段代码什么时候会停止执行呢?是当 count 大于 n 时。也就是说多少个 2 相乘后其结果值会大于 n,即 2^x=n。由 2^x=n 可以得到 x=logn,所以这段代码时间复杂度是 O(logn)。
线性阶 O(n)
线性阶表示代码要执行 n 次,如下 for 循环中的代码,第二行和第三行代码都执行 n 次,即 f(n)=2n。根据前面的分析,与最高次项相乘的常数 2 是可以忽略的,因此这段代码的时间复杂度是 O(n)。
public void circle(int n) {
for(int i = 0; i < n; i++) { // 执行n次
System.out.println(i); // 执行n次
}
}
线性对数阶 O(nlogn)
线性对数阶 O(nlogn) 就是将一段时间复杂度为 O(logn) 的代码执行 n 次,如下代码所示。
public void logarithm(int n) {
int count = 1;
for(int i = 0; i < n; i++) { // 执行n次
while (count <= n) { // 执行logn次
count = count*2; // 执行nlogn次
}
}
}
平方阶 O(n²)
如下代码是个双重 for 循环,其内循环的时间复杂度是线性阶 O(n)。对于外循环来说,是将内循环这个时间复杂度为 O(n) 代码在执行 n 次,所以整个这段代码的时间复杂度为 O(n²)。
public void square(int n) {
for(int i = 0; i < n; i++){ // 执行n次
for(int j = 0; j <n; j++) { // 执行n次
System.out.println(i+j); // 执行n方次
}
}
}
当内层循环和外层循环的次数不一致时,时间复杂度又该怎么表示呢?如下,内层循环执行 m 次,其时间复杂度为 O(m),外层循环执行次数为 n 次,其时间复杂度为 O(m)。整段代码的时间复杂度是就是 O(m*n),即循环的时间复杂度等于循环体的时间复杂度乘以该循环运行次数。
public void square(int n, int m) {
for(int i = 0; i < n; i++){ // 执行n次
for(int j = 0; j <m; j++) { // 执行m次
System.out.println(i+j); // 执行mn次
}
}
}
对于上述这些常见时间复杂度,它们的执行次数 T(n) 和问题规模 n 的关系如下图:
4、最好、最坏、平均情况时间复杂度
我们以判断一个目标值在数组中是否存在为例来看一下如何进行最好、最坏、平均情况时间复杂度的分析。我们假设目标值在数组中要么唯一存在要么不存在,代码如下:
public boolean exist(int target, int[] arr) {
boolean exist = false; // 执行一次
int n = arr.length; // 执行一次
for(int i = 0; i < n; i++) { // 执行n次
if (arr[i] == target) { // 执行n次
exist= true; // 执行一次
}
}
return exist; // 执行一次
}
对于上述代码其总执行次数 f(n)=2n+4,即其时间复杂度用大 O 记法表示是 T(n)=O(2n+4),根据之前的分析加法常数项和最高次项的常数项都可以忽略,因此 T(n)=O(n)。
对于上述代码来说,由于已经假定目标值是唯一存在的,因此当在数组中找到目标值时,其后剩余元素就不用继续考察了。优化后的代码如下:
public boolean exist(int target, int[] arr) {
boolean exist = false; // 执行一次
int n = arr.length; // 执行一次
for(int i = 0; i < n; i++) { // 还是执行n次吗
if (arr[i] == target) { // 还是执行n次吗
exist= true; // 执行一次
break;
}
}
return exist; // 执行一次
}
对于优化后的代码来说,第四行和第五行不一定会执行 n 次。这时,上述的时间复杂度分析就不适用于这种情况了。
如果目标值存在于数组中第一个位置,那么数组中剩余元素就不用考虑了,因此上述代码的时间复杂度是 O(1)。对于这种最理想情况的时间复杂度我们称之为最好情况时间复杂度。
如果目标值存在于数组中最后一个位置,那么数组中的每个元素都需要和目标值进行比较,因此上述代码的时间复杂度是 O(n)。对于这种最坏情况下的时间复杂度我们称之为最坏情况时间复杂度。
但是,不论是最好情况还是最坏情况,都是极端情况下才会发生的,因此为了更好的表示一个算法的时间复杂度,我们需要引入平均情况时间复杂度。
还是以上述优化后的代码为例看下如何进行平均情况时间复杂度计算。目标值在数组中和目标值不在数组中是两个基本情况,当目标值在数组中时,其可能在数组中的任意位置,即对于判断目标值是否在数组中这个算法来说一共有 n+1 中情况。
我们把这 n+1 种情况下需要考察数组中的元素个数加起来在除以 n+1,就可以得到一个平均情况时间复杂度,即:
5、均摊时间复杂度
之前介绍的复杂度分析是基于一个算法从头运行到尾,我们来看其时间复杂度是怎么样的。有时,会出现一个算法的复杂度比较高,但是该算法是和其它操作是一起的,在将这个较高复杂度的算法和其它操作一起进行复杂度分析时,需要将其均摊到其它操作上,这种分析称之为均摊复杂度分析。
我们以如下代码来看下如何进行均摊复杂度分析。
public class MyVector {
private int[] data;
private int size; // 数组中已存储的元素格式
private int capacity; // 数组中可容纳的最大元素个数
public MyVector() {
data = new int[10];
size= 0;
capacity = 10;
}
// 向数组末尾添加元素
public void pushBack(int e) {
// 如果原有数组已满,则扩容为原数组的2倍
if (size == capacity) {
resize(2*capacity);
}
data[size++] = e;
}
public void resize(int newCapacity) {
if (newCapacity < size) {
return;
}
int[] newData = new int[newCapacity];
// 把原有数组中的元素一次复制到新的数组中
for(int i = 0; i < size; i++) {
newData[i] = data[i];
}
data = newData;
capacity = newCapacity;
}
}
上述代码中的 pushBack 方法是每次向数组末尾添加一个元素,然后当数组满时,进行扩容,扩容为原有数组的 2 倍;resize 方法是用于扩容的,所谓的扩容就是新开辟一个容量大小为 newCapacity 的数组,然后将原数组的元素依次复制到新数组中。根据之前对时间复杂度的分析,resize 方法的时间复杂度 T(n)=O(n)。
接着看下 pushBack 方法的时间复杂度。对于 pushBack 这个方法来说,其中有两个操作,一个是向数组末尾添加元素,每次执行添加操作时,时间复杂度是 O(1);一个是扩容,每次扩容的时间复杂度是 O(n)。那么,pushBack 方法的时间复杂度是 O(n) 吗?
扩容这一步,是在数组满的情况下才会触发执行,也就是在扩容之前,会有 n 次向数组末尾添加元素的操作,且每次操作耗时是 1,总耗时为 n。扩容操作在数组满时触发一次,耗时是 n,即将数组添加满并进行扩容总共需要 n+1 次操作,这些操作总耗时是 2n。
因此,在将扩容这个操作的耗时均摊到之前每次添加元素到数组末尾这个操作上时,每次操作耗时约为 2,即将数组添加满并进行扩容操作,其时间复杂度不是 O(n),而是 O(1)。这种时间复杂度分析的方法,称之为均摊时间复杂度分析。
6、空间复杂度
关于算法的空间复杂度《大话数据结构》这本书中是这么说的:
算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n)=O(f(n)),其中 n 为问题的规模,f(n) 为语句关于 n 所占存储空间的函数。
在平时的开发中更多的是用空间换时间,关于算法的空间复杂度就介绍到这里。