复杂度分析

在讲复杂度分析之前，先理一下，什么是数据结构与算法，以及数据结构与算法之间的关系。

什么是算法与数据结构

数据结构，是指一组数据的存储结构；算法，就是操作一组数据的方法。

数据结构和算法，是相辅相成的。数据结构，是为算法服务的；算法，是要作用在特定的数据结构之上。

使用不同的算法，解决同一个问题，效率可能相差非常大。

比如，求第n个斐波那契数(fibonacci number)

/**
* 斐波那契数，当前项为前两项之和
* 0 1 1 2 3 5 8 13 ...
*/
	
// 递归
public static int fib1(int n) {
    if (n <= 1) {
        return n;
    }
    return fib1(n - 1) + fib1(n - 2);
}
// 循环遍历
public static int fib2(int n) {
    if (n <= 1) {
        return n;
    }
    int first = 0;
    int second = 1;
    for (int i = 0; i < n - 1; i++) {
        int sum = first + second;
        first = second;
        second = sum;
    }
    return second;
}

public static void main(String[] args) {
    int n = 45;
    Times.test("fib1", new Task() {
        public void execute() {
            System.out.println(fib1(n));
        }
    });
    Times.test("fib2", new Task() {
        public void execute() {
            System.out.println(fib2(n));
        }
    });
}

打印结果为：

【fib1】
开始：22:16:05.335
1134903170
结束：22:16:11.663
耗时：6.328秒
-------------------------------------
【fib2】
开始：22:16:11.666
1134903170
结束：22:16:11.666
耗时：0.0秒
-------------------------------------

第一种算法，耗掉了6.328秒！第二种算法，几乎瞬间完成。

如何评判一个算法的好坏？

如果单从执行效率上进行评估，可能会想到这么一种方案：比较不同算法对同一组输入的执行处理时间。这种方案叫做事后统计法，上面的测试用例，就是采用了此方案。

不过，这种方案有非常大的局限性：

执行时间严重依赖硬件以及运行时各种不确定的环境因素
必须编写相应的测算代码
测试数据的选择比较难以保证公正性，比如对小规模的数据排序，插入排序可能会比快速排序更快。

因此，我们需要一个不用具体测试数据来测试，就可以粗略估计算法执行效率的方法：时间复杂度分析法和空间复杂度分析法。

时间复杂度（time complexity）:估算程序指令的执行次数（执行时间）
空间复杂度（space complexity）:估算所需占用的存储空间

一般从以下维度来评估算法的优劣：

正确性
可读性
健壮性（对不合理输入的反应能力和处理能力）

大O表示法（Big O）

一般用大O表示法来描述复杂度，它表示的是数据规模n对应的复杂度

忽略常数、系数、低阶

9 –> O(1)
2n + 3 –> O(n)
n^2 + 2n + 6 –> O(n^2)
4n^3 + 3n^2 + 22n + 100 –> O(n^3)

注意：大O表示法，只是一种粗略的分析模型，是一种估算，能帮助我们短时间内了解一个算法的执行效率

常见的复杂度

常数阶 –> O(1)
线性阶 –> O(n)
平方阶 –> O(n^2)
对数阶 –> O(logn)
线性对数阶 –> O(nlogn)
立方阶 –> O(n^3)
指数阶 –> O(2^n)

数据规模较小时

数据规模较大时

规模较大时，复杂度从小到大 O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)

斐波那契数复杂度分析

在前面，我们用了递归和循环遍历的方法，分别求出第n个斐波那契数。

递归方法时间复杂度分析

O(fib1(n)) 
= O(2^0 + 2^1 + ... + 2^(n-2))
= O(2^(n-1) - 1)
= O(0.5 * 2^n - 1)
= O(2^n)

所以时间复杂度是O(2^n)，呈现指数级增长趋势

循环遍历方法时间复杂度分析

O(fib2(n))
= O(2 + (n - 1))
= O(n + 1)
= O(n)

所以时间复杂度是O(n)，呈线性增长趋势

从时间复杂度可以明显看出，两者的增长趋势。这也是两者时间消耗相差巨大的原因。

算法的优化方向

用尽量少的存储空间
用尽量少的执行步骤（执行时间）
根据情况：
- 空间换时间
- 时间换空间

数据结构与算法