排序算法分为内部排序和外部排序,而我们经常说的基础排序算法,都是内部排序算法。包括冒泡排序,选择排序,插入排序,快速排序,并归排序,希尔排序,堆排序等。
这里总结一下这几种排序算法,以备不时之需。
冒泡排序
它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
— 冒泡排序-维基百科
上面是摘自维基百科上冒泡排序的说明,之所以起名冒泡排序,是因为整个过程非常形象,每次经过比较交换后,较大的值都会“浮”到最后面(或者较小的值“浮”到最前面)。
动画示意图:
它的过程如下:
- 比较相邻的元素。如果第一个比第二个大,就交换他们两个。
- 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
- 针对所有的元素重复以上的步骤,除了最后一个。
- 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
最坏时间复杂度 | О(n²) |
最优时间复杂度 | O(n) |
平均时间复杂度 | О(n²) |
最坏空间复杂度 | 总共O(n) |
需要辅助空间 | O(1) |
代码实现
1 |
|
选择排序
选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理如下。首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
选择排序-维基百科
动画示意图:
最坏时间复杂度 | О(n²) |
最优时间复杂度 | О(n²) |
平均时间复杂度 | О(n²) |
最坏空间复杂度 | О(n) total, O(1) auxiliary |
代码实现
1 |
|
插入排序
它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
插入排序–维基百科
动画示意图:
最坏时间复杂度 | О(n²) |
最优时间复杂度 | O(n) |
平均时间复杂度 | О(n²) |
最坏空间复杂度 | 总共 O(n) ,需要辅助空间 O(1) |
代码实现
1 |
|
快速排序
快速排序采用分而治之的策略,找一个基准值,将所有小于基准值的元素放到该基准值前面,所有大于基准值的元素放到基准值的后面。
然后递归的将基准值的左右两部分子序列进行快速排序。
步骤:
- 从数列中挑出一个元素,称为“基准”(pivot),
- 重新排序数列,所有比基准值小的元素摆放在基准前面,所有比基准值大的元素摆在基准后面(相同的数可以到任何一边)。在这个分割结束之后,该基准就处于数列的中间位置。这个称为分割(partition)操作。
- 递归地(recursively)把小于基准值元素的子数列和大于基准值元素的子数列排序。
递归到最底部时,数列的大小是零或一,也就是已经排序好了。这个算法一定会结束,因为在每次的迭代(iteration)中,它至少会把一个元素摆到它最后的位置去。
从上面可以看出,该算法采用递归思想。
动画示意图:
最坏时间复杂度 | О(n²) |
最优时间复杂度 | O(nlogn) |
平均时间复杂度 | O(nlogn) |
代码实现
1 |
|
归并排序
归并排序和上面的快速排序相似,也是采用分而治之的策略,同样也是用递归的思想。
不同点在于,归并排序依赖于归并操作,即将两个已经排好序的子序列合并成一个大的有序序列。
步骤:
- 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
- 设定两个指针,最初位置分别为两个已经排序序列的起始位置
- 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
- 重复步骤3直到某一指针到达序列尾
- 将另一序列剩下的所有元素直接复制到合并序列尾
动画示意图:
最坏时间复杂度 | O(nlogn) |
最优时间复杂度 | O(nlogn) |
平均时间复杂度 | O(nlogn) |
最坏空间复杂度 | O(n) |
代码实现
1 |
|
希尔排序
希尔排序,也称递减增量排序算法,是插入排序的一种更高效的改进版本。
希尔排序通过将比较的全部元素分为几个区域来提升插入排序的性能。这样可以让一个元素可以一次性地朝最终位置前进一大步。然后算法再取越来越小的步长进行排序,算法的最后一步就是普通的插入排序,但是到了这步,需排序的数据几乎是已排好的了(此时插入排序较快)。
例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样:
1 | 13 14 94 33 82 |
然后我们对每列进行排序:
1 | 10 14 73 25 23 |
将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ].这时10已经移至正确位置了,然后再以3为步长进行排序:
1 | 10 14 73 |
排序之后变为:
1 | 10 14 13 |
最后以1步长进行排序(此时就是简单的插入排序了)。
代码实现
1 |
|
堆排序
堆排序(英语:Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并同时满足堆积的性质:即子节点的键值或索引总是小于(或者大于)它的父节点。
1 |
|
如上图所示,就是小顶堆和大顶堆的示意图。
堆一般用数组来表示,有如下特点:
- 索引为i的左孩子的索引是
2*i
- 索引为i的右孩子的索引是
2*i+1
- 索引为i的父节点的索引是
floor(i/2)
注:这里的索引是以在二叉树中根节点索引为1开始的。与数组中的索引相差1。
堆排序即是用堆的这种特性,先将数组构造成小顶堆(或大顶堆),堆的根元素即为最小值(或最大值)。
然后再一次将剩下的元素再构造成小顶堆(或大顶堆),直至最后的堆只有一个元素为止。
步骤:
- 数组调整为小顶堆
- 取小顶堆的根节点,放到第一个元素
- 递归调整剩下的元素为小顶堆,并取堆的根节点
最坏时间复杂度 | O(nlogn) |
最优时间复杂度 | O(nlogn) |
平均时间复杂度 | O(nlogn) |
代码实现
1 |
|