排序是程序开发过程中常用的解决问题的方式,而排序的算法种类繁多,不同的算法在稳定性、复杂度、使用场景方面都有一定的区别,我们要深度剖析每种排序算法的原理,才能在程序中恰当的使用。
下面针对几种经典的排序算法做详细说明:
1、快速排序
快速排序的基本思想: 通过一次排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。
算法说明:
假设我们现在对“6 1 2 7 9 3 4 5 10 8”这个10个数进行排序。
首先在这个序列中随便找一个数作为基准数。为了方便,就让第一个数6作为基准数吧。
接下来,需要将这个序列中所有比基准数大的数放在6的右边,比基准数小的数放在6的左边,类似下面这种排列:
3 1 2 5 4 6 9 7 10 8
在初始状态下,数字6在序列的第1位。 我们的目标是将6挪到序列中间的某个位置,假设这个位置是k。现在就需要寻找这个k,并且以第k位为分界点,左边的数都小于等于6,右边的数都大于等于6。
方法其实很简单:
分别从初始序列“6 1 2 7 9 3 4 5 10 8”两端开始“探测”。 先从右往左找一个小于6的数,再从左往右找一个大于6的数,然后交换他们。这里可以用两个变量i和j,分别指向序列最左边和最右边。
首先j开始出动。因为此处设置的基准数是最左边的数,所以需要让j先出动,这一点非常重要。 j一步一步地向左挪动(即j–),直到找到一个小于6的数停下来。接下来i再一步一步向右挪动(即i++),直到找到一个数大于6的数停下来。最后j停在了数字5面前,i停在了数字7面前。现在交换i和j所指向的元素的值。交换之后的序列如下:
6 1 2 5 9 3 4 7 10 8
到此,第一次交换结束。 接下来开始j继续向左挪动(再友情提醒,每次必须是j先出发)。他发现了4(比基准数6要小,满足要求)之后停了下来。i也继续向右挪动的,他发现了9(比基准数6要大,满足要求)之后停了下来。此时再次进行交换,交换之后的序列如下:
6 1 2 5 4 3 9 7 10 8
第二次交换结束,然后继续。
j继续向左挪动,他发现了3(比基准数6要小,满足要求)之后又停了下来。
i继续向右移动,糟啦!此时i和j相遇了,i和j都走到3面前。说明此时查找结束。
我们将基准数6和3进行交换。交换之后的序列如下:
3 1 2 5 4 6 9 7 10 8
到此第一轮查找真正结束。 此时以基准数6为分界点,6左边的数都小于等于6,6右边的数都大于等于6。 现在基准数6已经归位,它正好处在序列的第6位。 此时我们已经将原来的序列,以6为分界点拆分成了两个序列,左边的序列是“3 1 2 5 4”,右边的序列是“9 7 10 8”。
接下来还需要分别处理这两个序列。
快速排序之所比较快,因为相比冒泡排序,每次交换是跳跃式的。 每次排序的时候设置一个基准点,将小于等于基准点的数全部放到基准点的左边,将大于等于基准点的数全部放到基准点的右边。
这样在每次交换的时候就不会像冒泡排序一样每次只能在相邻的数之间进行交换,交换的距离就大的多了。 因此总的比较和交换次数就少了,速度自然就提高了。当然在最坏的情况下,仍可能是相邻的两个数进行了交换。
代码,如下:
2、桶排序
桶排序 (Bucket sort)的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序。
算法说明, 一个简单例子:
对6个人的英语测试成绩(1~10分)进行排序。假如分数是[6,5,8,8,10,9],用桶排序的思想就是准备10个桶,编号依次为1~10,将成绩放入对应的桶中,例如6分放入6号桶,两个8分放入8号桶...然后按照桶的标号顺序逐一输出(有就输出,没有就不输出),这就是桶排序的基本思想。
桶排序的性能:
桶排序实际上只需要遍历一遍所有的待排元素,然后依次放入指定的位置。如果加上输出排序的时间,就要遍历所有的桶。因此桶排序的时间复杂度是O(n+m),n是待排元素的个数,m是桶的个数,也就是待排元素的范围。这个算法算是相当快的排序算法了,但是空间复杂度比较大。
当待排元素的大小范围比较大,但待排元素个数比较少时,空间浪费就比较严重,待排元素分布越均匀,空间利用率越高,事实上这种情况很少见。 通过以上性能分析,可以得出桶排序的特点:速度快且简单,但同时空间利用率较低。
桶排序使用场景:
根据桶排序的特点,桶排序一般适用于一些特定的环境,比如数据范围较为局限,如果范围跨度过大,则考虑用其他算法。
代码如下:
3、插入排序
插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
算法说明:
一般来说,直接插入排序都采用in-place(原地算法)在数组上实现。具体算法描述如下:
1)从第一个元素开始,该元素可以认为已经被排序;
2)取出下一个元素,在已经排序的元素序列中从后向前扫描;
3)如果该元素(已排序)大于新元素,将该元素移到下一位置;
4)重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
5)将新元素插入到该位置后;
6)重复步骤2~5。
代码如下:
以上挑选了3种经典排序算法做了详细剖析,我们可以顺延这个思路,继续研究其他经典排序算法。