几种常见的排序算法之比较
2010-06-20 14:04
数据结构课程
摘要:
排序的基本概念以及其算法的种类,介绍几种常见的排序算法的算法:冒泡排序、选择排序、插入排序、归并排序、快速排序、希尔排序的算法和分析它们各自的复杂度,然后以表格的形式,清晰直观的表现出它们的复杂度的不同。
在研究学习了之前几种排序算法的基础上,讨论发现一种新的排序算法,并通过了进一步的探索,找到了新的排序算法较之前几种算法的优势与不足。
关键词:排序算法复杂度创新算法
一、引言
排序算法,是计算机编程中的一个常见问题。
在日常的数据处理中,面对纷繁的数据,我们也许有成百上千种要求,因此只有当数据经过恰当的排序后,才能更符合用户的要求。
因此,在过去的数十载里,程序员们为我们留下了几种经典的排序算法,他们都是智慧的结晶。
本文将带领读者探索这些有趣的排序算法,其中包括介绍排序算法的某些基本概念以及几种常见算法,分析这些算法的时间复杂度,同时在最后将介绍我们独创的一种排序方法,以供读者参考评判。
二、几种常见算法的介绍及复杂度分析
1.基本概念
1.1稳定排序(stable sort)和非稳定排序
稳定排序是所有相等的数经过某种排序方法后,仍能保持它们在排序之前的相对次序,。
反之,就是非稳定的排序。
比如:一组数排序前是a1,a2,a3,a4,a5,其中a2=a4,经过某种排序后为
a1,a2,a4,a3,a5,
则我们说这种排序是稳定的,因为a2排序前在a4的前面,排序后它还是在a4的前面。
假如变成a1,a4,a2,a3,a5就不是稳定的了。
1.2内排序( internal sorting )和外排序( external sorting)
在排序过程中,所有需要排序的数都在内存,并在内存中调整它们的存储顺序,称为内排序;在排序过程中,只有部分数被调入内存,并借助内存调整数在外存中的存放顺序排序方法称为外排序。
1.3算法的时间复杂度和空间复杂度
所谓算法的时间复杂度,是指执行算法所需要的计算工作量。
一个算法的空间复杂度,一般是指执行这个算法所需要的内存空间。
2.几种常见算法
2.1冒泡排序(Bubble Sort)
冒泡排序方法是最简单的排序方法。
这种方法的基本思想是,将待排序的元素看作是竖着排列的“气泡”,较小的元素比较轻,从而要往上浮。
在冒泡排序算法中我们要对这个“气泡”序列处理若干遍。
所谓一遍处理,就是自底向上检查一遍这个序列,并时刻注意两个相邻的元素的顺序是否正确。
如果发现两个相邻元素的顺序不对,即“轻”的元素在下面,就交换它们的位置。
显然,处理一遍之后,“最轻”的元素就浮到了最高位置;处理二遍之后,“次轻”的元素就浮到了次高位置。
在作第二遍处理时,由于最高位置上的元素已是“最轻”元素,所以不必检查。
一般地,第i遍处理时,不必检查第i高位置以上的元素,因为经过前面i-1遍的处理,它们已正确地排好序。
冒泡排序是稳定的。
算法时间复杂度是O(n ^2)。
2.2选择排序(Selection Sort)
选择排序的基本思想是对待排序的记录序列进行n-1遍的处理,第i遍处理是将L[i..n]中最小者与L[i]交换位置。
这样,经过i遍处理之后,前i个记录的位置已经是正确的了。
选择排序是不稳定的。
算法复杂度是O(n ^2 )。
2.3插入排序(Insertion Sort)
插入排序的基本思想是,经过i-1遍处理后,L[1..i-1]己排好序。
第i遍处理仅将L[i]插入L[1..i-1]的适当位置,使得L[1..i]又是排好序的序列。
要达到这个目的,我们可以用顺序比较的方法。
首先比较L[i]和L[i-1],如果
L[i-1]≤ L[i],则L[1..i]已排好序,第i遍处理就结束了;否则交换L[i]与L[i-1]的位置,继续比较L[i-1]和L[i-2],直到找到某一个位置j(1≤j≤i-1),使得L[j] ≤L[j+1]时为止。
图1演示了对4个元素进行插入排序的过程,共需要(a),(b),(c)三次插入。
直接插入排序是稳定的。
算法时间复杂度是O(n ^2)
2.4堆排序
堆排序是一种树形选择排序,在排序过程中,将A[n]看成是完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系来选择最
小的元素。
堆排序是不稳定的。
算法时间复杂度O(nlog n)。
2.5归并排序
设有两个有序(升序)序列存储在同一数组中相邻的位置上,不妨设为
A[l..m],A[m+1..h],将它们归并为一个有序数列,并存储在A[l..h]。
其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlog2n)。
2.6快速排序
快速排序是对冒泡排序的一种本质改进。
它的基本思想是通过一趟扫描后,使得排序序列的长度能大幅度地减少。
在冒泡排序中,一次扫描只能确保最大数值的数移到正确位置,而待排序序列的长度可能只减少1。
快速排序通过一趟扫描,就能确保某个数(以它为基准点吧)的左边各数都比它小,右边各数都比它大。
然后又用同样的方法处理它左右两边的数,直到基准点的左右只有一个元素为止。
快速排序是不稳定的。
最理想情况算法时间复杂度O(nlog2n),最坏O(n ^2)。
2.7希尔排序
在直接插入排序算法中,每次插入一个数,使有序序列只增加1个节点,并且对插入下一个数没有提供任何帮助。
如果比较相隔较远距离(称为增量)的数,使得数移动时能跨过多个元素,则进行一次比较就可能消除多个元素交换。
D.L.shell于1959年在以他名字命名的排序算法中实现了这一思想。
算法先将要排序的一组数按某个增量d分成若干组,每组中记录的下标相差d.对每组中全部元素进行排序,然后再用一个较小的增量对它进行,在每组中再进行排序。
当增量减到1时,整个要排序的数被分成一组,排序完成。
希尔排序是不稳定的。
算法时间复杂度是O(n2)。
3.常见算法复杂度比较
表一
三、一个创新算法
1.算法描述:
<SECRET> ......
2.优缺点分析
本算法总共使用了13次赋值;而对于同样的待排序数组,冒泡排序需要28次赋值(14次交换),选择排序法同样也需要28次比较。
这说明,新得的算法比以上算法有了明显的提高。
最重要的是,新的算法的时间复杂度是O(n),呈线性关系,明显节省了时间,空间复杂度也为O(n),但这和时间上的优化相比算不了什么。
当n值很大的时候,该算法有明显的优势。
但是这种方法有一定的局限性。
首先,要求进行排序数列必须是int型的数组,对于字符等怎无能为力;其次,要求进行排序的序列如果是稀疏的,那么回直接影响B数组的大小,比如:1,50,600,75,1000000,500 这时如果不做一些必要的修改,本算法至少需要运行1000000次。
因此,本算法适用于一些密集度较大的数据。
再次,只有当要排序的数量很大时才有明显的优势。
3.适用范围预测
鉴于以上几点分析,本算法适用于密集度较大、整数型的无序数列的排序,如:学生名次的排序等。
四、总结
排序有着广泛的应用,了解掌握各种排序的算法,做到学以致用有着很强的实用性。
本文介绍了几种常用的排序算法,通过描述和分析让你进一步加深对排序算法的理解。
除了原有的算法,在思考探究基础上,提出了也有着使用空间的创新算法,充分展示了研究探索精神。
排序算法各有优劣,希望阅读本文将在算法选择上给你提供帮助。
将排序算法更好的应用于实践中。
五、参考文献
[1] C++核心思想(第三版)-(美)霍斯特曼著-电子工业出版社;
[2] 算法设计与分析清华大学出版社郑宗汉郑晓明;
[3] 现代优化计算方法清华大学出版社;
[4] 软件学报。