当前位置:文档之家› 五种排序算法分析

五种排序算法分析

深圳大学实验报告课程名称:算法分析与复杂性理论实验项目名称:实验一排序算法性能分析学院:计算机与软件学院专业:软件工程指导教师:**报告人:赖辉学号:班级:软工学术型实验时间:2015-10-15实验报告提交时间:2015-11-24教务部制一.实验目的1.掌握选择排序、冒泡排序、合并排序、快速排序、插入排序算法原理2.掌握不同排序算法时间效率的经验分析方法,验证理论分析与经验分析的一致性。

二.实验步骤与结果实验总体思路:根据实验要求,需要用while循环控制用户选择相应算法(选择通过switch实现)或者选择输入0跳出while循环,退出程序。

Switch中选择相应的算法后需要通过一个for(int j=0;j<5;j++)循环更改数组大小MAX的值(MAX *= 10),从而控制输入不同问题规模的耗时。

再通过一个for(int i=0;i<20;i++)循环控制20组随机数组。

为了使得程序输出更加直观,部分数据后面没有输出。

相应结果和过程如下所示(代码和结果如下图所示)。

各排序算法的实现及实验结果:1、随机数产生代码1:srand((unsigned)time(NULL));For i=0 to 19randNum(MAX,array);当问题规模较小时,生成随机函数randNum()在for循环下运行时间短,每次产生的随机数组都是一样的,将srand((unsigned)time(NULL))语句放在for循环外面,就产生了20组不同的随机数组。

图1、产生20组随机数组2、选择排序代码2:for i=0 to n-2min=ifor j= i+1 to n-1if ele[min]>ele[j] min=jswap(ele[i],ele[min]) //交换元素图2、选择排序在不同数据规模下排序所消耗的时间3、冒泡排序代码3:for i= 0 to n-1for j=0 to n-1-iif a[j]>a[j+1]swap(a[j],a[j+1]) //交换图3、冒泡排序在不同数据规模下排序所消耗的时间3、合并排序代码4:MERGE(A, p, q, r)n1 ←q - p + 1n2 ←r - qcreate arrays L[1 ‥n1 + 1] and R[1 ‥n2 + 1]for i ←1 to n1do L[i] ←A[p + i - 1]for j ←1 to n2do R[j] ←A[q + j]L[n1 + 1] ←∞R[n2 + 1] ←∞i ←1j ←1for k ←p to rdo if L[i] ≤R[j]then A[k] ←L[i]i ←i + 1else A[k] ←R[j]j ←j + 1图4、合并排序在不同数据规模下排序所消耗的时间4、快速排序代码5:quick(ele[0...n-1],left,right)if l<rl←left r←right x←ele[l];while l<rwhile l<r && x<=ele[r] //比x小则之后交换到前面的部分r--if l<rele[l]←ele[r] l++while l<r && x>ele[l] //比x大则前面交换到后面部分ll++if l<rele[r]←ele[l] r--ele[l]←x;quick(ele,left,l-1) // 递归调用quick(ele,l+1,right)图5、快速排序在不同数据规模下排序所消耗的时间5、插入排序代码6:for i=1→n-1if ele[i]<ele[i-1] temp=ele[i]for j= i-1 to 0 && ele[j]>tempele[j+1]←ele[j]ele[j+1]←temp图6、插入排序在不同数据规模下排序所消耗的时间三.实验分析选择排序:图7、由图2数据整合而成的折线图数据规模:10 100 1000 10000 100000耗时(ms)0 0 2.05 195.25 19868.5图形上:形状基本符合n2(二次增长)数据上:我们发现当数据规模增大10倍时:1000→10000: 195.25/2.05=95.24≈10010000→100000:19868.5/195.25=101.75≈100其他倍数也可得到类似的结果。

结论:当数据规模为10和100时因为数据太小,耗时约为0。

但当数据规模为1000增大到10000时,并10000到100000时,规模增大10倍耗时都增大约100倍,可以计算出,选择排序的时间复杂度为o(n2)。

冒泡排序:图8、由图3数据整合而成的折线图表2、冒泡排序在不同数据规模下排序所消耗的时间数据规模:10 100 1000 10000 100000耗时(ms)0 0.1 2 194.15 19708图形上:形状基本符合n2(二次增长)数据上:我们发现当数据规模增大10倍时:100→1000:2/0.1=20 (误差太大)1000→10000:194.15/2=97.075 ≈ 10010000→100000:19708/194.15=101.5 ≈ 100其他倍数也可得到类似的结果。

结论:由于开始问题规模较小,产生误差较大,但随着问题规模的按10的倍数增大,耗时逐渐呈100的倍数增大,分析伪代码也可以算出该算法的时间复杂度为o(n2)。

随着问题规模的增大,多种误差会逐渐累积,耗时会超过o(n2)的倍数,但是整体上不会相差太大。

与此相比,电脑等其他因素造成轻微的误差可以忽略不计。

合并排序:图9、由图4数据整合而成的折线图数据规模:10 100 1000 10000 100000耗时(ms)0 0.1 0.7 6.05 59.2图形上:形状基本符合n(线性增长)数据上:我们发现当数据规模增大10倍时:100→1000::0.7/0.1=7 ≈10(误差较大)1000→10000: 6.05/0.7=8.64 ≈1010000→100000:59.2/6.05=9.78 ≈10其他倍数也可得到类似的结果。

结论:根据该算法的伪代码,可以计算出时间复杂度为o(nlog2n),当数据规模扩大10倍时,耗时呈线性增长,逐渐接近于n。

当数据规模扩大n倍时,相应的在时间的消耗上会扩大nlog2n倍,同时我们发现,理论上乘以nlog2n后的数据普遍会略小于实际数据,这主要原因快速排序需要递归调用,递归调用需要花费额外的时间。

快速排序:图10、由图5数据整合而成的折线图数据规模:10 100 1000 10000 100000耗时(ms)0 0 1.5 12.15 137.95图形上:形状基本符合n(线性增长)数据上:我们发现当数据规模增大10倍时:1000→10000::12.15/1.5=8.1 ≈ 1010000→100000: 137.95/12.15=10.1 ≈10其他倍数也可得到类似的结果。

结论:根据快速排序算法的伪代码,可以分析出该算法的时间复杂度是o(nlog2n),当数据规模扩大n倍时,相应的在时间的消耗上会扩大nlog2n倍。

从实验的数据上,可以看出随着问题规模的增大,耗时上面也呈线性增长,但累积起来的误差也使得程序的结果略微高于实验值。

总体上的实验结果和预期还是很接近的。

插入排序:图11、由图6数据整合而成的折线图表5、插入排序在不同数据规模下排序所消耗的时间数据规模:10 100 1000 10000 100000 耗时(ms)0 0 1.2 112.85 11329.5图形上:形状基本符合n2(二次增长)数据上:我们发现当数据规模增大10倍时:1000→10000: 112.85/1.2=94 ≈10010000→100000: 11329.5/112.85=100.4 ≈100其他倍数也可得到类似的结果。

结论:根据插入算法的伪代码,可以计算出该算法的时间复杂度是o(n2),当数据规模扩大n倍时,相应的在时间的消耗上会扩大n2倍,理论上,如果数据大具有特殊性,那此算法被影响的程度会比较大,他的的比较次数可以从线性次数,到n2次,赋值次数也可能由常数次变成n2总的来说,受数据影响较大。

将五种排序的实验汇总在一起,如下图12所示图12、由图7、8、9、10、11整合而来从图中以及之前的分析中我们可以得到以下结论1、在平均时间复杂度上面,冒泡排序、插入排序和选择排序都最差为o(n2)。

其主要原因是:随着问题规模的增大,冒泡排序在比较次数上达到了o(n2),但这种排序同时也受交换次数的影响,而且最多时间复杂度也是o(n2)。

如此,同样是o(n2),但冒泡排序的二次项系数会比另外两个大不少,所以最为耗时。

2、快速排序和合并排序都表现出比较好的复杂度。

但这两者中,合并排序表现更好。

其原因是:在最坏情况下,即整个序列都已经有序且完全倒序的情况下,快速排序呈o(n2)的增长,而归并排序不管在什么情况下都呈o(nlog2n),随着问题规模的增大,快速排序逐渐体现出这种弊端。

四.实验心得本次实验虽然花费很大的心思,但确实让我对这几种排序的认识更加深刻,同样的数据,排序的时间可以相差如此之大,这可能会改变我每次都使用冒泡排序的这一习惯,同时,对算法的优良性不同而导致的结果差异之大,感觉到好的算法是多么的重要,当然合理利用算法也是不可忽视的。

这次实验虽然花了很大精力,却收获累累。

注:1、报告内的项目或内容设置,可根据实际情况加以调整和补充。

2、教师批改学生实验报告时间应在学生提交实验报告时间后10日内。

附录:代码#include<stdio.h>#include<iostream>#include<windows.h>#include <Mmsystem.h>using namespace std;#include <ctime>#include <fstream>using namespace std;#define ARRAY_MAX 100000/*****************************生成随机函数*************************/ void randNum(int MAX,int *array){//srand((unsigned)time(NULL));//cout<<"生成的随机数为:"<<endl;;for(int i=0;i<MAX;i++){array[i] = rand()%100;//cout<<array[i]<<" ";}//cout<<"\t\t耗时:";}/*****************************选择排序*************************/ void select_sort(int MAX,int *array){int i, j, k;for (i = 0; i < MAX; i++){k = i;for (j = i + 1; j < MAX; j++){if (array[j] < array[k]){k = j;}}if (k != i){int temp = array[k];array[k] = array[i];array[i] = temp;}}}/***************************冒泡排序*************************/void buddle_sort(int MAX,int *array){int i, j;for(i=0;i<MAX;i++){for(j=i+1;j<MAX;j++){if(array[i]>array[j]) swap(array[i],array[j]);}}}/***************************合并排序*************************/ void Merge(int *array, int p, int q, int r){int n1 = q - p + 1;int n2 = r - q;int *L, *R, i, j, k;L = new int[n1 + 1];R = new int[n2 + 1];for (i = 0; i < n1; i++)L[i] = array[p + i];for (i = 0; i < n2; i++)R[i] = array[q + 1 + i];L[n1] = INT_MAX;R[n2] = INT_MAX;for (i = 0, j = 0, k = p; k <= r; k++){if (L[i] <= R[j]){array[k] = L[i++];}else{array[k] = R[j++];}}delete []L;delete []R;}void merge_sort(int *array, int p, int r){if (p < r){int q = (p + r) / 2;merge_sort(array, p, q); //递归调用merge_sort(array, q + 1, r);Merge(array, p, q, r);}else{return;}}/***************************快速排序*************************/ void quick_sort(int a[], int low, int high){if(low >= high){return;}int first = low;int last = high;int key = a[first];while(first < last){while(first < last && a[last] >= key){--last;}a[first] = a[last]; //将比第一个小的数移到后面while(first < last && a[first] <= key){++first;}a[last] = a[first]; //将比第一个大的数移到前面}a[first] = key; //记录当前位置quick_sort(a, low, first-1);quick_sort(a, first+1, high);}/***************************插入排序*************************/ void insert_sort(int MAX,int *array){int i, j, temp;for (i = 1; i < MAX; i++){temp = array[i];for(j=i;j > 0 && array[j-1] > temp;j--){array[j] = array[j-1];}array[j] = temp;}}int main(){int n,loop = 1;while(loop != 0){//产生随机数组clock_t time_start,time_end;double time_used = 0,count = 0;int MAX = 10;int array[ARRAY_MAX];cout<<"\n\t\t请输入序号选择相应的操作:"<<endl;cout<<"1.选择排序 2.冒泡排序 3.合并排序 4.快速排序 5.插入排序0.退出程序"<<endl;cout<<"******************************************************************"< <endl;cin>>n;switch(n){case 0: loop = 0;break;case 1:for(int j=0;j<5;j++){ //控制问题规模MAX从10-100000cout<<"数组规模MAX="<<MAX<<" 时,耗时:"<<endl;srand((unsigned)time(NULL));for(int i=0;i<20;i++){ //控制20组随机数产生randNum(MAX,array);time_start = clock();select_sort(MAX,array);time_end = clock();time_used = time_end - time_start;cout<<time_used<<" ";//cout<<endl;count += time_used;}cout<<"\n选择排序平均耗时:"<<count/20<<"毫秒"<<endl<<endl;count = 0;MAX *= 10;}break;case 2:for(int j=0;j<5;j++){ //控制问题规模MAX从10-100000cout<<"数组规模MAX="<<MAX<<" 时,耗时:"<<endl;srand((unsigned)time(NULL));for(int i=0;i<20;i++){ //控制20组随机数产生randNum(MAX,array);time_start = clock();buddle_sort(MAX,array);time_end = clock();time_used = time_end - time_start;cout<<time_used<<" ";//cout<<endl;count += time_used;}cout<<"\n冒泡排序平均耗时:"<<count/20<<"毫秒"<<endl<<endl;count = 0;MAX *= 10;}break;case 3:for(int j=0;j<5;j++){ //控制问题规模MAX从10-100000cout<<"数组规模MAX="<<MAX<<" 时,耗时:"<<endl;srand((unsigned)time(NULL));for(int i=0;i<20;i++){ //控制20组随机数产生randNum(MAX,array);time_start = clock();merge_sort(array,0,MAX-1);time_end = clock();time_used = time_end - time_start;cout<<time_used<<" ";//cout<<endl;count += time_used;}cout<<"\n合并排序平均耗时:"<<count/20<<"毫秒"<<endl<<endl;count = 0;MAX *= 10;}break;case 4:for(int l=0;l<5;l++){ //控制问题规模MAX从10-100000cout<<"数组规模MAX="<<MAX<<" 时,耗时:"<<endl;srand((unsigned)time(NULL));for(int i=0;i<20;i++){ //控制20组随机数产生randNum(MAX,array);time_start = clock();quick_sort(array,0,MAX);time_end = clock();time_used = time_end - time_start;cout<<time_used<<" ";//cout<<endl;count += time_used;}cout<<"\n快速排序平均耗时:"<<count/20<<"毫秒"<<endl<<endl;count = 0;MAX *= 10;}break;case 5:for(int j=0;j<5;j++){ //控制问题规模MAX从10-100000cout<<"数组规模MAX="<<MAX<<" 时,耗时:"<<endl;srand((unsigned)time(NULL));for(int i=0;i<20;i++){ //控制20组随机数产生randNum(MAX,array);time_start = clock();insert_sort(MAX,array);time_end = clock();time_used = time_end - time_start;cout<<time_used<<" ";//cout<<endl;count += time_used;}cout<<"\n插入排序平均耗时:"<<count/20<<"毫秒"<<endl<<endl;count = 0;MAX *= 10;}break;default: cout<<"请输入合法的序号!";}}return 0;}。

相关主题