倚楼听风雨
淡看江湖路

浅析数据结构排序篇之快速排序Quick Sort

老四开始浅析数据结构相关的知识了,由于大学的时候没有好好学习这门课程,现在虽然说后悔不已,但是我更觉得只要认真,什么时候都不晚。所以开这个菜单栏也采取随学随用随写的模式,不按照顺序来,之前已经浅析过合并排序相关的知识,可以参考一下《浅析数据结构排序篇之归并排序Merge sort》这篇文章。接下来少啰嗦,开始。

开始之前老四推荐一个app-中文名《算法动画图解》,该app是由两个日本友人开发设计,支持iOS和安卓。软件官网: Algorithms。安卓版本请在Google Play(谷歌应用商店)中下载。下载链接: 算法动画图解谷歌应用商店安卓版本下载。该app将所有的算法通过动画图解的方式来讲述,由浅入深,简单易懂,学习完之后还可以不断的进行测试训练,非常好用。注意: 软件部分算法需要付费购买才能解锁全部算法,18元左右,感觉好的话可以支持一下。

接下来,需要先简单的复习一下数据结构中两个重要的表达式:空间复杂度时间复杂度

算法时间复杂度的定义:

在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作: T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。这样用大写O()来体现算法时间复杂度的记法,我们称之为大O记法。一般情况下,随着n的增大,T(n)增长最慢的算法为最优算法。由此算法时间复杂度的定义可知,我们常用的时间复杂度分别为O(n),O(1),O(n^2)。我们分别给它们取了非官方的名称,O(1)叫常数阶、O(n)叫线性阶、O(n^2)叫平方阶,当然,还有其他的一些阶。

如何推导大O阶:

  1. 用常数1取代运行时间中的所有加法常数。
  2. 在修改后的运行次数函数中,只保留最高阶项。
  3. 如果最高阶项存在且不是1,则去除与这个项相乘的常数。

常用的大O阶:

  • 常数阶: 执行时间恒定的算法,我们称之为具有O(1)的时间复杂度,又叫常数阶。注意:不管这个常数是多少,我们都记作O(1),而不能是O(3)、O(12)等其他任何数字
  • 线性阶: 代码中的循环体要执行n次,每次时间复杂度O(1),所以线性阶的时间复杂度O(n)。
  • 对数阶: 在循环体中,循环索引按照几何级别指数新增并接近循环的最大值n。形如while(count < n) { count = count * 2 };由2^x=n得出x=log(2为底n的对数),简作O(logn)。
  • 平方阶: 一般都是循环的嵌套,总结可以得出平方阶是循环的时间复杂度等于循环体的复杂度乘该循环运行的次数。

常用的时间复杂度所耗费的时间从小到大依次是:

O(1)<O(logn)<O(n)<O(nlogn)<O(n^2)<O(n^3)<O(2^n)<O(n!)<O(n^n);

算法空间复杂度:

我们经常会碰到用空间换时间的例子,比如说List中的LinkedList的查询就是利用了双向链表的特性,如果index离链表表头比较近,就从节点头部遍历。否则就从节点尾部开始便利,从而牺牲空间(双向链表)来换取时间。再比如老四之前在文章《Java十道由浅入深的面试题第一期(上) 详细解析》中提及到的关于判断某年是不是闰年的思路以及解决办法也提及到了利用空间换时间。算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作: S(n)=O(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。一般情况下,一个程序在机器上执行时,除了需要存储程序本身的指令、常数、变量和输入数据外,还需要存储对数据操作的存储单元。若输入数据所占空间只取决于问题本身,和算法无关,这样只需要分析该算法在实现时所需的辅助单元即可。若算法执行时所需的辅助空间相对于输入数据量而言是个常数,则称此算法为原地工作,空间复杂度为O(1)。通常,我们都使用”时间复杂度”来指运行时间的需求,使用”空间复杂度”指空间需求。当不用限定词地使用”复杂度”时,通常都是指时间复杂度。

我们开始步入正题,快速排序算法被列为20世纪十大算法之一,上世纪最伟大的计算机科学家由图灵奖获得者TonyHoare设计。与其他算法相比,它的特点是数字的比较和交换次数少,在许多情况下可以高速的进行排序。附20世纪十大算法:

  1. 蒙特卡洛方法
  2. 单纯形法
  3. Krylov子空间迭代法
  4. 矩阵计算的分解方法
  5. 优化的Fortran编译器
  6. 计算矩阵特征值的QR算法
  7. 快速排序算法
  8. 快速傅立叶变换
  9. 整数关系检测算法
  10. 快速多极算法

快速排序的基本思想:

通过一趟排序将待排序记录分割成独立的两部分,其中一部分记录的关键字均比另一部分记录的关键字小,则可分别对这两部分记录进行排序,以达到整个序列有序的目的。

快速排序属于不稳定排序,时间空间复杂度均为O(logn);

感谢老四的同事”菠菜”同学为本篇文章提供的快速排序动画学习教程以及快速排序动画图解,让我们对快速排序有了更加清晰直观的感受,深刻的印象。

快速排序动画学习教程:

浅析数据结构排序篇之快速排序Quick Sort的图片-高老四博客 第1张

快速排序动画图解:

浅析数据结构排序篇之快速排序Quick Sort的图片-高老四博客 第2张

下面看一下基本的快速排序代码示例:

以上属于基本的快速排序实现,在此基础上我们可以对其进行代码以及思路上的优化,包括但不限于:

  • 优化选取枢轴(三数取中、九数取中): 所谓的三数取中其实是为了优化基本有序的数列,中枢点的选取对排序的性能影响很大,而随机选取也总不能保证碰撞成功,于是经过前人的实验,弄出了三数取中,即随机取三个数(但是一般都取最左、最右以及中间位置)排列好将中间数作为枢轴。

  • 优化不必要的交换(两个索引,在两个索引的的过程中如果等于枢轴集中放在两端,最后放入到中间也是一种优化,叫fat-partion)

  • 优化小数组时的排序方案(大小大于40的数组使用median-of-nine(九数取中)选择pivot,大小在7到40之间的数组使用median-of-three选择中数,大小等于7的数组直接选择中数,大小小于7的数组则直接使用插入排序)

  • 优化递归操作(尾递归:在函数返回的时候,调用自身本身,并且return语句不能包含表达式。这样.编译器或者解释器就可以把尾递归做优化.使递归本身无论调用多少次.都只占用一个栈帧.会出现栈溢出的情况。)

老四针对以上优化又写了几个例子,分别是:

  • 随机数作为pivot
  • 快速排序随机数作pivot双索引实现(这个就是动画中体现的一个pivot加双索引的实现,只不过是随机数作pivot)
  • 快速排序随机数作为枢轴双索引短数组插入排序(一)
  • 快速排序随机数作为枢轴短数组插入排序另一种写法(二)
  • 快速排序三数取中九数取中做枢轴双索引尾递归

老四这里限于篇幅的原因只给出快速排序三数取中(九数取中)做枢轴pivot双索引尾递归的代码,其余代码放到工程文件之中,需要参考的文末自助获取下载即可。

这里再说一下关于递归和递归的一点基础知识和浅析:

递归的定义: 栈有一个重要应用是在程序设计语言中实现递归.一个直接调用自己或者通过一系列的调用语句间接地调用自己的函数,称作递归函数。

尾递归的定义: 在函数返回的时候,调用自身本身,并且return语句不能包含表达式。这样.编译器或者解释器就可以把尾递归做优化.使递归本身无论调用多少次.都只占用一个栈帧.不会出现栈溢出的情况。

如何解决递归带来的栈帧或者堆带来的内存溢出的问题?
使用尾递归优化:
  • 调用同一个方法
  • 尾递归的形式&编译器对尾递归的优化(重复利用同一个栈帧)

内存泄露: 指程序中动态分配内存给一些临时对象,但是对象不会被GC所回收,它始终占用内存。即被分配的对象可达但已无用。

内存溢出: 指程序运行过程中无法申请到足够的内存而导致的一种错误。内存溢出通常发生于OLD段或Perm段垃圾回收后,仍然无内存空间容纳新的Java对象的情况。
递归与jvm的垃圾回收(GC):
jvm内存机制:
  • JVM中的栈记录了线程的方法调用。每个线程拥有一个栈。在某个线程的运行过程中,如果有新的方法调用,那么该线程对应的栈就会增加一个存储单元,即栈帧 (frame)。在frame中,保存有该方法调用的参数、局部变量和返回地址。
  • Java的参数和局部变量只能是基本类型的变量(比如int),或者对象的引用(reference) 。因此,在栈中,只保存有基本类型的变量和对象引用。而引用所指向的对象保存在堆中。
GC的特点
  • 解决了所有情况下的内存泄露的问题,但还可以由于其他原因内存溢出
  • 针对内存中的堆空间
  • 正在运行的方法中的堆中的对象是不会被管理的,因为还有引用(栈帧没有被清空)
  • 一般简单的自动垃圾回收机制是采用引用计数 (reference counting)的机制。每个对象包含一个计数器。当有新的指向该对象的引用时,计数器加1。当引用移除时,计数器减 1,当计数器为0时,认为该对象可以进行垃圾回收。
尾递归的特点
  • 优化了递归调用时的内存溢出问题
  • 针对内存中的堆空间和栈空间
  • 只在递归调用的时候使用,而且只能对于写成尾递归形式的递归进行优化
  • 正在运行的方法的堆和栈空间正是优化的目标

更博不易,如果觉得文章对你有帮助并且有能力的老铁烦请赞助盒烟钱,点我去赞助。或者扫描文章下面的微信/支付宝二维码打赏任意金额,老四这里抱拳了。赞助时请备注姓名或者昵称,因为您的署名会出现在赞赏列表页面,您的赞赏钱财也会被用于小站的服务器运维上面,再次抱拳。

资源下载

隐藏内容:******,购买后可见!

下载价格:0 G币

您需要先后,才能购买资源

欢迎访问高老四博客(glorze.com),本站技术文章代码均为老四亲自编写或者借鉴整合,其余资源多为网络收集,如涉及版权问题请与站长联系。如非特殊说明,本站所有资源解压密码均为:glorze.com。

赞(43) 给你买杜蕾斯
本站原创文章受自媒体平台原创保护,未经允许不得转载高老四博客 » 浅析数据结构排序篇之快速排序Quick Sort

开始你的表演 抢沙发

觉得文章有用就打赏一下老四,鼓励我更好的创作

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫打赏

微信扫一扫打赏

登录

找回密码

注册