JAVA十大排序算法之快速排序详解

目录

  • 快速排序
    • 问题
    • 思路
    • 荷兰国旗问题
    • 代码实现
    • 时间复杂度
    • 算法稳定性
  • 总结

    快速排序 快速排序是对冒泡排序的一种改进,也是采用分治法的一个典型的应用。JDK中Arrays的sort()方法,具体的排序细节就是使用快速排序实现的。
    从数组中任意选取一个数据(比如数组的第一个数或最后一个数)作为关键数据,我们称为基准数(pivot,或中轴数),然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序,也称为分区(partition)操作。

    问题
    若给定一个无序数组 [8, 5, 6, 4, 3, 1, 7, 2],并指定一个数为基准,拆分数组使得左侧的数都小于等于它 ,右侧的数都大于它。
    基准的选取最优的情况是基准值刚好取在无序区数值的中位数,这样能够最大效率地让两边排序,同时最大地减少递归划分的次数,但是一般很难做到最优。基准的选取一般有三种方式:
    • 选取数组的第一个元素
    • 选取数组的最后一个元素
    • 以及选取第一个、最后一个以及中间的元素的中位数(如4 5 6 7, 第一个4, 最后一个7, 中间的为5, 这三个数的中位数为5, 所以选择5作为基准)。

    思路
    • 随机选择数组的一个元素,比如 6 为基准,拆分数组同时引入一个初始指针,也叫分区指示器,初始指针指向 -1
    • 将数组中的元素和基准数遍历比较
    • 若当前元素大于基准数,不做任何变化
    • 若当前元素小于等于基准数时,分割指示器右移一位,同时
      • 当前元素下标小于等于分区指示器时,当前元素保持不动
      • 当前元素下标大于分区指示器时,当前元素和分区指示器所指元素交换
    JAVA十大排序算法之快速排序详解
    文章图片


    荷兰国旗问题
    荷兰的国旗是由红白蓝三种颜色构成,如图:
    JAVA十大排序算法之快速排序详解
    文章图片

    若现在给一个随机的图形,如下:
    JAVA十大排序算法之快速排序详解
    文章图片

    把这些条纹按照颜色排好,红色的在上半部分,白色的在中间部分,蓝色的在下半部分,这类问题称作荷兰国旗问题。
    对应leetcode:颜色分类
    给定一个包含红色、白色和蓝色,一共 n 个元素的数组,原地对它们进行排序,使得相同颜色的元素相邻,并按照红色、白色、蓝色顺序排列。

    分析:
    假如给定一个数组[8, 3, 6, 2, 5, 1, 7, 5],做如下操作:
    1.随机选择数组的一个元素,比如 5 为基准,拆分数组同时引入一个左分区指示器,指向 -1,右分区指示器指向基准数(注:此时的基准数为尾元素)
    2.若当前元素大于基准数,右分区指示器左移一位,当前元素和右分区指示器所指元素交换,
    索引保持不变
    3.若当前元素小于等于基准数时,左分区指示器右移一位,索引右移
    • 当前元素大于等于左分区指示器所指元素,当前元素保持不动
    • 当前元素小于左分区指示器所指元素,交换
    简单来说就是,左分区指示器向右移动的过程中,如果遇到大于或等于基准数时,则停止移动,右分区指示器向左移动的过程中,如果遇到小于或等于主元的元素则停止移动。这种操作也叫双向快速排序。
    JAVA十大排序算法之快速排序详解
    文章图片


    代码实现
    public class QuickSort {public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2}; public static final int[] ARRAY2 = {8, 3, 6, 2, 5, 1, 7, 5}; private static int[] sort(int[] array, int left, int right) {if (array.length < 1 || left > right) return null; //拆分int partitionIndex = partition(array, left, right); //递归if (partitionIndex > left) {sort(array, left, partitionIndex - 1); }if (partitionIndex < right) {sort(array, partitionIndex + 1, right); }return array; }/*** 分区快排操作** @param array 原数组* @param left左侧头索引* @param right 右侧尾索引* @return 分区指示器最后指向基准数*/public static int partition(int[] array, int left, int right) {//基准数下标---随机方式取值,也就是数组的长度随机1-8之间int pivot = (int) (left + Math.random() * (right - left + 1)); //分区指示器索引int partitionIndex = left - 1; //基准数和尾部元素交换swap(array, pivot, right); //按照规定,如果当前元素大于基准数不做任何操作;//小于基准数,分区指示器右移,且当前元素的索引大于分区指示器,交换for (int i = left; i <= right; i++) {if (array[i] <= array[right]) {//当前元素小于等于基准数partitionIndex++; if (i > partitionIndex) {//当前元素的索引大于分区指示器//交换swap(array, i, partitionIndex); }}}return partitionIndex; }/*** 双向扫描排序*/public static int partitionTwoWay(int[] array, int left, int right) {//基准数int pivot = array[right]; //左分区指示器索引int leftIndex = left - 1; //右分区指示器索引int rightIndex = right; //索引int index = left; while (index < rightIndex) {//若当前元素大于基准数,右分区指示器左移一位,当前元素和右分区指示器所指元素交换,索引保持不变if (array[index] > pivot) {swap(array, index, --rightIndex); } else if (array[index] <= pivot) {//当前元素小于等于基准数时,左分割指示器右移一位,索引右移leftIndex++; index++; //当前元素小于等于左分区指示器所指元素,交换if (array[index] < array[leftIndex]) {swap(array, index, leftIndex); }}}//索引和 L 指向同一个元素swap(array, right, rightIndex); return 1; }//交换private static void swap(int[] array, int i, int j) {int temp = array[i]; array[i] = array[j]; array[j] = temp; }public static void print(int[] array) {for (int i : array) {System.out.print(i + ""); }System.out.println(""); }public static void main(String[] args) {print(ARRAY); System.out.println("============================================"); print(sort(ARRAY, 0, ARRAY.length - 1)); System.out.println("====================双向排序=================="); print(ARRAY2); System.out.println("============================================"); print(sort(ARRAY2, 0, ARRAY2.length - 1)); }}


    时间复杂度
    在拆分数组的时候可能会出现一种极端的情况,每次拆分的时候,基准数左边的元素个数都为0,而右边都为n-1个。这个时候,就需要拆分n次了。而每次拆分整理的时间复杂度为O(n),所以最坏的时间复杂度为O(n2)。什么意思?举个简单例子:
    在不知道初始序列已经有序的情况下进行排序,第1趟排序经过n-1次比较后,将第1个元素仍然定在原来的位置上,并得到一个长度为n-1的子序列;第2趟排序经过n-2次比较后,将第2个元素确定在它原来的位置上,又得到一个长度为n-2的子序列;以此类推,最终总的比较次数:
    【JAVA十大排序算法之快速排序详解】C(n) = (n-1) + (n-2) + … + 1 = n(n-1)/2
    所以最坏的情况下,快速排序的时间复杂度为O(n^2)
    而最好的情况就是每次拆分都能够从数组的中间拆分,这样拆分logn次就行了,此时的时间复杂度为O(nlogn)。
    而平均时间复杂度,则是假设每次基准数随机,最后算出来的时间复杂度为O(nlogn)
    参考:快速排序的时间复杂度与空间复杂度

    算法稳定性
    通过上面的分析可以知道,在随机取基准数的时候,数据是可能会发生变化的,所以快速排序有不是稳定的情况。

    总结 本篇文章就到这里了,希望能给你带来帮助,也希望您能够多多关注脚本之家的更多内容!

      推荐阅读