【算法与数据结构】归并排序的代码实现(详细图解)以及master公式的讲解

目录

1、归并排序

 1.1、算法描述

 1.2、图解说明

2、代码实现 

3、master公式

3.1、公式以及结论

3.2、适用于某些特殊的递归

3.3、计算归并排序的时间复杂度


1、归并排序

归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用递归或者说是分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。

若将两个有序表合并成一个有序表,称为二路归并

 1.1、算法描述

  • 把长度为n的输入序列分成两个长度为n/2的子序列;
  • 对这两个子序列分别采用归并排序;
  • 将两个排序好的子序列合并成一个最终的排序序列。

而将两个的有序数列合并成一个有序数列,我们称之为"归并",这就是归并排序名字的由来。

 1.2、图解说明

一句话简单说:对L到R范围排序,可以先求出L到R的中点M。先让左侧数据排好序,然后再让右侧数据排好序,此时再将两个有序子序列整合成一个新的有序序列。

 例如:

对一个数组[8,3,6,4,2,1,5,7]进行归并排序。

第一步:把长度为n的输入序列分成两个长度为n/2的子序列,新的子序列再分别分成两个长度为自身一半也就是n/4的子序列,以此类推。当分到单个子序列只剩下一个数字时,一个数字就是天然了有序,即此时左侧和右侧都排好序了。

第二步:将两个排序好的子序列合并成一个新的排序序列。首先在每个子序列中都有一个指针指向子序列的第一个元素,两个指针的元素两两比较,较小的元素先放入新的子序列中,然后指针挪动继续比较,直至全部放入新的子序列当中,即完成一次子序列合并。慢慢合并最终使所有元素都成有序,即完成归并排序。

 这个思路过程是非常精髓的,理解了这个思路之后,就可以试着用代码实现了。

2、代码实现 

要使用归并,首先需要知道数组arr以及数组最左L下标和最右R下标,因此需要求出并带入MergeSort当中。

int main()
{int arr[10] = { 8,3,6,4,2,1,5,7 };int sz = sizeof(arr) / sizeof(arr[0]);MergeSort(arr, 0, sz - 1);int i = 0;for ( i = 0; i < sz; i++){printf("%d ", arr[i]);}return 0;
}

接下来看看MergeSort的实现。

  1. 首先是判断L是否等于R,如果L和R相等时就相当于是单个子序列中只存在了一个元素,而此时该子序列就为有序,因此不用进行操作直接返回即可,即if(L == R) return;
  2. 如果L不等于R时则认为该子序列中仍然可拆分,便求出mid中间值,并分别进行两次递归让两块递归范围有序,递归范围是L到mid、mid+1到R。
  3. 最后当递归结束时则代表L到mid、mid+1到R序列已有序,整体还无序,此时需要使用ExternalSort外部排序将这两个子序列整合成一个新的有序序列。
void MergeSort(int* arr, int L, int R)
{if (L == R)  //子序列只有一个数,默认为有序{return;}int mid = L + (R - L) / 2;MergeSort(arr, L, mid);MergeSort(arr, mid + 1, R);ExternalSort(arr, L, mid, R);
}

ExternalSort的作用就是让arr中的L到M、M+1到R合并成一个新的有序序列,并将判断后的结果序列先存入到help指针指向的区域,等待完成所有合并,再将help整个区域的数据拷贝到arr对应的位置。

而存入help的规则是:

1、如果p1和p2都没有越界进行while循环:

p1和p2比较,如果p1大于p2,则将p2所指向的元素放入help中,然后将p2右移指向下一个,继续下一轮比较。

p1和p2比较,如果p1小于等于p2,则将p1所指向的元素放入help中,然后将p1右移指向下一个,继续下一轮比较。

2、如果有一方越界了,则退出循环,并判断p1和p2中哪个还有剩余的元素未排入help中,如果有则直接排入到help中。

void ExternalSort(int* arr, int L, int M, int R)
{int* help = (int*)malloc(sizeof(int) * (R - L + 1)); //辅助空间,用于存放排序后的数据,空间大小为R-L+1。if (help == NULL){perror("ExternalSort->malloc");return;}int helpSz = R - L + 1;int i = 0;int p1 = L;int p2 = M + 1;while (p1 <= M && p2 <= R){//判断p1是否小于等于p2,如果是则将p1指向的值放入help数组中然后两指针前进一位,反之p2亦然help[i++] = arr[p1] <= arr[p2] ? arr[p1++] : arr[p2++];}while (p1 <= M)   //如果p1还没越界,则将剩余的元素全部拷贝到help之后{help[i++] = arr[p1++];}while (p2 <= R)   //如果p2还没越界,则将剩余的元素全部拷贝到help之后{help[i++] = arr[p2++];}for ( i = 0; i < helpSz; i++){arr[L + i] = help[i];    //将合并完成的数据拷贝回原数组arr的对应位置}free(help);help = NULL;
}

到这里,归并排序的代码实现部分就结束了,总的来说因为使用的是递归,代码量是不多的,但是最难的是理解归并排序的思路, 需要好好体会归并排序的操作步骤和思路。

3、master公式

那么完成了归并排序之后,我想知道这个排序的时间复杂度是多少的话,我该怎么算?有人说当然是直接百度搜索一下就知道了。我想说的是这样确实是没问题,但是秉持着“授人以鱼不如授人以渔”的理念,我想带大家深入了解并让大家学会自己去计算递归的时间复杂度

而用来计算的公式就是使用master公式:在计算涉及递归的算法的时候,计算复杂度就会变得有些麻烦。master公式就是用来进行剖析递归行为和递归行为时间复杂度的估算的。

3.1、公式以及结论

  • master公式:T(N) = a*T(N/b) + O(N^d)

  • T(N) = a * T(\frac{N}{b})+O(N^{d})

  • 公式解释:N表示母问题的规模。N/b表示子问题的规模,子问题规模必须相同,即都为N/b。a表示递归的次数也就是子问题在母问题中被调用了多少次。O(N^d)表示除了递归调用操作以外其余操作的复杂度。

  • 结论(证明过于复杂,只需要记住结论即可):
  1. 当公式中的a、b、d符合d<logb a时,时间复杂度为O(N^(logb a))
  2. 当公式中的a、b、d符合d=logb a时,时间复杂度为O((N^d)*logN)
  3. 当公式中的a、b、d符合d>logb a时,时间复杂度为O(N^d)
  • 注意:master公式适用于一些特殊的递归,就是子问题规模必须等分,不管你是分成几部分,就算是划分的区域有重叠,只要区域大小一致,就都可以使用。

【举例说明】

下面是一个使用递归实现在一个数组中找最大值的代码,这里是使用二分法来快速查找最大值,子问题的划分大小是一致的,因此可以使用master公式计算时间复杂度。

  1. 首先可以看到process中自身调用了两次process,母问题中有两个子问题调用即a=2
  2. 然后由于是二分法,因此每个子问题的规模是母问题规模的一半,即N/2
  3. 接着再看其他操作,其他操作都只执行一次,即时间复杂度为O(1)
  4. 最后:该递归的master公式就是T(N) = 2 * T(N/2) + O(1)。

即a = 2, b = 2, d = 0,代入结论公式得d<logb a,时间复杂度为O(N^(logb a)) = O(N)

int process(int* arr, int L, int R)
{if (L == R)return arr[L];int mid = L + (R - L) / 2;int leftMAX = process(arr, L, mid);    //左半边int rightMAX = process(arr, mid + 1, R);   //右半边return leftMAX > rightMAX ? leftMAX : rightMAX;
}int main()
{int arr[] = { 8,3,6,4,2,1,5,7 };int sz = sizeof(arr) / sizeof(arr[0]);int max = process(arr, 0, sz - 1);printf("%d\n", max);return 0;
}

3.2、适用于某些特殊的递归

上面说到过:master公式适用于一些特殊的递归,就是子问题规模必须等分,不管你是分成几部分,就算是划分的区域有重叠,只要区域大小一致,就都可以使用。

但是仍然会有些人会误解意思,下面使用图解的方式给大家解释一下。

【图解说明】

 首先,等分区域是最容易理解的,就是将N等分成若干份,二分就是N/2,三分就是N/3。

子问题的规模是左侧三分之二和右侧三分之二,这样的符合master公式吗?

答案是符合的,因为这里只关注的是区域大小是否一致,而不关心区域是否重叠。

 子问题规模不一样,不符合master公式。

3.3、计算归并排序的时间复杂度

学完了master公式,那么我们就来计算一下归并排序的时间复杂度吧。

void MergeSort(int* arr, int L, int R)
{if (L == R)  //子序列只有一个数,默认为有序{return;}int mid = L + (R - L) / 2;MergeSort(arr, L, mid);MergeSort(arr, mid + 1, R);ExternalSort(arr, L, mid, R);
}

假设整个过程的数据量是N的规模,两个子问题都是T(N/2),因此是2*T(N/2)。

那么现在来观察除了子问题外的其他语句:if语句是O(1)的时间复杂度,而ExternalSort函数的两个指针都只往右前进不会回退的遍历所有数据一遍,又因为数据量是N的规模,所以ExternalSort函数的时间复杂度是O(N)

即:T(N) = 2 * T(N/2) + O(N)    其中a  = 2,b = 2,d = 1

将a、b、d代入结论公式得d=logb a,时间复杂度为O((N^d)*logN) = O(N*logN)。

 

如果觉得作者写的不错,求给博主一个大大的点赞支持一下,你们的支持是我更新的最大动力!

如果觉得作者写的不错,求给博主一个大大的点赞支持一下,你们的支持是我更新的最大动力!

如果觉得作者写的不错,求给博主一个大大的点赞支持一下,你们的支持是我更新的最大动力!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149423.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

JAVA学习(5)-全网最详细~

&#x1f308;write in front&#x1f308; &#x1f9f8;大家好&#xff0c;我是Aileen&#x1f9f8;.希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流. &#x1f194;本文由Aileen_0v0&#x1f9f8; 原创 CSDN首发&#x1f412; 如…

第八章 Linux文件系统权限

目录 8.1 文件的一般权限 1.修改文件或目录的权限---chmod命令 2.对于文件和目录&#xff0c;r&#xff0c;w&#xff0c;x有不同的作用&#xff1a; 3.修改文件或目录的所属主和组---chown,chgrp 8.2 文件和目录的特殊权限 三种通过字符描述文件权限 8.3 ACL 权限 1.A…

redis高可用(主从复制,哨兵,集群)

目录 一、主从复制&#xff1a; 1.主从复制介绍&#xff1a; 2.主从复制的作用&#xff1a; 3.主从复制流程&#xff1a; 4.搭建Redis 主从复制&#xff1a; 4.1 环境准备&#xff1a; 4.2 安装redis&#xff1a; 4.3 master节点修改 Redis 配置文件&#xff1a; 4.4 slave节点…

JAVA面经整理(7)

一)什么是AQS&#xff1f; 1)AQS也被称之为是抽象同步队列&#xff0c;它是JUC包底下的多个组件的底层实现&#xff0c;Lock&#xff0c;CountDownLatch和Semphore底层都使用到了AQS AQS的核心思想就是给予一个等待队列和同步状态来实现的&#xff0c;它的内部使用一个先进先出…

【C语言】循环结构程序设计(第二部分 -- 习题讲解)

前言:昨天我们学习了C语言中循环结构程序设计&#xff0c;并分析了循环结构的特点和实现方法&#xff0c;有了初步编写循环程序的能力&#xff0c;那么今天我们通过一些例子来进一步掌握循环程序的编写和应用。 &#x1f496; 博主CSDN主页:卫卫卫的个人主页 &#x1f49e; &am…

提示msvcp140.dll丢失的5个解决方法,msvcp140.dll丢失问题全面分析

在我们的日常生活和工作中&#xff0c;电脑已经成为不可或缺的工具。然而&#xff0c;在使用电脑的过程中&#xff0c;我们经常会遇到各种问题&#xff0c;其中就包括提示 msvcp140.dll 丢失的问题。msvcp140.dll 是 Visual C Redistributable for Visual Studio 2015 的运行时…

动态内存管理<C语言>

✨Blog&#xff1a;&#x1f970;不会敲代码的小张:)&#x1f970; &#x1f251;推荐专栏&#xff1a;C语言&#x1f92a;、Cpp&#x1f636;‍&#x1f32b;️、数据结构初阶&#x1f480; &#x1f4bd;座右铭&#xff1a;“記住&#xff0c;每一天都是一個新的開始&#x1…

微信小程序代驾系统源码(含未编译前端,二开无忧) v2.5

简介&#xff1a; 如今有越来越多的人在网上做代驾&#xff0c;打造一个代驾平台&#xff0c;既可以让司机增加一笔额外的收入&#xff0c;也解决了车主酒后不能开发的问题&#xff0c;代驾系统基于微信小程序开发的代驾系统支持一键下单叫代驾&#xff0c;支持代驾人员保证金…

Python的NumPy库(一)基础用法

NumPy库并不是Python的标准库&#xff0c;但其在机器学习、大数据等很多领域有非常广泛的应用&#xff0c;NumPy本身就有比较多的内容&#xff0c;全部的学习可能涉及许多的内容&#xff0c;但我们在这里仅学习常见的使用&#xff0c;这些内容对于我们日常使用NumPy是足够的。 …

2023.10.5 文件操作IO 经典例题

目录 例题一 例题二 例题一 扫描指定目录&#xff0c;并找到名称中包含指定字符的所有普通文件&#xff08;不包含目录&#xff09;&#xff0c;并且后续询问用户是否删除该文件 代码如下&#xff1a; package io;import java.io.File; import java.util.Scanner;//扫描指定目…

RSA攻击:模数分解

目录 一、模数分解总览 1.1直接分解法 1.2费马分解与Pollard_rho分解 1.3公约数分解 1.4其他模数分解 二、实战特训 2.1[黑盾杯 2020]Factor 2.2[GWCTF 2019]babyRSA 2.3[LitCTF 2023]yafu (中级) 2.4[RoarCTF 2019]RSA 2.5[CISCN 2022 西南]rsa 三、总结 一、模数分解总览 …

使用idea 中的rest 将 git 合并部分分支代码到主分支

需求&#xff1a;当要将dev的分支中的部分代码合并到test分支时&#xff0c;又不想把dev的全部代码合并到test分支 例如dev分支已经提交了 demo1到4&#xff0c;到想把demo1-3的代码合并到test分支&#xff0c;demo4暂时不合并 可以使用idea的reset 功能满足以上需求 1首先切…

Seata 源码篇之AT模式启动流程 - 中 - 03

Seata 源码篇之AT模式启动流程 - 中 - 03 数据源代理会话代理锁定查询执行器本地事务提交本地事务回滚 更新执行器删除执行器插入执行器 小节 本系列文章: Seata 源码篇之核心思想 - 01Seata 源码篇之AT模式启动流程 - 上 - 02 数据源代理 当我们的数据源被代理后&#xff0c…

.Net开源迁移框架FluentMigrator的使用。

在实际的开发过程中&#xff0c;经常会遇到数据库结构变动&#xff0c;比如新增表、删除表&#xff1b;已有的表新增字段&#xff0c;删除字段&#xff1b;修改字段属性等等。而且需要开发环境、测试环境和生产环境进行同步。如果使用的是EF&#xff0c;还是挺方便的。而非EF环…

PyTorch入门之【tensor】

目录 tensor的创建tensor的相关信息tensor的运算 tensor的创建 1.手动创建 import torch test1torch.tensor([1,2,3])#一维时为向量 test2torch.tensor([[1,2,3]])#二维时为矩阵 test3torch.tensor([[[1,2,3]]])#三维及以上统称为tensor print(test1) print(test2) print(tes…

【Linux】线程详解完结篇——信号量 + 线程池 + 单例模式 + 读写锁

线程详解第四篇 前言正式开始信号量引例信号量的本质信号量相关的四个核心接口生产消费者模型用环形队列实现生产者消费者模型基于环形队列的生产消费模型的原理代码演示单生产者单消费者多生产者多消费者 计数器的意义 线程池基本概念代码 单例模式STL,智能指针和线程安全STL中…

文心一言 VS 讯飞星火 VS chatgpt (106)-- 算法导论10.1 4题

四、用go语言&#xff0c;重写 ENQUEUE 和 DEQUEUE 的代码&#xff0c;使之能处理队列的下溢和上溢。 文心一言&#xff1a; 在 Go 语言中&#xff0c;我们可以使用切片来实现队列。下面是如何实现 ENQUEUE 和 DEQUEUE 操作&#xff0c;同时处理队列的下溢和上溢的情况&#…

git提交代码的流程

1.拉取代码 当你进入了一家公司就需要拉去公司的代码进行开发,此时你的项目小组长会给你个地址拉代码, git clone 公司项目的地址 此时如果不使用了这个方式拉去代码,拉去的是master分支上的代码,但是很多数的情况下&#xff0c;公司的项目可能会在其它的分支上,因此到公…

经典算法-----汉诺塔问题

前言 今天我们学习一个老经典的问题-----汉诺塔问题&#xff0c;可能在学习编程之前我们就听说过这个问题&#xff0c;那这里我们如何去通过编程的方式去解决这么一个问题呢&#xff1f;下面接着看。 汉诺塔问题 问题描述 这里是引用汉诺塔问题源自印度一个古老的传说&#x…