百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

CSP-J/S常考算法探秘:不用比较也能排序(1)——基数排序

itomcoil 2025-02-16 21:10 11 浏览

算法探秘:不用比较也能排序(1)

——基数排序

排序算法是通过特定的算法将一组或多组数据按照一定的模式进行排序,通常为从小到大或从大到小或按字典序排列。

在洛谷中有这样一道排序的模板题:

如果使用经典的排序方法,例如冒泡排序、选择排序、插入排序等,由于时间复杂度在O(n^2),对于10000个数字而言,需要进行的操作最多高达1亿次,程序进行这些操作的时间大概为1秒钟。

但是题目要求程序要在1秒内完成5个测试点,显然这些排序算法满足不了高效排序的要求。

此时有同学学过快速排序(或者直接调用sort()函数)、堆排序、归并排序等,可以将排序的时间复杂度降低到O(nlogn),轻松通过该题。

(图为快速排序的测试结果)

那么,有没有效率更高的排序呢?以上这些排序都是基于数据比较的排序,只要涉及到比较就需要两两对比,就必定包含一个外循环是遍历整个数组的双重循环,时间复杂度的下限就只能在O(nlogn)上。

除了基于比较的排序外,还有三种不需要比较也能排序的排序算法——计数排序、基数排序和桶排序,它们的原理是利用了数组下标是有序的特点,属于线性排序算法,时间复杂度都为O(n+k)(其中,n为数组元素个数,k为对元素进行分组的组数)。

本期,将带着大家学习第一种线性排序算法——基数排序

基数排序的基本思想

基数排序的基本思想是对于待排序的序列按数字的数位进行多趟排序,先按照低位排序,然后收集结果;再按照高位排序、收集结果;以此类推,直到按照了最高位进行排序,最后收集的结果就是排序完成的结果。

这种思想能够实现排序的基本原理大致可以这么描述:对于两个十进制数来说,位数多的那个数字更大;位数一样的话,高位大的数字更大。因此,在两个数的比较过程中,高位比较的优先级最大,低位比较的优先级最低。

例如123、82、39三个数字,只有123有百位,肯定最大,在82和39中,十位上8>3,因此82>39。

基数排序的过程

(1)先输入所有待排序的数字,并找到序列中的最大值,取得最多的位数;

例如上面待排序的序列中,最大值为616,是个三位数,因此接下来要按照个位、十位、百位的顺序进行3趟排序


(2)按个位进行排序,将个位相同的元素放入同一个“桶”中。(此处的“桶”相当于一个容器,用来存放数位相同的元素)

对于上述序列,设计了10个“桶”,分别存放个位是0~9的数字,在代码中可以定义一个大小为10的数组a当做“桶”。


(3)按照“先进先出”的原则,按“桶”的顺序依次取出元素,排成一排。上述序列第一次排序后的结果如下:


(4)以第一次排序的结果为基准,对十位数进行排序,如果没有十位数(例如“2”),则在十位上用0补全。同样地,十位相同的元素放入同一个“桶”中。分配结果如下:

此处为了便于理解,在“2”和“8”的前面都补全了0,实际算法运行过程中是没有0的。


(5)再次按“先进先出”的原则将数据排成一排:

可以看到,如果去掉所有的三位数,剩下的一位数和二位数已经是有序的了。

(6)以第二次排序的结果为基准,再次对百位进行“桶”分配,没有百位的数字在百位上用0补全。


(6)再重新将数据排成一排:

数列已经变成一个有序序列了。

基数排序的时空复杂度分析

以上面的序列为例,总共进行了3次与数位相关的排序,每次排序都是将所有数字先分配到对应的10个“桶”中,再从“桶”取出来,再将中间结果返回到原数组中,因此基数排序的时间复杂度O(d(n+k)) = T(d(3n+k)),其中d为最大值的位数,n为数组元素个数,k为“桶”的个数。

如果最大值的位数远小于序列元素个数,那么时间复杂度可以近似地看作是O(n+k)。

在算法过程中,需要分配的空间有:原数组空间、“桶”的空间、存放中间过程结果的空间,因此空间复杂度也为O(n+k)

基数排序的优势

(1)对于拥有正整数或整数编码的字符串来说,线性排序算法的时间复杂度低,效率极高;

(2)在排序过程中,能够保证相等元素的原始相对顺序,排序算法稳定;

(3)不仅是基数排序,计数排序和桶排序都是用空间换时间的排序算法,在现在内存都很大的时代,其空间复杂度仍旧不算高,因此在处理大规模数据时也能有出色的表现。

但是,基数排序对于数据有一定的限制,如果遇到浮点数、复杂对象等数据类型,需要将数据进行预处理后才能排序。

代码展示:

#include
#include 
#include
using namespace std;
#define N 20 //以20个元素的数组为例 
int a[N]; 
int main(){
  srand(time(0));//设置随机数种子
  cout<<"排序前:"; 
  for(int i=0;i=0;j--){
      //从后往前,将每个数字按当前趟的数位(例如个位)最后的位置放数字进tmp数组 
      tmp[cnt[a[j]/base%10]-1]=a[j]; 
      cnt[a[j]/base%10]--; //放好一个数字(例如个位是2的数字)后,位置往前1个 
    } 
    cout<<"第"<

运行结果

课后同学们可以根据老师给出的算法思路与代码展示,使用基数排序的技巧来完成洛谷上“P1177 【模板】排序”这一题,记录程序AC后的用时与内存消耗,与前面的快速排序对比,理解线性排序算法用空间换时间的特点。

相关推荐

Python Qt GUI设计:将UI文件转换Python文件三种妙招(基础篇—2)

在开始本文之前提醒各位朋友,Python记得安装PyQt5库文件,Python语言功能很强,但是Python自带的GUI开发库Tkinter功能很弱,难以开发出专业的GUI。好在Python语言的开放...

Connect 2.0来了,还有Nuke和Maya新集成

ftrackConnect2.0现在可以下载了--重新设计的桌面应用程序,使用户能够将ftrackStudio与创意应用程序集成,发布资产等。这个新版本的发布中还有两个Nuke和Maya新集成,...

Magicgui:不会GUI编程也能轻松构建Python GUI应用

什么是MagicguiMagicgui是一个Python库,它允许开发者仅凭简单的类型注解就能快速构建图形用户界面(GUI)应用程序。这个库基于Napari项目,利用了Python的强大类型系统,使得...

Python入坑系列:桌面GUI开发之Pyside6

阅读本章之后,你可以掌握这些内容:Pyside6的SignalsandSlots、Envents的作用,如何使用?PySide6的Window、DialogsandAlerts、Widgets...

Python入坑系列-一起认识Pyside6 designer可拖拽桌面GUI

通过本文章,你可以了解一下内容:如何安装和使用Pyside6designerdesigner有哪些的特性通过designer如何转成python代码以前以为Pyside6designer需要在下载...

pyside2的基础界面(pyside2显示图片)

今天我们来学习pyside2的基础界面没有安装过pyside2的小伙伴可以看主页代码效果...

Python GUI开发:打包PySide2应用(python 打包pyc)

之前的文章我们介绍了怎么使用PySide2来开发一个简单PythonGUI应用。这次我们来将上次完成的代码打包。我们使用pyinstaller。注意,pyinstaller默认会将所有安装的pack...

使用PySide2做窗体,到底是怎么个事?看这个能不能搞懂

PySide2是Qt框架的Python绑定,允许你使用Python创建功能强大的跨平台GUI应用程序。PySide2的基本使用方法:安装PySide2pipinstallPy...

pycharm中conda解释器无法配置(pycharm安装的解释器不能用)

之前用的好好的pycharm正常配置解释器突然不能用了?可以显示有这个环境然后确认后可以conda正在配置解释器,但是进度条结束后还是不成功!!试过了pycharm重启,pycharm重装,anaco...

Conda使用指南:从基础操作到Llama-Factory大模型微调环境搭建

Conda虚拟环境在Linux下的全面使用指南:从基础操作到Llama-Factory大模型微调环境搭建在当今的AI开发与数据分析领域,conda虚拟环境已成为Linux系统下管理项目依赖的标配工具。...

Python操作系统资源管理与监控(python调用资源管理器)

在现代计算环境中,对操作系统资源的有效管理和监控是确保应用程序性能和系统稳定性的关键。Python凭借其丰富的标准库和第三方扩展,提供了强大的工具来实现这一目标。本文将探讨Python在操作系统资源管...

本地部署开源版Manus+DeepSeek创建自己的AI智能体

1、下载安装Anaconda,设置conda环境变量,并使用conda创建python3.12虚拟环境。2、从OpenManus仓库下载代码,并安装需要的依赖。3、使用Ollama加载本地DeepSe...

一文教会你,搭建AI模型训练与微调环境,包学会的!

一、硬件要求显卡配置:需要Nvidia显卡,至少配备8G显存,且专用显存与共享显存之和需大于20G。二、环境搭建步骤1.设置文件存储路径非系统盘存储:建议将非安装版的环境文件均存放在非系统盘(如E盘...

使用scikit-learn为PyTorch 模型进行超参数网格搜索

scikit-learn是Python中最好的机器学习库,而PyTorch又为我们构建模型提供了方便的操作,能否将它们的优点整合起来呢?在本文中,我们将介绍如何使用scikit-learn中的网格搜...

如何Keras自动编码器给极端罕见事件分类

全文共7940字,预计学习时长30分钟或更长本文将以一家造纸厂的生产为例,介绍如何使用自动编码器构建罕见事件分类器。现实生活中罕见事件的数据集:背景1.什么是极端罕见事件?在罕见事件问题中,数据集是...