百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

C++中标准库中map与unorder_map在小数据量下如何选择

itomcoil 2025-05-03 14:44 22 浏览

在 C++ 中,std::map 和 std::unordered_map 都是非常有用的关联容器,用于存储键值对。它们的主要区别在于其底层实现和性能特性,尤其是在处理不同数据量时。

  • 当大数据量时优选是std::unorder_map
  • 当数据量较小时,它们的性能差异可能不如大数据量时那么显著,但仍然存在一些关键的对比点。

std::map和 std::unordered_map的基本特性

  • std::map:
    • 底层实现: 基于红黑树(Red-Black Tree)实现。红黑树是一种自平衡二叉搜索树。
    • 键的顺序: std::map 中的元素按照键的排序顺序存储。默认情况下,使用键类型的 < 运算符进行排序。
    • 时间复杂度: 对于插入、删除、查找等操作,平均和最坏情况下的时间复杂度都是 O(log n),其中 n 是 std::map 中元素的数量。
    • 内存占用: 由于红黑树的结构,每个节点需要额外的空间来维护树的平衡信息(例如颜色、父节点指针等)。
  • std::unordered_map:
    • 底层实现: 基于哈希表(Hash Table)实现。
    • 键的顺序: std::unordered_map 中的元素是无序的,元素的顺序取决于哈希函数和哈希表的内部结构。不保证任何特定的顺序。
    • 时间复杂度: 在理想情况下(良好的哈希函数和较低的哈希冲突),对于插入、删除、查找等操作,平均时间复杂度可以达到 O(1),即常数时间。但在最坏情况下(例如所有键都哈希到同一个桶中,或哈希冲突严重),时间复杂度可能会退化到 O(n)
    • 内存占用: 哈希表通常需要预分配一定的桶(buckets)空间,并且可能需要额外的空间来处理哈希冲突(例如链地址法或开放寻址法)。此外,为了维持较好的性能,std::unordered_map 会在元素数量达到一定阈值时进行 rehash(重新分配桶并重新哈希所有元素),这会带来额外的开销。

小数据量下的性能对比分析:

当数据量非常小(例如,只有几个到几十个元素)时,std::mapstd::unordered_map 之间的性能差异会变得微妙,并且受多种因素影响。我们可以从以下几个方面进行比较:

1. 插入操作 (Insertion):

  • std::map: 插入操作需要在红黑树中找到合适的位置并调整树结构以保持平衡。对于小数据量,红黑树的高度较小,插入操作的实际耗时可能非常短,但仍然是 O(log n) 的复杂度。
  • std::unordered_map: 插入操作需要计算键的哈希值,找到对应的桶,并将元素放入桶中。在理想情况下,这是常数时间操作。然而,即使是小数据量,哈希函数的计算本身也可能带来一定的开销,并且如果哈希函数质量不高,即使数据量小也可能发生少量冲突,导致性能略有下降。

在小数据量下,std::unordered_map 的平均插入速度通常会比 std::map 快一些,但这个差距可能并不明显。 std::map 的插入性能在小数据量时已经足够优秀,而 std::unordered_map 的常数时间优势在数据量小时体现得不那么突出,因为红黑树的 log n 在小 n 的情况下也很小

2. 查找操作 (Search/Lookup):

  • std::map: 查找操作需要在红黑树中进行搜索,时间复杂度为 O(log n)。
  • std::unordered_map: 查找操作需要计算哈希值并直接访问对应的桶,理想情况下是常数时间 O(1)。

在小数据量下,std::unordered_map 的查找速度通常会明显快于 std::map 这是 std::unordered_map 最主要的优势之一,即使数据量很小,哈希表的常数时间查找也比红黑树的对数时间查找更快。 当然,前提是哈希函数质量良好,冲突较少。

3. 删除操作 (Deletion):

  • std::map: 删除操作需要在红黑树中找到元素并调整树结构以保持平衡,时间复杂度为 O(log n)。
  • std::unordered_map: 除操作需要计算哈希值并找到对应的桶,然后移除元素,理想情况下是常数时间 O(1)。

与插入操作类似,在小数据量下,std::unordered_map 的删除速度通常会比 std::map 快一些,但差距可能不显著

4. 迭代 (Iteration):

  • std::map 的迭代器会按照键的排序顺序遍历元素。迭代的效率较高,因为红黑树的有序性使得迭代过程相对简单。
  • std::unordered_map 的迭代器会按照哈希表内部的顺序遍历元素,这个顺序通常与插入顺序无关,并且不可预测。 迭代效率也比较高,因为只需要遍历哈希表的桶。

在迭代性能上,两者在小数据量下可能相差不大。 但是,std::map 保证了迭代顺序是排序的,这在某些场景下非常重要。 如果你需要有序的遍历,则必须使用 std::map

5. 内存占用 (Memory Overhead):

  • std::map: 红黑树的节点需要存储键、值以及维护树结构的信息(例如颜色、指针)。
  • std::unordered_map: 哈希表需要预分配桶空间,即使桶是空的也会占用内存。 此外,为了解决哈希冲突,可能还需要额外的空间(例如链表或额外的桶)。

在小数据量下,std::map 的内存占用可能略小于 std::unordered_map。 哈希表为了保证平均常数时间的性能,通常会预留一定的空桶,即使元素数量很少,也可能占用比红黑树更多的内存。 但是,这种差异通常可以忽略不计,除非内存资源极其受限。

总结: 小数据量下的选择建议

特性

std::map

std::unordered_map

小数据量下对比总结

底层结构

红黑树 (Red-Black Tree)

哈希表 (Hash Table)


键的顺序

有序 (Sorted by key)

无序 (Unordered)

std::map 提供有序性,如果需要有序遍历或基于键的顺序操作,则必须选择 std::map

插入

O(log n)

平均 O(1),最坏 O(n)

std::unordered_map 平均更快,但小数据量差距不明显。

查找

O(log n)

平均 O(1),最坏 O(n)

std::unordered_map 通常明显更快,即使数据量小。

删除

O(log n)

平均 O(1),最坏 O(n)

std::unordered_map 平均更快,但小数据量差距不明显。

迭代

有序迭代,与插入顺序无关,按键排序

无序迭代,与插入顺序无关,顺序不可预测

std::map 提供有序迭代,如果需要有序遍历,则必须选择 std::map。 小数据量下迭代性能相差不大。

内存占用

可能略小

可能略大

小数据量下 std::map 内存占用可能略小,但通常可以忽略不计。

适用场景

需要键的有序性,例如需要按顺序遍历,范围查询等

追求平均快速的查找、插入、删除操作,不关心元素顺序

数据量很小 (例如 < 几百): 如果不关心顺序,std::unordered_map 查找速度略有优势。如果需要顺序,则必须用 std::map。 实际应用中,如果性能不是瓶颈,优先考虑代码可读性和功能需求 (例如是否需要有序)。

总结来说,在小数据量下:

  • 如果你的主要操作是查找,并且不关心元素的顺序,那么 std::unordered_map 通常会提供略微更好的性能。 其常数时间的平均查找速度即使在小数据量下也能体现出优势。
  • 如果你的应用场景需要保持键的排序顺序,或者需要按顺序迭代元素,那么必须选择 std::map std::map 的性能在小数据量下也足够优秀,并且提供了有序性这一关键特性。
  • 如果性能不是关键瓶颈,并且数据量确实非常小,那么选择哪个容器可能更多地取决于代码的可读性和你对有序性的需求。 在许多情况下,小数据集的性能差异可能微乎其微,选择更符合语义或更易于理解的代码可能更为重要。




相关推荐

《Queendom》宣布冠军!女团MAMAMOO四人激动落泪

网易娱乐11月1日报道据台湾媒体报道,南韩女团竞争回归的生死斗《Queendom》昨(10/31)晚播出大决赛,并以直播方式进行,6组女团、女歌手皆演唱新歌,并加总前三轮的赛前赛、音源成绩与直播现场投...

正确复制、重写别人的代码,不算抄袭

我最近在一篇文章提到,工程师应该怎样避免使用大量的库、包以及其他依赖关系。我建议的另一种方案是,如果你没有达到重用第三方代码的阈值时,那么你就可以自己编写代码。在本文中,我将讨论一个在重用和从头开始编...

HTML DOM tr 对象_html event对象

tr对象tr对象代表了HTML表格的行。HTML文档中出现一个<tr>标签,就会创建一个tr对象。tr对象集合W3C:W3C标签。集合描述W3Ccells返回...

JS 打造动态表格_js如何动态改变表格内容

后台列表页最常见的需求:点击表头排序+一键全选。本文用原生js代码实现零依赖方案,涵盖DOM查询、排序算法、事件代理三大核心技能。效果速览一、核心思路事件入口:为每个<th>绑...

连肝7个晚上,总结了66条计算机网络的知识点

作者|哪吒来源|程序员小灰(ID:chengxuyuanxiaohui)计算机网络知识是面试常考的内容,在实际工作中经常涉及。最近,我总结了66条计算机网络相关的知识点。1、比较http0....

Vue 中 强制组件重新渲染的正确方法

作者:MichaelThiessen译者:前端小智来源:hackernoon有时候,依赖Vue响应方式来更新数据是不够的,相反,我们需要手动重新渲染组件来更新数据。或者,我们可能只想抛开当前的...

为什么100个前端只有1人能说清?浏览器重排/重绘深度解析

面试现场的"致命拷问""你的项目里做过哪些性能优化?能具体讲讲重排和重绘的区别吗?"作为面试官,我在秋招季连续面试过100多位前端候选人,这句提问几乎成了必考题。但令...

HTML DOM 介绍_dom4j html

HTMLDOM(文档对象模型)是一种基于文档的编程接口,它是HTML和XML文档的编程接口。它可以让开发人员通过JavaScript或其他脚本语言来访问和操作HTML和XML文档...

JavaScript 事件——“事件流和事件处理程序”的注意要点

事件流事件流描述的是从页面中接收事件的顺序。IE的事件流是事件冒泡流,而NetscapeCommunicator的事件流是事件捕获流。事件冒泡即事件开始时由最具体的元素接收,然后逐级向上传播到较为不...

探秘 Web 水印技术_水印制作网页

作者:fransli,腾讯PCG前端开发工程师Web水印技术在信息安全和版权保护等领域有着广泛的应用,对防止信息泄露或知识产品被侵犯有重要意义。水印根据可见性可分为可见水印和不可见水印(盲水印)...

国外顶流网红为流量拍摄性侵女学生?仅被封杀三月,回归仍爆火

曾经的油管之王,顶流网红DavidDobrik复出了。一切似乎都跟他因和成员灌酒性侵女学生被骂到退网之前一样:住在950万美元的豪宅,开着20万美元的阿斯顿马丁,每条视频都有数百万观看...人们仿佛...

JavaScript 内存泄漏排查方法_js内存泄漏及解决方法

一、概述本文主要介绍了如何通过Devtools的Memory内存工具排查JavaScript内存泄漏问题。先介绍了一些相关概念,说明了Memory内存工具的使用方式,然后介绍了堆快照的...

外贸独立站,网站优化的具体内容_外贸独立站,网站优化的具体内容有哪些

Wordpress网站优化,是通过优化代码、数据库、缓存、CSS/JS等内容,提升网站加载速度、交互性和稳定性。网站加载速度,是Google搜索引擎的第一权重,也是SEO优化的前提。1.优化渲染阻塞。...

这8个CSS工具可以提升编程速度_css用什么编译器

下面为大家推荐的这8个CSS工具,有提供函数的,有提供类的,有提取代码的,还有收集CSS的统计数据的……请花费两分钟的时间看完这篇文章,或许你会找到意外的惊喜,并且为你的编程之路打开了一扇新的大门。1...

vue的理解-vue源码 历史 简介 核心特性 和jquery区别 和 react对比

一、从历史说起Web是WorldWideWeb的简称,中文译为万维网我们可以将它规划成如下的几个时代来进行理解石器时代文明时代工业革命时代百花齐放时代石器时代石器时代指的就是我们的静态网页,可以欣...