Python 的hash 函数(python的hash函数)
itomcoil 2025-05-02 18:57 12 浏览
今天在看python的hash 函数源码的时候,发现针对不同的数据类型python 实现了不同的hash 函数,今天简单介绍源码中提到的hash 函数。(
https://github.com/python/cpython/blob/main/Python/pyhash.c)
- 针对short string 类型, python 用的是DJBX33A hash
DJBX33A是DJB(Daniel J. Bernstein)哈希函数的一种变体,专门设计用于快速计算和提供良好的分布特性, 我们来看一下DJBX33A
def djbX33A_hash(key):
hash_value = 5381 # 初始哈希值
for char in key:
hash_value = (hash_value * 33) ^ ord(char)
return hash_value
同时看一下DJB2 的实现
def djb2_hash(key):
hash_value = 5381 # Initial hash value
for char in key:
hash_value = ((hash_value << 5) + hash_value) + ord(char)
return hash_value
这个hash 函数用在很多的hashmap 的实现上
- 针对文件的hash, python使用的是FNV hash。 我们看一下FNV hash 的具体实现
def fnv_hash(key):
FNV_PRIME_32 = 16777619
FNV_OFFSET_32 = 2166136261
hash_value = FNV_OFFSET_32
for char in key:
hash_value = (hash_value ^ ord(char)) * FNV_PRIME_32
return hash_value
- 最后介绍python 默认的hash SipHash, 上面两种hash 函数都是相对不安全的,我们直接看代码
def siphash(key, message):
c = 2
d = 4
v0 = 0x736f6d6570736575
v1 = 0x646f72616e646f6d
v2 = 0x6c7967656e657261
v3 = 0x7465646279746573
def rotl(x, b):
return ((x << b) & 0xffffffffffffffff) | (x >> (64 - b))
def sip_round():
v0 += v1
v1 = rotl(v1, 13)
v1 ^= v0
v0 = rotl(v0, 32)
v2 += v3
v3 = rotl(v3, 16)
v3 ^= v2
v0 += v3
v3 = rotl(v3, 21)
v3 ^= v0
v2 += v1
v1 = rotl(v1, 17)
v1 ^= v2
v2 = rotl(v2, 32)
k0 = int.from_bytes(key[:8], 'little')
k1 = int.from_bytes(key[8:16], 'little')
m = len(message)
last_chunk = m % 8
b = m // 8 * 8
v3 ^= k1
v2 ^= k0
v1 ^= k1
v0 ^= k0
for i in range(b // 8):
mi = int.from_bytes(message[i*8:(i+1)*8], 'little')
v3 ^= mi
for _ in range(d):
sip_round()
v0 ^= mi
mi = (last_chunk << 56) | int.from_bytes(message[b:], 'little')
v3 ^= mi
for _ in range(d):
sip_round()
v0 ^= mi
v2 ^= 0xff
for _ in range(c):
sip_round()
hash_value = v0 ^ v1 ^ v2 ^ v3
return hash_value
最后我们给出python的PEP 456 – Secure and interchangeable hash algorithm | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme,这篇PEP可以很好的了解的python关于hash的具体事现,以及python的开发者是如何从众多的hash 函数中选择最优的hash function。
相关推荐
- Python字符串格式化:你真的会用吗?告别混乱代码,看这一篇就够
-
大家好!今天我们来聊聊Python中一个看似简单却暗藏玄机的操作——字符串格式化。你是不是还在用%s拼凑变量?或者写了无数个format()却依然被同事吐槽代码太“复古”?别急,这篇干货带你解锁三种神...
- Python Unicode字符串编程实用教程
-
Unicode是现代文本处理的基础,本教程将介绍Python中的Unicode字符串处理,涵盖从基础概念到高级应用等。一、Unicode基础概念1.1Unicode与编码核心概念:Unicode:字...
- 殊途同归 python 第 6 节:字符串的使用
-
字符串作为Python的基础数据之一,以下是字符串的几种最常用情形,直接上代码1.声明字符串a="helloworld"b='竹杖芒鞋轻胜马,谁怕,一蓑烟雨任平生...
- python爬虫字符串定位开始跟结束(find方法的使用)
-
python爬虫采集的时候会需要对采集的内容进行处理行为,处理什么?简单的说就是处理多余的HTML代码跟确定文章标题跟结尾,还有内容区间,方法如下:首先先是定位,我们先假设我们采集到了一批数据,数据里...
- python 入门到脱坑 基本数据类型—字符串string
-
以下是Python字符串(String)的入门详解,包含基础操作、常用方法和实用技巧,适合初学者快速掌握:一、字符串基础1.定义字符串#单引号/双引号s1='hello's...
- python字符串知识点总结
-
Python字符串知识点总结1.字符串基础字符串是不可变的序列类型可以用单引号(')、双引号(")或三引号('''或""")创建三引号...
- 在 Python 中使用 f-String 格式化字符串
-
在Python3.6中引入的f字符串提供了一种既简洁又可读的字符串格式新方法。f字符串的正式名称为格式化字符串文字,是以f或F为前缀的字符串,其中包含大括号内的表达式。这些表达式在...
- 零起点Python机器学习快速入门-4-3-字符串常用方法
-
Python中字符串的多种操作。包括去除字符串首尾的空格和特定字符、字符串的连接、查找字符在字符串中的位置、字符串之间的比较、计算字符串的长度、大小写转换以及字符串的分割。通过这些操作,我们可以对字...
- Python 中 字符串处理的高效方法,不允许你还不知道
-
以下是Python中字符串处理的高效方法,涵盖常用操作、性能优化技巧和实际应用场景,帮助您写出更简洁、更快速的代码:一、基础高效操作1.字符串拼接:优先用join()代替+原因:join()预...
- Python字符串详解与示例
-
艾瑞巴蒂字符串的干货来了,字符串是程序中最常见的数据类型之一,用来表示数据文本,下面就来介绍下字符串的特性,操作和方法,和一些示例来吧道友:1.字符串的创建在python中字符串可以永单引号(...
- Python中去除字符串末尾换行符的方法
-
技术背景在Python编程中,处理字符串时经常会遇到字符串末尾包含换行符的情况,如从文件中读取每一行内容时,换行符会作为字符串的一部分被读取进来。为了满足后续处理需求,需要将这些换行符去除。实现步骤1...
- 表格编程之争:Python VS VBA?Excel用户:新编程语言才真香!
-
Python和VBA哪个更好用?Python和VBA是两种不同的编程语言,它们都有自己的特点和优缺点。在表格编程方面,VBA在Excel中的应用非常广泛,可以通过宏来实现自动化操作和数据处理,也可以通...
- 用Python把表格做成web可视化图表
-
Python中有一个streamlit库,Streamlit的美妙之处在于您可以直接在Python中创建Web应用程序,而无需了解HTML、CSS或JavaScrip,今天我们就用st...
- 使用 Python 在 PowerPoint 演示文稿中创建或提取表格
-
PowerPoint中的表格是一种以结构化格式组织和呈现数据的方法,类似于Excel或Word等其他应用程序中表格的使用方式。它们提供了一种清晰简洁的方式来显示信息,使您的受众更容易消化和理...
- 用python实现打印表格的方法
-
最近在做表格输出的任务,一般有两种方法实现在控制台打印,一种是根据表格的输出规则自己写代码实现,另外一种是安装python的第三方依赖包prettytable实现这个效果。方法1:根据表格规则写代码...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)