news 2026/6/10 2:51:15

xxHash vs MurmurHash3:非加密哈希的王者之争

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
xxHash vs MurmurHash3:非加密哈希的王者之争

背景

长久以来,MD5 这个名字几乎成了“文件校验”的代名词。然而,在非加密哈希领域,更为现代的xxHash128和MurmurHash3都是顶尖算法,但它们在设计哲学、性能特征和适用场景上各有侧重。下来我们简单介绍两个算法的差异,然后实际上手测试比较。

核心对比

特性维度

xxHash (XXH3)

MurmurHash3

设计理念

大块数据现代CPU优化

短键哈希表优化

诞生时间

2019年(XXH3)

2011年

性能焦点

极致吞吐量,特别是>1KB数据

优异的随机分布,均衡性能

速度(现代CPU)

极快

较快

小数据性能

良好

优秀

随机分布质量

良好

极好

硬件优化

深度SIMD优化(AVX2等)

少量SIMD使用

可移植性

需考虑SIMD支持

高度可移植

社区采用

快速增长

RocksDB、ClickHouse等

广泛

Redis、Spark、Cassandra等

键值测试

无论是在数据库键值存储、数据键去重、分布式系统还是机器学习中,mmh3 均能发挥其强大的作用。

大块测试

本次测试的 cpu 是 Intel(R) Xeon(R) Silver 4214 CPU @ 2.20GHz,测试数据为 os.urandom() 生成内存数据。加入MD5作为基准,分别测试4KB、8KB、64KB、256KB、1MB、10MB、100MB的哈希计算耗时

数据大小

MD5耗时

单位 ms

mmh3-128

单位 ms

xxHash128耗时

单位 ms

说明

1KB

0.008

1.800

0.004

4KB

0.014

1.791

0.004

16KB

0.036

1.798

0.006

32KB

0.067

1.813

0.008

64KB

0.136

1.809

0.012

256KB

0.498

1.872

0.038

1MB

1.961

2.036

0.139

10MB

19.465

4.178

1.379

100MB

194.403

23.938

14.794

从测试可以看出,xxHash128 在1KB以及以上的数据大小上都表现最优,特别是对于大数据量,优势极为明显。实际测试上,xxHash128 比 MD5 能快 10 倍以上,在大块数据表现上是绝对的哈希王者。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 9:27:13

面向新手的鸿蒙跨平台开发技术选型指南

💡 一、为什么要关注“跨平台 鸿蒙” 对于刚入门移动 / 多端开发的同学,现在面临的现实是: 安卓 / iOS 依然是主战场;Web、桌面、小程序、IoT 等场景越来越多;鸿蒙(OpenHarmony / HarmonyOS)…

作者头像 李华
网站建设 2026/6/10 9:27:37

楼宇设备运维标准规范:以标准化体系提升物业运维能力

设备运维标准的核心框架楼宇设备运维是物业运营的核心支撑,其标准化体系直接决定了物业对设施的管控精度与服务输出质量。设备运维标准体系需覆盖全生命周期管理要求,包括设备分类编码、日常巡检流程、故障处置规范、维护记录管理等核心模块。分类编码是…

作者头像 李华
网站建设 2026/6/10 9:26:58

吐血推荐10个AI论文写作软件,MBA论文写作必备!

吐血推荐10个AI论文写作软件,MBA论文写作必备! AI 工具正在重塑论文写作的未来 在当今学术研究日益数字化的背景下,AI 工具已经成为许多 MBA 学生和研究人员不可或缺的助手。尤其是在论文写作过程中,AI 不仅能够帮助提高效率&…

作者头像 李华
网站建设 2026/6/10 9:27:36

学术双标红 “终结者”!虎贲等考 AI 让降重 + 降 AIGC 双向合规

学术写作中,“查重标红” 与 “AIGC 检测标红” 是两大高频痛点。传统工具要么机械降重导致逻辑断裂,要么无法根除机器痕迹,让论文陷入 “改了又错、错了再改” 的内耗。虎贲等考 AI 以第五代智能技术为核心,创新打造 “语义重构 …

作者头像 李华