news 2026/4/18 12:07:46

行式存储 vs 列式存储:原理、差异与真实业务案例解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
行式存储 vs 列式存储:原理、差异与真实业务案例解析

文章目录

  • 一、什么是行式存储和列式存储?
  • 二、核心差异一览
  • 三、业务案例一:订单详情查询(典型 OLTP)
  • 四、业务案例二:销售额统计报表(典型 OLAP)
  • 五、真实对比案例(10 亿订单表)
  • 六、为什么列式存储在分析场景这么快?
  • 七、真实系统中的最佳实践架构
  • 八、选型建议
  • 九、总结

在数据库选型时,很多性能问题并不是 SQL 写得不好,而是存储模型从一开始就选错了

本文将通过原理讲解 + 实际业务案例,帮助你真正理解:

为什么有的系统适合行式存储,有的系统必须用列式存储?


一、什么是行式存储和列式存储?

1️⃣ 行式存储(Row-based Storage)

以“行”为单位存储数据,一行的所有字段在物理上连续存放。

示例表:

order_iduser_idamountstatus
1100199.9PAID
21002199.0PAID

行式存储逻辑结构:

[1, 1001, 99.9, PAID] [2, 1002, 199.0, PAID]

2️⃣ 列式存储(Column-based Storage)

以“列”为单位存储数据,同一列的数据连续存放。

order_id: [1, 2] user_id: [1001, 1002] amount: [99.9, 199.0] status: [PAID, PAID]

二、核心差异一览

对比维度行式存储列式存储
存储单位
查询方式点查扫描
I/O读整行只读列
更新
压缩一般极强
适合场景OLTPOLAP

三、业务案例一:订单详情查询(典型 OLTP)

业务需求

用户在 App 中查看自己的订单详情

SELECT*FROMordersWHEREorder_id=123456;

数据特点

  • 查询单行
  • 高频访问
  • 需要事务保证

行式存储表现(MySQL)

  • 通过B+Tree 索引
  • 一次磁盘 I/O 读取整行
  • 返回完整记录

👉性能极高,毫秒级返回


列式存储表现(ClickHouse)

  • 需要从多个列文件中拼装一行
  • 不适合点查
  • 并发能力弱

明显不适合


结论

订单系统、用户系统必须使用行式存储


四、业务案例二:销售额统计报表(典型 OLAP)

业务需求

统计 2025 年每个月的销售额

SELECTtoMonth(create_time)ASmonth,SUM(amount)AStotal_amountFROMordersWHEREcreate_time>='2025-01-01'GROUPBYmonth;

行式存储的执行方式(MySQL)

  • 扫描整张 orders 表
  • 每一行都读取所有字段
  • 大量无效 I/O

📉数据量一大,查询变慢


列式存储的执行方式(ClickHouse)

  • 只读取create_timeamount两列
  • 列数据连续、压缩率高
  • 向量化并行计算

📈百万级数据,秒级返回


结论

统计分析场景,列式存储碾压行式存储


五、真实对比案例(10 亿订单表)

表规模

  • 订单表:10 亿行
  • 字段数:20
  • 查询字段:2 个

性能对比

存储方式扫描数据量查询耗时
行式存储全行 20 列60+ 秒
列式存储仅 2 列2~3 秒

👉差距来源:I/O + 压缩 + 并行


六、为什么列式存储在分析场景这么快?

1️⃣ 只读取必要的列

  • 减少磁盘 I/O

2️⃣ 高效压缩

  • 同类型数据连续
  • 压缩比 5~10 倍

3️⃣ 向量化执行

  • 一次处理 1024 行
  • CPU Cache 友好

七、真实系统中的最佳实践架构

行式 + 列式 混合使用(最常见)

业务系统 | MySQL(行式存储,OLTP) | CDC / MQ | ClickHouse(列式存储,OLAP)
  • MySQL:写、事务、点查
  • ClickHouse:报表、分析、统计

👉各司其职,性能最大化


八、选型建议

快速判断口诀

写多用行式,算多用列式

场景建议
订单 / 用户行式存储
BI 报表列式存储
实时分析行式 + 列式
数据仓库列式存储

九、总结

  • 行式存储是事务系统的基石
  • 列式存储是分析系统的利器
  • 二者不是替代关系,而是协作关系

一个成熟的系统,一定同时使用行式存储和列式存储

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 2:04:01

2.3 LoRA微调黑科技:低成本定制专属大模型

2.3 LoRA微调黑科技:低成本定制专属大模型 引言 在前两节中,我们学习了Transformer的核心机制和主流预训练模型(BERT、GPT、T5)。虽然这些预训练模型功能强大,但直接对整个模型进行微调需要巨大的计算资源和存储空间。特别是在大模型时代,微调一个拥有数十亿甚至数千亿…

作者头像 李华
网站建设 2026/4/18 2:06:20

YOLO26 核心模块精讲:SKAttention 如何实现动态感受野与通道自适应

文章目录 第一部分:创建和修改文件 1. 创建 `ultralytics\nn\SK.py` 2. 创建 `ultralytics\cfg\models\v8\yolov8-SK.yaml` 3. 修改 `ultralytics\nn\tasks.py` 第二部分:SKAttention 的原理介绍 深度解读 SKAttention:选择性核注意力机制 1. 引言:注意力机制在深度学习中的…

作者头像 李华
网站建设 2026/4/18 2:06:20

YOLO26中的PPM空间金字塔池化:改良设计与多尺度特征提取教程

文章目录 PPM(Pyramid Pooling Module)模块原理与实现详解 1. 引言与背景 1.1 语义分割中的挑战 1.2 全局上下文的重要性 1.3 设计动机 2. PPM模块核心原理 2.1 金字塔池化概念 2.2 自适应池化机制 2.3 特征融合策略 3. 代码实现详解 3.1 模块初始化 3.2 前向传播过程 3.3 设…

作者头像 李华
网站建设 2026/4/17 13:51:49

为什么欧洲人比美国更喜欢购买排量小的车型

欧洲人更爱小排量车型,核心是政策税费 用车成本 城市环境 消费文化 技术路径五大因素叠加,形成 “选小排量更划算、更实用” 的市场共识,而美国在这五方面均偏向大排量,具体如下:一、政策与税费:强激励…

作者头像 李华
网站建设 2026/4/18 2:42:06

学霸同款10个AI论文工具,自考毕业论文轻松搞定!

学霸同款10个AI论文工具,自考毕业论文轻松搞定! AI 工具如何成为自考论文写作的得力助手? 随着人工智能技术的不断发展,越来越多的自考生开始借助 AI 工具来提升论文写作的效率和质量。尤其是在当前 AIGC(人工智能生成…

作者头像 李华
网站建设 2026/4/18 3:42:18

8.5 AI员工监控与维护:确保持续稳定运行

8.5 AI员工监控与维护:确保持续稳定运行 构建一个AI员工系统只是第一步,更重要的是确保它能够在生产环境中持续稳定运行。AI系统与传统的软件系统不同,它需要持续监控、定期更新、性能优化和异常处理。一个缺乏有效监控和维护的AI系统,可能会在运行过程中出现性能下降、错…

作者头像 李华