Elasticsearch：性能悖论 - 当更慢的代码并不会拖慢你-程序员充电站

作者：来自 Elastic AndersonQ

欢迎来到我们 Advent Calendar 的第 20 天！在今天这扇门后面，我们没有找到威士忌（像我平时那样），而是找到了对工程师来说更棒的东西：一个有圆满结局的性能谜题。

我曾经参与开发一个功能，我们非常确定它会降低 Elastic Agent 和 Filebeat 的整体日志摄取性能。剧透一下：结果并没有。

这个功能是：摄取 GZIP 压缩的日志。

为什么要摄取 GZIP 压缩的日志？因为日志通常会被轮转，新日志写入 “活动” 日志文件，而旧日志会保存在其他文件中，也就是轮转日志。为了节省存储空间，这些轮转日志通常会被 gzip 压缩。对我们来说，一个主要的使用场景是收集运行在 Kubernetes 上的应用日志，包括那些最终会被 GZIP 压缩的轮转日志。

如果你在想：“但我的应用运行在 Kubernetes 上，只是把日志写到 standard out，没有日志文件啊”。对你来说确实没有日志文件，但对我们这些负责收集日志、把它们发送到 Elasticsearch（或其他持久化存储），并在 Kibana（或其他前端）中展示给你的人来说，它们全都是日志文件。

简单来说，在 Kubernetes 中，容器把日志写到 standard out（ stdout ）和 standard error（ stderr ），kubelet 读取这些内容并把它们保存成日志文件。Elastic Agent 和 Filebeat 读取这些文件，处理它们，然后发送到 Elasticsearch。如果你感兴趣，可以去看看 Kubernetes 日志架构。

GZIP 标准支持在压缩和解压时进行流式处理。这意味着我们不需要先解压整个文件，只需要在读取时，一点一点地按需解压。

此外，这个功能还有一些其他要求：

offset 跟踪 / 部分读取：如果文件没有被完全读取，可以恢复继续读取。市场上只有我们支持这一点 😉
通过解压后的数据指纹来识别文件：能够把最初以纯文本出现、后来变成 GZIP 的同一个文件识别为同一个文件

Elastic Agent 和 Filebeat：快速概览

先快速介绍一下相关组件，这样你在接下来我提到这些术语时就不会迷糊。

Filebeat：一个轻量级的日志 shipper。它是 Beats 之一，每个 beat 负责摄取一种类型的数据，Filebeat 负责摄取文件（不出所料！）。
Elastic Agent：“一体化” 的受管解决方案。“Elastic Agent 是一种统一的方式，用于在主机上添加日志、指标以及其他类型数据的监控。”

Elastic Agent 会在后台配置并运行 Beats 来收集所需的数据。它可以由 Fleet 集中管理，也可以以独立模式部署。

Filebeat 可以从不同来源收集数据。对于每一种来源，负责收集数据的组件被称为 input。filestream是用于摄取日志文件的 input。数据读取之后，会在 Pipeline 中进行处理，然后发送到 output，将数据传输到持久化存储（例如 Elasticsearch）或用于进一步处理（例如 Logstash）。

开发过程

由于我们预计这个功能会降低整体日志摄取性能，所以一开始我们先做了一个概念验证（ POC ），把filestream中真正负责读取文件的部分单独拿出来，与读取普通文件进行基准测试。正如预期的那样，它确实更慢，但还没有慢到不可接受的程度。

然后我们决定继续实现这个功能，等全部完成后再进行基准测试，以了解它对性能的影响，并向用户解释在摄取 GZIP 文件时可以预期什么。

基准测试

我们有两种不同类型的基准测试：端到端测试，以及标准的 Go / 微基准测试。

端到端

我们有一个内部工具叫 “benchbuilder”，用于对 Beats（ Filebeat、 Metricbeat 等）和 Elastic Agent 进行端到端测试。它关注用户体验，以每秒日志数作为关键指标（这里称为每秒事件数， EPS ）。这种测试更复杂，需要大量的环境配置。

Go / 微基准测试

常规的 Go 基准测试，用于测试某个函数或小组件，以评估新实现是否真的更好，或者新功能或重构是否带来了性能下降。开发和运行都比较简单、成本低。

我们测量的指标

EPS（ events per second ）：输出日志的速度有多快
CPU 使用率：使用了多少 CPU
内存使用：需要多少内存

使用场景

很多小文件：数千个 10MB 的文件。这模拟了高负载环境下 Kubernetes 的日志轮转
一个超大文件：几个 GB。确保它可以处理比可用内存还大的文件

第一个（仍在进行中的）基准测试

令我们惊讶的是，10MB 的 gzipped 文件反而快了一点点！

我们先来看所有基准测试，然后再解释这些结果。

EPS 对比

1 个 45GB 的文件，以及 4150 个每个 10MB 的文件

真是个惊喜！在吞吐性能上，也就是每秒发送到 Elasticsearch 的事件数，我们看到的差异几乎可以忽略。不仅如此，在包含 4150 个小文件的场景中，读取 GZIP 文件反而还快了一点点。

CPU 使用率

同样地，在 CPU 使用率方面我们也没有看到明显差异。我们观察到，读取成千上万个小文件比读取一个大文件消耗更多的 CPU。这是符合预期的，因为在检测新文件的存在、打开文件进行读取，以及在完全读取后关闭文件的过程中，会发生很多操作。

内存使用情况

最后，至少有一次，常识赢了！不过只赢了 0.5 分。

读取 4150 个 GZIP 文件比读取对应的纯文本文件需要更多内存。不过，在读取 48GB 文件时，尽管内存使用并不是非常稳定，但纯文本文件和 GZIP 文件的内存使用量基本相同。

通过端到端测试、更多的 Go / 微基准测试，以及对 GZIP 解压库工作方式的了解，我们确定：每读取一个 GZIP 文件，大约会多消耗 100KB 的内存。这也是为什么在读取一个 48GB 文件时，看不到 GZIP 解压带来的明显影响 —— 额外的 100KB 在整体内存消耗中几乎可以忽略。

另一方面，当同时读取成千上万个文件时，这个内存开销就变得显著了，这一点需要考虑。可以通过配置并行读取的文件数量以及文件何时关闭，来帮助缓解内存增加带来的影响。

理解这些结果

好吧，我们知道数据不会说谎 —— 至少在实验设计和数据采集都正确的情况下是这样，而这次确实如此。那么，为什么这些数据看起来违背了常识，也违背了我最初的基准测试结论呢？

理解 Filebeat 的工作方式

正如我一开始提到的，真正承担重活、实际读取文件的是 Filebeat，Elastic Agent 只是底层运行 Filebeat。

Filebeat，以及其他所有 Beat，在内部都有三个主要组件：Input、Queue / Pipeline、Output。

Input： filestream

input 是实际读取数据的组件，然后把数据发布到 Pipeline。在我一开始给你看的 Go 基准测试中，我们看到filestream在读取 GZIP 文件时更慢。后续更多的 Go / 微基准测试也证实了这一点。数据以更慢的速度被读取，然后发送到 Pipeline 队列。

Pipeline / Queue

在 Pipeline 中，收集到的数据会被进一步处理和转换。processors 是 Pipeline 的一部分。它们会对数据进行转换，包括添加、修改和删除日志中的字段。由于 processors 会改变数据的形式，它们是按顺序依次应用的：
一个 processor 的输出会成为下一个 processor 的输入。

event -> processor 1 -> event1 -> processor 2 -> event2 ...

有些转换是破坏性的，也就是说它们无法被恢复，尤其是在失败的情况下。因此，为了保证数据完整性，如果任何 processor 失败，我们会中止 Pipeline，并发布最后一个成功 processor 的输出。这样即使发生失败，也能保证数据一致性。对于执行破坏性操作的 processor，它们会作用在日志的副本上。这个副本操作通常涉及内存分配，会带来性能开销。

基于这个理解，去掉 processors 会不会让 GZIP 文件读取变慢呢？

答案是：有也有没有！确实，processors 的开销不可忽视。启用 processors 时，EPS 大约为每秒 20,000 条，而去掉它们后为 25,000 条，明显更快。不过，GZIP 文件和普通文件之间的差异依然可以忽略不计。

不仅 processors 是顺序应用的，日志本身也按顺序处理。Input、Pipeline 和 Output 之间存在一个队列。和任何队列一样——无论是人还是日志——如果队列“移动不够快”，而人（或日志）到达的速度比离开队列的速度快，队列就会不断增长。Input 就像一个快跑者，却被慢速队列堵住了。

在 Filebeat 中，一旦队列满了，input 就会停止读取数据，直到队列中有空位为止。

这就是发生的情况！filestream比 Pipeline 快得多，所以即使因为 GZIP 解压而稍微慢了一点，它依然比 Pipeline 快。Input（filestream）会被阻塞，它会停止读取数据，等待队列中有空位后再继续读取。

这也与我们在帮助用户优化和提升 Filebeat 吞吐量时的观察一致。大量工作都投入到为用户使用场景找到理想的队列配置上。