Prometheus 服务发现(Service Discovery)深度解析:动态云原生环境的监控基石
开篇引用:用户提出的问题是:“8. 什么是服务发现(Service Discovery)?为什么它在动态环境(如 Kubernetes)中至关重要?”。本文将深入剖析 Prometheus 服务发现机制的设计哲学、实现原理与多种集成方式,从静态配置的局限性出发,通过 Flink 实时计算作业集群的自动扩缩容案例,揭示服务发现如何成为现代云原生可观测性平台不可或缺的核心能力。
一、问题引入:静态配置在云原生时代的“失明”之痛
在早期,某团队使用 Prometheus 监控一个由 10 个固定 IP 的 Flink JobManager 组成的集群。prometheus.yml中使用static_configs硬编码了这些 IP:
-job_name:'flink'static_configs