news 2026/4/18 0:17:14

Nomad组件部署clickhouse-job

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Nomad组件部署clickhouse-job

#作者:stackofumbrella

文章目录

  • 首先nomad组件配置meta、host_volume
  • 启动nomad并查询meta
  • clickhouse配置
  • 配置clickhouse.hcl指定node部署

首先nomad组件配置meta、host_volume

# /etc/nomad.d/nomad.hcl datacenter = "dc1" data_dir = "/opt/nomad/data" # 启用 Server 模式 server { enabled = true bootstrap_expect = 3 server_join { retry_join = [ "192.168.123.70", "192.168.123.71", "192.168.123.72" ] } } # 启用 Client 模式(允许本机运行任务) client { enabled = true servers = [ "192.168.123.70:4647", "192.168.123.71:4647", "192.168.123.72:4647" ] # Host Volumes —— 业务需要的持久化目录必须在client上声明 host_volume "ck-data" { path = "/shaxiang/ck/data" read_only = false } host_volume "ck-config" { path = "/shaxiang/ck/conf" read_only = false } host_volume "ck-users" { path = "/shaxiang/ck/user" read_only = false } # node_class = "worker" # ✅ meta 必须在这里!作为 client 的子配置 meta { job_constraint = "shard-2" } } # 绑定地址 addresses { http = "0.0.0.0" rpc = "0.0.0.0" serf = "0.0.0.0" } ports { http = 4646 rpc = 4647 serf = 4648 } consul { address = "127.0.0.1:8500" auto_advertise = true }

启动nomad并查询meta

/etc/systemd/system/nomad.service [Unit] Description=Nomad After=network.target [Service] Type=simple User=root ExecStart=/usr/local/bin/nomad agent -config=/etc/nomad.d Restart=on-failure [Install] WantedBy=multi-user.target systemctl daemon-reload systemctl enable nomad systemctl start nomad systemctl status nomad 查询命令 nomad node status [options] [<node-id>] 不带参数:列出所有节点 带 <node-id>:查看指定节点的详细信息 nomad node status -json [<node-id>] | jq '.Meta.job_constraint' 会输出配置的meta的volume视为正常 nomad node status -verbose [<node-id>] | grep ck #查看你的host_volume是否声明 ck-config false /shaxiang/ck/conf ck-data false /shaxiang/ck/data ck-users false /shaxiang/ck/user

clickhouse配置

首先使用run启动ck的容器,ps查看配置文件(config、users),cp到主机。
docker run -d --name some-clickhouse-server --ulimit nofile=262144:262144 clickhouse-server:25.10

配置clickhouse.hcl指定node部署

# 定义一个 Nomad Job,名字为 clickhouse01 job "clickhouse01" { datacenters = ["dc1"] # 指定 Job 运行的数据中心 type = "service" # Job 类型为 service(长期运行的服务) priority = 100 # 调度优先级 # 定义 Task Group(任务组),名字同样为 clickhouse01 group "clickhouse01" { count = 1 # 期望部署的 Task 数量 # ======== Host Volume 定义 ======== # volume 必须在 group 内部、task 之前定义 volume "ck-data" { type = "host" # 本地宿主机目录 source = "ck-data" # 指定 host_volume 名称(非绝对路径) read_only = false # 可读写 } volume "ck-config" { type = "host" source = "ck-config" # 对应 client 上声明的 host_volume 名称 read_only = false # 配置文件需要写权限时设为 false } volume "ck-users" { type = "host" source = "ck-users" read_only = false } # ======== 节点约束 ======== # 仅在 meta.job_constraint = "shard-2" 的节点上运行 constraint { attribute = "${meta.job_constraint}" value = "shard-2" } # ======== 网络配置 ======== network { mode = "host" # 使用宿主机网络 port "http" { static = 8123 } # HTTP 服务端口 port "tcp" { static = 9000 } # TCP 服务端口 } # ======== Task 定义 ======== task "clickhouse" { #定义具体容器名称以及日志文件名称 driver = "docker" # 使用 Docker 驱动 # Docker 配置 config { image = "registry.cn-hangzhou.aliyuncs.com/ali_cloud_images/clickhouse-server:25.10" # 镜像 ports = ["http", "tcp"] # 端口映射,和 network 部分对应 } # ======== 挂载 Volume ======== volume_mount { volume = "ck-data" # 对应上面定义的 volume 名称 destination = "/var/lib/clickhouse" # 容器内部路径 } volume_mount { volume = "ck-config" destination = "/etc/clickhouse-server/config.d" # 配置文件目录 } volume_mount { volume = "ck-users" destination = "/etc/clickhouse-server/users.d" # 用户权限文件目录 } # ======== 环境变量 ======== env { CLICKHOUSE_PASSWORD = "ck@123" # ClickHouse 用户密码 } # ======== 资源限制 ======== resources { cpu = 2000 # CPU 单位为 MHz(2 核) memory = 4096 # 内存单位为 MB(4 GB) } # ======== 服务注册和健康检查 ======== service { name = "clickhouse01" # Nomad/Consul 注册服务名称 port = "http" # 对应 network 定义的 http 端口 check { # 健康检查 name = "alive" type = "http" # HTTP 检查 path = "/ping" # 检查路径 interval = "20s" # 每 20 秒检查一次 timeout = "10s" # 超时 10 秒 } } } } }

nomad job validate
验证Job文件语法和逻辑

作用
检查 .nomad 文件是否符合 HCL 语法
验证资源请求、网络、卷、约束等配置是否合法
不会连接 Nomad 集群,纯本地校验(安全!)

基本用法
nomad job validate clickhouse.hcl
成功输出示例
Job validation successful.

nomad job run (run之前对应的目录要给到权限)
提交并运行Job

作用
将 Job 提交到 Nomad 集群
触发调度器分配任务到 Client 节点
如果 Job 已存在,则执行 滚动更新(默认策略)
基本用法
nomad job run clickhouse.hcl

nomad job status [<job-name>]

用来查看 Nomad 中指定 Job 的整体状态。
输出信息包括:
Job ID、Name、Type、Datacenter 等基本信息
Task Group 的数量和状态(Queued、Starting、Running、Failed 等)
Placement Failure(如果调度失败,会显示具体原因)
最新 Deployment 状态
用途:快速判断整个 Job 是否正常运行或有调度问题。

nomad alloc status [<Allocation-id>]

用来查看某个具体Allocation的详细状态。
Allocation 是 Job 中实际运行的任务实例,每个 Task Group 的每个副本都会生成一个 allocation。
输出信息包括:
Allocation ID、对应 Job ID、Node ID
Client Status(pending、running、lost 等)
资源分配情况(CPU、Memory)
Task 内部状态(task name、driver、port 映射、volume mount)
Allocation Addresses(实际宿主机 IP + 端口)

nomad job stop -purge [<job-name>] 停止job并清理缓存
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 10:52:24

Qwen2.5-1.5B实战教程:将Qwen2.5-1.5B集成进Notion AI插件

Qwen2.5-1.5B实战教程&#xff1a;将Qwen2.5-1.5B集成进Notion AI插件 1. 为什么你需要一个本地版的Notion AI助手 你有没有试过在Notion里写周报时&#xff0c;想让AI帮忙润色却卡在“正在连接服务器”&#xff1f;或者编辑敏感项目文档时&#xff0c;犹豫要不要把内部数据发…

作者头像 李华
网站建设 2026/4/15 13:44:44

智能客服虚拟形象联动:HY-Motion与对话系统协同方案

智能客服虚拟形象联动&#xff1a;HY-Motion与对话系统协同方案 1. 为什么虚拟客服需要“会动”的身体&#xff1f; 你有没有遇到过这样的智能客服&#xff1f;声音清晰、回答准确&#xff0c;但画面里只有一张静止的头像&#xff0c;或者更糟——干脆是文字气泡在飘。用户问…

作者头像 李华
网站建设 2026/4/18 3:38:26

Hunyuan-MT-7B部署卡GPU?显存优化技巧让推理效率翻倍

Hunyuan-MT-7B部署卡GPU&#xff1f;显存优化技巧让推理效率翻倍 1. 为什么Hunyuan-MT-7B值得你花时间调优 你是不是也遇到过这样的情况&#xff1a;刚拉起Hunyuan-MT-7B-WEBUI&#xff0c;点开网页界面&#xff0c;输入一句“今天天气不错”&#xff0c;结果页面卡住、显存爆…

作者头像 李华
网站建设 2026/4/18 3:27:21

CLAP模型部署教程:基于LAION-Audio-630K的零样本分类落地

CLAP模型部署教程&#xff1a;基于LAION-Audio-630K的零样本分类落地 1. 什么是CLAP音频分类&#xff1f;它能帮你解决什么问题&#xff1f; 你有没有遇到过这样的场景&#xff1a;手头有一段现场录制的环境音&#xff0c;想快速知道里面是什么声音——是施工噪音、还是鸟鸣、…

作者头像 李华
网站建设 2026/4/18 3:35:33

用Z-Image-Turbo做了个知乎配图项目,全过程分享

用Z-Image-Turbo做了个知乎配图项目&#xff0c;全过程分享 1. 为什么是知乎&#xff1f;一个内容创作者的真实痛点 上周三晚上十一点&#xff0c;我正赶一篇关于“认知偏差如何影响决策”的知乎长文。写到“确认偏误”那段时&#xff0c;卡住了——文字讲得再清楚&#xff0…

作者头像 李华