news 2026/4/18 5:23:32

【Kubernetes】Kubelet 数据目录迁移操作指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Kubernetes】Kubelet 数据目录迁移操作指南

Kubelet 默认工作目录 /var/lib/kubelet 存储着 Pod 清单、容器镜像等关键数据;当磁盘规划不合理时,可能需迁移数据目录。下方将详细介绍,一起来看看吧!

  • 在操作前请务必完成数据备份
  • 先在测试环境验证流程,确认无误后再执行生产环境迁移
  • 默认 Kubernetes 节点 Kubelet 数据目录在 /var/lib/kubelet

1、为节点打污点,停止 Kubelet 和 Docker/Containerd 服务

# 给节点打上污点 kubectl taint nodes <node-name> specialnode=exclusivenode:NoSchedule # 停止节点 Kubelet 和 Docker/Containerd 服务 systemctl stop kubelet systemctl stop docker/containerd

2、目录卸载

# 目录卸载 umount /var/lib/kubelet/pods/*/volumes/kubernetes.io~*/*

3、数据备份

# 数据备份 mkdir -p /data/kubelet/ cp -r /var/lib/kubelet /data/kubelet/kubelet-bak

4、修改 Kubelet 数据目录

  • 此处仅修改 pods 的数据目录,kubelet 证书相关目录依旧在 /var/lib/kubelet/pki
# 修改节点 Kubelet 数据盘目录 # 在 Kubelet 的配置文件中配置 --data-dir 参数指定所需的目录路径 vi /etc/systemd/system/kubelet.service.d/10-kubeadm.conf --- Environment="KUBELET_EXTRA_ARGS=--root-dir=/data/kubelet/kubelet" ---

5、重启 Kubelet 和 Docker/Containerd 服务

# 创建 kubelet 数据目录并重启节点 Kubelet 和 Docker/Containerd 服务 mkdir -p /data/kubelet/kubelet systemctl daemon-reload systemctl restart docker/containerd systemctl restart kubelet

6、验证数据目录修改成功

# 检查 kubelet 数据目录是否修改成功 df -h |grep/data/kubelet/kubelet

7、取消节点污点

# 取消节点污点 kubectl taint nodes <node-name> specialnode- # 删除某个 pod,验证可正常重建 kubectl get pod -A kubectl delete pod xxx -n xxx --froce

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:21:19

基于Miniconda-Python3.9部署Llama、ChatGLM等大模型推理环境

基于 Miniconda-Python3.9 部署 Llama、ChatGLM 等大模型推理环境 在当前 AI 技术飞速演进的背景下&#xff0c;大型语言模型&#xff08;LLMs&#xff09;如 Llama、ChatGLM 已从研究实验室走向实际应用。无论是科研复现、产品原型开发&#xff0c;还是企业级服务部署&#xf…

作者头像 李华
网站建设 2026/4/16 10:04:00

Miniconda-Python3.9环境下实现PyTorch服务熔断与降级

Miniconda-Python3.9环境下实现PyTorch服务熔断与降级 在现代AI系统中&#xff0c;模型推理服务早已不再是“训练完模型、部署API”这么简单。随着线上请求量的激增和系统复杂度的提升&#xff0c;一个看似稳定的PyTorch服务可能因为一次GPU内存溢出、一次网络抖动或某个依赖组…

作者头像 李华
网站建设 2026/4/15 17:24:44

PyTorch DataLoader性能瓶颈排查:从Miniconda环境入手

PyTorch DataLoader性能瓶颈排查&#xff1a;从Miniconda环境入手 在深度学习训练过程中&#xff0c;你是否曾遇到这样的场景&#xff1f;GPU 利用率长期徘徊在 20% 以下&#xff0c;而 CPU 却满载运行、磁盘 I/O 持续飙高——明明模型不复杂&#xff0c;训练速度却始终上不去。…

作者头像 李华
网站建设 2026/3/23 8:27:59

sourcefare速成手册(2) - 使用Git方式克隆代码代码扫描

sourcefare是一款开源免费的代码扫描工具&#xff0c;支持免费私有化部署&#xff0c;一键安装、零配置&#xff0c;包含安全漏洞、编码缺陷和合规性问题扫描&#xff0c;页面操作简洁明了&#xff0c;本文将介绍如何创建项目&#xff0c;使用服务端Git方式获取代码进行代码扫描…

作者头像 李华
网站建设 2026/4/5 17:21:40

从LangGraph到PydanticAI:AI Agent开发框架全方位解析与选择指南!

AI Agent开发框架的涌现‌&#xff0c;让开发者在框架选择上陷入困惑。 本文通过翻译整理项目文档&#xff0c;梳理了当前主流的AI Agent开发框架&#xff1a;LangGraph、AutoGen、CrewAI、OpenAI Agents SDK、Google Agent Development Kit (ADK)、MetaGPT和PydanticAI。 研…

作者头像 李华