news 2026/4/27 17:58:21

VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境

VMware虚拟机安装Ubuntu:在本地搭建Qianfan-OCR 4B模型开发测试环境

1. 前言:为什么选择本地虚拟机环境

对于AI开发者来说,云服务器虽然方便但成本较高,特别是进行模型实验和调试时。本教程将带你一步步在Windows系统上,通过VMware Workstation搭建Ubuntu虚拟机环境,并部署Qianfan-OCR 4B模型进行本地测试。

用虚拟机的好处很明显:成本低、可随时快照恢复、不影响主机系统。特别适合学生、个人开发者或需要频繁实验的场景。我自己刚开始接触AI开发时,就是用这种方式搭建的第一个测试环境,既经济又实用。

2. 准备工作与环境搭建

2.1 所需软件和硬件

在开始之前,请确保你的电脑满足以下要求:

  • 硬件配置

    • CPU:Intel i5或同等性能以上(建议i7)
    • 内存:16GB以上(运行模型需要足够内存)
    • 硬盘:至少50GB可用空间(建议SSD)
    • 显卡:NVIDIA显卡(可选,如需GPU加速)
  • 软件准备

    • VMware Workstation Pro/Player(本教程使用16.x版本)
    • Ubuntu 20.04 LTS镜像(推荐使用LTS长期支持版)
    • Qianfan-OCR 4B模型镜像(后续会介绍获取方式)

2.2 安装VMware Workstation

  1. 从VMware官网下载Workstation安装包
  2. 双击运行安装程序,按向导完成安装
  3. 安装完成后启动VMware,界面大致如下:
[VMware主界面截图描述] 左侧是虚拟机列表,中间是操作选项,右侧是虚拟机详细信息区域

3. 创建Ubuntu虚拟机

3.1 新建虚拟机向导

  1. 在VMware中点击"创建新的虚拟机"
  2. 选择"典型(推荐)"配置,点击下一步
  3. 选择"稍后安装操作系统",点击下一步
  4. 操作系统选择Linux,版本选择Ubuntu 64位

3.2 虚拟机硬件配置

  1. 命名虚拟机并选择存储位置(建议放在剩余空间大的磁盘)
  2. 分配处理器和内存:
    • 处理器:至少2核(建议4核)
    • 内存:至少8GB(建议12GB以上)
  3. 网络类型选择:
    • 桥接模式:虚拟机与主机在同一局域网,有独立IP
    • NAT模式:虚拟机通过主机上网,更安全(推荐新手选择)
  4. 创建虚拟磁盘:
    • 大小建议40GB以上
    • 选择"将虚拟磁盘拆分成多个文件"

3.3 安装Ubuntu系统

  1. 右键新建的虚拟机,选择"设置"
  2. 在CD/DVD选项中,选择下载的Ubuntu ISO镜像文件
  3. 启动虚拟机,开始Ubuntu安装过程
  4. 按照安装向导完成:
    • 语言选择英文或中文
    • 安装类型选择"正常安装"
    • 分区选择"清除整个磁盘并安装Ubuntu"
    • 设置用户名和密码(记住这个密码)

安装完成后重启虚拟机,你就拥有了一个完整的Ubuntu系统环境。

4. 虚拟机环境配置

4.1 安装VMware Tools(增强工具)

VMware Tools能提供更好的显示效果和文件共享功能:

# 在Ubuntu中打开终端,执行以下命令 sudo apt update sudo apt install open-vm-tools open-vm-tools-desktop sudo reboot

4.2 配置共享文件夹

  1. 在VMware中右键虚拟机,选择"设置"
  2. 进入"选项"标签,选择"共享文件夹"
  3. 添加主机上的文件夹作为共享目录
  4. 在Ubuntu中,共享文件夹通常位于/mnt/hgfs/

4.3 网络配置检查

确保虚拟机可以正常联网:

ping www.baidu.com

如果无法联网,检查网络适配器设置是否为NAT或桥接模式。

5. 安装Python和Docker环境

5.1 安装Python 3.8+

Ubuntu 20.04默认安装了Python 3.8,但我们需要确保pip也安装好:

sudo apt update sudo apt install python3-pip pip3 install --upgrade pip

5.2 安装Docker和NVIDIA支持

  1. 安装Docker CE:
sudo apt install apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" sudo apt update sudo apt install docker-ce sudo systemctl enable docker sudo systemctl start docker
  1. 将当前用户加入docker组(避免每次sudo):
sudo usermod -aG docker $USER newgrp docker # 立即生效
  1. 如果使用NVIDIA显卡,安装NVIDIA Docker支持:
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt update sudo apt install nvidia-docker2 sudo systemctl restart docker

6. 部署Qianfan-OCR 4B模型

6.1 获取模型镜像

Qianfan-OCR 4B是百度推出的OCR识别模型,我们可以从星图平台获取:

docker pull registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest

6.2 运行模型容器

使用以下命令启动模型服务:

docker run -itd --name qianfan-ocr \ -p 8866:8866 \ --gpus all \ registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest

如果没有GPU,可以去掉--gpus all参数,但性能会下降。

6.3 测试模型服务

模型启动后,可以通过以下方式测试:

  1. 在虚拟机内测试:
curl -X POST http://localhost:8866/predict/ocr_system \ -H "Content-Type: application/json" \ -d '{"images": ["base64编码的图片数据"]}'
  1. 在宿主机浏览器中访问:
    • 确保虚拟机网络设置为桥接模式
    • 获取虚拟机IP地址(在Ubuntu终端运行ifconfig
    • 在宿主机浏览器访问http://[虚拟机IP]:8866

7. 常见问题解决

7.1 虚拟机性能优化

如果感觉虚拟机运行缓慢,可以尝试:

  1. 在VMware设置中分配更多CPU和内存资源
  2. 关闭不必要的视觉效果:
    sudo apt install gnome-tweaks gnome-tweaks
    然后在"外观"中关闭动画效果

7.2 Docker拉取镜像慢

可以配置国内镜像源:

sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker

7.3 共享文件夹不可见

如果/mnt/hgfs下没有共享文件夹,可以尝试:

sudo vmhgfs-fuse .host:/ /mnt/hgfs -o allow_other -o uid=1000

8. 总结与下一步建议

整个搭建过程虽然步骤不少,但每一步都不复杂。用虚拟机环境最大的好处是可以随时快照保存状态,遇到问题也能快速回滚。我自己在开发过程中就经常使用快照功能,特别是在尝试一些可能有风险的配置时。

Qianfan-OCR 4B模型部署完成后,你可以开始探索它的各种功能,比如文档识别、表格识别等。建议先从简单的图片识别开始,逐步尝试更复杂的场景。如果遇到性能问题,可以考虑升级硬件配置,或者优化模型参数。

对于想深入学习AI模型部署的开发者,下一步可以尝试:

  • 了解Docker Compose管理多个容器
  • 学习Kubernetes进行容器编排
  • 探索模型微调和优化技术

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/27 17:57:48

Let‘s Encrypt免费SSL证书自动续期完整指南:Certbot配置与Nginx安全优化

【摘要】 Lets Encrypt提供免费SSL证书但有效期仅90天&#xff0c;自动化续期是保障HTTPS服务不中断的关键。本文基于Nginx Ubuntu环境&#xff0c;详细介绍Certbot申请证书、配置自动续期定时任务、模拟测试续期、外部监控兜底及Nginx安全参数优化的完整流程。关键词&#xf…

作者头像 李华
网站建设 2026/4/27 17:49:23

暗黑2存档编辑终极指南:5分钟打造你的完美角色

暗黑2存档编辑终极指南&#xff1a;5分钟打造你的完美角色 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为暗黑破坏神2的刷装备、练级过程感到疲惫吗&#xff1f;想要快速体验游戏的全部内容&#xff0c;却不想花费数百小…

作者头像 李华
网站建设 2026/4/27 17:48:58

Claude Code 完全重装与接入 DeepSeek 指南

从卸载清理到接入全新模型&#xff0c;一篇搞定 如果你在使用 Claude Code 时遇到了莫名其妙的 bug&#xff0c;或者想要尝试更强大的模型&#xff08;比如 DeepSeek&#xff09;&#xff0c;彻底重装并接入新模型是一个不错的选择。本文将带你一步步完成&#xff1a; 完全卸载…

作者头像 李华
网站建设 2026/4/27 17:48:15

代码灭绝事件:当AI吞噬测试脚本,测试工程师的生存边界与价值重塑

一场静默的“灭绝”在软件测试行业内部&#xff0c;一场远比普通技术迭代更深刻、更静默的变革正在发生。我们暂且称之为“代码灭绝事件”。这不是指编程语言或框架的消亡&#xff0c;而是指以传统手工编写、维护自动化测试脚本为核心的工作模式&#xff0c;正面临结构性瓦解的…

作者头像 李华