VMware虚拟机安装Ubuntu：在本地搭建Qianfan-OCR 4B模型开发测试环境-程序员充电站

VMware虚拟机安装Ubuntu：在本地搭建Qianfan-OCR 4B模型开发测试环境

1. 前言：为什么选择本地虚拟机环境

对于AI开发者来说，云服务器虽然方便但成本较高，特别是进行模型实验和调试时。本教程将带你一步步在Windows系统上，通过VMware Workstation搭建Ubuntu虚拟机环境，并部署Qianfan-OCR 4B模型进行本地测试。

用虚拟机的好处很明显：成本低、可随时快照恢复、不影响主机系统。特别适合学生、个人开发者或需要频繁实验的场景。我自己刚开始接触AI开发时，就是用这种方式搭建的第一个测试环境，既经济又实用。

2. 准备工作与环境搭建

2.1 所需软件和硬件

在开始之前，请确保你的电脑满足以下要求：

硬件配置：
- CPU：Intel i5或同等性能以上（建议i7）
- 内存：16GB以上（运行模型需要足够内存）
- 硬盘：至少50GB可用空间（建议SSD）
- 显卡：NVIDIA显卡（可选，如需GPU加速）
软件准备：
- VMware Workstation Pro/Player（本教程使用16.x版本）
- Ubuntu 20.04 LTS镜像（推荐使用LTS长期支持版）
- Qianfan-OCR 4B模型镜像（后续会介绍获取方式）

2.2 安装VMware Workstation

从VMware官网下载Workstation安装包
双击运行安装程序，按向导完成安装
安装完成后启动VMware，界面大致如下：

[VMware主界面截图描述] 左侧是虚拟机列表，中间是操作选项，右侧是虚拟机详细信息区域

3. 创建Ubuntu虚拟机

3.1 新建虚拟机向导

在VMware中点击"创建新的虚拟机"
选择"典型(推荐)"配置，点击下一步
选择"稍后安装操作系统"，点击下一步
操作系统选择Linux，版本选择Ubuntu 64位

3.2 虚拟机硬件配置

命名虚拟机并选择存储位置（建议放在剩余空间大的磁盘）
分配处理器和内存：
- 处理器：至少2核（建议4核）
- 内存：至少8GB（建议12GB以上）
网络类型选择：
- 桥接模式：虚拟机与主机在同一局域网，有独立IP
- NAT模式：虚拟机通过主机上网，更安全（推荐新手选择）
创建虚拟磁盘：
- 大小建议40GB以上
- 选择"将虚拟磁盘拆分成多个文件"

3.3 安装Ubuntu系统

右键新建的虚拟机，选择"设置"
在CD/DVD选项中，选择下载的Ubuntu ISO镜像文件
启动虚拟机，开始Ubuntu安装过程
按照安装向导完成：
- 语言选择英文或中文
- 安装类型选择"正常安装"
- 分区选择"清除整个磁盘并安装Ubuntu"
- 设置用户名和密码（记住这个密码）

安装完成后重启虚拟机，你就拥有了一个完整的Ubuntu系统环境。

4. 虚拟机环境配置

4.1 安装VMware Tools（增强工具）

VMware Tools能提供更好的显示效果和文件共享功能：

# 在Ubuntu中打开终端，执行以下命令 sudo apt update sudo apt install open-vm-tools open-vm-tools-desktop sudo reboot

4.2 配置共享文件夹

在VMware中右键虚拟机，选择"设置"
进入"选项"标签，选择"共享文件夹"
添加主机上的文件夹作为共享目录
在Ubuntu中，共享文件夹通常位于/mnt/hgfs/

4.3 网络配置检查

确保虚拟机可以正常联网：

ping www.baidu.com

如果无法联网，检查网络适配器设置是否为NAT或桥接模式。

5. 安装Python和Docker环境

5.1 安装Python 3.8+

Ubuntu 20.04默认安装了Python 3.8，但我们需要确保pip也安装好：

sudo apt update sudo apt install python3-pip pip3 install --upgrade pip

5.2 安装Docker和NVIDIA支持

安装Docker CE：

sudo apt install apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" sudo apt update sudo apt install docker-ce sudo systemctl enable docker sudo systemctl start docker

将当前用户加入docker组（避免每次sudo）：

sudo usermod -aG docker $USER newgrp docker # 立即生效

如果使用NVIDIA显卡，安装NVIDIA Docker支持：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt update sudo apt install nvidia-docker2 sudo systemctl restart docker

6. 部署Qianfan-OCR 4B模型

6.1 获取模型镜像

Qianfan-OCR 4B是百度推出的OCR识别模型，我们可以从星图平台获取：

docker pull registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest

6.2 运行模型容器

使用以下命令启动模型服务：

docker run -itd --name qianfan-ocr \ -p 8866:8866 \ --gpus all \ registry.baidubce.com/paddlepaddle/qianfan-ocr-4b:latest

如果没有GPU，可以去掉--gpus all参数，但性能会下降。

6.3 测试模型服务

模型启动后，可以通过以下方式测试：

在虚拟机内测试：

curl -X POST http://localhost:8866/predict/ocr_system \ -H "Content-Type: application/json" \ -d '{"images": ["base64编码的图片数据"]}'

在宿主机浏览器中访问：
- 确保虚拟机网络设置为桥接模式
- 获取虚拟机IP地址（在Ubuntu终端运行ifconfig）
- 在宿主机浏览器访问http://[虚拟机IP]:8866

7. 常见问题解决

7.1 虚拟机性能优化

如果感觉虚拟机运行缓慢，可以尝试：

在VMware设置中分配更多CPU和内存资源
关闭不必要的视觉效果：
```
sudo apt install gnome-tweaks gnome-tweaks
```
然后在"外观"中关闭动画效果

7.2 Docker拉取镜像慢

可以配置国内镜像源：

sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker

7.3 共享文件夹不可见

如果/mnt/hgfs下没有共享文件夹，可以尝试：

sudo vmhgfs-fuse .host:/ /mnt/hgfs -o allow_other -o uid=1000

8. 总结与下一步建议

整个搭建过程虽然步骤不少，但每一步都不复杂。用虚拟机环境最大的好处是可以随时快照保存状态，遇到问题也能快速回滚。我自己在开发过程中就经常使用快照功能，特别是在尝试一些可能有风险的配置时。

Qianfan-OCR 4B模型部署完成后，你可以开始探索它的各种功能，比如文档识别、表格识别等。建议先从简单的图片识别开始，逐步尝试更复杂的场景。如果遇到性能问题，可以考虑升级硬件配置，或者优化模型参数。

对于想深入学习AI模型部署的开发者，下一步可以尝试：

了解Docker Compose管理多个容器
学习Kubernetes进行容器编排
探索模型微调和优化技术

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

VMware虚拟机安装Ubuntu：在本地搭建Qianfan-OCR 4B模型开发测试环境