ResNet18实战：商品识别应用，云端GPU 5元搞定-程序员充电站

ResNet18实战：商品识别应用，云端GPU 5元搞定

引言：为什么选择ResNet18做商品识别？

作为电商创业者，你可能经常遇到这样的烦恼：每天要手动分类上百件新上架的商品，既耗时又容易出错。这时候，AI图像识别技术就能派上用场。ResNet18就像是一个经过专业训练的"商品分类小助手"，它能自动识别商品图片并分类，准确率能达到80%以上。

ResNet18是深度学习领域最经典的图像分类模型之一，它的优势就像是一个经验丰富的超市收银员：

识别速度快：处理一张图片只需0.1秒
准确率高：经过训练可以达到专业级分类水平
轻量级：相比其他大型模型，它更节省计算资源
容易上手：现成的预训练模型可以直接使用

更棒的是，现在借助云端GPU服务，你不需要购买昂贵的显卡设备，5元就能完成初步测试。接下来，我会手把手教你如何零基础搭建这个商品识别系统。

1. 准备工作：5分钟快速部署环境

1.1 选择云GPU平台

对于新手来说，我推荐使用CSDN星图平台的预置镜像，它已经配置好了所有需要的软件环境，包括：

PyTorch深度学习框架
ResNet18预训练模型
必要的图像处理库

这样你就不需要自己安装复杂的开发环境了。

1.2 启动GPU实例

登录平台后，按照以下步骤操作：

选择"PyTorch基础镜像"(建议选1.12版本)
选择GPU机型(入门级选T4就够用)
点击"立即创建"

等待2-3分钟，系统就会自动配置好所有环境。首次使用可能会有5元的预充值要求，但足够完成本次测试。

1.3 验证环境

创建成功后，打开终端输入以下命令检查环境：

python -c "import torch; print(torch.cuda.is_available())"

如果返回True，说明GPU环境已经准备就绪。

2. 快速上手：使用预训练模型识别商品

2.1 准备测试图片

我们先从简单的开始，用现成的预训练模型测试几张商品图片。你可以准备3-5张不同类别的商品照片，比如：

运动鞋
背包
手机

把这些图片上传到云服务器的/data/test_images目录下。

2.2 运行识别脚本

创建一个新文件quick_test.py，复制以下代码：

import torch from torchvision import models, transforms from PIL import Image # 加载预训练模型 model = models.resnet18(pretrained=True) model.eval() # 图像预处理 preprocess = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225] ) ]) # 加载类别标签 with open('imagenet_classes.txt') as f: classes = [line.strip() for line in f.readlines()] # 识别单张图片 def predict(image_path): img = Image.open(image_path) img_t = preprocess(img) batch_t = torch.unsqueeze(img_t, 0) with torch.no_grad(): out = model(batch_t) _, index = torch.max(out, 1) percentage = torch.nn.functional.softmax(out, dim=1)[0] * 100 return classes[index[0]], percentage[index[0]].item() # 测试所有图片 for img_path in ['/data/test_images/shoe.jpg', '/data/test_images/bag.jpg', '/data/test_images/phone.jpg']: label, confidence = predict(img_path) print(f"图片: {img_path.split('/')[-1]} | 识别结果: {label} | 置信度: {confidence:.2f}%")

运行这个脚本，你就能看到每张图片的识别结果和置信度了。

3. 定制训练：让模型认识你的商品

预训练模型虽然方便，但它识别的是ImageNet的1000个通用类别。要让模型准确识别你的特定商品，还需要进行微调训练。

3.1 准备自定义数据集

收集商品图片时要注意：

每个类别至少准备50张图片
不同角度、不同背景的照片
图片尺寸建议300x300以上

目录结构如下：

/data/train/ ├── 运动鞋/ │ ├── shoe1.jpg │ ├── shoe2.jpg │ └── ... ├── 背包/ │ ├── bag1.jpg │ ├── bag2.jpg │ └── ... └── 手机/ ├── phone1.jpg ├── phone2.jpg └── ...

3.2 数据增强配置

为了提升模型泛化能力，我们需要对训练数据进行增强处理。创建train.py文件：

from torchvision import datasets, transforms import torch import torch.nn as nn import torch.optim as optim # 数据增强和加载 train_transform = transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) train_dataset = datasets.ImageFolder( '/data/train', transform=train_transform ) train_loader = torch.utils.data.DataLoader( train_dataset, batch_size=32, shuffle=True, num_workers=4 )

3.3 模型微调训练

继续在train.py中添加以下代码：

# 加载预训练模型 model = models.resnet18(pretrained=True) # 修改最后一层全连接层 num_classes = len(train_dataset.classes) model.fc = nn.Linear(model.fc.in_features, num_classes) # 设置训练参数 criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9) # 训练循环 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") model = model.to(device) for epoch in range(10): # 训练10轮 running_loss = 0.0 for i, (inputs, labels) in enumerate(train_loader): inputs, labels = inputs.to(device), labels.to(device) optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() if i % 10 == 9: # 每10个batch打印一次 print(f'Epoch {epoch+1}, Batch {i+1}, Loss: {running_loss/10:.3f}') running_loss = 0.0 print('训练完成！') torch.save(model.state_dict(), 'custom_resnet18.pth')

运行这个脚本，通常20-30分钟就能完成训练（取决于数据量和GPU性能）。

4. 部署应用：打造你的商品识别系统

训练好的模型需要部署成可用的服务。这里我们使用最简单的Flask框架创建一个Web API。

4.1 创建API服务

新建app.py文件：

from flask import Flask, request, jsonify from PIL import Image import io import torch from torchvision import models, transforms app = Flask(__name__) # 加载自定义模型 model = models.resnet18(pretrained=False) num_classes = 3 # 根据你的类别数修改 model.fc = torch.nn.Linear(model.fc.in_features, num_classes) model.load_state_dict(torch.load('custom_resnet18.pth')) model.eval() # 类别标签 class_names = ['运动鞋', '背包', '手机'] # 替换为你的类别 # 图像预处理 preprocess = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225] ) ]) @app.route('/predict', methods=['POST']) def predict(): if 'file' not in request.files: return jsonify({'error': '没有上传文件'}) file = request.files['file'] img_bytes = file.read() img = Image.open(io.BytesIO(img_bytes)) img_t = preprocess(img) batch_t = torch.unsqueeze(img_t, 0) with torch.no_grad(): out = model(batch_t) _, pred = torch.max(out, 1) return jsonify({'class': class_names[pred[0]]}) if __name__ == '__main__': app.run(host='0.0.0.0', port=5000)

4.2 测试API服务

启动服务：

python app.py

然后用Postman或curl测试：

curl -X POST -F "file=@/path/to/your/image.jpg" http://localhost:5000/predict

你会收到类似这样的响应：

{ "class": "运动鞋" }

5. 常见问题与优化技巧

5.1 识别准确率不高怎么办？

增加训练数据：每个类别至少100张图片效果更好
调整学习率：尝试0.0001到0.01之间的值
增加训练轮数：把epochs从10增加到20或30
使用更复杂模型：如果数据量足够大，可以尝试ResNet34或50

5.2 如何提高识别速度？

减小输入尺寸：把224x224改为128x128
量化模型：使用torch.quantization减少模型大小
使用ONNX Runtime：转换模型为ONNX格式加速推理

5.3 实际部署建议

使用GPU服务器：推理速度比CPU快10倍以上
添加缓存机制：对相同商品图片缓存识别结果
设置超时重试：处理偶尔的识别失败情况

总结

通过本教程，你已经掌握了使用ResNet18搭建商品识别系统的完整流程：

快速验证：使用预训练模型5分钟测试可行性
数据准备：收集和整理自己的商品图片数据集
模型训练：在云端GPU上微调ResNet18模型
服务部署：创建简单的Web API供业务系统调用
优化技巧：多种方法提升准确率和性能

整个过程成本不到5元，却能为你的电商业务带来显著的效率提升。现在就可以上传你的商品图片，开始测试这个AI分类助手了！

💡获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

ResNet18实战：商品识别应用，云端GPU 5元搞定