ResNet18异常检测：工业制造缺陷识别实战-程序员充电站

ResNet18异常检测：工业制造缺陷识别实战

引言

在工业生产线上，质检环节往往是最耗时且容易出错的环节之一。想象一下，一位质检员每天需要检查成千上万个产品，用肉眼寻找微小的划痕、凹陷或颜色异常，这不仅效率低下，还容易因疲劳导致漏检。而ResNet18这种轻量级的深度学习模型，就像一位不知疲倦的"AI质检员"，能够24小时不间断工作，准确识别出产品表面的各种缺陷。

ResNet18是残差网络(Residual Network)的一个精简版本，特别适合工业场景的应用。它通过"跳跃连接"的设计（就像抄近路一样，让信息可以绕过某些层直接传递），解决了深层网络训练困难的问题。相比更复杂的模型，ResNet18在保持较高准确率的同时，对计算资源的需求更低，这意味着你甚至可以用价格亲民的GPU（如CSDN算力平台提供的T4显卡）就能运行它。

本文将带你从零开始，用ResNet18搭建一个工业缺陷检测系统。即使你没有任何深度学习经验，也能跟着步骤完成模型训练和部署。我们会使用PyTorch框架，这是目前最受欢迎的深度学习工具之一，就像"乐高积木"一样容易上手。学完本教程后，你将能够：

理解ResNet18如何识别产品缺陷
准备自己的工业缺陷数据集
训练一个专属的质检AI模型
在实际生产环境中使用这个模型

1. 环境准备与数据收集

1.1 选择适合的GPU环境

对于ResNet18这样的模型，你不需要顶级的GPU。CSDN算力平台提供的T4或RTX 3060级别的显卡就完全够用，性价比很高。这些显卡：

价格实惠：每小时费用通常在1-2元
显存充足：16GB显存足够处理批量图像
预装环境：已配置好PyTorch和CUDA

登录CSDN算力平台后，选择"PyTorch 1.12 + CUDA 11.3"的基础镜像，这个环境已经包含了我们需要的所有基础库。

1.2 收集缺陷数据集

好的数据集是成功的一半。工业缺陷数据通常有两种获取方式：

实际产线拍摄：用工业相机拍摄正常产品和有缺陷的产品
建议：每个缺陷类型至少200张，正常样本500张
注意：在不同光照、角度下拍摄，增加多样性
公开数据集：如果没有条件自己采集，可以使用这些：
MVTec AD：包含多种工业品缺陷
NEU Surface Defect Database：钢铁表面缺陷

数据集目录建议这样组织：

dataset/ ├── train/ │ ├── normal/ # 正常样本 │ ├── scratch/ # 划痕类缺陷 │ ├── dent/ # 凹陷类缺陷 │ └── ... # 其他缺陷类型 └── test/ # 测试集 ├── normal/ └── defect/

1.3 安装必要库

在CSDN算力平台创建实例后，只需额外安装几个辅助库：

pip install opencv-python matplotlib scikit-learn

这些库将帮助我们进行图像处理和可视化。

2. 数据预处理与增强

2.1 图像标准化

工业图像往往存在光照不均等问题，我们需要进行标准化处理：

import torchvision.transforms as transforms # 定义图像变换 train_transform = transforms.Compose([ transforms.Resize(256), # 调整大小 transforms.RandomCrop(224), # 随机裁剪 transforms.RandomHorizontalFlip(), # 水平翻转增强 transforms.ToTensor(), # 转为张量 transforms.Normalize( # 标准化 mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225] ) ]) test_transform = transforms.Compose([ transforms.Resize(224), transforms.ToTensor(), transforms.Normalize( mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225] ) ])

这里使用的均值和标准差是ImageNet数据集的统计值，对工业图像也同样有效。

2.2 创建数据加载器

使用PyTorch的DataLoader来高效加载数据：

from torchvision.datasets import ImageFolder from torch.utils.data import DataLoader # 加载数据集 train_dataset = ImageFolder('dataset/train', transform=train_transform) test_dataset = ImageFolder('dataset/test', transform=test_transform) # 创建数据加载器 train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True) test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

参数说明： -batch_size=32：每次处理32张图片，适合T4显卡 -shuffle=True：训练时打乱数据顺序，避免模型记住顺序

2.3 可视化样本

检查数据是否正确加载是个好习惯：

import matplotlib.pyplot as plt import numpy as np def imshow(img): # 反标准化显示图像 img = img.numpy().transpose((1, 2, 0)) mean = np.array([0.485, 0.456, 0.406]) std = np.array([0.229, 0.224, 0.225]) img = std * img + mean img = np.clip(img, 0, 1) plt.imshow(img) plt.axis('off') # 获取一批训练数据 images, labels = next(iter(train_loader)) # 显示图像 plt.figure(figsize=(12, 6)) for i in range(6): plt.subplot(2, 3, i+1) imshow(images[i]) plt.title(train_dataset.classes[labels[i]]) plt.show()

这段代码会显示6张训练图像及其标签，帮助你确认数据加载是否正确。

3. 构建ResNet18模型

3.1 加载预训练模型

PyTorch提供了预训练的ResNet18模型，我们可以基于它进行微调：

import torchvision.models as models import torch.nn as nn # 加载预训练模型 model = models.resnet18(pretrained=True) # 修改最后一层全连接层 num_features = model.fc.in_features model.fc = nn.Linear(num_features, 2) # 2分类：正常/缺陷 # 转移到GPU device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") model = model.to(device)

关键点说明： -pretrained=True：加载在ImageNet上预训练的权重 - 修改model.fc：将原来的1000类分类改为我们的2分类 -.to(device)：将模型转移到GPU

3.2 定义损失函数和优化器

对于二分类问题，我们使用交叉熵损失和Adam优化器：

import torch.optim as optim criterion = nn.CrossEntropyLoss() optimizer = optim.Adam(model.parameters(), lr=0.001) # 学习率调度器 scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

参数说明： -lr=0.001：初始学习率，适合微调 -step_size=7：每7个epoch学习率乘以gamma -gamma=0.1：学习率衰减因子

3.3 训练模型

下面是训练循环的完整代码：

def train_model(model, criterion, optimizer, scheduler, num_epochs=25): best_acc = 0.0 for epoch in range(num_epochs): print(f'Epoch {epoch}/{num_epochs-1}') print('-' * 10) # 每个epoch有训练和验证阶段 for phase in ['train', 'val']: if phase == 'train': model.train() # 训练模式 dataloader = train_loader else: model.eval() # 评估模式 dataloader = test_loader running_loss = 0.0 running_corrects = 0 # 迭代数据 for inputs, labels in dataloader: inputs = inputs.to(device) labels = labels.to(device) # 梯度清零 optimizer.zero_grad() # 前向传播 with torch.set_grad_enabled(phase == 'train'): outputs = model(inputs) _, preds = torch.max(outputs, 1) loss = criterion(outputs, labels) # 反向传播+优化仅在训练阶段 if phase == 'train': loss.backward() optimizer.step() # 统计 running_loss += loss.item() * inputs.size(0) running_corrects += torch.sum(preds == labels.data) if phase == 'train': scheduler.step() epoch_loss = running_loss / len(dataloader.dataset) epoch_acc = running_corrects.double() / len(dataloader.dataset) print(f'{phase} Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f}') # 深度拷贝模型 if phase == 'val' and epoch_acc > best_acc: best_acc = epoch_acc best_model_wts = copy.deepcopy(model.state_dict()) # 加载最佳模型权重 model.load_state_dict(best_model_wts) return model # 开始训练 model = train_model(model, criterion, optimizer, scheduler, num_epochs=25)

训练过程通常需要1-2小时（在T4显卡上），你会看到类似这样的输出：

Epoch 0/24 ---------- train Loss: 0.5123 Acc: 0.8124 val Loss: 0.3214 Acc: 0.8921 Epoch 1/24 ---------- train Loss: 0.2987 Acc: 0.9012 val Loss: 0.2543 Acc: 0.9215 ...

3.4 保存和加载模型

训练完成后，保存模型以便后续使用：

torch.save(model.state_dict(), 'defect_detection_resnet18.pth')

加载模型时：

model = models.resnet18(pretrained=False) num_features = model.fc.in_features model.fc = nn.Linear(num_features, 2) model.load_state_dict(torch.load('defect_detection_resnet18.pth')) model = model.to(device) model.eval() # 设置为评估模式

4. 模型评估与部署

4.1 评估模型性能

使用测试集评估模型：

def evaluate(model, test_loader): model.eval() correct = 0 total = 0 with torch.no_grad(): for images, labels in test_loader: images = images.to(device) labels = labels.to(device) outputs = model(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print(f'Test Accuracy: {100 * correct / total:.2f}%') evaluate(model, test_loader)

好的模型在测试集上的准确率通常能达到90%以上。如果结果不理想，可以尝试： - 增加训练数据，特别是缺陷样本 - 调整学习率或增加训练轮次 - 尝试数据增强的更多变化

4.2 可视化预测结果

查看模型在具体样本上的表现：

def visualize_predictions(model, dataloader, num_images=6): model.eval() images, labels = next(iter(dataloader)) images = images.to(device) labels = labels.to(device) with torch.no_grad(): outputs = model(images) _, preds = torch.max(outputs, 1) plt.figure(figsize=(12, 6)) for i in range(num_images): plt.subplot(2, 3, i+1) img = images[i].cpu().numpy().transpose((1, 2, 0)) mean = np.array([0.485, 0.456, 0.406]) std = np.array([0.229, 0.224, 0.225]) img = std * img + mean img = np.clip(img, 0, 1) plt.imshow(img) plt.title(f'True: {dataloader.dataset.classes[labels[i]]}\nPred: {dataloader.dataset.classes[preds[i]]}') plt.axis('off') plt.show() visualize_predictions(model, test_loader)

这会显示6张测试图像，并标注真实标签和模型预测结果，方便你直观判断模型的表现。

4.3 部署到生产环境

将训练好的模型部署到生产线通常有两种方式：

方案一：实时API服务

使用Flask创建简单的API：

from flask import Flask, request, jsonify from PIL import Image import io app = Flask(__name__) @app.route('/predict', methods=['POST']) def predict(): if 'file' not in request.files: return jsonify({'error': 'no file uploaded'}) file = request.files['file'].read() image = Image.open(io.BytesIO(file)) image = test_transform(image).unsqueeze(0).to(device) with torch.no_grad(): output = model(image) _, pred = torch.max(output, 1) result = 'defect' if pred.item() == 1 else 'normal' return jsonify({'result': result}) if __name__ == '__main__': app.run(host='0.0.0.0', port=5000)

方案二：边缘设备部署

将模型转换为ONNX格式，部署到边缘设备：

# 导出为ONNX格式 dummy_input = torch.randn(1, 3, 224, 224, device=device) torch.onnx.export(model, dummy_input, "defect_detection.onnx", input_names=['input'], output_names=['output'], dynamic_axes={'input': {0: 'batch_size'}, 'output': {0: 'batch_size'}})

然后在边缘设备上使用ONNX Runtime进行推理：

import onnxruntime as ort ort_session = ort.InferenceSession("defect_detection.onnx") inputs = {'input': image.numpy()} # 预处理后的图像 outputs = ort_session.run(None, inputs)

5. 常见问题与优化技巧

5.1 数据不平衡问题

工业缺陷数据通常是严重不平衡的（正常样本远多于缺陷样本），解决方法：

数据重采样： ```python from torch.utils.data import WeightedRandomSampler

# 计算每个类别的样本权重 class_counts = [len(os.listdir(f'dataset/train/{c}')) for c in train_dataset.classes] weights = 1. / torch.tensor(class_counts, dtype=torch.float) samples_weights = weights[labels]

# 创建采样器 sampler = WeightedRandomSampler( weights=samples_weights, num_samples=len(samples_weights), replacement=True )

# 修改DataLoader train_loader = DataLoader(train_dataset, batch_size=32, sampler=sampler) ```

损失函数加权：python class_weights = torch.tensor([1.0, 5.0], device=device) # 给缺陷类更高权重 criterion = nn.CrossEntropyLoss(weight=class_weights)

5.2 模型过拟合

如果验证集准确率明显低于训练集，说明模型过拟合了：

增加数据增强：python train_transform.transforms.insert(2, transforms.RandomRotation(10)) train_transform.transforms.insert(3, transforms.ColorJitter(brightness=0.2, contrast=0.2))
添加正则化：python optimizer = optim.Adam(model.parameters(), lr=0.001, weight_decay=1e-4)
早停法：当验证集准确率不再提升时停止训练

5.3 提高小缺陷检测能力

对于微小的缺陷，可以尝试：

局部注意力机制：在ResNet18中添加CBAM注意力模块
高分辨率输入：将输入尺寸从224x224提高到320x320
多尺度训练：训练时随机缩放图像

6. 总结

通过本教程，你已经掌握了使用ResNet18进行工业缺陷检测的完整流程。让我们回顾关键要点：

数据为王：收集多样化的缺陷样本是关键，公开数据集是好的起点
迁移学习：基于预训练的ResNet18微调，比从头训练效果更好
轻量高效：ResNet18在T4这样的平价GPU上就能良好运行
部署灵活：可以部署为API服务或直接集成到边缘设备
持续优化：通过数据增强、类别平衡等技巧不断提升模型性能

现在，你可以尝试在自己的数据集上训练模型了。实测下来，这套方案在多个工业场景中都表现稳定，准确率通常能达到90%以上。如果在实践中遇到问题，可以回顾本文的"常见问题"部分，或者调整参数进行优化。

💡获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

ResNet18异常检测：工业制造缺陷识别实战