基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的多种类动物识别（Python+PySide6界面+训练代码）-程序员充电站

摘要

本文详细介绍了一个基于YOLO系列目标检测算法的多类别动物识别系统。该系统结合了最新的YOLOv8算法以及其前代版本（YOLOv7、YOLOv6、YOLOv5），通过Python编程语言和PySide6图形界面框架，实现了一个完整的动物识别解决方案。系统支持图像识别、视频识别、实时摄像头识别等多种功能，并提供了完整的训练代码和用户友好的图形界面。本文将详细讲解算法原理、数据集准备、模型训练、系统实现以及性能评估等内容。

1. 引言

1.1 研究背景

随着计算机视觉技术的快速发展，目标检测技术在野生动物保护、畜牧业管理、宠物识别等领域有着广泛的应用需求。传统的动物识别方法主要依赖于人工特征提取和分类器，如SIFT、HOG等特征结合SVM等分类器。然而，这些方法在复杂环境下的鲁棒性和准确性有限。

深度学习的兴起为目标检测带来了革命性的变化。YOLO（You Only Look Once）系列算法作为单阶段目标检测的代表，以其高效的速度和良好的精度，在实际应用中得到了广泛使用。从YOLOv1到最新的YOLOv8，YOLO系列算法在精度和速度上不断优化，为动物识别提供了强大的技术支持。

1.2 研究意义

开发一个多类别动物识别系统具有重要的现实意义：

野生动物保护：自动识别和统计野生动物，辅助生态监测和保护工作
畜牧业管理：识别和跟踪牲畜，实现智能化养殖管理
宠物识别：帮助寻找走失宠物或识别宠物品种
生态研究：自动收集和分析动物行为数据

1.3 本文贡献

本文的主要贡献包括：

实现了一个基于YOLO系列算法的完整动物识别系统
提供了多种YOLO版本（v5-v8）的实现和比较
开发了用户友好的PySide6图形界面
提供了完整的数据集准备、模型训练和部署代码
系统支持多种输入源（图像、视频、摄像头）和多种输出格式

2. 相关工作

2.1 目标检测算法发展

目标检测算法主要分为两阶段检测器和单阶段检测器：

两阶段检测器：如R-CNN系列（R-CNN、Fast R-CNN、Faster R-CNN），首先生成候选区域，然后对候选区域进行分类和回归
单阶段检测器：如YOLO系列、SSD、RetinaNet，直接在特征图上预测目标的类别和位置

YOLO系列算法因其高效性在实际应用中更受欢迎。YOLOv5在工业界广泛应用，YOLOv6由美团团队开发优化，YOLOv7在精度和速度上取得更好平衡，YOLOv8作为最新版本提供了更先进的特征。

2.2 动物识别研究现状

现有的动物识别研究主要采用以下方法：

传统机器学习方法：使用手工特征和分类器
深度学习方法：基于CNN的特征提取和目标检测
多模态方法：结合图像、声音等多种信息

本文采用基于YOLO的深度学习方法，充分利用其高效准确的特性。

3. 系统设计与实现

3.1 系统架构

整个系统分为以下几个模块：

数据准备模块：处理图像数据，生成标注文件
模型训练模块：支持多种YOLO版本的训练
模型推理模块：加载训练好的模型进行预测
图形界面模块：提供用户友好的交互界面
结果分析模块：统计和可视化识别结果

3.2 技术栈

深度学习框架：PyTorch
YOLO实现：Ultralytics YOLOv8, YOLOv5官方实现
图形界面：PySide6 (Qt for Python)
图像处理：OpenCV, PIL
数据增强：Albumentations
开发环境：Python 3.8+

4. 数据集准备

4.1 参考数据集

对于动物识别任务，可以使用以下公开数据集：

Animals-10：包含10种动物类别，约28,000张图像
Open Images Animals Subset：从Open Images数据集中提取的动物子集
iNaturalist 2021：包含大量物种的自然图像
ImageNet Animals Subset：ImageNet中的动物类别
自定义数据集：根据具体需求收集和标注的数据

4.2 数据预处理

数据预处理包括以下步骤：

图像标准化：调整图像大小，归一化像素值
数据增强：使用翻转、旋转、裁剪、色彩调整等方法增加数据多样性
标注格式转换：将不同格式的标注转换为YOLO格式

YOLO标注格式：每个图像对应一个.txt文件，每行表示一个目标：

text

<class_id> <x_center> <y_center> <width> <height>

坐标和尺寸都是相对于图像宽度和高度的比例值。

4.3 数据集结构示例

text

dataset/ ├── images/ │ ├── train/ │ │ ├── image1.jpg │ │ ├── image2.jpg │ │ └── ... │ └── val/ │ ├── image1001.jpg │ ├── image1002.jpg │ └── ... ├── labels/ │ ├── train/ │ │ ├── image1.txt │ │ ├── image2.txt │ │ └── ... │ └── val/ │ ├── image1001.txt │ ├── image1002.txt │ └── ... └── dataset.yaml

5. 模型训练

5.1 YOLO算法原理

YOLO将目标检测视为回归问题，直接在图像上预测边界框和类别概率。主要步骤包括：

将输入图像划分为S×S的网格
每个网格预测B个边界框和置信度分数
每个边界框包含5个值：(x, y, w, h, confidence)
每个网格预测C个类别概率
使用非极大值抑制（NMS）去除冗余检测框

5.2 YOLO版本比较

YOLOv5：采用CSPDarknet骨干网络，PANet颈部网络，易于使用和部署
YOLOv6：引入RepVGG风格骨干网络，更高效的颈部设计
YOLOv7：提出扩展高效层聚合网络（E-ELAN），模型重参数化技术
YOLOv8：无锚框设计，新的骨干网络和损失函数

5.3 训练代码实现

以下是完整的训练代码实现：

python

# train.py - 动物识别模型训练脚本 import os import yaml import torch import argparse from pathlib import Path import sys # 添加YOLOv5路径（如果需要） sys.path.append('./yolov5') if './yolov5' not in sys.path else None def train_yolov5(data_yaml, weights='yolov5s.pt', epochs=100, batch_size=16, img_size=640): """训练YOLOv5模型""" from yolov5 import train # 训练参数 args = { 'weights': weights, 'data': data_yaml, 'epochs': epochs, 'batch-size': batch_size, 'imgsz': img_size, 'project': 'runs/train', 'name': 'animal_detection_v5', 'exist-ok': True, 'workers': 8, 'save-period': 10, 'patience': 50, 'device': '0' if torch.cuda.is_available() else 'cpu' } # 转换参数并训练 train_args = argparse.Namespace(**args) train.run(**vars(train_args)) def train_yolov8(data_yaml, model='yolov8s.pt', epochs=100, batch_size=16, img_size=640): """训练YOLOv8模型""" from ultralytics import YOLO # 加载模型 model = YOLO(model) # 训练参数 train_args = { 'data': data_yaml, 'epochs': epochs, 'batch': batch_size, 'imgsz': img_size, 'project': 'runs/train', 'name': 'animal_detection_v8', 'exist_ok': True, 'workers': 8, 'save_period': 10, 'patience': 50, 'device': '0' if torch.cuda.is_available() else 'cpu', 'amp': True, # 自动混合精度训练 'lr0': 0.01, # 初始学习率 'lrf': 0.01, # 最终学习率因子 'momentum': 0.937, 'weight_decay': 0.0005, 'warmup_epochs': 3, 'warmup_momentum': 0.8, 'box': 7.5, # 边界框损失权重 'cls': 0.5, # 分类损失权重 'dfl': 1.5, # 分布焦点损失权重 } # 开始训练 results = model.train(**train_args) return results def prepare_dataset(dataset_path, class_names): """准备数据集""" # 创建数据集目录结构 dataset_dir = Path(dataset_path) dataset_dir.mkdir(parents=True, exist_ok=True) # 创建images和labels目录 for split in ['train', 'val']: (dataset_dir / 'images' / split).mkdir(parents=True, exist_ok=True) (dataset_dir / 'labels' / split).mkdir(parents=True, exist_ok=True) # 创建dataset.yaml配置文件 data_yaml = { 'path': str(dataset_dir.absolute()), 'train': 'images/train', 'val': 'images/val', 'names': class_names } yaml_path = dataset_dir / 'dataset.yaml' with open(yaml_path, 'w') as f: yaml.dump(data_yaml, f, default_flow_style=False) print(f"数据集配置已保存到: {yaml_path}") return yaml_path def main(): parser = argparse.ArgumentParser(description='动物识别模型训练') parser.add_argument('--model', type=str, default='yolov8', choices=['yolov5', 'yolov6', 'yolov7', 'yolov8'], help='选择YOLO版本') parser.add_argument('--dataset', type=str, required=True, help='数据集路径') parser.add_argument('--epochs', type=int, default=100, help='训练轮数') parser.add_argument('--batch-size', type=int, default=16, help='批次大小') parser.add_argument('--img-size', type=int, default=640, help='输入图像尺寸') parser.add_argument('--weights', type=str, default=None, help='预训练权重路径') args = parser.parse_args() # 动物类别（示例） animal_classes = { 0: 'dog', 1: 'cat', 2: 'bird', 3: 'horse', 4: 'cow', 5: 'sheep', 6: 'elephant', 7: 'lion', 8: 'tiger', 9: 'bear', 10: 'deer', 11: 'rabbit', 12: 'fox', 13: 'monkey', 14: 'zebra' } # 准备数据集配置 data_yaml = prepare_dataset(args.dataset, animal_classes) # 根据选择的模型进行训练 if args.model == 'yolov5': weights = args.weights or 'yolov5s.pt' train_yolov5(data_yaml, weights, args.epochs, args.batch_size, args.img_size) elif args.model == 'yolov8': model = args.weights or 'yolov8s.pt' train_yolov8(data_yaml, model, args.epochs, args.batch_size, args.img_size) else: print(f"暂不支持 {args.model}，请使用 yolov5 或 yolov8") if __name__ == '__main__': main()

6. 图形界面实现

使用PySide6开发图形用户界面，提供友好的交互体验：

python

# animal_detector_ui.py - 动物识别系统图形界面 import sys import os from pathlib import Path import cv2 import numpy as np from datetime import datetime import json from PySide6.QtWidgets import (QApplication, QMainWindow, QWidget, QVBoxLayout, QHBoxLayout, QPushButton, QLabel, QFileDialog, QComboBox, QSpinBox, QDoubleSpinBox, QTextEdit, QGroupBox, QTabWidget, QCheckBox, QProgressBar, QMessageBox, QTableWidget, QTableWidgetItem) from PySide6.QtCore import Qt, QTimer, Signal, QThread from PySide6.QtGui import QImage, QPixmap, QFont, QIcon # 导入YOLO模型 try: from ultralytics import YOLO YOLOv8_AVAILABLE = True except ImportError: YOLOv8_AVAILABLE = False try: import torch TORCH_AVAILABLE = True except ImportError: TORCH_AVAILABLE = False class DetectionWorker(QThread): """检测工作线程""" finished = Signal(list) progress = Signal(int) error = Signal(str) def __init__(self, model_path, image_path, conf_threshold=0.5): super().__init__() self.model_path = model_path self.image_path = image_path self.conf_threshold = conf_threshold self.running = True def run(self): try: # 加载模型 model = YOLO(self.model_path) # 读取图像 image = cv2.imread(self.image_path) if image is None: self.error.emit(f"无法读取图像: {self.image_path}") return # 执行检测 results = model(image, conf=self.conf_threshold) # 处理结果 detections = [] for result in results: boxes = result.boxes if boxes is not None: for box in boxes: x1, y1, x2, y2 = box.xyxy[0].cpu().numpy() confidence = box.conf[0].cpu().numpy() class_id = int(box.cls[0].cpu().numpy()) class_name = result.names[class_id] detections.append({ 'bbox': [float(x1), float(y1), float(x2), float(y2)], 'confidence': float(confidence), 'class_id': class_id, 'class_name': class_name }) self.finished.emit(detections) except Exception as e: self.error.emit(f"检测错误: {str(e)}") def stop(self): self.running = False class AnimalDetectorUI(QMainWindow): """动物识别系统主界面""" def __init__(self): super().__init__() self.model = None self.current_image = None self.current_video = None self.camera_active = False self.cap = None self.detection_worker = None self.init_ui() self.load_settings() def init_ui(self): """初始化用户界面""" self.setWindowTitle("多类别动物识别系统") self.setGeometry(100, 100, 1400, 900) # 设置应用图标 self.setWindowIcon(QIcon("icon.png") if os.path.exists("icon.png") else QIcon()) # 创建中央部件 central_widget = QWidget() self.setCentralWidget(central_widget) # 主布局 main_layout = QHBoxLayout(central_widget) # 左侧控制面板 control_panel = self.create_control_panel() main_layout.addWidget(control_panel, 1) # 右侧显示区域 display_panel = self.create_display_panel() main_layout.addWidget(display_panel, 2) # 状态栏 self.statusBar().showMessage("就绪") def create_control_panel(self): """创建控制面板""" panel = QWidget() layout = QVBoxLayout(panel) # 模型选择组 model_group = QGroupBox("模型设置") model_layout = QVBoxLayout() # 模型选择 model_label = QLabel("选择模型:") self.model_combo = QComboBox() self.model_combo.addItems(["YOLOv8n", "YOLOv8s", "YOLOv8m", "YOLOv8l", "YOLOv8x"]) model_layout.addWidget(model_label) model_layout.addWidget(self.model_combo) # 置信度阈值 conf_label = QLabel("置信度阈值:") self.conf_spin = QDoubleSpinBox() self.conf_spin.setRange(0.0, 1.0) self.conf_spin.setValue(0.5) self.conf_spin.setSingleStep(0.05) model_layout.addWidget(conf_label) model_layout.addWidget(self.conf_spin) # IOU阈值 iou_label = QLabel("IOU阈值:") self.iou_spin = QDoubleSpinBox() self.iou_spin.setRange(0.0, 1.0) self.iou_spin.setValue(0.45) self.iou_spin.setSingleStep(0.05) model_layout.addWidget(iou_label) model_layout.addWidget(self.iou_spin) # 加载模型按钮 self.load_model_btn = QPushButton("加载模型") self.load_model_btn.clicked.connect(self.load_model) model_layout.addWidget(self.load_model_btn) model_group.setLayout(model_layout) layout.addWidget(model_group) # 输入源组 input_group = QGroupBox("输入源") input_layout = QVBoxLayout() # 图像输入 self.image_btn = QPushButton("选择图像") self.image_btn.clicked.connect(self.select_image) input_layout.addWidget(self.image_btn) # 视频输入 self.video_btn = QPushButton("选择视频") self.video_btn.clicked.connect(self.select_video) input_layout.addWidget(self.video_btn) # 摄像头输入 self.camera_btn = QPushButton("打开摄像头") self.camera_btn.clicked.connect(self.toggle_camera) input_layout.addWidget(self.camera_btn) # 文件夹批量处理 self.folder_btn = QPushButton("选择文件夹") self.folder_btn.clicked.connect(self.select_folder) input_layout.addWidget(self.folder_btn) input_group.setLayout(input_layout) layout.addWidget(input_group) # 检测选项组 options_group = QGroupBox("检测选项") options_layout = QVBoxLayout() # 显示选项 self.show_bbox = QCheckBox("显示边界框") self.show_bbox.setChecked(True) options_layout.addWidget(self.show_bbox) self.show_label = QCheckBox("显示标签") self.show_label.setChecked(True) options_layout.addWidget(self.show_label) self.show_conf = QCheckBox("显示置信度") self.show_conf.setChecked(True) options_layout.addWidget(self.show_conf) # 类别筛选 filter_label = QLabel("筛选类别:") self.class_filter = QComboBox() self.class_filter.addItem("所有类别") self.class_filter.setEditable(True) options_layout.addWidget(filter_label) options_layout.addWidget(self.class_filter) options_group.setLayout(options_layout) layout.addWidget(options_group) # 统计信息组 stats_group = QGroupBox("统计信息") stats_layout = QVBoxLayout() self.stats_text = QTextEdit() self.stats_text.setReadOnly(True) self.stats_text.setMaximumHeight(150) stats_layout.addWidget(self.stats_text) # 导出结果按钮 self.export_btn = QPushButton("导出结果") self.export_btn.clicked.connect(self.export_results) stats_layout.addWidget(self.export_btn) stats_group.setLayout(stats_layout) layout.addWidget(stats_group) # 进度条 self.progress_bar = QProgressBar() layout.addWidget(self.progress_bar) # 拉伸因子 layout.addStretch(1) return panel def create_display_panel(self): """创建显示面板""" panel = QWidget() layout = QVBoxLayout(panel) # 标签页 self.tab_widget = QTabWidget() # 图像显示标签页 self.image_tab = QWidget() image_layout = QVBoxLayout(self.image_tab) self.image_label = QLabel("选择图像开始检测") self.image_label.setAlignment(Qt.AlignCenter) self.image_label.setStyleSheet("border: 2px solid #cccccc; background-color: #f0f0f0;") image_layout.addWidget(self.image_label) # 检测按钮 self.detect_btn = QPushButton("开始检测") self.detect_btn.clicked.connect(self.detect_image) self.detect_btn.setEnabled(False) image_layout.addWidget(self.detect_btn) self.tab_widget.addTab(self.image_tab, "图像检测") # 视频显示标签页 self.video_tab = QWidget() video_layout = QVBoxLayout(self.video_tab) self.video_label = QLabel("选择视频开始检测") self.video_label.setAlignment(Qt.AlignCenter) self.video_label.setStyleSheet("border: 2px solid #cccccc; background-color: #f0f0f0;") video_layout.addWidget(self.video_label) # 视频控制按钮 video_control_layout = QHBoxLayout() self.play_video_btn = QPushButton("播放") self.play_video_btn.clicked.connect(self.play_video) self.play_video_btn.setEnabled(False) video_control_layout.addWidget(self.play_video_btn) self.pause_video_btn = QPushButton("暂停") self.pause_video_btn.clicked.connect(self.pause_video) self.pause_video_btn.setEnabled(False) video_control_layout.addWidget(self.pause_video_btn) self.stop_video_btn = QPushButton("停止") self.stop_video_btn.clicked.connect(self.stop_video) self.stop_video_btn.setEnabled(False) video_control_layout.addWidget(self.stop_video_btn) video_layout.addLayout(video_control_layout) self.tab_widget.addTab(self.video_tab, "视频检测") # 结果表格标签页 self.results_tab = QWidget() results_layout = QVBoxLayout(self.results_tab) self.results_table = QTableWidget() self.results_table.setColumnCount(6) self.results_table.setHorizontalHeaderLabels(["ID", "类别", "置信度", "X1", "Y1", "X2", "Y2"]) results_layout.addWidget(self.results_table) self.tab_widget.addTab(self.results_tab, "检测结果") layout.addWidget(self.tab_widget) return panel def load_model(self): """加载模型""" try: model_name = self.model_combo.currentText().lower() self.statusBar().showMessage(f"正在加载模型: {model_name}") # 这里可以加载自定义训练好的模型 # self.model = YOLO(f"models/{model_name}.pt") # 或者加载预训练模型 self.model = YOLO(f"{model_name}.pt") # 更新类别筛选 self.update_class_filter() self.statusBar().showMessage(f"模型加载成功: {model_name}") self.detect_btn.setEnabled(True) QMessageBox.information(self, "成功", f"模型 {model_name} 加载成功！") except Exception as e: QMessageBox.critical(self, "错误", f"加载模型失败: {str(e)}") self.statusBar().showMessage("模型加载失败") def update_class_filter(self): """更新类别筛选下拉框""" if self.model is not None: self.class_filter.clear() self.class_filter.addItem("所有类别") for class_id, class_name in self.model.names.items(): self.class_filter.addItem(f"{class_id}: {class_name}") def select_image(self): """选择图像文件""" file_path, _ = QFileDialog.getOpenFileName( self, "选择图像", "", "图像文件 (*.jpg *.jpeg *.png *.bmp *.tiff)" ) if file_path: self.current_image = file_path pixmap = QPixmap(file_path) # 缩放以适应标签 scaled_pixmap = pixmap.scaled( self.image_label.size(), Qt.KeepAspectRatio, Qt.SmoothTransformation ) self.image_label.setPixmap(scaled_pixmap) self.statusBar().showMessage(f"已选择图像: {file_path}") self.tab_widget.setCurrentIndex(0) # 切换到图像标签页 def select_video(self): """选择视频文件""" file_path, _ = QFileDialog.getOpenFileName( self, "选择视频", "", "视频文件 (*.mp4 *.avi *.mov *.mkv *.flv)" ) if file_path: self.current_video = file_path self.statusBar().showMessage(f"已选择视频: {file_path}") self.play_video_btn.setEnabled(True) self.tab_widget.setCurrentIndex(1) # 切换到视频标签页 def toggle_camera(self): """打开/关闭摄像头""" if not self.camera_active: # 打开摄像头 self.cap = cv2.VideoCapture(0) if not self.cap.isOpened(): QMessageBox.warning(self, "警告", "无法打开摄像头") return self.camera_active = True self.camera_btn.setText("关闭摄像头") self.statusBar().showMessage("摄像头已打开") # 定时器更新摄像头画面 self.camera_timer = QTimer() self.camera_timer.timeout.connect(self.update_camera_frame) self.camera_timer.start(30) # 30ms更新一次 else: # 关闭摄像头 self.camera_active = False self.camera_btn.setText("打开摄像头") if self.cap: self.cap.release() if hasattr(self, 'camera_timer'): self.camera_timer.stop() self.statusBar().showMessage("摄像头已关闭") def update_camera_frame(self): """更新摄像头帧""" if self.cap and self.cap.isOpened(): ret, frame = self.cap.read() if ret: # 转换为RGB格式 frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) # 如果模型已加载，进行实时检测 if self.model and self.show_bbox.isChecked(): results = self.model(frame_rgb, conf=self.conf_spin.value()) frame_rgb = self.draw_detections(frame_rgb, results) # 显示图像 h, w, ch = frame_rgb.shape bytes_per_line = ch * w qt_image = QImage(frame_rgb.data, w, h, bytes_per_line, QImage.Format_RGB888) pixmap = QPixmap.fromImage(qt_image) # 缩放以适应标签 scaled_pixmap = pixmap.scaled( self.video_label.size(), Qt.KeepAspectRatio, Qt.SmoothTransformation ) self.video_label.setPixmap(scaled_pixmap) def select_folder(self): """选择文件夹进行批量处理""" folder_path = QFileDialog.getExistingDirectory(self, "选择文件夹") if folder_path: self.batch_process_folder(folder_path) def detect_image(self): """检测图像""" if not self.model: QMessageBox.warning(self, "警告", "请先加载模型") return if not self.current_image: QMessageBox.warning(self, "警告", "请先选择图像") return # 在工作线程中执行检测 self.detection_worker = DetectionWorker( self.model.weights if hasattr(self.model, 'weights') else self.model.__class__.__name__, self.current_image, self.conf_spin.value() ) self.detection_worker.finished.connect(self.on_detection_finished) self.detection_worker.error.connect(self.on_detection_error) self.progress_bar.setRange(0, 0) # 不确定进度 self.detection_worker.start() def on_detection_finished(self, detections): """检测完成处理""" self.progress_bar.setRange(0, 100) self.progress_bar.setValue(100) # 显示检测结果 self.display_detections(detections) # 更新统计信息 self.update_statistics(detections) # 更新结果表格 self.update_results_table(detections) self.statusBar().showMessage(f"检测完成，发现 {len(detections)} 个目标") def on_detection_error(self, error_msg): """检测错误处理""" self.progress_bar.setRange(0, 100) self.progress_bar.setValue(0) QMessageBox.critical(self, "错误", error_msg) def draw_detections(self, image, results): """在图像上绘制检测结果""" for result in results: boxes = result.boxes if boxes is not None: for box in boxes: # 获取边界框坐标 x1, y1, x2, y2 = map(int, box.xyxy[0].cpu().numpy()) # 获取类别和置信度 confidence = box.conf[0].cpu().numpy() class_id = int(box.cls[0].cpu().numpy()) class_name = result.names[class_id] # 绘制边界框 color = self.get_color_for_class(class_id) cv2.rectangle(image, (x1, y1), (x2, y2), color, 2) # 绘制标签 if self.show_label.isChecked(): label = f"{class_name}" if self.show_conf.isChecked(): label += f" {confidence:.2f}" # 标签背景 (label_width, label_height), baseline = cv2.getTextSize( label, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 2 ) cv2.rectangle( image, (x1, y1 - label_height - baseline - 5), (x1 + label_width, y1), color, -1 ) # 标签文字 cv2.putText( image, label, (x1, y1 - baseline - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2 ) return image def get_color_for_class(self, class_id): """根据类别ID获取颜色""" colors = [ (255, 0, 0), # 红色 (0, 255, 0), # 绿色 (0, 0, 255), # 蓝色 (255, 255, 0), # 青色 (255, 0, 255), # 品红 (0, 255, 255), # 黄色 (128, 0, 0), # 深红 (0, 128, 0), # 深绿 (0, 0, 128), # 深蓝 (128, 128, 0), # 橄榄色 (128, 0, 128), # 紫色 (0, 128, 128), # 青色 (192, 192, 192),# 银色 (128, 128, 128),# 灰色 (255, 165, 0) # 橙色 ] return colors[class_id % len(colors)] def display_detections(self, detections): """显示检测结果""" if not self.current_image: return # 读取图像 image = cv2.imread(self.current_image) image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # 绘制检测结果 for detection in detections: x1, y1, x2, y2 = map(int, detection['bbox']) class_id = detection['class_id'] class_name = detection['class_name'] confidence = detection['confidence'] # 绘制边界框 color = self.get_color_for_class(class_id) cv2.rectangle(image_rgb, (x1, y1), (x2, y2), color, 2) # 绘制标签 if self.show_label.isChecked(): label = f"{class_name}" if self.show_conf.isChecked(): label += f" {confidence:.2f}" # 标签背景 (label_width, label_height), baseline = cv2.getTextSize( label, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 2 ) cv2.rectangle( image_rgb, (x1, y1 - label_height - baseline - 5), (x1 + label_width, y1), color, -1 ) # 标签文字 cv2.putText( image_rgb, label, (x1, y1 - baseline - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2 ) # 显示图像 h, w, ch = image_rgb.shape bytes_per_line = ch * w qt_image = QImage(image_rgb.data, w, h, bytes_per_line, QImage.Format_RGB888) pixmap = QPixmap.fromImage(qt_image) # 缩放以适应标签 scaled_pixmap = pixmap.scaled( self.image_label.size(), Qt.KeepAspectRatio, Qt.SmoothTransformation ) self.image_label.setPixmap(scaled_pixmap) def update_statistics(self, detections): """更新统计信息""" stats = {} for detection in detections: class_name = detection['class_name'] if class_name not in stats: stats[class_name] = 0 stats[class_name] += 1 # 生成统计文本 stats_text = "检测统计:\n" stats_text += f"总目标数: {len(detections)}\n\n" for class_name, count in stats.items(): stats_text += f"{class_name}: {count}个\n" self.stats_text.setText(stats_text) def update_results_table(self, detections): """更新结果表格""" self.results_table.setRowCount(len(detections)) for i, detection in enumerate(detections): x1, y1, x2, y2 = detection['bbox'] self.results_table.setItem(i, 0, QTableWidgetItem(str(i+1))) self.results_table.setItem(i, 1, QTableWidgetItem(detection['class_name'])) self.results_table.setItem(i, 2, QTableWidgetItem(f"{detection['confidence']:.4f}")) self.results_table.setItem(i, 3, QTableWidgetItem(f"{x1:.0f}")) self.results_table.setItem(i, 4, QTableWidgetItem(f"{y1:.0f}")) self.results_table.setItem(i, 5, QTableWidgetItem(f"{x2:.0f}")) self.results_table.setItem(i, 6, QTableWidgetItem(f"{y2:.0f}")) def play_video(self): """播放视频""" if not self.current_video: return # 实现视频播放和检测逻辑 # 这里可以添加视频处理代码 self.statusBar().showMessage("视频播放开始") def pause_video(self): """暂停视频""" self.statusBar().showMessage("视频已暂停") def stop_video(self): """停止视频""" self.statusBar().showMessage("视频已停止") def batch_process_folder(self, folder_path): """批量处理文件夹中的图像""" # 实现批量处理逻辑 self.statusBar().showMessage(f"开始批量处理文件夹: {folder_path}") def export_results(self): """导出检测结果""" file_path, _ = QFileDialog.getSaveFileName( self, "导出结果", f"detection_results_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json", "JSON文件 (*.json);;文本文件 (*.txt);;CSV文件 (*.csv)" ) if file_path: # 这里可以实现结果导出逻辑 self.statusBar().showMessage(f"结果已导出到: {file_path}") def load_settings(self): """加载设置""" # 这里可以实现设置加载逻辑 pass def closeEvent(self, event): """关闭事件""" if self.camera_active: self.toggle_camera() if self.detection_worker and self.detection_worker.isRunning(): self.detection_worker.stop() self.detection_worker.wait() event.accept() def main(): app = QApplication(sys.argv) app.setStyle('Fusion') # 设置应用样式 # 设置字体 font = QFont("Arial", 10) app.setFont(font) window = AnimalDetectorUI() window.show() sys.exit(app.exec()) if __name__ == '__main__': main()