news 2026/4/17 23:40:35

如何训练自己处理好的的数据集之—红外可见光无人机检测数据集 双模态红外可见光无人机检测数据集

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何训练自己处理好的的数据集之—红外可见光无人机检测数据集 双模态红外可见光无人机检测数据集


如何训练自己处理好的的数据集之—红外可见光无人机检测数据集 双模态红外可见光无人机检测数据集

文章目录

      • 数据集概览
      • 数据准备与组织结构
        • 1. 数据目录结构
        • 2. 创建 `data_rgb.yaml` 和 `data_ir.yaml` 文件
      • 环境搭建
      • 模型训练
        • 使用命令行进行训练:
          • 训练可见光数据集
          • 训练红外数据集
        • 参数说明:
      • 推理与结果展示
        • 单张图像推理:
        • 视频流实时检测:
      • 性能评估
      • 模型导出(可选)
      • 进一步优化与部署

可见光(RGB)和红外(IR)的无人机检测数据集,两种数据集是对应上的,可见光或者红外均有5019张训练集和1233张验证集。来源于开源数据集anti-uav310,数据集格式已转化为yolo格式,可直接训练,有训练好的模型直接训练

两种数据集相对应,可见光或者红外均有5019张训练集1233张验证集,已转化为yolo格式可直接训练,+模型,红外可见光无人机数据集 红外无人机数据集 可见光无人机数据集

可见光(RGB)与红外(IR)无人机检测数据集介绍
数据集概述
​​​​

可见光(RGB)和红外(IR)的无人机检测数据集,两种数据集是对应上的,可见光或者红外均有5104张训练集和2209张验证集和2203张测试集。来源于开源数据集anti-uav300,对视频进行了20抽帧。仅收取整理费用。yolo格式,可直接训练

训练指标具体如图(map50-95为0.657的是红外,map50-95为0.713的是可见光)

YOLOv8训练一个针对可见光(RGB)和红外(IR)无人机检测的数据集,你可以按照以下步骤进行。假设你的数据集已经转换为 YOLO 格式,并且分为训练集和验证集。代码示例,仅供参考。

数据集概览

  • 图像总数: 可见光和红外图像各有 5019 张训练集和 1233 张验证集。
  • 标注格式: YOLO txt 文件(每个图像对应一个.txt文件)
  • 类别: 假设只有一个类别drone,如果有更多类别请根据实际情况调整。

数据准备与组织结构

1. 数据目录结构

确保同学你的数据集按如下结构组织:

anti_uav310_dataset/ ├── rgb/ │ ├── images/ │ │ ├── train/ │ │ └── val/ │ └── labels/ │ ├── train/ │ └── val/ └── ir/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/

每个图像文件都有对应的.txt文件,内容格式为:

class_id x_center y_center width height

其中:

  • class_id = 0表示drone
2. 创建data_rgb.yamldata_ir.yaml文件

创建两个名为data_rgb.yamldata_ir.yaml的配置文件,分别用于描述可见光和红外数据集的路径和类别信息:

data_rgb.yaml

train:anti_uav310_dataset/rgb/images/train/val:anti_uav310_dataset/rgb/images/val/nc:1names:['drone']

data_ir.yaml

train:anti_uav310_dataset/ir/images/train/val:anti_uav310_dataset/ir/images/val/nc:1names:['drone']

环境搭建

安装 Ultralytics YOLOv8 环境:

# 克隆仓库gitclone https://github.com/ultralytics/ultralytics.gitcdultralytics# 安装依赖pipinstall-rrequirements.txt

模型训练

使用命令行进行训练:

选择分别对可见光和红外数据集进行训练,也可以尝试联合训练(如果模型支持多模态输入)。这里我们先介绍如何分别训练两个数据集。

训练可见光数据集
yolo traindata=data_rgb.yamlmodel=yolov8s.ptepochs=100batch=16imgsz=640
训练红外数据集
yolo traindata=data_ir.yamlmodel=yolov8s.ptepochs=100batch=16imgsz=640
参数说明:
参数含义
data数据集配置文件路径
model使用的预训练模型权重(如 yolov8n/s/m/l/x)
epochs总训练轮次
batch批大小(根据显存调整)
imgsz输入图像尺寸(默认640x640)

推理与结果展示

单张图像推理:
fromultralyticsimportYOLO# 加载最佳模型model_rgb=YOLO('runs/train/exp/weights/best_rgb.pt')# 可见光模型model_ir=YOLO('runs/train/exp/weights/best_ir.pt')# 红外模型# 推理单张图像results_rgb=model_rgb('test_images/rgb_image.jpg')results_ir=model_ir('test_images/ir_image.jpg')# 显示结果forrinresults_rgb:print(r.boxes)# 输出预测框信息annotated_img=r.plot()cv2.imshow("RGB Detection",annotated_img)cv2.waitKey(0)forrinresults_ir:print(r.boxes)# 输出预测框信息annotated_img=r.plot()cv2.imshow("IR Detection",annotated_img)cv2.waitKey(0)
视频流实时检测:
defdetect_video(source,model):cap=cv2.VideoCapture(source)whilecap.isOpened():ret,frame=cap.read()ifnotret:breakresults=model(frame)annotated_frame=results[0].plot()cv2.imshow("Real-time Detection",annotated_frame)ifcv2.waitKey(1)==27:# ESC键退出breakcap.release()cv2.destroyAllWindows()# 调用函数detect_video('path/to/rgb_video.mp4',model_rgb)detect_video('path/to/ir_video.mp4',model_ir)

性能评估

使用验证命令评估 mAP、Recall、Precision 等指标:

# 对于可见光数据集yolo valdata=data_rgb.yamlmodel=runs/train/exp/weights/best_rgb.ptimgsz=640# 对于红外数据集yolo valdata=data_ir.yamlmodel=runs/train/exp/weights/best_ir.ptimgsz=640

输出包括:

  • mAP@0.5
  • mAP@0.5:0.95
  • Precision / Recall 曲线
  • F1-score

模型导出(可选)

将模型导出为 ONNX、TensorRT 或 OpenVINO 等格式以便部署:

# 导出可见光模型yoloexportmodel=runs/train/exp/weights/best_rgb.ptformat=onnx# 导出红外模型yoloexportmodel=runs/train/exp/weights/best_ir.ptformat=onnx

支持格式:onnx,engine,coreml,tflite,pb,pt

进一步优化与部署

根据验证结果,你可能需要进一步调整模型超参数或尝试不同的模型架构以获得更好的性能。此外,考虑将模型导出为适合边缘设备的格式以便在实际应用中部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 23:27:30

nhentai-cross跨平台漫画阅读器:终极免费解决方案

nhentai-cross跨平台漫画阅读器:终极免费解决方案 【免费下载链接】nhentai-cross A nhentai client 项目地址: https://gitcode.com/gh_mirrors/nh/nhentai-cross 还在为在不同设备上阅读漫画而烦恼吗?nhentai-cross跨平台漫画阅读器为你提供了…

作者头像 李华
网站建设 2026/4/17 23:27:24

AI编程助手谁才是真·生产力引擎?2026奇点大会4大旗舰工具横向测评(含代码生成准确率、调试通过率、IDE兼容性三重压力测试)

第一章:2026奇点智能技术大会:AI编程助手对比评测 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,来自全球12家主流厂商的AI编程助手接受了统一基准测试——涵盖代码补全准确率、跨文件上下文理解、调试建议有效性…

作者头像 李华
网站建设 2026/4/17 23:26:16

dlopen_dlsym:运行时加载动态库

文章目录dlopen/dlsym:运行时加载动态库什么是 dlopen 和 dlsym?为什么使用运行时加载?基本用法和代码示例深入 dlopen 和 dlsymdlopen 函数dlsym 函数错误处理高级主题:符号版本和依赖管理实际应用场景插件系统条件加载跨平台考虑…

作者头像 李华
网站建设 2026/4/17 23:20:48

STM32新手必看:GPIO初始化失败,别再用RCC_AHBPeriphResetCmd了!

STM32开发避坑指南:为什么你的GPIO初始化总失败? 刚拿到STM32开发板的那天,我对着闪烁的LED灯兴奋不已——直到自己动手配置GPIO时,代码怎么改都不工作。寄存器纹丝不动,引脚死活不输出,Keil的调试界面像在…

作者头像 李华