news 2026/6/10 8:32:43

[cmake]C++使用yolo26目标检测结合bytetrack实现目标追踪

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[cmake]C++使用yolo26目标检测结合bytetrack实现目标追踪

【简介】

在C++中实现YOLO26的目标检测与ByteTrack的多目标追踪是一个相对复杂的过程,涉及到深度学习、计算机视觉和实时数据处理等多个领域。下面我将简单介绍这两个技术,并概述如何在C++中实现它们。

YOLO26(You Only Look Once,版本26)是一种实时目标检测算法,它通过在单个网络中同时预测所有目标的位置和类别来实现高效的目标检测。YOLO26在速度和精度之间取得了很好的平衡,使其成为许多实时应用的首选方法。

ByteTrack是一种多目标追踪算法,它结合了目标检测和目标追踪两个步骤。ByteTrack使用目标检测算法(如YOLOv8)来识别视频帧中的目标,并使用追踪算法来跟踪这些目标在连续帧之间的运动。ByteTrack通过关联相邻帧中的目标来实现多目标追踪,从而可以准确地跟踪多个目标的运动轨迹。

在C++中实现YOLO26和ByteTrack的结合,需要以下几个步骤:

  1. 加载YOLO26模型:首先,你需要加载预训练的YOLO26模型。这可以通过使用深度学习框架(如TensorFlow、PyTorch或ONNX Runtime)来实现。你需要将模型转换为C++可以理解的格式,并在程序中加载它。
  2. 处理视频帧:然后,你需要从视频文件中读取帧,或者从摄像头捕获实时帧。这些帧将被送入YOLO26模型进行目标检测。
  3. 执行目标检测:在加载模型后,你可以将每一帧送入模型进行目标检测。模型将返回每个检测到的目标的边界框和类别。
  4. 多目标追踪:接下来,你可以使用ByteTrack算法来追踪这些目标。ByteTrack将根据相邻帧中的目标位置和运动信息来关联目标,从而追踪它们的运动轨迹。
  5. 显示结果:最后,你可以将追踪结果可视化并显示在屏幕上。这可以通过在原始视频帧上绘制边界框和轨迹线来实现。

需要注意的是,实现这一过程需要一定的计算机视觉和深度学习基础,以及对C++编程的熟悉。此外,由于YOLO26和ByteTrack都是比较新的技术,因此可能需要使用较新的深度学习框架和库来支持。

总的来说,在C++中实现YOLO26和ByteTrack的多目标追踪是一个具有挑战性的任务,但它为实时目标检测和追踪提供了强大的工具。通过不断学习和实践,你可以逐渐掌握这些技术,并将其应用于各种实际应用中。

【效果展示】

【运行步骤】

需要提前准备好环境:
windows x64一台
vs2019或者vs2022
cmake==3.30.1
onnxruntime==1.20.1(GPU的话需要安装cuda和下载对应版本库)
opencv==4.9.0
vscode

第一步:首先安装好opencv4.9.0和onnxruntime1.20.1以及vs2019或者vs2022以及cmake=3.30.1
第二步:用vscode打开CMakeLists.txt修改opencv和onnxuntime路径
第三步:build生成exe,yolo26-onnxruntime-cplus\build\Release文件夹exe拷贝到yolo26-onnxruntime-cplus\data文件夹,替换源文件即可。
第四步:双击运行exe,即可查看效果

【调用代码】

#include <iostream> #include <opencv2/opencv.hpp> #include "Yolo26Manager.h" #include "cmdline.h" #include "ByteTrack/BYTETracker.h" #include "ByteTrack/Object.h" using namespace std; using namespace cv; Scalar get_color(int track_id) { int hue = track_id * 180 % 180; Mat hsv(1, 1, CV_8UC3, Scalar(hue, 255, 255)); Mat rgb; cvtColor(hsv, rgb, COLOR_HSV2BGR); return Scalar(rgb.at<Vec3b>(0, 0)[0], rgb.at<Vec3b>(0, 0)[1], rgb.at<Vec3b>(0, 0)[2]); } int main(int argc, char *argv[]) { const float confThreshold = 0.3f; const float iouThreshold = 0.4f; bool isGPU = false; const std::string modelPath = "yolo26n.onnx"; // Initialize the YOLO detector Yolo26Manager detector(modelPath, isGPU); std::cout << "Model was initialized." << std::endl; std::vector<Detection> result; cv::VideoCapture cap("car.mp4"); // Get video properties int img_w = static_cast<int>(cap.get(cv::CAP_PROP_FRAME_WIDTH)); int img_h = static_cast<int>(cap.get(cv::CAP_PROP_FRAME_HEIGHT)); int fps = static_cast<int>(cap.get(cv::CAP_PROP_FPS)); std::cout << "Video properties: " << img_w << "x" << img_h << ", " << fps << " FPS" << std::endl; long nFrame = static_cast<long>(cap.get(cv::CAP_PROP_FRAME_COUNT)); if (!cap.isOpened()) { std::cout << "open capture failured!" << std::endl; return -1; } Mat frame; byte_track::BYTETracker tracker(fps, 30); int num_frames = 0; int keyvalue = 0; int total_ms = 1; while (true) { cap.read(frame); if (frame.empty()) { std::cout << "read to end" << std::endl; break; } num_frames++; auto start = std::chrono::system_clock::now(); result.clear(); // Detect objects in the frame result = detector.Inference(frame); // Draw bounding boxes on the frame // detector.DrawImage(frame, result); // Uncomment for mask drawing std::vector<byte_track::Object> objects; for (const auto &det : result) { objects.emplace_back(byte_track::Rect<float>(det.bbox.x, det.bbox.y, det.bbox.width, det.bbox.height), det.class_id, det.confidence); } std::vector<std::shared_ptr<byte_track::STrack>> output_stracks = tracker.update(objects); auto end = chrono::system_clock::now(); total_ms = total_ms + static_cast<int>(std::chrono::duration_cast<chrono::microseconds>(end - start).count()); for (size_t i = 0; i < output_stracks.size(); i++) { const byte_track::Rect<float> &rect = output_stracks[i]->getRect(); bool vertical = rect.width() / rect.height() > 1.6f; if (rect.width() * rect.height() > 20.0f && !vertical) { Scalar s = get_color(static_cast<int>(output_stracks[i]->getTrackId())); putText(frame, format("objectid=%zu,trackid=%zu,conf=%.2f", output_stracks[i]->getObjId(), output_stracks[i]->getTrackId(), output_stracks[i]->getScore()), Point(static_cast<int>(rect.x()), static_cast<int>(rect.y() - 5)), 0, 0.6, Scalar(0, 0, 255), 2, LINE_AA); cv::rectangle(frame, cv::Rect(static_cast<int>(rect.x()), static_cast<int>(rect.y()), static_cast<int>(rect.width()), static_cast<int>(rect.height())), s, 2); } } cv::putText(frame, format("frame: %d fps: %d num: %zu", num_frames, num_frames * 1000000 / total_ms, output_stracks.size()), Point(0, 30), 0, 0.6, cv::Scalar(0, 0, 255), 2, cv::LINE_AA); cv::imshow("demo", frame); keyvalue = cv::waitKey(1); if (keyvalue == 113 || keyvalue == 81) { break; } } cap.release(); return 0; }
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 9:12:38

java-SSM348的线上导医院问询系统vue-springboot

目录具体实现截图线上导医院问询系统&#xff08;Vue-SpringBoot-SSM348&#xff09;摘要系统所用技术介绍写作提纲源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;具体实现截图 线上导医院问询系统&#xff08;Vue-SpringBoot-SSM348&…

作者头像 李华
网站建设 2026/6/10 9:10:33

java-SSM350的图书馆图书借阅管理系统x1x74-springboot

目录具体实现截图系统概述技术架构核心功能创新与优化应用价值系统所用技术介绍写作提纲源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;具体实现截图 系统概述 Java-SSM350图书馆图书借阅管理系统基于SpringBoot框架开发&#xff0c;…

作者头像 李华
网站建设 2026/6/10 8:57:16

Qwen_Image_Cute_Animal_For_Kids部署案例:儿童智能玩具开发

Qwen_Image_Cute_Animal_For_Kids部署案例&#xff1a;儿童智能玩具开发 1. 技术背景与应用场景 随着人工智能技术在消费级硬件和教育产品中的深入应用&#xff0c;面向儿童群体的智能化内容生成需求日益增长。传统图像生成模型虽然具备较强的泛化能力&#xff0c;但在风格控…

作者头像 李华
网站建设 2026/6/10 9:12:38

当AI遇见DevOps:加速部署的隐藏技巧

AI与DevOps的融合革命 在当今快速迭代的软件开发世界中&#xff0c;DevOps已成为提升交付效率的核心方法论&#xff0c;而人工智能&#xff08;AI&#xff09;的崛起正为其注入全新动能。作为软件测试从业者&#xff0c;您深知部署环节的瓶颈——从测试覆盖率不足到环境配置延…

作者头像 李华
网站建设 2026/6/10 9:09:35

采用思维链格式的GRPO训练数据示例

之前探索了GRPO优化方法 https://blog.csdn.net/liliang199/article/details/157061810 这里尝试进一步探索GRPO训练LLM的训练数据示例。 所用示例参考和修改自网络内容。 1 训练数据示例 1.1 输入prompt格式 采用思维链格式&#xff0c;示例如下 SYSTEM_PROMPT "“”…

作者头像 李华
网站建设 2026/6/10 10:44:30

GPT-OSS开源模型部署教程:WEBUI一键推理操作手册

GPT-OSS开源模型部署教程&#xff1a;WEBUI一键推理操作手册 获取更多AI镜像 想探索更多AI镜像和应用场景&#xff1f;访问 CSDN星图镜像广场&#xff0c;提供丰富的预置镜像&#xff0c;覆盖大模型推理、图像生成、视频生成、模型微调等多个领域&#xff0c;支持一键部署。 1.…

作者头像 李华