从玩具舵机到视觉追踪：聊聊OpenMV色块识别背后的图像处理与坐标转换-程序员充电站

从玩具舵机到视觉追踪：OpenMV色块识别背后的图像处理与坐标转换

在嵌入式视觉系统中，色块追踪是一个看似简单却蕴含丰富技术细节的经典问题。当我们将OpenMV摄像头对准一个彩色物体时，屏幕上实时跳动的矩形框背后，是一系列精密的图像处理算法和坐标转换逻辑。不同于常见的"调用find_blobs函数"这类笼统描述，本文将深入剖析色块识别的工作流程，揭示从像素阵列到物理坐标的完整转换链条。

1. 色块识别的底层逻辑

1.1 图像采集与预处理

OpenMV的视觉流水线始于图像传感器。当设置为QVGA(320x240)分辨率时，每个帧包含76,800个像素点。传感器输出的原始数据通常采用RGB565格式：

# OpenMV典型初始化代码 sensor.reset() sensor.set_pixformat(sensor.RGB565) # 每个像素占2字节 sensor.set_framesize(sensor.QVGA)

这种格式将红色和蓝色各分配5位，绿色分配6位，在色彩分辨率和存储效率间取得平衡。实际应用中，自动增益和白平衡必须关闭：

sensor.set_auto_gain(False) # 避免颜色失真 sensor.set_auto_whitebal(False) # 保持色彩一致性

1.2 阈值设定的科学

色块识别的核心是颜色阈值。OpenMV使用LAB色彩空间的阈值元组：

(30, 100, 15, 127, 15, 127) # 典型红色阈值

这个六元组分别对应：

L（亮度）范围：30-100
A（红绿轴）范围：15-127
B（蓝黄轴）范围：15-127

阈值优化技巧：

在目标环境中采集样本图像
使用OpenMV IDE的阈值编辑器实时调整
考虑光照变化的影响范围
对相似颜色设置排斥区间

1.3 连通域分析与特征提取

find_blobs()函数执行的是经典的连通域标记算法。该过程包含：

二值化：根据阈值将图像转换为黑白掩膜
区域生长：识别相连的像素块
特征计算：为每个色块计算包括：
- 外接矩形（x,y,w,h）
- 中心坐标（cx,cy）
- 像素面积
- 长宽比
- 旋转角度

blobs = img.find_blobs([threshold]) if blobs: max_blob = max(blobs, key=lambda b: b.pixels()) print(max_blob.rect()) # 输出：(x,y,w,h)

2. 坐标系转换的艺术

2.1 图像坐标系到物理坐标系的映射

OpenMV的QVGA分辨率下，坐标系原点在左上角：

(0,0)-------→ +X | | ↓ +Y

而舵机控制系统通常采用以图像中心为原点的相对坐标系：

+Y | | -X --------+------- +X | | -Y

转换公式为：

物理X = (像素X - 160) / 160 * 视场角宽度 物理Y = (120 - 像素Y) / 120 * 视场角高度

2.2 舵机控制量的计算

以常见的SG90舵机为例，其控制信号为50Hz PWM波，脉宽0.5ms-2.5ms对应0-180度。在STM32中，通过定时器比较值控制：

// 示例：设置TIM3通道1输出PWM __HAL_TIM_SET_COMPARE(&htim3, TIM_CHANNEL_1, pulse_width);

典型映射关系：

图像坐标X	PWM比较值	舵机角度
0	25	0°
160	75	90°
320	125	180°

2.3 动态调整策略

简单的比例控制会导致系统振荡。改进方案包括：

死区控制：当误差小于阈值时不响应
```
if abs(cx - 160) < 5: # 5像素死区 return
```

速度限制：限制单次调整幅度

motor1 += constrain(PID_output, -10, 10); // 每次变化不超过10

非线性响应：对小误差使用更激进的控制
```
float gain = (error < 20) ? 1.5 : 0.8;
```

3. 系统集成与优化

3.1 串口通信协议设计

稳定通信需要定义明确的帧格式。常见方案：

# OpenMV发送帧示例 def send_data(x,y,w,h): FH = bytearray([0xb3,0xb3]) # 帧头 uart.write(FH) uart.write(f"{x} {y} {w} {h}".encode()) uart.write(bytearray([0x0d,0x0a])) # 帧尾

STM32端解析逻辑要点：

双字节帧头校验（0xB3B3）
ASCII数字和空格分隔
CRLF作为帧结束标志
缓冲区溢出保护

3.2 性能优化技巧

图像处理优化：
- 使用sensor.set_windowing()缩小处理区域
- 调整帧率与处理需求的平衡
- 优先使用整数运算
通信优化：
- 二进制协议替代ASCII
- 差分发送（仅发送变化量）
- 数据压缩（如使用相对坐标）
控制环路优化：
- 分离视觉更新率与控制更新率
- 预测目标运动轨迹
- 实现运动模糊补偿

3.3 常见问题排查

色块识别不稳定：

检查阈值是否过宽/过窄
确认环境光照一致性
测试关闭自动曝光和增益

舵机响应迟钝：

测量实际PWM信号波形
检查机械结构阻力
验证PID参数是否合理

通信丢包：

降低波特率测试
增加硬件流控
添加重传机制

4. 进阶应用方向

4.1 多目标追踪

扩展基础色块识别系统可支持：

颜色编码的多目标区分
基于运动轨迹的ID保持
目标间相对位置计算

# 多目标处理示例 targets = { 'red': {'threshold': (30, 100, 15, 127, 15, 127), 'pos': None}, 'blue': {'threshold': (0, 30, 0, 64, -128, 0), 'pos': None} } for color, config in targets.items(): blobs = img.find_blobs([config['threshold']]) if blobs: targets[color]['pos'] = max(blobs, key=lambda b: b.pixels()).rect()

4.2 三维定位

通过双目视觉或结构光可增加深度信息：

双OpenMV基线法
- 计算视差
- 三角测量确定距离
- 需要精确校准
激光测距辅助
- 单点TOF传感器
- 与视觉数据融合

4.3 机器学习增强

在OpenMV H7等高性能型号上可运行：

TinyML模型进行物体分类
特征点匹配替代颜色追踪
异常检测算法

# 示例：加载预训练模型 net = tf.load('person_detection.tflite') for obj in net.classify(img): print(obj.label())

在实际项目中，我们发现当目标移动速度超过30cm/s时，基础PID控制会出现明显滞后。这种情况下，引入速度前馈控制能显著改善追踪性能——通过OpenMV计算色块移动向量，预测其下一帧位置，提前发出控制指令。

从玩具舵机到视觉追踪：聊聊OpenMV色块识别背后的图像处理与坐标转换