一、深夜的部署报错
上周三凌晨两点,产线控制室的工控机屏幕上跳出这么一行错误:
TensorRT ERROR: INVALID_ARGUMENT: getPluginCreator could not find plugin: RTDETRDecoder_TRT version: 1空调嗡嗡作响,产线已经停摆半小时。
这是RT-DETR改进版在产线环境部署时遇到的第一个真实挑战——模型在训练时表现完美,精度达到99.2%,但一到TensorRT推理环节就卡在插件注册这一关。
工业部署从来不是torch.save()加torch.load()那么简单,特别是当你对RT-DETR的Decoder层做过深度定制之后。
二、从训练到推理的“暗礁”
我们的改进版RT-DETR在Backbone里插入了自研的轻量化注意力模块,Decoder层也重写了跨尺度融合逻辑。
训练脚本跑得顺畅,导出ONNX时却开始报警告:
# 这是最初导出ONNX的代码片段torch.onnx.export(