福大大吧 关注:10贴子:1,004
  • 0回复贴,共1

yolo v8.3.241:macOS CoreML 推理加速、ExecuTorch 导出稳定性

只看楼主收藏回复

yolo v8.3.241:macOS CoreML 推理加速、ExecuTorch 导出稳定性提升与边缘硬件支持扩展
一、版本概述
yolo v8.3.241 是一个以后端性能优化与兼容性增强为核心的版本更新,重点围绕 macOS 平台的 ONNX Runtime 推理加速、ExecuTorch 导出的稳定性、边缘硬件支持扩展以及可视化与文档体系的完善展开。该版本在不改变现有 CUDA 行为的前提下,为 Apple 硬件用户和嵌入式部署场景带来了明显收益。
二、macOS 上 ONNX Runtime 的 CoreML 优先策略
在 macOS 环境中,当使用 device="mps" 进行推理时,yolo v8.3.241 现在会优先使用 CoreML 执行提供器,而不是回退到 CPU。新的执行提供器选择顺序为:
CUDA > CoreML(MPS) > CPU
同时,日志输出更加清晰,能够明确提示当前实际使用的执行提供器,方便排查和性能分析。
此外,IO Binding 现在仅在被支持的情况下使用(例如 CUDA 场景),避免了在 CoreML 执行时可能引发的兼容性问题。
在实际应用中,这一改动可显著提升 macOS 上的推理性能,在部分测试场景中,单次推理耗时可从约 20 毫秒降低至 9 毫秒左右,接近 2 倍性能提升。
三、ExecuTorch 导出稳定性改进
针对 ExecuTorch 导出过程中偶发的失败问题,本版本进行了多项修复与优化:
1. 在导出路径中对 NumPy 版本进行了限制,固定为不高于 2.3.5,以规避新版本 NumPy 与 CoreML 工具链之间的已知不兼容问题。
2. 清理了导出流程中冗余的 torch 导入,使导出逻辑更加简洁。
这些调整显著降低了在 CoreML 与移动端部署场景中出现“无法解释的导出失败”概率,使 ExecuTorch 的使用体验更加稳定可靠。
四、Rockchip 硬件支持扩展
yolo v8.3.241 新增对 Rockchip RV1126B 芯片的支持,并在代码与文档中明确标注该处理器为受支持目标。
这意味着用户可以更直接地将 Ultralytics 模型导出并部署到 RV1126B 平台,无需额外的自定义补丁或修改配置,从而拓展了在边缘计算设备上的应用范围。
五、2 通道图像可视化支持增强
在可视化方面,Annotator 现已支持 2 通道的 numpy 图像数据。
当输入为 2 通道图像时,会在绘制与保存之前自动转换为 3 通道格式,确保标注流程正常运行。这一改进使得非标准图像数据(如光谱数据或自定义传感器输入)在推理与可视化环节中更加顺畅,与 1 通道、3 通道以及多光谱数据的支持保持一致。
六、TensorRT 与 TensorFlow 后端清理
本次更新对推理后端相关代码进行了进一步梳理:
1. TensorFlow SavedModel 的加载路径统一使用标准的加载方式,逻辑更加清晰。
2. TensorRT 引擎解析过程进行了重构,更好地处理不同 TensorRT 版本下的动态形状与数据类型差异。
这些改动提升了不同版本环境下后端行为的一致性与可维护性。
七、文档与使用示例优化
文档层面也进行了多项同步更新:
1. SAM 3 相关示例修正了保存参数的使用方式,明确应在初始化阶段进行配置。
2. Sony IMX500 相关示例代码进行了整理与排版优化。
3. 自动标注、解决方案参数、跟踪与可视化参数、验证参数等文档描述更加准确、易读。
4. 文档站点的工具与组件进行了版本更新,整体使用体验更加顺畅。
八、版本总结
yolo v8.3.241 是一次以性能与稳定性为导向的重要更新。
它在 macOS 平台显著提升了 ONNX Runtime 推理速度,在移动与嵌入式场景中增强了 ExecuTorch 导出的可靠性,同时扩展了对边缘硬件和特殊图像数据格式的支持。配合后端清理和文档改进,该版本在训练、推理与部署的整体体验上更加成熟、可控,适合希望在多平台环境中稳定使用 YOLO 的用户升级采用。


IP属地:北京1楼2025-12-24 06:31回复