6.4.10 YOLO-World 物体检测
YOLO-World 模型简介
YOLO-World 是腾讯 AI Lab(AI 实验室)提出的一种实时 开放词汇(Open-Vocabulary)零样本物体检测 模型,首次发表于 2024 年初,它基于快速高效的 YOLO 系列(尤其是 Ultralytics 的 YOLOv8)架构,并结合了视觉–语言(Vision-Language)融合技术,实现无需针对每个类别单独训练即可检测任意描述的对象
本示例展示如何基于 SpacemiT 智算核,使用图片或视频流作为输入,执行 YOLO-World 模型的推理,并通过 ROS 2 发布检测结果。
环境准备
安装依赖
sudo apt install python3-venv python3-pip ros-humble-camera-info-manager \
ros-humble-image-transport python3-spacemit-ort
导入 ROS2 环境
source /opt/bros/humble/setup.bash
准备虚拟环境
python3 -m venv ~/test3
source ~/test3/bin/activate
pip install -r /opt/bros/humble/share/jobot_yolo_world/data/requirements.txt
export PYTHONPATH="$HOME/test3/lib/python3.12/site-packages":$PYTHONPATH
图片推理
准备图片
cp /opt/bros/humble/share/jobot_yolo_world/data/test2.jpg .