BOP
- BOP - Benchmark for 6D Object Pose Estimation - 6D 物体位姿估计数据集
- 用于 6D 姿态 / 位姿检测、机器人抓取、工业视觉
- 一般提供如下数据:
- RGB-D图像
- 物体3D模型
- 6D真实位姿(GroundTruth)
- 掩膜/边框标注
- 相机内参
1. LM-O 遮挡物体数据集
基础参数
数据集全称:Linemod-Occluded
- 物体数量:8 个经典日用物件(罐头盒、马克杯、订书机、小瓶子等),源自 Linemod 基础数据集
- 图像总量:1214 张真实 RGB-D 测试图;无官方实景训练图,行业通用规则:原 LM 数据集 15% 画面划分做训练集,剩余做测试
- 图像分辨率:640×480,Kinect v1 采集,深度图有效测距 0.5~3m
场景与难点
- 场景:桌面杂乱摆放,全场景重度物体互相遮挡,单个物体平均遮挡率 35%~70%,是遮挡位姿入门基准;
- 纹理:多数物体表面带有印刷纹理,少数圆柱类物体轴对称;
量化相关特点
圆柱类物体在 FP16 量化后偶发 180° 旋转误差,带纹理物体 FP32/FP16 结果基本一致;
适用场景:论文算法基线评测、遮挡场景位姿预训练。
2. YCB-V 日常物体视频数据集
基础参数
数据集全称:YCB-Video
- 物体数量:21 件 YCB 工业标准化日用品(工具、食品罐、塑料玩具、餐具,出自 50 件 YCB 物体库)
- 图像总量:92 段连续 RGB-D 视频,合计133827 帧,640×480 分辨率;官方配套百万级 Blender 合成训练数据集(YCB-Synth)
- 采集设备:Intel RealSense D400 系列,室内居家桌面环境
场景与难点
- 动态连续画面,物体缓慢位移、多物体堆叠,自然光 + 室内混合光照,阴影变化剧烈;
- 包含金属反光、半透明塑料、哑光材质等多种表面特性;
量化相关特点
大部分物体纹理丰富,FP32/FP16 推理差异小;仅圆柱形罐头偶发角度偏移;
适用场景:机器人抓取算法训练 / 评测、视频序列 6D 位姿跟踪(PoseCNN、DPOD 经典数据集)。
3. T-LESS 无纹理工业零件数据集
基础参数
数据集全称:Texture-Less
- 物体数量:30 款精密工业五金零件(卡扣、套筒、法兰盘、异形金属件),全物体无表面印刷纹理、大量轴对称 / 中心对称结构
- 图像总量:每个物体 1296 张实拍图,全数据集合计≈39000 张 RGB-D,多视角环绕拍摄
- 采集环境:实验室标准光源 + 多角度补光,零件密集堆叠
场景与难点
- 无纹理 + 几何对称是最大痛点:物体外形高度雷同,仅靠几何轮廓区分;大量回转体零件绕轴旋转 180° 后视觉完全一致;
量化相关(重点对应你的 180° 偏差)
本数据集是 FP16 量化角度跳变最高发数据集:半精度浮点数值舍入丢失微小几何特征,对称零件极易出现 ±180° 旋转预测错误,FP32 全精度因数值冗余可保留细微特征,结果稳定;
适用场景:工业无纹理零件质检、严苛对称物体位姿算法验证。
4. ITODD 高精度金属工业零件数据集
基础参数
数据集全称:Industrial Textureless Object Detection Dataset
- 物体数量:28 个高精度金属机械零部件(轴承座、精密冲压件、阀件,MVTec 官方出品工业零件)
- 图像总量:实景测试图不足 1000 张,无配套官方实景训练集,仅靠合成数据做训练;
- 图像特征:金属镜面高光、强反光,环境为工厂工作台杂光
场景与难点
- 金属高光造成局部深度失效、表面像素过曝;过半零件为回转对称结构;
量化特点:金属反光 + 对称双重问题,FP16 推理相比 FP32 更容易发生 180° 周向旋转偏差;
适用场景:汽车零部件自动化质检、精密金属件视觉定位。
5. IC-BIN 工业塑料料盒分拣数据集
基础参数
数据集全称:Industrial Containers Binning Dataset
- 物体数量:8 款方形 / 圆柱形工业塑料收纳料盒,BOP 评测固定选取其中 3 个零件做基准测试
- 图像总量:3 组测试序列,合计 150 张 RGB-D 实拍图;无原生训练数据,依赖合成图训练
场景与难点
- 料箱内杂乱嵌套堆叠,箱体大面积互相遮挡;纯色注塑塑料零纹理、高度轴对称;
量化特点:纯色对称塑料件 FP16 量化后轮廓特征精度下降,绕中心轴 180° 翻转是高频错误;
适用场景:仓储自动化料盒分拣、流水线箱体抓取定位。
6. HB 居家杂乱物体数据集
基础参数
数据集全称:HomebrewedDB
- 物体数量:33 个混合物件:17 件玩具 + 8 件家用厨具 + 8 件小型工业零件,物体尺寸跨度大(2cm~25cm)
- 图像总量:13 个拍摄场景,共 4420 张图;BOP 官方拆分 3 组 ×100 张作为标准测试集,剩余用于自验证
场景与难点
- 室内多变自然光,近距离微距拍摄,物体密集重叠、明暗阴影剧烈;混合对称 / 非对称物体;
量化特点:非对称纹理物件 FP32/FP16 基本无差,圆柱对称小件存在少量 180° 误差;
适用场景:通用杂乱居家环境机器人抓取算法测试。
7. TUD-L 灯具零部件光照测试数据集
基础参数
数据集全称:Technische Universität Darmstadt Light Dataset
- 物体数量:3 款照明灯具金属 / 塑料配件,全部为回转轴对称结构(圆筒、法兰底座)
- 图像总量:多序列动态拍摄,8 种差异化光照环境(强光 / 弱光 / 侧逆光 / 顶光),物体画面内缓慢移动
场景与难点
- 金属壳体反光 + 圆柱全对称,不同光照下物体轮廓形变明显;
量化特点:全对称结构,FP16 半精度量化后几乎必然出现绕轴 180° 预测偏差,是验证量化鲁棒性专用数据集;
适用场景:灯具生产线自动化装配定位、光照鲁棒性测试。
Reference
BOP
1. LM-O 遮挡物体数据集
基础参数
数据集全称:Linemod-Occluded
场景与难点
量化相关特点
圆柱类物体在 FP16 量化后偶发 180° 旋转误差,带纹理物体 FP32/FP16 结果基本一致;
适用场景:论文算法基线评测、遮挡场景位姿预训练。
2. YCB-V 日常物体视频数据集
基础参数
数据集全称:YCB-Video
场景与难点
量化相关特点
大部分物体纹理丰富,FP32/FP16 推理差异小;仅圆柱形罐头偶发角度偏移;
适用场景:机器人抓取算法训练 / 评测、视频序列 6D 位姿跟踪(PoseCNN、DPOD 经典数据集)。
3. T-LESS 无纹理工业零件数据集
基础参数
数据集全称:Texture-Less
场景与难点
量化相关(重点对应你的 180° 偏差)
本数据集是 FP16 量化角度跳变最高发数据集:半精度浮点数值舍入丢失微小几何特征,对称零件极易出现 ±180° 旋转预测错误,FP32 全精度因数值冗余可保留细微特征,结果稳定;
适用场景:工业无纹理零件质检、严苛对称物体位姿算法验证。
4. ITODD 高精度金属工业零件数据集
基础参数
数据集全称:Industrial Textureless Object Detection Dataset
场景与难点
量化特点:金属反光 + 对称双重问题,FP16 推理相比 FP32 更容易发生 180° 周向旋转偏差;
适用场景:汽车零部件自动化质检、精密金属件视觉定位。
5. IC-BIN 工业塑料料盒分拣数据集
基础参数
数据集全称:Industrial Containers Binning Dataset
场景与难点
量化特点:纯色对称塑料件 FP16 量化后轮廓特征精度下降,绕中心轴 180° 翻转是高频错误;
适用场景:仓储自动化料盒分拣、流水线箱体抓取定位。
6. HB 居家杂乱物体数据集
基础参数
数据集全称:HomebrewedDB
场景与难点
量化特点:非对称纹理物件 FP32/FP16 基本无差,圆柱对称小件存在少量 180° 误差;
适用场景:通用杂乱居家环境机器人抓取算法测试。
7. TUD-L 灯具零部件光照测试数据集
基础参数
数据集全称:Technische Universität Darmstadt Light Dataset
场景与难点
量化特点:全对称结构,FP16 半精度量化后几乎必然出现绕轴 180° 预测偏差,是验证量化鲁棒性专用数据集;
适用场景:灯具生产线自动化装配定位、光照鲁棒性测试。
Reference