三维物体多视角检测旨在未知背景环境中,在任意视角下,快速检测出目标物体,并能得到其位置。随着大数据时代的到来,三维物体检测技术有着很广泛的应用前景,如机器人避障,目标跟踪,人脸检测,车辆识别,医学图像处理等。
BHID数据库(Beihang Instance Detection Dataset)采用自己拍摄的图片作为训练数据,拍摄的物品包括容器类和模型类两大类物品,其中,容器类包括罐子,盒子两类,模型类包括小车和飞机两类物品,选用的实例物体形状颜色差异较大。
对于每一个实例物体,我们采用三种不同的尺度,两种不同的光照条件,在白背景下进行拍摄。将物体放置在背景布前的转台上(转速为25s一圈),距离转台一米处放置摄像机,拍摄物体旋转360度的视频序列,每帧图像视角相差0.58度。最终建立了一个包含4类物体,共7392张带位置标注和掩模的图片数据库。

为了测试检测算法,我们同样制作了检测数据集。该数据集所提供的检测视频,分别对应每一个目标样本有四个视频序列,视频是由人手持摄像机,在日常工作场景中拍摄得到的。拍摄场景包括光照变化,遮挡,视角变化,目标尺度变化等多种情况,对检测任务造成了一定的挑战。
训练集:
car_train.rar
box_train.rar
helicopter_train.rar
测试集:
car_test.rar
box_test.rar
helicopter_test.rar