业界首个!大规模多相机通用物品场景数据集MessyTable
-

作者 | 商汤、南洋理工大学
编辑 | 陈大鑫
众所周知巧妇难为无米之炊,在如今深度学习大行其道的时代,一个数量大、质量好的数据集犹如一块璞玉,就等着算法去雕刻。
今天介绍的就是来自商汤与新加坡南洋理工大学联合制作的大规模多相机通用物品场景数据集MessyTable,MessyTable包括5500+ 手工设计的场景,共计5万多张图片和120万个密集标注的检测框,其对应论文已被ECCV 2020接收。
针对现实生活中多相机系统应用的难点,如相似相同的物品、密集遮挡、大角度差等问题,我们设计了大量真实、有趣又极富挑战的场景:围绕着混乱的餐桌(Messy Table)部署了多个视角的相机,其任务是关联不同相机视角中的实例。看似简单任务却要求算法能够分辨细微的外观差别、从邻近的区域获取线索以及巧妙地使用几何约束等。我们同时提出了利用多相机场景下周围信息的新算法。我们希望MessyTable不仅可以作为极富挑战的基线为后续研究指明方向,也可以作为高度真实的预训练源为算法落地开辟道路。

-

图1:MessyTable中的一个场景示例(只可视化了4个视角中的5个物体)
本文我们以7次问答的方式总结了我们的工作:
-

图2:MessyTable中的各种挑战:a)部分遮挡;b)完全遮挡;c)相似物体;d)相同物体;e)和f)复杂的堆叠
3
MessyTable的规模有多大?
抖音内测云游戏 有望重塑手游产业链格局(股)
抖音内测云游戏 有望重塑手游产业链格局(股)…
我是如何连续抓到几只涨停股的
我是如何连续抓到几只涨停股的…


















