Google 近日发布了全新的移动端 3D 识别方案 Objectron。
Objectron 可在 2D 图像中发现物体并通过 AI 模型估算其位置、方向和尺寸。Google 表示,Objectron 对机器人技术、自动驾驶汽车、图像检索和 AR 技术影响深远,例如,其可以帮助工厂车间的机器人实时规避障碍。
目前,跟踪 3D 对象是一个棘手的问题,尤其是在处理有限的计算资源时。由于缺乏数据以及物体的外观和形状的多样性,当仅有的可用图像为 2D 时,情况会变得更糟。
为此,Objectron 研发团队开发了一种图片标记工具,该工具可以通过分屏视角显示 2D 视频帧,支持标记者使用分屏视图显示 2D 视频帧来标记对象的 3D 边界框(即矩形边框)。这些 3D 边界框将叠加在点云数据、摄像头画面和识别到的平面上。