此屏幕截图显示了Scoop中的视频帧,这是Voxel 51用于按内容组织视频的工具。车辆通过类型,品牌和颜色进行识别。Voxel51的平台执行AI视频处理,识别视频中的对象和动作。图片来源:Voxel51
密歇根大学创业公司Voxel51今天推出了其旗舰产品 - 一个软件平台,旨在使其更容易,更快速,更经济地获取未开发的视频数据潜力。
该软件面向那些使用视频但却难以从中提取所需信息的公司。虽然视频是一种丰富的数据形式,但由于其复杂性,大文件大小以及缺少定义单位(如单词),因此很难进行分析和搜索。
Voxel51已着手通过其视频分析平台和开源软件库克服这些障碍,这些软件库共同实现了最先进的视频识别。它识别并跟踪每个剪辑中的对象和动作。正如联合创始人布莱恩摩尔所说:“我们将视频转化为价值。”
他们最初的焦点,特别是与无人驾驶汽车相关的,是关于道路场景和公共安全的录像。在这两种应用中,相机都是关键传感器,但是人类处理数据非常耗时,以便计算机可以对其进行分析。更快,更自动化的处理应该加速开发更好的计算机视觉。
“这是第一个也是唯一一个公开可用的道路场景理解平台,”电气和计算机工程教授联合创始人Jason Corso说。“汽车公司正在建造它们,但是在专有的孤岛中。我们的任何人都可以使用和尝试。
“通过使视频处理民主化和访问大型带注释的图书馆,我们使年轻的初创公司能够与资源丰富的团队竞争,这些团队致力于无人驾驶汽车和大公司的其他计算机视觉应用。”
在今天的无人驾驶车辆中,感知算法是利用机器学习技术产生的,这意味着他们需要接受带有对象识别和跟踪注释的视频剪辑的训练 - 例如,行人,车辆,灯柱,标志和交通灯。
此屏幕截图显示了Scoop中的视频帧,这是Voxel 51用于按内容组织视频的工具。通过夹子标记和跟踪车辆,标志和行人。Voxel51的平台执行AI视频处理,识别视频中的对象和动作。图片来源:Voxel51
在对系统进行训练之前,必须对视频进行注释 - 通常由人进行注释。这就是为机器学习算法创建训练数据耗时且昂贵的原因。
使用Voxel51,用户可以依靠平台的AI软件来加速这一过程。然后,可以搜索非常特定的视频内容 - 例如,狗步行者。使用开源库,一些用户可以访问比他们能够获得的更大的数据集。
“显然需要Voxel51在自动化车辆领域开发的那种尖端AI技术,我们对已经取得的进展充满热情,”UM Tech Transfer许可总监Bryce Pilz说。 。
“目前,Voxel51技术正在帮助Mcity的自动驾驶汽车了解他们在路上看到的东西,以便他们做出更好的决策,我们毫不怀疑我们最终会看到这些创新进入生产车辆,使它们更安全,更高效,更可靠。“
除了将强大的AI 视频分析交付给开发人员之外,Voxel51的主要引擎差异化因素是它们的处理在帧间的时空体积中运行,它们可以捕捉运动和外观随时间的变化。换句话说,他们不是看像素而是看体素。
该公司已筹集了200万美元的风险投资。Corso说,它位于安娜堡,拥有15名员工,并且正在招聘更多人。
“自从现代计算开始以来,人类一直在适应计算机。我认为这是计算机开始适应我们的时间,这涉及对视觉世界的更深入理解,”Corso说。“Voxel51的新平台是朝着这个方向迈出的重要一步。我们希望新公司能够轻松,省力地增加视觉感知功能。”