meta|Meta开放Project Aria Pilot数据集，未来将开发实时3D地图 3d地图|ar眼镜|ai

文章图片

文章图片

文章图片

文章图片

【meta|Meta开放Project Aria Pilot数据集，未来将开发实时3D地图】

文章图片

文章图片

为了训练属于AR眼镜的视觉助手、提升AR定位能力， Meta早在2020年就开始通过Project Aria项目收集第一人称视频数据，用来训练AR眼镜的计算视觉算法。 Meta表示：现有的计算机视觉算法主要是根据第三人称视角的照片和视频训练而成，因此总是以旁观者角度去感知周围环境。如果要让机器人、AR眼镜像人一样感知世界，那么将需要使用第一人称数据来训练，也就是人在执行各类任务时眼前看到的画面。
历经两年时间， Meta在新加坡、英国、美国等地陆续收集了大量第一人称视频数据。项目共有3000人参与数据收集，包括Meta员工、承包商、有偿的外部参与者等等，项目合作方包括卡内基梅隆大学、新加坡国立大学、宝马等等。数据采集环境包括Meta办公室、获得批准的私人住宅、公共场所。

最近，该公司将在美国拍摄的数据面向AI、ML科研人员开放，以加速机器感知和AI技术发展。 Meta表示：发布Aria Pilot数据集的目的是，向外部科研人员展示一种可重复的研究基准，目的是推动第一人称计算机视觉、场景感知AI/ML算法的发展。

Aria Pilot数据集
据青亭网了解，这个数据集名为Project Aria Pilot ，其中包含了159段第一人称视频，累计时长7小时，分别拍摄于每个5个地点。视频中包含了各种日常生活场景，比如洗碗、开门、做饭、在客厅使用手机、玩游戏、锻炼等等。除此之外，还包括利用多视角动捕系统拍摄的桌面交互数据，其中包含了人与物体交互的视频。此外， Aria Pilot数据集中还包含多个由演员拍摄的全天候视频，记录了Aria眼镜全天传感/捕捉环境数据的效果。

实际上， Meta此前也曾推出过开源第一人称视频数据集Ego4D ，区别是Ego4D采用头戴摄像头拍摄，设备不限于GoPro ，以及Vuzix Blade等AR/拍照眼镜。相比之下， Project Aria Pilot真正基于Meta研发的眼镜设备拍摄，其拍摄角度、高度将更好的满足训练Meta AR眼镜助手的需求。
值得注意的是， Aria Pilot是一个匿名的视频数据集，为了隐私安全将人脸、车牌等关键信息进行了模糊处理。

Meta在原始视频基础上，不仅去掉了隐私信息，还加入了自动和手动标记/注释，帮助机器学习/AI模型理解场景的失控参考框架和上下文信息。

为了帮助AI理解同一个参考框架中多个用户的姿态/运动， Aria Pilot数据集还将同一场景中捕捉的数据与这个参考帧对齐，目的是允许算法共享该场景的上下文信息。同时， Project Aria Pilot数据集还将视频数据的时间线对齐，也就是说不同的设备可共享同一时间捕捉的视频数据，这将有望推动多人共享AR效果。

meta|Meta开放Project Aria Pilot数据集，未来将开发实时3D地图

相关经验推荐

新鲜猪血保存技巧图解新鲜猪血保存技巧

枸杞子受潮发粘怎么办枸杞子回潮了还能吃吗

海底生物简笔画

使命召唤先锋多人模式怎么玩？多人模式玩法前瞻攻略

各种饲料原料的营养价值表狗饲料的种类与营养价值

说话抬杠是什么意思抬杠是什么意思

1997年属牛几点出生最好几点出生的属牛人命好，属牛的哪天出生最命苦

金牛座的弱点和软肋金牛座的人性格特点，金牛座女生8个性格脾气

2023温州瓯海区新居民子女积分入学需要具备什么条件?

分类汇总的正确步骤 Excel分类汇总的正确步骤介绍

中原地区指的是哪里中原地区指的是哪里地图

让男人更自信的6种养肾食品让男人补肾吃什么

贝加庞克|海贼王1025话：机械大熊、桃之助的蛟龙，贝加庞克第一科学家实锤

世界环境日是哪天哪月世界环境日是哪天

35岁男人要开始眼部保养

海贼王|海贼王1053话：基德和罗不配当四皇，他们缺少什么？未来还有机会

《启航当风起时》剧情简介，《启航当风起时》原著小说结局是什么

八珍糕的标准配方如何制作八珍糕

古诗个签

苹果|苹果从来不飙配置，也从不关注配置，即使一般的配置也能卖好价钱，为啥没人喷