当 Optimus (“擎天柱”)人形机器人在发布会现场登场,这意味着马斯克又一 flag 得到实现。
“我们现在展示的机器人是我们即将投入使用的机器人”,马斯克表示,有信心以较低的成本实现量产,价格预计不到 2 万美元(折合人民币 14 万元),低于 Model 3 ,最终产量将达到数百万台,
除了带来擎天柱人形机器人,在 AI Day 上还公布了 FSD 以及 Dojo 超级计算机的相关进展。
可以说,这是一场汇聚了多项硬核技术的发布会。
能搬能抗的“擎天柱”,预计售价约 2 万美元
擎天柱机器人身高约 170cm ,重 73 公斤,搭载 2.3kWh 的电池组,在特斯拉 SoC 上运行,具备 Wi-Fi 和 LTE 连接。
目前擎天柱全身最大实现 200 度自由活动维度,手部具备最大 27 度活动维度。静坐时用电功率为 100 W,快走时达到 500W。
在 AI DAY 现场,擎天柱能够在没有外部辅助的前提下缓缓走向舞台,并做了一个舞蹈动作;据悉,擎天柱是在今年 4 月才迈出了第一步,而仅仅不到半年,其已经能够实现独立行走,且移动速度有了明显提升。
在视频演示中,擎天柱已经能够执行搬运、浇水等操作;这主要得益于其在感知、执行、运动平衡等方面的技术设计。
基于模仿人类的关节和肌肉工作方式,特斯拉为擎天柱开发了 6 种不同的执行机构。例如,该膝盖由多个具有优化关节的机械执行器构建,手部也类似于人类手掌,手指有 6 个执行器和 11 个自由度,在关节、指尖触点处装有传感器,能够单手拿起 20 磅重的物品。
在平衡性上,工程师通过运动计划和控制堆栈开发了全新的机器人运动模型,提前规划好预设路线输入到系统,在系统中绘制出机器人的下一个落脚点,然后再让执行器执行,与机器人重心联动,由此保持行动的平衡性。
在感知规控上,擎天柱机器人采用了的人工智能软件,以及类似高级驾驶员辅助功能的传感器,具有与 FSD 测试版相同的技术,使用摄像头输入数据,以神经网络进行计算。
Autopilot 工程总监 Milan Kovac 表示,为汽车开发辅助驾驶尤其是计算机视觉系统方面的经验,可以帮助他们让人形机器人适应实际应用场景。
对于未来的研发方向,工程师表示正在开发一种特殊的电池和制动器,努力降低擎天柱机器人的功耗和零件数量,让机器人一次充电即可运行一整天。
事实上,马斯克在去年 AI DAY 上就宣布了“机器人”,并表示将彻底改变公司的装配线和制造业务,但当时仅是停留在概念版本。
随着擎天柱人形机器人的到来,马斯克再立 FLAG——表示最早在明年实现生产,产量将达数百万台,预计每台低于 2 万美元。
“预计在 3 到 5 年内,消费者将能够购买擎天柱人形机器人。”马斯克在采访中说道。
值得一提的是,在 AI DAY 进行过程中,马斯克还特意下台发了一条推文,表示“ Optimus 机器人肯定会有猫女版。”
FSD 应用规模达 16 万,2023年前将建造第一台Dojo ExaPod
除了带来擎天柱人形机器人,在 AI Day 上还公布了 FSD 以及 Dojo 超级计算机的相关进展。
Autopilot 负责人 Ashok Ellaswamy 表示, FSD 在车辆上的应用已从去年的2000 扩充至 16 万。
截至目前,已有 35 个 FSD 软件版本。按照马斯克的说法,最新版本 FSD 将于今年年底在北美推出,受部分国家政策监管和测试障碍的影响,其它市场还需要视情况而定。
在演示环节中,的自动驾驶仪运动规划技术负责人 Pail Jain 展示了 FSD 在实际应用中的决策升级。
例如,在左转进入十字路口时,可以根据轨迹预测算法计算出多种可能的运动轨迹,依据车道线、行人、路况等多种交通因素筛选掉不安全、不合规的轨迹,选择一条不会对行人、障碍物进行近距离接触的轨道。不仅如此,FSD 每个操作的运行时间已缩短到 100 微秒。
这其实得益于 FSD 系统对巨量的真实道路数据学习以及数据处理能力的提升。
据工程师介绍,已经开发了一种自动标记技术,每天能处理 50 万个视频片段,尽管最终也要由让人类进行复核,但工作效率有了大幅提升。
另外,在其超级计算机上训练人工智能软件,然后通过 OTA 更新至用户车辆,不仅如此,还内置了一个虚幻引擎的模拟器,用于改进自动驾驶仪。
对于采集到的大量数据,用一台大型英伟达 GPU 超级计算机和一个数据中心存储 30PB 的存储素材,但这也难以满足日益增长的数据储存需求。
发布会上,表示正在用自研的 D1 芯片打造超级计算机集群,Dojo 超级计算机的单个训练模块由25 块 D1 集成,仅用四个计算模块就能够取代由 4000 个 GPU 组成的 72 个 GPU 机架。
D1 芯片是特斯拉自主研发的神经网络训练芯片,在 2021 年 AI DAY 上发布,搭载了 500 亿个晶体管,热设计功耗(TDP)达 400W,FP32 精度下的算力峰值能够达到 22.6 TFLOPS。
作为对比,英伟达 A100 Tensor Core GPU 晶体管数量 542 亿颗,热设计功耗同样为 400W,而 FP32峰值算力仅有 19.5TFLOPS。
据方面宣布,其计划在 2023 年前在美国加州的 PaloAlto 建造第一台 Dojo ExaPod,总共建造 7 台。
团队介绍,Dojo 的建造将发福提高效率,原本花费数月的工作将缩减至一周完成。不难预见,系统构建成功后,Dojo 超级计算机预计将成为世界上最强大的超级计算机之一。
对于 DOJO 的商业模式,马斯克在采访中表示,DOJO 不仅是自用产品,也会考虑 AWS 一样以服务形式对外商用。
从今年的 AI DAY 来看,擎天柱机器人的出现无疑掀起了会场高潮。仅用一年时间,从存在于概念形式的 PPT 到真正造出实体机器人,足以想见特斯拉强大的 AI 技术研发能力。
不仅如此,2 万美元左右预计售价、三年量产、五年商用的 FLAG 更是在科技圈内激起一阵浪潮。不过,鉴于马斯克在自动驾驶技术应用上频频放鸽子,机器人能否如期实现量产和商用还有待考证。
另外,围绕智能驾驶,在介绍 FSD 的进展时将大量时间用于阐述技术迭代和更新,不难看出,已经开始着手解决自动驾驶的长尾问题,而这也是关乎安全的关键之处。
总的来看,相比机器人的惊艳亮相,FSD 部分稍显亮点不足,但从另一角度来看,这也从侧面反映要实现自动驾驶并非易事,即使强大如,也要经历艰难的爬坡阶段。