据《汽车新闻》报道,日前,特斯拉机器人官方X账号Tesla Optimus更新了一个介绍视频。该视频展示了特斯拉人形机器人Optimus(擎天柱)在控制能力和执行能力方面取得的新进展。Optimus现在能够仅仅依靠视觉对物体进行分类,甚至还能完成瑜伽动作。
特斯拉方面表示,Optimus神经网络训练是完全“端到端”的,即输入视频后,输出控制信号。这类似于特斯拉自动驾驶FSD V12开发过程中的神经网络训练:处理所有输入信号,然后输出驾驶决策。这中间的过程由神经网络全权处理。
emc易倍app
《汽车新闻》指出,Optimus在感知、大脑、运动与控制方面具有多个亮点:在感知方面,通过视觉感知及关节位置编码器,Optimus可自动校准四肢,并精准定位四肢的空间位置。在大脑方面,凭借纯视觉技术及完全本地部署的神经网络,Optimus可以迅速适应环境并完成多项任务。它将蓝色与绿色积木分拣到对应颜色的托盘中,即便在抓取积木的过程中,有人在一旁将积木打乱,Optimus也可以立即调整并适应新的环境,继续分拣积木。与此同时,Optimus还可以将翻倒的积木摆正,并执行“打乱分类好的积木”等新任务。在运动控制能力方面,Optimus可以精准抓取物品,在做出动作时,该机器人的四肢、躯干、手指动作都极为灵活,并且与人类接近。此外,Optimus还能够做出多个单腿支撑的运动拉伸动作,并能在拉伸的同时emc易倍app,保持躯干平衡。
emc易倍app
《福布斯》认为,人形机器人是非常明确的下一个风口,也是人工智能技术的主要应用载体之一。对于特斯拉而言,汽车只是机器人项目中很小的一部分,而真正的庞大应用在于人形机器人,包括从简单的工业领域到生活和医疗领域。但是目前,特斯拉面临着两大挑战:一是人形机器人物理躯体的技术突破,因为目前的人形机器人并不具备真正取代人类职业的能力,原因在于物理躯体的精细化程度不够;二是人形机器人的超级大脑,也就是人工智能部分也是摆在特斯拉面前现实的挑战。
目前,特斯拉FSD与人形机器人底层模块已经实现了一定程度的算法复用。FSD的算法主要依赖于神经网络和计算机视觉技术,它们均会对机器人的感知、决策和控制技术迭代起到重要作用,自动驾驶与人形机器人业务有望产生强协同效应。
有了强大的算法,还需要有强大的算力作为支撑。而特斯拉在前不久量产的Dojo就是特斯拉为AI帝国所准备的“基石”。Dojo是特斯拉自研的超级计算机,可利用海量视频数据,完成“无人监管”的数据标注和训练,是特斯拉为了提升自动驾驶和智能机器人等人工智能产品的性能而开发的一款强大的计算平台。
从字面意思来看,Dojo意为“道场,武馆”,这也应和了它的意义——特斯拉为AI打造的修行场。在2021年的AI Day上,特斯拉就已发布Dojo超级计算机,但当时尚未完善,只有第一个芯片及训练块。
《底特律时报》指出,Dojo的最终落地单位是一个名为ExaPOD的超级计算集群,它集成了3000颗基于7nm制程工艺的D1芯片,包含120个训练瓦片,最终能够实现高达1.1EFlops(每秒100亿亿次浮点运算)峰值算力。作为对比,一张3090Ti显卡的算力约为40TFlops(每秒10000亿次浮点算力),相差6个数量级。
需要注意的是,作为超级计算集群的ExaPOD并不是这台超级计算机的最终形态:从理论上说,它完全可以根据特斯拉的更大计算需求进行数量上的扩展,从而堆出更高的AI算力性能。
实际上,根据特斯拉在今年6月份发布的算力发展规划,Dojo将在明年第一季度成为全球排名前五的算力设施,并将在明年10月份达到100EFlops的超级算力。
而如今,Dojo超级计算机已投入生产,预计到2024年有望成为全球最先进的5台计算机之一。在跑自动标注算法测试、预测汽车周围所有物体空间占用率的神经网络模型Occupancy Networks时,相比英伟达A100,Dojo能实现性能倍增。
据路透社报道,以亚当姆·乔纳斯为首的摩根士丹利分析师在一份9月10日发布的报告中表示,特斯拉的Dojo超级计算机可能会推动Robotaxi及其软件服务的普及,从而使特斯拉的市值跃升近6000亿美元。
摩根士丹利分析师在报告中写道,特斯拉Dojo可以开辟新的潜在市场,“远远超出以固定价格销售汽车的范围。”“如果Dojo可以帮助汽车‘看到’和‘做出反应’,那么还能开拓哪些市场呢?想象一下,任何带摄像头的设备都可以根据它的视野做出实时决策。”
摩根士丹利将特斯拉网络服务业务的收入预期从此前的1570亿美元上调至2040年的3350亿美元。乔纳斯预计,到2040年,该部门将占特斯拉核心收益的60%以上。特斯拉未来12个月的预期市盈率为57.9倍,远高于美国传统汽车制造商福特汽车的6.31倍和通用汽车的4.56倍。