当自动驾驶遇上大模型(自动驾驶模型都有哪些)

  说起AI技术,自动驾驶与大模型是两大重要议题。而在“AI热潮”催化之下,作为AI关键载体之一的机器人将这两条主线汇聚至一处,指向了AI下一个浪潮“具身智能”,即能理解、推理、并与物理世界互动的智能系统。

  特斯拉不久前披露Optimus人形机器人最新进展,机器人展现出不带辅助的行走能力,且能精准做到电机转矩控制,产品力的进步也被看作产业化渐近的信号。值得注意的是,Optimus内置FSD芯片、与汽车共用AI系统,毕竟正如马斯克所说,“我们的汽车差不多算是有轮子的半感知机器人。”

  与此同时,相继面世的大模型则进一步赋予了机器人更智慧的“大脑”与“感官”

  例如Meta的SAM(Segment Anything Model)模型可分割图像中的一切对象,向多模态更进一步的同时,一举突破了机器视觉底层技术;还有谷歌联合柏林工业大学团队发布的“史上最大‘通才’AI模型”PaLM-E,只需要一句简单指令,便可实现更为自主的机器人控制,使得机器人的行动不再需要仰赖人类的手写指令与代码。

  可以看到,这场由ChatGPT引起的“AI狂欢”中,技术大跨步迈进的,并不只有能在线上与用户自由交流的聊天机器人,更有线下能与现实世界切实交互的实体机器人们——此番热潮赋予了后者更聪明的大脑、更敏锐的眼睛以及更具行动能力的躯体

  特斯拉“擎天柱”:站在机器人、AI、自动驾驶的交汇点

  在人形机器人行业中,特斯拉的Optimus(擎天柱)可以说得上是行业“领头羊”。

  特斯拉研发人形机器人的初衷,便是最大程度上利用特斯拉在造车和自动驾驶方面的优势,特别是自动驾驶研发过程中积累的算法经验、数据驱动能力、AI芯片能力、模型训练能力等。开源证券指出,智能是特斯拉投入机器人领域最核心的竞争力。

  人形机器人与特斯拉自动驾驶汽车都遵循“感知-认知-决策-执行”运行逻辑。而正如上文提到的,特斯拉机器人与汽车共用FSD系统。该系统由数据、算法、硬件构成整体架构,其迭代路径则是通过不断升级算力的硬件来支撑不断升级的算法,从而处理不断增加的海量数据。

  image

  其中,分析师指出,数据方面,特斯拉FSD系统已有海量数据储备,开发人形机器人可节省大量前期费用。

  感知方面,特斯拉FSD系统拥有非常强大的纯视觉感知方案,特斯拉已引入Occupancy Network,与激光雷达相比,其视觉的语义感知能力更强。对于成本控制更加严格的人形机器人而言,类似Occupancy Network的方式优于激光雷达解决方案。

  规划和控制方面,特斯拉“交互搜索”规划模型进一步增强了FSD系统的规控能力,且FSD系统还能通过Occupancy Network对可视区域进行建模,以处理未知不可见场景。

  人工智能与机器人相辅相成

  大模型可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学习能力,推动机器人向更智能、灵活和自主的方向发展。

  人工智能是机器人实现智能化的关键,而与此同时,对于人工智能技术而言,机器人则是重要落地场景。如广发证券指出的,人形机器人作为具象的实体,是AI绝佳载体。

  一方面,机器人、特别是人形机器人能丰富AI的表现方式。除了传统的语音交互、图片交互,人形机器人也为AI带来了更多的交互方式,包括表情、手势等,极大延展了AI的表达领域。

  image

  另一方面,机器人也承担起了AI输出窗口的作用

  以英国机器人公司Engineered Arts研发的一款类人型机器人Ameca为例,除了与人类相像的外表,其最重要的功能便是为各种AI技术提供了一个真实的平台。用户可以根据需要,从库中快速加载预先保存的姿势、声音、动画和子序列,只需使用、宁江机床、北平机床已具备批量生产高精度齿轮加工设备的能力。

  (5)其他零部件:特斯拉人形机器人电池实现小体积大容量,推测复用汽车动力电池技术。视觉传感器硬件为左右单目相机+鱼眼相机,硬件成本较低,依赖算法。集成汽车视觉传感技术,工厂等部分场景有应用GPS传感器。

  数据显示,目前Optimus硬件成本占BOM表比例超过50%,要达到2万美元售价还有84%的降价空间。对比当前时点和终局状态下BOM表拆解,开源证券指出,线性关节和灵巧手的降本空间最大

  image

  总体而言,目前人形机器人成本约为 10-15 万美元左右。优必选预测,根据量产规模不同,人形机器人降本进程大致分为3个阶段

  几千台小批量生产,降本20%-30%至约10万美元;

  1万-几万台量产,降本50%至5万美元;

  几十万至上百万台大规模量产,降本70%-80%至2-3万美元。

  结语

  总体而言,AI大模型与人形机器人的相辅相成,迈出了通向通用人工智能的一大步。

  国泰君安指出,服务机器人商业化落地的前提是产品能提供真实价值,而真实价值的判断在于机器人能否通用。将机器人做成人形,便是为了使机器人的执行能力更加通用

  伴随着自动驾驶技术的高速发展,人形机器人在视觉、SLAM与基础AI上有了更多方案选择。分析师预计,大模型的出现,会从语音、视觉、决策、控制等多方面实现同人形机器人的结合,形成感知、决策、控制闭环,机器人产业有望进入渗透率快速提升的新阶段

标签:
N本文来源:科创板日报