以上这段文字,是日本新创 TURING(图灵)公司说明「为什麽实现完全自动驾驶会需要LLM 技术」一文的摘要中译。该内容由 Notion AI 翻译成繁体中文,而日文原文则是 TURING 公司使用 ChatGPT4 生成的摘要。
TURING 是一家致力於「量产完全自动驾驶电动汽车」的新创公司。该公司的两位共同创办人,山本一成、与青木俊介,分别是 AI 及自动驾驶技术的专家。该公司已成功在种子轮完成 10 亿日圆的融资,并预计在 2023 年建立自己的车辆生产体系、并进行 A 轮融资。
具体来说,大型语言模型(LLM)与自动驾驶的关系是⋯⋯?
TURIING 於 20 日发表的新闻稿指出,LLM 是藉由学习大量的文本资料、而能够生成如人类写出的自然的文章,并且回答问题的 AI 模型。该公司认为要实现完全自动驾驶,必须仰赖像人类一样理解世界、或是比人类更理解这个世界的 AI 模型。而以生成式 AI 及 ChatGPT 为代表的 LLM 的本质,正是「透过语言,高层次的认知并理解这个世界」。
因此为了让自动驾驶 AI 能够「像人类一样理解世界、或是比人类更理解这个世界」,TURING 选择 LLM 作为有效的手段。
理解世界的 AI 模型听起来很抽象,但是以自动驾驶车辆的需求而言,TURING 的研发目标就浅显易懂多了。TURING 的研发特徵有三:
- 为了依据不同情况进行适切判断并行动,将会是一款能处理如视觉、声音数据等现实世界资讯的复合式 AI
- 为了让 AI 能够有立即判断的即时(Real time)性,必须进行模型的压缩、并针对车用硬体做最佳化
- 考虑到因应外部环境、对系统的攻击、以及应对突发状况,必须设计为既可对抗敌对攻击、也能够推论出不确定性的模型
LLM 学开车、与人类学开车的方式⋯⋯
TURING 的 CEO 山本一成以在驾训班学开车为例说明,在驾训班所学到的技巧可以比作「Few-shot learning(小数据学习)」,也就是在短时间、高效率学习的展现。而 LLM 则是深度学习大量的文本进行训练,因此可以处理精准的语言理解任务。针对特定的任务,透过 Fine Tune 将经过事前学习的 LLM 校正为适合特定任务的型态。换言之,若把类似人类在驾训班学习开车的方式、套在 LLM 上,
- 学习这个世界
- 在驾训班,针对所谓「驾驶」这个任务,使用 Few-shot learning 校正,学会开车
- 透过实际上路开车来加强学习,习得更安全的驾驶技能
山本一成认为,当一个能够和人类一样理解世界、能像人类一样开车的大型模型完成时,人类或许就能看见 Level 5 的全新景致。
核稿编辑:Chris