品玩

科技创新者的每日必读

打开APP
关闭

多模态大语言模型Dolphins 亮相,为自动驾驶车辆提供支持

2023年12月7日

品玩12月7日讯,来自威斯康星大学、英伟达、密歇根大学和斯坦福大学等高校的学者近日发表论文,介绍了一款名为Dolphins 的多模态大模型,旨在为自动驾驶车辆提供类似于人类的理解和反应能力。

Dolphins是一种视觉语言模型,擅长处理包括视频(或图像)数据、文本指示和历史控制信号在内的多模态输入,以生成与提供的指示相对应的有根据的输出。在开源预训练视觉语言模型OpenFlamingo的基础上,研究者通过创新性的Grounded Chain of Thought (GCoT)过程增强了Dolphins的推理能力,并针对驾驶领域构建了特定的指令数据,进行了指令调整。

论文表示,Dolphins可以提供复杂且尾部开放的驾驶场景的全面理解,并解决一系列自动驾驶任务。

论文地址:https://arxiv.org/pdf/2312.00438.pdf

取消 发布

下载品玩App,比99.9%的人更先知道关于「自动驾驶」的新故事

下载品玩App

比99.9%的人更先知道关于「自动驾驶」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测