品玩

科技创新者的每日必读

打开APP
关闭

智源研究院发布多模态大模型Emu3.5

22小时前

品玩12月4日讯,北京智源人工智能研究院正式推出新一代多模态大模型Emu3.5,首次实现图像、文本与视频的“世界级统一建模”。

该模型摒弃传统分立架构,将所有模态统一编码为Token序列,专注于“Next State Prediction”(预测下一世界状态)任务,从而掌握物理规律与因果逻辑。

Emu3.5可合理推演视觉动作、语言续写及跨模态演化,显著提升生成内容的连贯性与真实性。专家认为,此举标志着多模态AI从“生成时代”迈向“世界模型时代”,为具身智能、自动驾驶仿真等高阶应用奠定基础。

取消 发布

下载品玩App,比99.9%的人更先知道关于「智源研究院」的新故事

下载品玩App

比99.9%的人更先知道关于「智源研究院」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测