智源研究院发布多模态大模型Emu3.5-品玩

智源研究院发布多模态大模型Emu3.5

22小时前

品玩12月4日讯，北京智源人工智能研究院正式推出新一代多模态大模型Emu3.5，首次实现图像、文本与视频的“世界级统一建模”。

该模型摒弃传统分立架构，将所有模态统一编码为Token序列，专注于“Next State Prediction”（预测下一世界状态）任务，从而掌握物理规律与因果逻辑。

Emu3.5可合理推演视觉动作、语言续写及跨模态演化，显著提升生成内容的连贯性与真实性。专家认为，此举标志着多模态AI从“生成时代”迈向“世界模型时代”，为具身智能、自动驾驶仿真等高阶应用奠定基础。

下载品玩App，比99.9%的人更先知道关于「智源研究院」的新故事

下载品玩App

比99.9%的人更先知道关于「智源研究院」的新故事

AI阅读助手

以下有两点提示，请您注意：
1. 请避免输入违反公序良俗、不安全或敏感的内容，模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务，但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时，您需要自行判断并承担风险；
感谢您的理解与配合

该功能目前正处于内测阶段，尚未对所有用户开放。如果您想快人一步体验产品的新功能，欢迎点击下面的按钮申请参与内测申请内测