品玩

科技创新者的每日必读

打开APP
关闭

上海AI实验室发布IWR-Bench 揭示AI视频转网页短板

13小时前

品玩10月21日讯,据AIBASE 报道,上海人工智能实验室联合浙江大学推出全球首个视频转网页评测基准IWR-Bench,填补AI前端开发动态交互评测空白。

该基准要求模型通过“视频+静态资源”重建网页交互,覆盖2048游戏、机票预订等场景,以视觉保真度(VFS)和交互功能正确性(IFS)评估。其匿名化静态资源、自动化测试设计贴近真实开发。

对28款主流模型评测显示,GPT-5综合得分仅36.35分:VFS达64.25%,IFS仅24.39%。视频优化模型表现不及通用模型,“思考”机制提升有限。该基准将推动技术融合,未来或降低前端开发门槛。

取消 发布

下载品玩App,比99.9%的人更先知道关于「上海人工智能实验室」的新故事

下载品玩App

比99.9%的人更先知道关于「上海人工智能实验室」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测