Anthropic 启动新计划，资助创建更可靠的人工智能基准-品玩

Anthropic 启动新计划，资助创建更可靠的人工智能基准

2024年7月2日

品玩7月2日讯，据 Siliconangle 报道，Anthropic宣布启动一项新计划，激励研究人员创建新的行业基准，以更好地评估人工智能的性能和影响。

Anthropic解释说，他们愿意向任何能够提出更好的方法来 "衡量人工智能模型的先进能力 "的第三方组织提供资助。Anthropic 的倡议源于对现有人工智能模型基准测试越来越多的批评，比如非营利实体 MLCommons 每年进行两次的 MLPerf 评估。人们普遍认为，用于评定人工智能模型的最流行基准在评估普通人日常如何实际使用人工智能系统方面做得很差。

Anthropic 希望鼓励人工智能研究界提出更具挑战性的基准，重点关注其社会影响和安全性。它呼吁对现有方法进行彻底改革。