品玩3月13日讯,据 AI Base 报道,xAI正式发布Grok 4.20 Beta模型,在行业普遍追逐性能跑分的背景下,该模型将优化重点转向事实可靠性。
据Artificial Analysis评测,Grok 4.20在启用推理模式下的智能指数为48分,虽暂落后于Gemini 3.1 Pro Preview与GPT-5.4的57分,但在AA Omniscience测试中创下78%的非幻觉率新高。其核心突破在于面对未知问题时能准确承认“不知”,显著降低虚假信息生成风险。
技术架构上,Grok 4.20提供推理、标准及多智能体三种API变体,支持200万token超长上下文窗口。商业定价方面,每百万token成本介于2至6美元,较前代更具竞争力。此举标志着xAI战略从单纯追求通用智能转向深耕企业级应用的准确性与可信度,为对数据严谨性要求极高的科研及办公场景提供了新的可靠选择。





0 条评论
请「登录」后评论