品玩8月20日讯,DeepSeek 官方悄然上线 V3.1 版本,上下文长度拓展至 128k,支持 10 万 - 16 万字内容处理。该模型拥有 685B 参数,支持多种精度格式。
其编程能力突出,在 Aider Polyglot 测试中获 71.6% 高分,超越 Claude 4 Opus,每次完整编程任务成本仅 1.01 美元,为专有系统的六十分之一。新增原生 “search token” 支持,线上模型去除 “R1” 标识,或暗示采用 “混合架构”。
虽未公布模型卡,V3.1 已登 Hugging Face 趋势榜第四,粉丝数破 8 万。实测显示其推理响应速度提升,在 SVGBench 基准表现优异,网友对后续 R2 版本充满期待。

0 条评论
请「登录」后评论