品玩3月26日讯,Cloudflare官方近日宣布Workers AI正式支持前沿开源大模型,首发集成Moonshot AI的Kimi K2.5。
该模型具备256k上下文窗口及多轮工具调用能力,专为复杂智能体任务设计。内部测试显示,相较于专有模型,Kimi K2.5在保持高质量推理的同时降低77%成本,成为代码审查与安全检测等场景的高效引擎。
为优化大规模推理体验,Cloudflare推出多项平台升级:通过前缀缓存技术与x-session-affinity头显著降低延迟与费用;重构异步API架构,采用拉取模式确保高负载下的任务持久执行,避免容量限制。结合Durable Objects等底层原语,Cloudflare致力于提供从模型推理到状态管理的全链路解决方案,助力开发者在统一架构下构建可靠、可扩展的智能体应用。





0 条评论
请「登录」后评论