这次升级并非仅仅是增添几个新功能而已,它意味着AI助手在实用性上,在效率方面,以及在成本控管层面上,都跨出了关键的一步。对于开发者而言,这是一次需要认真细致去探究的更新。对于企业来讲,这也是一次值得深入钻研的更新。对于普通用户来说,同样是一次值得反复琢磨的更新。
官方应用与API全面升级
如今,所有官方应用、网页端均已更新到-V3.1版本,用户在操作运用期间,会发觉一个极为显著的全新功能,即“深度思考”按钮,此按钮准许用户于需要展开复杂推理之际开启思考模式,而在应对简单问答之时维持非思考模式,达成自由切换,进而提升了交互的灵活性 。
也在API层面同步达成了升级,-chat接口对应着非思考模式,而则有所不同,-接口是专门为思考模式所设计,这二者接口的上下文长度均已被扩展到了128K,这就喻示着模型能够处理更为的长对话历史以及文档内容,除此之外,API Beta接口还对特定模式予以了支持,是以确保输出格式契合严格的定义标准。
兼容性与智能体能力增强
新版本对 API 格式的支持予以增强,目的是为方便开发者进行集成,这能叫用户把 -V3.1 的强大能力轻松接入流行的 Code 开发框架里,还降低了技术集成的门槛,详细的技术规范能参考官方文档 。
在智能体范畴之内,编程智能体获得了重点强化,于代码修复评测SWE当中,在命令行终端环境下的复杂任务测验时,-V3.1的表现相较于先前的系列模型呈现出显著提升,这表明其在实际编程辅助以及问题调试里将会更为可靠。

搜索智能体性能领先
很多用户所依赖的核心能力是搜索功能,-V3.1在多项搜索评测指标方面取得了较大进步,特别是在需要进行多步推理的复杂搜索测试当中,以及涵盖多学科的专家级难题测试之上,其性能已经在很大程度上超越了以前表现出色的R1-0528模型。

这对那些有着深度研究需求、涉及信息查证事宜或者要解决专业问题的用户来讲,是一则利好消息。新版模型可更加精准地领会复杂化的查询意图,且能从数量庞大的信息里筛选并整合出更具价值的答案。
思考效率显著优化
本次升级有着一个核心目标,那就是提升效率。测试数据表明,经过思维链压缩训练的V3.1 - Think版本,在输出内容长度出现减少,减少幅度为百分之二十到百分之五十的情形下,各项任务的平均表现依旧能够与R1 - 0528保持持平状态。这所表示的是它能够借助更短的篇幅达成同样的推理深度哟。
与此同时,处于非思考模式之时,V3.A的输出长度已然获得了有效的控制,跟-V3-0324版本相比较而言,它能够在输出显著变短的情形之下,维持相同的模型性能,这直接削减了API调用的Token成本,对于用户来讲更为友好。

模型开源与部署调整
关于开源这一情况,V3版本之上的V3.1的Base模型,是经过重启训练的,而且还另外增添了840B数据的向外扩展训练。它的Base模型以及后续训练模型,都已经于主流开源平台以及魔搭社区予以开放,从而能够让研究者还有开发者去自由地加以使用。
需留意的是,V3.1运用了UE8M0 FP8 Scale的参数精准度,与此同时,它针对分词器以及聊天模板作出了较大幅度的调整,和-V3版本有着显著的不同,所以,打算自行部署模型的用户要认真研读新版说明文档,以此来保证能够实现平滑迁移。
价格调整与服务扩容
按照官方所发布的公告来看,自北京时间二零二五年九月六日凌晨开始,开放平台的API接口调用这一行为的价格将会实施新的调整。具体的价格相关信息要以官方文档作为标准。在九月六日以前,所有的API服务依旧是按照原来的价格来进行计费 。
为了应对那潜在可能会增长起来的需求,官方已经进一步去进行增长了那 API 服务资源的量,目的在于能够去提供更为稳定、更为顺滑流畅的调用这种行为的体验感受。用户在当下这个时候能够从而更加安心放心地去规划自身所作所为的使用量之情景,并不需要过度地去忧思担心服务能力方面所存在的那种限制阻碍、瓶颈之情形 。
本次-V3.1予以发布,在功能方面、效率方面以及成本方面,差不多将用户所关心的全部层面都给涵盖了。针对此次升级当中所提及的“思考模式”,你最为期待借助它去解决你工作或者学习里的哪一种具体问题呢?欢迎在评论区域分享你的想法,要是觉得本文具备帮助作用,同样请点赞予以支持。


发表评论