2025年8月22日星期五

迈向 Agent 时代的第一步!DeepSeek-V3。1 重磅发布,多维度升级超惊艳,开启智能推理新体验。

2025年8月21日,DeepSeek-V3.1正式发布。它采用混合推理架构,一个模型支持思考与非思考两种模式,上下文扩至128K,还支持strict模式Function Calling。

添加微信号:AIGC_Tech,公众号小助手会拉你进群!

扫描下方二维码,加入AIGC Studio知识星球可以获得最新AI前沿应用/AIGC实践教程/大厂面试经验/算法刷题IT各学科入门到精通学习资料!学习/科研/工作/副业,强烈推荐!

图片

2025年8月21日,DeepSeek-V3.1正式发布。它采用混合推理架构,一个模型支持思考与非思考两种模式。相比前代,DeepSeek-V3.1-Think 思考效率大幅提升,能更快作答。经Post-Training优化,其Agent能力增强,工具使用和智能体任务表现更出色。官方App与网页端同步升级,用户用"深度思考"按钮就能切换模式。DeepSeek API也同步更新,deepseek-chat和deepseek-reasoner对应不同模式,上下文扩至128K,还支持strict模式Function Calling。

图片

unsetunsetDeepSeek-V3.1 介绍unsetunset

DeepSeek-V3.1 的升级包含以下主要变化:

  • 混合推理架构:一个模型同时支持思考模式与非思考模式;

  • 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;

  • 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

DeepSeek-V3.1正式发布UE8M0 FP8技术助力国产芯片加速追赶

官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过"深度思考"按钮,实现思考模式与非思考模式的自由切换。

图片

DeepSeek API 此次同步升级可谓诚意满满!在模式对应上,deepseek-chat 精准适配非思考模式,deepseek-reasoner 则完美对应思考模式,且二者上下文容量均大幅扩展至 128K,为复杂交互提供更广阔空间。更值得一提的是,API Beta 接口还创新性地支持了 strict 模式的 Function Calling,有力保障了输出的 Function 严格遵循 schema 定义。

  • 官方文档:
    https://api-docs.deepseek.com/zh-cn/guides/function_calling

另外,增加了对 Anthropic API 格式的支持,让大家可以轻松将 DeepSeek-V3.1 的能力接入 Claude Code 框架。

  • 官方文档:
    https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

unsetunset工具调用/智能体支持增强unsetunset

编程智能体

图片在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。

unsetunset搜索智能体unsetunset

图片DeepSeek-V3.1 在多项搜索评测指标方面均实现了显著提升。在涉及多步推理的复杂搜索测试场景(browsecomp)以及涵盖多学科专家级难题的测试项目(HLE)中,DeepSeek-V3.1 所展现出的性能表现,已大幅超越 R1-0528 版本。

unsetunset思考效率提升unsetunset

测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。图片同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。

unsetunsetAPI & 模型开源unsetunset

V3.1的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。

Base 模型

  • Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

  • 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

后训练模型

  • Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1

  • 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

DeepSeek-V3.1 运用了 UE8M0 FP8 Scale 这种参数精度。而且,V3.1 对分词器和聊天模板(chat template)进行了比较大的改动,和 DeepSeek-V3 有明显不同

unsetunset价格调整unsetunset

2025 年 9 月 6 日凌晨起,对 DeepSeek 开放平台 API 接口调用价格进行调整:

图片
图片

图片在 9 月 6 日前,所有 API 服务仍按原价格政策计费,可继续享受当前优惠。

unsetunset相关链接unsetunset

  • 产品试用:https://chat.deepseek.com/

感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~

图片

没有评论:

发表评论

一个火爆外网的AI模型,吊打sd、flux?!

最近,一个叫  nano-banana  的神秘 AI 生图模型火了! 说它神秘,是因为到现在也没有公司出来认领这个模型。 而且它的火爆也不是靠什么营销,而是凭借它出色的性能大家的"口口相传"。 甚至有网友评价它是 人物一致性新王 、 AI 图片编辑史诗级...