2025年8月20日星期三

Deepseek 重磅更新V3。1版本,上下文长度拓展至128K, 代码编程思维能力急剧上升


图片

点击上方卡片关注 不要错过精彩文章


🎉

读完这篇文章,别忘记给舰长点一个关注!舰长的智能体搭建文章,不仅是节点的构建,也有思路的分享。智能体搭建最重要的就是思路。最希望,能给大家带来不一样的搭建思路和方法。 

点一点上方的🔵蓝色小字关注,你的支持是我最大的动力!🙏谢谢啦!🌟"


大家好,我是舰长🙏

就在昨晚,Deepseek一声不响地干了件大事,悄咪咪地给模型升级到了deepseekV3.1。

deepseek在官方群宣布:DeepSeek线上模型版本已升级至V 3.1,上下文长度拓展至128k,欢迎前往官方网页、APP、小程序测试,API接口调用方式保持不变。

官方通告虽然只有这么简短的一句话,但舰长相信,更新的东西绝对没那么少,于是舰长赶紧进入官网体验一番DpV3.1。

Image



1.天气卡片案例测试

测试提示词:创建一个包含 CSS 和 JavaScript 的单个 HTML 文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。


卡片应具有深色背景。在此单个文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。


deepseekV3.1


deepseekR1


可以看出V3.1虽然在卡片的动态效果上与R1仍有差距,但差距已经很小了,V3.1相较于之前的v3版本,在代码编程能力和用户意图识别上有了较大的提升。


2.个人网站/公司网站的开发

DeepseekV3.1发送了这样的提示词:"设计一个充满科技感的公司网站,公司名为伶问科技,公司业务是智能体的开发和企业咨询,直接开发成可用网页。"



deepseekV3.1


deepseekR1

生成过程中,R1明显比V3.1耗时更久,两个网站整体,相差不大,R1由于属于推理性大模型上,更多时间在推理用户意图上,相比之下非推理大模型V3.1速度更快。

V3.1与V3.0相比,生成的网页特效更多,布局更为合理,排版上也更为美观。


3.推理能力的提升

提示词:

单选题

某办公室甲、乙、丙、丁四人对本办公室当选先进工作者的职工进行如下预测:甲:乙和丙要么都当选,要么都落选。乙:最多只有2人当选。丙:我不可能当选。丁:你们中肯定有人的预测是错的。结果发现四个人中只有一个人说对了,问以下哪项判断是正确的?()

A 甲当选了

B 乙当选了

C 丙未当选

D 丁未当选

Image

deepseekV3.1

Image

豆包深度思考


在这道题目里,虽然V3.1相较于豆包深度思考推理时间更长,但两者同时得出了正确答案,虽然V3.1属于非推理模型,但这次更新后V3.1的逻辑推理也有一定的进步。



4.逻辑能力与构图能力的测试



舰长连着测试了几个基础算术题上,DeepSeek-V3.1最终都能给出正确答案,V3.1思考的过程简洁明了。


流程图提示词:请帮我生成一个流程图,要求展示用户输入账号密码通过验证就进入网站,验证失败就返回输入账号密码那一步,验证失败超过10次就锁定网站禁止进入



Image

deepseekv3.1

Image

deepseekR1


可用看出,在构图方面,R1与V3.1有较大的差距,能看出V3.1的思考逻辑,但在流程图上,毫无疑问V3.1的能力弱于R1。


5.需求理解并撰写的案例测试

提示词:你是名有着30年经验的小红书文案撰写专家,请你帮我就兰蔻香水,写一篇小红书推广软文,要求:足够吸引眼球,让人有想购买的欲望。带有小红书爆款文案的元素


Image

deepseekV3.1


Image

deepseekR1

可以看出DeepSeek-V3.1在撰写文案时,语气更为活泼、温暖,语言更通俗、口语化,他撰文的文案隐隐有股子小红书爆款文案那味了,不加以区分的话,两篇舰长我也分不清哪篇是V3.1写的,哪篇是R1写的


总结

V3.1相较于V3有了较大的提升,但和市面上流行的一些大模型仍有不小的差距,其本身虽为非推理型模型,但其推理能力相较于R1差距在缩小,综合来说,V3.1属于性价比较高的大模型之一。


关注公众号并添加舰长微信,领取智能体学习资料,并参与Coze技术直播讲解

Image

舰长积极创建智能体;工作流交流群,让我们在AI时代一起进步互相学习!每天会在群里分享智能体的搭建,欢迎各位小伙伴加入~

Image



没有评论:

发表评论

跨境电商神器,一分钟出片!这个AI数字人工具让视频创作“卷”出新高度!

视频这件事,在AI加持下,真的可以从"重成本"变为"轻操作"。 在短视频创作越来越"卷"、内容更新越来越频繁的时代,一款能让你"5分钟无剪辑,自动配音口型同步,还能说70种语言"的工具,是不是听着...