Kimi K2.6上线并开源,实测其300个Agent集群自动拆解任务、并行协作。模拟券商研究所:1.25小时产出97页PDF研报、11张Sheet估值Excel、26页PPT及HTML可视化看板。模拟科研工具:45分钟生成论文工作台前端页面(含开屏动画、3D可视化、参考文献悬停)。适用于金融分析师、开发者、科研人员,无需本地部署,支持调用天眼查等数据库(免额外会员费)。注意:数据持久化、多轮编辑等生产级功能仍有提升空间,生成内容仅供测试。
Tags:
Talk is cheap. Show me the code. ——Linus Torvalds
月之暗面把这句话放进了 K2.6 的技术博客开头。
inus说的没错。对于编程模型,一切参数和 benchmark 都是虚的,唯一真实的是:它能不能帮你把事办了,能办到什么程度。
4月20日,Kimi K2.6 上线并开源,这次我最感兴趣的是他们的 Agent集群。
说实话,现在几乎每周都有新模型发布,对跑分上的刷新已经无感了,反倒是这个号称能调动 300 个 Agent 同步干活的 Agent 集群比较有新意。
我很好奇,AI的进化会不会像人类社会一样,朝着大规模协作的方向前进。
所以,我花了一天时间,跑了两个深度案例,同时把它的技术报告和行业横向对比数据啃了一遍。
结论是:K2.6 似乎想做“Agent的超级工厂” 。
一个人就是一个团队的时代,来了吗?
“群体智能”这个词,我见过太多产品拿来当营销词用。打开一看,就是一个模型套了个壳,换个 UI,然后告诉你这是“多智能体协作”。
既然是 Kimi 声称“Agent集群”可以调度那么多 Agent 并行完成任务,那咱们就给“AI团队”上点压力:
测试一:模拟券商公司产出全球AI算力产业研究报告(用时~1.25小时)
模拟券商研究所,产出全球AI算力产业链深度研究。
要求一次性交付五样东西——80-100页PDF报告、30家公司DCF/PE/PEG三套估值的Excel、25-30页高管PPT、一页纸股票池跟踪看板、一个独立的HTML视觉看板(含产业链全景图、估值热力图、龙头雷达图)。
组织协作这件事,它好像真的会。
收到任务后,K2.6 自动拆解任务为 8 个 Stage:
12 个专业研究团队“保驾护航”:
过程中,它主动调用了多个Skill(screensheet处理Excel、doc处理Word/PDF/PPT、frontend-skill处理HTML),并创建了专门的智能体负责报告/PPT的结构设计与文案骨架。
这里要插一句:你是不是也在网上天天找“把PDF转成网页”的skill?
结果从0开始部署、买API、忙活半天最后等到一个什么也不能用的东西?
K2.6直接把整个流程封装好了。你想要什么skill,告诉它,它来帮你解决。
相比较 codex 这么密密麻麻的字,不得不说 kimi 用户体验是真的好。
1个多小时后,去吃顿晚饭的功夫,回来彻底傻眼了。
界面上是它交付的:
-
97页PDF -
11个Sheet的Excel -
26页PPT -
1页Word看板 -
一个完整的ECharts可视化HTML页面 -
外加6张经济学人风格的科研图表
一次性,一条龙,全做出来了。
还给了6张附加产出,再一次秀了K2.6的制图能力(且可编辑)。
据以前在投行待过的朋友说,过往金融分析师写一份完整研报,平均耗时80小时以上。
不是他们不努力,是这件事本身就是体力活。
数据拉取、财务建模、行业分析、排版设计,每一环都是独立的专业技能,而且是串行的——数据组做完,建模组才能开始;
建模组做完,撰写组才能动笔。
券商研究员人均年产研报约20-30篇,按每篇80小时算,一年有效工作时间几乎全耗在这上面了。
下面我们就一口气看看AI到底产出了什么东西:
1、全球AI算力产业链视觉看板(HTML)
2、深度产业研究报告(PDF)绝杀!
97页,11.39MB,含6张嵌入的科研图表。
目录结构完整,从行业概览到五大环节拆解,再到30家公司的逐一分析,附录还有数据来源说明。
排版用的是“经济学人”式的高清矢量图风格。
不得不说,干净、专业!
3、全球AI算力产业链深度研究(PPT)
26页,彭博终端深色风格。每页都有数据支撑,图表与Excel模型同步。
可以直接拿去给老板汇报,不用再自己调格式。
4、AI算力产业链综合财务估值模型(Excel)
11个Sheet,覆盖30家公司的DCF+PE+PEG三套估值:
5、AI算力股票池跟踪看板(Word)
可以说,这样一个企业级的任务,K2.6完成的真的还不错。
以及大家最担心的“数字幻觉”问题,据官方说,目前K2.6支持调用专业数据库:天眼查、同花顺等,无需再额外购买这些数据的会员。
对于经常要花钱买数据的同学,这么一个自带数据库的自动化数据可视化工具真的很香了。
搞完金融了,咱们再试试他的Coding能力如何。作为官方强调的“设计师级别的前端”,效果如何。
测试二:一键生成论文草稿的智能工作台(用时~45min)
K2.6自动拆解任务,创建了项目结构,阅读了相关设计文档(react-dev.md、design.md、visualization.md),然后开始实现:
-
开屏动画自动生成(淡入淡出+呼吸感) -
左右分栏布局:左侧半透明笔记栏,右侧主编辖区 -
笔记输入后实时生成论文结构 -
参考文献悬停卡片效果 -
Three.js实现的3D分子/数据可视化占位 -
一键导出PDF功能(套用LaTeX模板样式)
这次只用了两个角色,但是效果依然很惊艳。
下面是自动生成的开屏页动画:
这是他嵌入前端设计后的效果:
怎么说呢,总感觉有点“那味儿了”。
反正比我自己设计的好看哈哈。
交互也很丝滑,悬停在左侧的文献会显示论文摘要:
不得不说,这审美确实在线,开屏动画、字体搭配、留白、交互反馈都远超一般AI生成的前端。交互逻辑清晰,体验感也很流畅。
美中不足的是,我并没有要求这个网页配备后端和数据库,似乎需要主动提示还能唤起。
功能上还“不太能用”——数据持久化、多轮编辑、导出PDF的格式完善度、参考文献的自动抓取等生产级能力还有欠缺,离真正可用的科研工具还有距离。
据官方说的是,目前已经可以在添加预约系统、表单功能,来收集访客信息并支持账号登录了。
这对于普通用户而言,已经足够用了,把从0到1的门槛砍掉90%。
絮叨
跑完这两个案例,我有两个强烈的感受。
第一,K2.6 真的在探索 AGI 的可能性。
你见过哪个模型能同时调度 300 个 Agent,并行跑 4000 多个步骤,替你写完一份 97 页的券商报告,再做出一张设计师级别的论文工作台?
K2.6 不只会“听话干事”。
它会自己试错、自己迭代、自己拆解任务、自己调用工具(而且不用本地部署和科学上网),这已经不单单是简单的代码生成和工程实现,而是有逻辑的“工程自主性”。
第二,它知道自己的边界。
K2.6 不是完美的,它的功能还有提升空间,它的推理能力还不是最强。
但它是目前开源模型里,最接近“真能帮你干活”的那个,因为它是开源模型里目前的最强者。
如果你还没试过,建议你去试试。不用懂代码,只管打开 Kimi,说人话,看它干活。
然后告诉我,你用它做了什么。
最后,放上 kimi 的使用地址:
https://www.kimi.com
https://huggingface.co/moonshotai/Kimi-K2.6
·················END·················