2026年4月25日星期六

Kimi K2。6深度实测:300个Agent协同,1小时完成券商研报与论文工作台

Kimi K2.6上线并开源,实测其300个Agent集群自动拆解任务、并行协作。模拟券商研究所:1.25小时产出97页PDF研报、11张Sheet估值Excel、26页PPT及HTML可视化看板。模拟科研工具:45分钟生成论文工作台前端页面(含开屏动画、3D可视化、参考文献悬停)。适用于金融分析师、开发者、科研人员,无需本地部署,支持调用天眼查等数据库(免额外会员费)。注意:数据持久化、多轮编辑等生产级功能仍有提升空间,生成内容仅供测试。

Tags:

Talk is cheap. Show me the code. ——Linus Torvalds

月之暗面把这句话放进了 K2.6 的技术博客开头。

图片

inus说的没错。对于编程模型,一切参数和 benchmark 都是虚的,唯一真实的是:它能不能帮你把事办了,能办到什么程度。

4月20日,Kimi K2.6 上线并开源,这次我最感兴趣的是他们的 Agent集群。

说实话,现在几乎每周都有新模型发布,对跑分上的刷新已经无感了,反倒是这个号称能调动 300 个 Agent 同步干活的 Agent 集群比较有新意。

我很好奇,AI的进化会不会像人类社会一样,朝着大规模协作的方向前进。

所以,我花了一天时间,跑了两个深度案例,同时把它的技术报告和行业横向对比数据啃了一遍。

结论是:K2.6 似乎想做“Agent的超级工厂” 。

一个人就是一个团队的时代,来了吗?

“群体智能”这个词,我见过太多产品拿来当营销词用。打开一看,就是一个模型套了个壳,换个 UI,然后告诉你这是“多智能体协作”。

既然是 Kimi 声称“Agent集群”可以调度那么多 Agent 并行完成任务,那咱们就给“AI团队”上点压力:

测试一:模拟券商公司产出全球AI算力产业研究报告(用时~1.25小时)

模拟券商研究所,产出全球AI算力产业链深度研究。

要求一次性交付五样东西——80-100页PDF报告、30家公司DCF/PE/PEG三套估值的Excel、25-30页高管PPT、一页纸股票池跟踪看板、一个独立的HTML视觉看板(含产业链全景图、估值热力图、龙头雷达图)。

图片

组织协作这件事,它好像真的会。

收到任务后,K2.6 自动拆解任务为 8 个 Stage:

图片
图片

12 个专业研究团队“保驾护航”:

图片
图片

过程中,它主动调用了多个Skill(screensheet处理Excel、doc处理Word/PDF/PPT、frontend-skill处理HTML),并创建了专门的智能体负责报告/PPT的结构设计与文案骨架。

这里要插一句:你是不是也在网上天天找“把PDF转成网页”的skill?

结果从0开始部署、买API、忙活半天最后等到一个什么也不能用的东西?

K2.6直接把整个流程封装好了。你想要什么skill,告诉它,它来帮你解决。

图片

相比较 codex 这么密密麻麻的字,不得不说 kimi 用户体验是真的好。

1个多小时后,去吃顿晚饭的功夫,回来彻底傻眼了。

界面上是它交付的:

  • 97页PDF
  • 11个Sheet的Excel
  • 26页PPT
  • 1页Word看板
  • 一个完整的ECharts可视化HTML页面
  • 外加6张经济学人风格的科研图表

一次性,一条龙,全做出来了。

图片

还给了6张附加产出,再一次秀了K2.6的制图能力(且可编辑)。

图片
图片

据以前在投行待过的朋友说,过往金融分析师写一份完整研报,平均耗时80小时以上。

不是他们不努力,是这件事本身就是体力活。

数据拉取、财务建模、行业分析、排版设计,每一环都是独立的专业技能,而且是串行的——数据组做完,建模组才能开始;

建模组做完,撰写组才能动笔。

券商研究员人均年产研报约20-30篇,按每篇80小时算,一年有效工作时间几乎全耗在这上面了。

下面我们就一口气看看AI到底产出了什么东西:

1、全球AI算力产业链视觉看板(HTML)

图片
图片
图片

2、深度产业研究报告(PDF)绝杀!

97页,11.39MB,含6张嵌入的科研图表。

目录结构完整,从行业概览到五大环节拆解,再到30家公司的逐一分析,附录还有数据来源说明。

排版用的是“经济学人”式的高清矢量图风格。

不得不说,干净、专业!

图片
图片

3、全球AI算力产业链深度研究(PPT)

26页,彭博终端深色风格。每页都有数据支撑,图表与Excel模型同步。

可以直接拿去给老板汇报,不用再自己调格式。

图片

4、AI算力产业链综合财务估值模型(Excel)

11个Sheet,覆盖30家公司的DCF+PE+PEG三套估值:

图片

5、AI算力股票池跟踪看板(Word)

AI测评内容仅供交流学习,不可作为投资建议
AI测评内容仅供交流学习,不可作为投资建议

可以说,这样一个企业级的任务,K2.6完成的真的还不错。

以及大家最担心的“数字幻觉”问题,据官方说,目前K2.6支持调用专业数据库:天眼查、同花顺等,无需再额外购买这些数据的会员。

对于经常要花钱买数据的同学,这么一个自带数据库的自动化数据可视化工具真的很香了。

搞完金融了,咱们再试试他的Coding能力如何。作为官方强调的“设计师级别的前端”,效果如何。

测试二:一键生成论文草稿的智能工作台(用时~45min)

图片

K2.6自动拆解任务,创建了项目结构,阅读了相关设计文档(react-dev.md、design.md、visualization.md),然后开始实现:

  • 开屏动画自动生成(淡入淡出+呼吸感)
  • 左右分栏布局:左侧半透明笔记栏,右侧主编辖区
  • 笔记输入后实时生成论文结构
  • 参考文献悬停卡片效果
  • Three.js实现的3D分子/数据可视化占位
  • 一键导出PDF功能(套用LaTeX模板样式)
图片

这次只用了两个角色,但是效果依然很惊艳。

下面是自动生成的开屏页动画:

这是他嵌入前端设计后的效果:

怎么说呢,总感觉有点“那味儿了”。

反正比我自己设计的好看哈哈。

图片

交互也很丝滑,悬停在左侧的文献会显示论文摘要:

图片

不得不说,这审美确实在线,开屏动画、字体搭配、留白、交互反馈都远超一般AI生成的前端。交互逻辑清晰,体验感也很流畅。

美中不足的是,我并没有要求这个网页配备后端和数据库,似乎需要主动提示还能唤起。

功能上还“不太能用”——数据持久化、多轮编辑、导出PDF的格式完善度、参考文献的自动抓取等生产级能力还有欠缺,离真正可用的科研工具还有距离。

据官方说的是,目前已经可以在添加预约系统、表单功能,来收集访客信息并支持账号登录了。

这对于普通用户而言,已经足够用了,把从0到1的门槛砍掉90%。

絮叨

跑完这两个案例,我有两个强烈的感受。

第一,K2.6 真的在探索 AGI 的可能性。

你见过哪个模型能同时调度 300 个 Agent,并行跑 4000 多个步骤,替你写完一份 97 页的券商报告,再做出一张设计师级别的论文工作台?

K2.6 不只会“听话干事”。

它会自己试错、自己迭代、自己拆解任务、自己调用工具(而且不用本地部署和科学上网),这已经不单单是简单的代码生成和工程实现,而是有逻辑的“工程自主性”。

第二,它知道自己的边界。

K2.6 不是完美的,它的功能还有提升空间,它的推理能力还不是最强。

但它是目前开源模型里,最接近“真能帮你干活”的那个,因为它是开源模型里目前的最强者。

图片
图片
图片

如果你还没试过,建议你去试试。不用懂代码,只管打开 Kimi,说人话,看它干活。

然后告诉我,你用它做了什么。

最后,放上 kimi 的使用地址:

https://www.kimi.com

https://huggingface.co/moonshotai/Kimi-K2.6

图片·················END·················

没有评论:

发表评论

Kimi K2。6深度实测:300个Agent协同,1小时完成券商研报与论文工作台

Kimi K2.6上线并开源,实测其300个Agent集群自动拆解任务、并行协作。模拟券商研究所:1.25小时产出97页PDF研报、11张Sheet估值Excel、26页PPT及HTML可视化看板。模拟科研工具:45分钟生成论文工作台前端页面(含开屏动画、3D可视化、参考文献悬停...