AI 界永不停歇,闹钟没把我吵醒,但各种AI产品把我从床上炸了起来……
昨晚,两个重要的 AI 进展引发了广泛关注:
Manus:一个号称全球首个通用 AI Agent 的产品 Manus 横空出世,主打自主执行复杂任务,整理数据、规划行程等能力。它的出现,是否意味着 AI 助手真正向智能代理迈进?
QwQ-32B:阿里开源的 32B 参数模型,在多个基准测试上媲美 DeepSeek-R1,但参数量仅为其 1/20。更小的模型,如何实现更高的推理能力?
让我们来看看到底发生了什么。
1、Manus
北京时间 3 月 6 日凌晨,AI 界迎来一位狠角色:Manus!
Manus 到底是什么?
简单来说,以前的 AI 只会聊天,Manus 直接帮你把事做了。
AI 助手(ChatGPT / Claude): 你问它问题,它给你答案。
AI Agent(Manus): 你给它一个任务,它独立思考、规划、执行,最后把完整结果交到你手上。
朋友都调侃到,它不只是 AI 助手,而是AI 实习生。大家都在想,会不会被它取代了。
Manus 的硬核案例
1)可以快速市场调研
让它调研一下AI眼镜。它快速的逐一搜索网络上的信息。
最后生成一个清晰的表格,在短短的几分钟之内干了,别人可能几小时的活:
用户的问题,它不是直接给个答案,而是像人一样做调研,产出报告,比如介绍下小米:
它会像人一样工作,搜索素材,整理材料,最后产出一个报告,给你一个压缩包。
打开一看,好家伙 PPT 这样就有了。
2)制作个性化的课程
我想让它帮我制作一个交互式的关于Transformers的课程。
它通过一系列搜索,加上编写代码,最后它生成了一个网站可供我进行交互式的学习。
没错,这个网站不是它从网上找的,而是根据我的需求,直接帮我生成一个交互式学习 Transformers 的网站...
除了这些,Manus 还能做旅行规划、保险对比、供应商采购、财报分析等等。
Manus 官网 & 如何体验?目前仍需邀请码
说了这么多,肯定已经心动了。可惜的是,Manus目前还是邀请制,想用还得排队。
官网地址
https://manus.im/
想尝鲜的朋友,建议尽早去申请 waitlist。
但是让我们再客观的思考一下 Manus 真的有那么神吗?
Manus 背后的公司—— Monica.im,其实是一个"缝合怪"高手。
Manus 的核心能力 = Compute Use + 虚拟机 + Artifacts + 内置多个 Agent,更像是一个高度整合的 AI 工作流工具,而非真正的通用 AI Agent。
它可能会像 AI 搜索一样,探索新的通用模式,但门槛更高,不一定能快速成为大众可用的产品。
如果 AI 继续进化,很多通用 Agent 的能力未来可能会被更强的大模型吞并,而 AI 领域的其他公司(如 Coze、Dify)也可能会推出类似产品,竞争将更加激烈。
Manus 的确是 AI Agent 方向的重要探索,但它距离真正的「万能 AI 助手」还有很长的路要走。
2、阿里 QwQ-32B 发布
阿里 Qwen 团队也憋了个大招:QwQ-32B 大模型正式开源!
这个(QwQ)听起来像个表情包,但实力炸裂。
QwQ-32B 参数量仅 320 亿,但在多个测试基准上,直接媲美 6710 亿参数的 DeepSeek-R1 甚至部分任务还略胜一筹。
其中的秘密武器就是强化学习(Reinforcement Learning)!
从下面图表中我们可以清晰地看到,在 AIME24 和 IFEval 等关键基准测试中,QwQ-32B 的表现相当或者略微超过了参数量巨大的 DeepSeek-R1! 而在其他基准测试中,也基本与 DeepSeek-R1 持平,远超其他对比模型。
QwQ-32B 的黑科技:
冷启动 + RL 训练:从预训练模型出发,用 RL 提高推理能力
结果导向奖励机制:不依赖传统的奖励模型,而是直接根据任务结果(数学、代码推理直接用"正确率"评分)
比传统预训练方法更高效、更精准!
如何体验 QwQ-32B?
开源地址(免费体验)
Hugging Face:
https://huggingface.co/Qwen/QwQ-32B
ModelScope:
https://modelscope.cn/models/Qwen/QwQ-32B
Qwen Chat:
https://chat.qwen.ai
甚至,ollama 也已经集成了 QwQ-32B,直接运行:
ollama pull qwq
我先尝尝鲜了,有什么好玩的地方,再给大家分享。
意义在哪?
以前,想跑个大模型,少说得几块 A100 显卡。
现在,32B 模型用 24G 显存 + 16 核 CPU + 64G 内存就能跑!
本地推理模型的时代,真的来了!
2025 年,AI 正在加速改变世界,甚至改变我们的日常工作方式。
你觉得未来 AI Agent 会让哪些工作消失?你最期待 AI 帮你做什么?
没有评论:
发表评论