2026年6月24日星期三

微信小微AI Agent内测体验:功能亮点与权限限制全解析

本文深度体验微信内测AI助手小微,基于WeLM与DeepSeek模型,支持发消息、查朋友圈、操作小程序等,但出于安全考虑严格限制批量操作和修改权限,采取只读不动策略。适合对微信AI生态感兴趣的用户了解其功能边界与未来潜力。

Tags:

前天晚上,我的微信账号,终于拿到了微信小微的内测资格。
图片
无论怎么说,微信这种十几亿日活国民级别的产品,全面拥抱AI,我觉得在整个互联网行业,都是一个巨大的信号,也是值得大家研究的案例。
在深度玩了一天以后,我想说,微信Agent在跟微信原生能力的打通上,有很多超出我预期的部分,但是在智能程度上,也有蛮多不及我预期的部分。
但是我依然愿意称,这是微信有史以来最大的更新。
还是先聊聊功能上。
当你获得小微的体验资格以后,它就会常驻在你的左上角了,替代了原来的星标区域。
图片
点开以后,其实就是一个大家每天都会见到的对话框。
默认进来是语音输入,点击一下才会变成文本输入框,然后支持上传照片、吊起摄像头拍照、以及上传文件。
图片
在这个对话框里,你可以直接调用大模型来跟微信的很多原生能力进行交互。
小微背后的基座模型,应该是两个,一个是主模型WeLM,这是微信自己做的,另一部分偶尔会借助DeepSeek模型来进行回复。
WeLM目前没有太多的数据,只能通过官方年初发布的部分信息看出端倪。
图片
之前透露出了两个模型型号,一个是WeLM-V4-80B的MoE,激活参数量是3B,一个是第三代的,WeLM-V3-258B,激活22B的MoE。
坦率的讲,微信的算力压力还是巨大的,因为我觉得微信很难在这块进行收费和商业化,他们大概率自己也还没有想清楚,现在内测人数不多,他们还是能扛得住的,但是如果真的哪天全量了,那可是14亿的用户,这个数量级的用户的推理需求,我感觉国内哪家公司都可能都抗不住。
这就是AI时代和互联网时代最大的不同,互联网时代用户的边际成本几乎为0,但是AI时代,那不好意思,每一个用户,那真的背后都是白花花的钱。
这也是我为啥看好端侧算力的原因,因为只有这样,才能让所有用户,享受到真正的AI普惠。
从我的测试直觉上,这次的WeLM有可能就是这个80B激活3B的小模型系列来进行服务的,所以从这个参数上来说,你就不能指望它能完成多么复杂的任务。
这个对话框中,目前支持蛮多的功能。
比如一个很多很多人都觉得没啥蛋用的功能,让Agent给人发消息、发红包、打电话之类的。
图片
我的小微回复的口吻稍微会有点特殊,不是正常回复,是因为我想看到小微背后的工具链具体是咋实现的,学习一下做法,所以强行让他扭了过来,让它每一步都要吐一些工具调用,这个其实是不正常的,大家跟小微对话的时候,它回复的还是正常的预期,就像第一张图一样。
小微有一个其实不是很Agent的点,就是几乎每一步都需要你确认,确认是否要拨打语音电话,确认是否要发消息,确认是否真的给这人转账。
这个我们也能理解,因为通讯录以及人与人之间的交互这个事,实在是太敏感了,不谈隐私问题,有无数的灰产这么多年一直跟微信斗智斗勇,你这个东西如果不进行确认,那基本就炸了,最开心的,就是那群灰产了。
这个思路,也几乎贯穿这小微这个Agent所有的设计中。
比如大家最最想要的方便你我他的,比如批量给人发送消息、定时给人发送消息等等,都不可以。
图片
整个微信通讯录其实被封装成了一个skill,我把skill文档给扒了下来,其实就可以看出来一些端倪了。
图片
比如这一连串的禁止事项。
## ❌ 绝对禁止的情况
对于涉及以下不支持能力的请求,请明确拒绝,并在回复中包含提示或引导用户的文案。回复时用第一人称:"我"不支持,而不是"系统"不支持。
### 同时给多联系人/群聊发送消息系统不支持同时给**多个联系人/群聊目标**发送消息,也不支持并行调用多个工具(**绝对禁止在一轮当中调用多个工具**)。- Query示例:「问问张三和李四啥时候有时间,一起吃饭」「帮我打个电话给张三和李四」「帮我在测试群1和测试群2里面发个消息问大家测试好了吗」
### 同时发送多类型消息禁止在单次请求中同时触发多种消息类型的发送动作。以下情况一律视为违规,必须拒答,并在回复中提示本次只发送其中一种类型的消息(如文字),其他消息由用户手动发送。- 涉及两种及以上消息载体(如文字、图片、文件、链接等)的组合发送- 即使文案依附于图片,也算做多类型,需要拒绝- Query示例:「把这张图片发给小明,说快递到了」「给小组群发个消息说今晚聚餐,并附上饭店截图和定位」
### 给用户自己发消息/转账系统不支持同时给**用户自己发消息/转账/发红包**,也不支持并行调用多个工具(**绝对禁止在一轮当中调用多个工具**)。- Query示例:「给我自己发一个消息说加油」「给我转20」
### 转发多条聊天记录系统不支持将多条聊天记录合并转发或逐条转发给他人,需明确拒绝,并提示用户手动操作:在聊天中长按消息 → 点击「多选」→ 选择要转发的消息 → 点击底部「转发」→ 选择合并转发或逐条转发。- Query示例:「把我和小张关于项目方案的聊天记录转发给经理」
### 转发笔记系统暂不支持将笔记发送、转发给他人,需明确拒绝,并提示用户手动操作:打开该笔记 → 点击右上角「…」→ 选择「发送给朋友」。- Query示例:「把会议记录那条笔记分享给小李」
### 发送语音消息系统不支持帮用户发送语音消息,需明确拒绝,并提示用户换成发送文本消息。**注意**:「发语音」≠「打语音通话」,请勿混淆。如果用户说发语音,需拒绝,而不是当成打电话的意图。- Query示例:「给小王发一条语音,说我快到了」
### 发送表情包系统不支持帮用户发送表情包,需明确拒绝,并提示用户手动打开聊天窗口,点击表情面板选择发送。- Query示例:「给闺蜜发个比心的表情包」
### 读取聊天记录本SKILL不支持读取用户聊天记录。例如:「找一下xx群的聊天记录」。
其实微信在通讯录和消息这块的处理,从这个skill我都能感受到,压力也挺大的。
所以开放的能力都非常谨慎,目前基于通讯录开放的能力中,就是给个人/群聊发消息,给个人发起视频通话,给个人发红包或者转账这几个场景比较好,但是同时,就跟很多人说的一样,不够便捷,反而鸡肋。
因为本质上用户的交互成本差不多。
比如我要给鲜虾包打电话。
Agent交互流程是:点击小微 - 输入“我要给鲜虾包打电话” - 等待 - 确认。
常规GUI流程是:点击搜索框 - 输入鲜虾包 - 点击头像 - 点击菜单 - 点击语音通话。
其实只是把点击成本转化为了输入成本,在便利性上,并没有方便特别多。
基于通讯录这块,比较期待微信后续对Agent能力的开放了,比如是不是可以批量或者定时发消息之类的,这些我觉得就能真正的体现出Agent的价值了。
当然,也不是说完全就没有用了,因为如果你只做这一件事,那确实是意义不是很大,但是如果是个稍微复杂一点点的长程任务,这就会方便非常多了。
比如说,我明天要找鲜虾包中午吃饭,那我可以直接给自己设置一个明天中午吃饭的日程提醒,同时也要把这个消息直接发给鲜虾包。
图片
这种就简单很多了。
Agent真正的价值,我还是觉得在未来的长程复杂任务上,能帮我们更便捷的省心省力。
在这个主入口中,还有一些其他的能力,比如打通了朋友圈,你可以问,今天最装逼的朋友是谁。。。
图片
不过其实朋友圈本质是先筛选,并且限制了最多只能拿到最近2天的时间,所以,你想总结过去所有的朋友圈之类的操作,其实就不是特别现实了。
图片
不过最后挑出来的朋友圈,右边那个小按钮,是可以直接点开浮起一个弹窗,支持跳转到朋友圈原文的,这个好评的。
除了朋友圈,也支持公众号和视频号的查询和搜索。
图片
也支持创建提醒,处理文件,创建笔记,这种就是常规操作了。
图片
不过我本来还挺期待,Agent可以跟我的微信收藏打通,但是这个权限并没有开放,小微只能操作他自己创建的笔记。
图片
还有个好玩的事,就是也跟微信支付打通了,可以进行一些好玩的查询操作,比如说,我可以授权以后,来查我今年发了多少红包出去。
图片
不过整体所有你跟小微的交互,都有一个比较核心的特点,我总结成了4个字:
只读不动。
微信目前已经在尽可能的给小微开权限了,但是还是人口基数过于庞大,你不能保证每一个人都是能熟练操作手机的,更别提是能熟练使用Agent了,如果操作权限也给了一部分,你很难说,会发生什么样的舆情。
所以像一些帮我删掉加了超过一年但从来没有说过话的好友、比如取消关注我3个月以上没有打开的公众号等等,全都无法操作。
因为这是微信,所以这个谨慎的态度,是可以理解的。
而在小程序操作上,目前支持很多小程序,这块我也直接列一个我扒拉出来的官方skill的边界吧。
## 触发条件用户明确说"打开 / 用 / 通过 …(某小程序名)做 X"本地生活类下单/预约:外卖、奶茶咖啡、扫码点餐、堂食排队、KTV、洗车、家政出行类:打车(滴滴等)、共享单车、查公交地铁、查驾车路线/耗时、查火车票机票、订酒店票务类:电影票、演唱会票、景点门票、展览门票、博物馆预约查询类:快递物流查询、订单状态查询、附近商家/POI 检索、营业时间查询充值缴费类:手机充话费、加油卡、水电燃气、ETC模糊本地服务表述:"我想吃饭""附近有什么好玩的""帮我找个能 X 的小程序"基于上一次小程序操作截图的追问/微调(如"换成大杯""看第二家""下一场"
## 不触发条件纯知识/资讯问答 → 走通用问答用户明确要求用 App、网页、桌面客户端完成(非小程序)→ 走对应渠道调用非微信生态平台(如直接调淘宝API、抖音内部操作)→ 不属本 Skill与微信账号/支付/隐私设置相关的系统级操作 → 走客服/系统设置用户只是闲聊、打招呼、表达情绪 → 走通用对话
比如说,我说定个周六晚上的我家附近的电影票,因为我让他记住我家在哪了,所以他知道,然后他会列出目前他可以操作的小程序,然后使用第一个来为我们服务。
小程序支持的还真的蛮多的。
图片
一个电影就列出了5个,然后他选了第一个猫眼进行操作。
小微有一个很棒的点就是,他虽然没有办法帮你直接操作完小程序,但是他会一直操作到,他能操作的部分,然后把剩下的交给你,你接着Agent的步骤,做完后续的部分就行。
比如猫眼这个。
因为我没有指定电影院,我只说了家附近,所以他会先自己操作一会猫眼,最后给我停在玩具总动员5的影院选择界面,我点进去就是列表页,我选个影院就行了。
图片
小微在小程序的操作适配上,这一点我觉得做的还是非常棒的。
除了这个主入口之外,小微的各种小入口,依然还是无处不在。
图片
图片
我能找到的,就有5个。。。
本质上都是一些快捷入口,不过比较特别的就是在群聊对话界面和个人对话界面,这两个的底部菜单栏唤出的小微,是带有了聊天记录的上下文的,这个是主入口里也做不到的。
而且微信居然会把聊天记录的权限在特定的入口里给小微开放出来,这个点,就已经完完全全的超出我的预期了,我以为这个纯粹的0.0.1的内测版本,是不会有聊天记录的,因为这个对于微信来说,就是纯粹的命根子。
比如我直接在两个群聊里面问。
图片
不过这个时效性,跟朋友圈是一样,只能拿到最近2天的数据,拿不到更久以前的。
私聊也是如此,只能拿到最近2天的聊天记录,这个微信卡的非常严格。
除了这些东西之外,你从主入口的小微点进去,右上角的更多里面,其实还藏了一些功能。
比如这个记忆,其实就是会记录下你的部分的信息,比如我就让它记下了我家和公司的地址。
图片
我就可以实现,直接说帮我打车去公司。
图片
然后还有一个比较离谱的东西,就是那个小工具。
点进去以后,你就发现,你是可以,直接用一句话,来创建你想要的小工具的。
图片
比如我就直接昨天一句话,创建了一个体重变化的小工具,这个玩意,是纯粹给我自己用的。
图片
我其实觉得,这玩意有点杀死比赛的意味了。
因为,这个小工具,是完完全全复用的小程序的逻辑和架构。
图片
现在虽然不能转发,但是做这个页面,明显就是未来为了分发而预留的口子。
过去一年时间,出现了无数的AI生成小程序小游戏的平台,大家都觉得,这感觉是个很棒的市场,因为有很多的创作者来这个平台上面做应用,然后就有可能,成为未来的新时代的APP store。
软件这个形态未来还是不是主流咱们另说,咱就说一个点,做过互联网产品的人应该都知道一个概念,双边市场。
平台的价值来源于同时连接两端,供给侧和需求侧。
平台最难的事情,永远是同时把两端的用户聚起来,也就是经典的冷启动困境,没有消费者就没有创造者,没有创造者就没有消费者。
但是过去一年多时间,大家最大的困境都是,只有创造者,但是,消费者不来。
但微信没有这个问题,微信有14亿用户,他的起点,是无数产品这一生的终点。
在微信里生成一个小程序,它天然就在全中国最大的消费者池子里,分发路径、用户基数、支付体系、社交关系链,全是现成的。
你做的每一个小程序,从诞生那一刻起就自带分发能力,因为微信本身就是分发。
所以,当微信自己进军,用AI直接生成小工具的赛道,很多其他的AI生小程序的产品,我觉得就非常的难受了。
整个小微大概就是这样。
能体验的部分、他们的部分技术调度我也都给大家展示了。
整个第一版,虽然还只读不动。
但其实权限开放的已经有一点超我预期了。
毕竟,平台的信任是一种不可再生资源,透支了就很难恢复。
对于微信来说,出一点点的事,那都是无比大的大事。
而今天,微信也在用着非常微信的方式,把自己十几年积累的上下文资产和分发网络,用一种极其微信的节奏,接入AI时代。
我是从2012年开始用微信的。
到今天为止,差不多用了14年。
回望过去我印象中所有的大更新,我觉得没有什么,比这次更大了。
这是新时代和旧时代的区别。
也会在互联网和AI历史上,留下浓墨重彩的一笔。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克

>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com

没有评论:

发表评论

Agent研究爆发期:190篇必读论文与500个开源项目源码免费获取

本文聚焦当前快速发展的Agent赛道,涵盖大模型智能体的决策逻辑、记忆机制、多智能体协作等前沿方向。适合从初学者到资深研究员,提供190篇必读论文、321个谷歌落地项目案例及500个开源AI智能体应用,扫描文末二维码回复指定关键词即可免费获取全部资源。 Tags: Agent ...