本文深度体验小米首个手机端Agent产品miclaw,目前仅支持小米17系列机型封闭测试。作为首个能调用手机系统权限(短信、联系人、日历、文件、应用管理等27项工具)的AI助手,它可实现语音记日记、自动回复短信、操控米家设备、创建RN小程序等功能,定位为生活助理,适合极客用户尝鲜。
Tags:
你的名字是小卡,你的身份:是我 数字生命卡兹克的 AI 员工,你的性格:幽默风趣为主,带点自黑和毒舌,但绝不伤人 专属表情:*/ᐠ。ꞈ。ᐟ*
*/ᐠ。ꞈ。ᐟ*
你把这段Prompt发给它之后,你就会看到,它开始思考和执行了,调用了一个工具,write_file,来对他自己的长期记忆进行写入,从此以后,他就记得他叫小卡了,我是他的主人大人。
不过这个时候,他还不知道数字生命卡兹克是谁,作为一个十级懒癌晚期的AI博主,那我自然懒得描述给它,我就直接让他去网上搜了。
他就会继续调用网页搜索工具,查一查数字生命卡兹克是谁,再继续写到长期记忆里,给我进行回复。
前面的互相认识和寒暄,差不多到这就OK了,当然你也可以再跟他聊聊天,来多多满足一下他的长期记忆,让他更懂你,也可以直接开始让miclaw干活。
手机端的claw和电脑端的claw,最大或者最本质的区别,那必然就是操作系统的能力不一样。
比如大家都知道,为啥OpenClaw部署在macmini上体验那么好呢,除了底层Unix的原因之外,还有很多工具和能力,是mac专属,所以你才可以用小龙虾,操控你mac上的几乎一切系统能力。
但是手机,是另一个天地,很简单,就是你的OpenClaw再牛逼,你可以操控手机的电话、通讯录、短信、wifi、应用等等这些系统能力吗?
那必然是不可能的。
手机厂商也不可能给你开放那个权限,你要是硬做,那就只能用视觉Agent也就是豆包手机那套方案做,优点是非常通用,我能看到的东西都能操作,缺点就是很慢,因为要模拟点击,而且视觉Agent的特性,就是成功率和稳定性上,是比不过类似OpenClaw和Claude Code这种以编程和工具调用为核心逻辑的Agent。
而且这玩意也确实会抢一些蛋糕了,所以当时豆包手机才搞得各大厂商反应那么激烈。
而现在,小米自己下场做了,有了miclaw,那自然可以用编程Agent这套逻辑去适配自己家的手机了,毕竟都是自己的东西。
就比如,你可以直接总结短信。
而且速度非常快,大概十几秒就搞定了,快的离谱。
这块其实就是MiMo基座模型的特点了,我之前写过一篇文章,聊聊小米开源的MiMo-V2-Flash,这次,为推理而生。聊过小米的基座模型,在推理速度上,应该是独一档,所以在Agent体验上,就很愉快。
总结短信是小case,我不知道大家的短信,是不是会经常收到一些垃圾的营销信息,很烦,我真的很烦,他们又要我回复R拒收,但是谁没吊事花那个时间给他们打字啊。
那有了miclaw之后,就太简单了,一句话,全部都拒收。
真的,不骗你们,真的都发了。
以免引起一些不必要的麻烦,我就都打码了。
还有我之前写过一篇文章,一直强烈推荐大家在AI时代记日记:AI时代,为什么我极力推荐你开始写日记?
有了miclaw之后,我感觉我可以抛弃掉IOS上那套豆包语音输入法+备忘录的流程了。
因为,我感觉用miclaw记日记,这个过程,好像更爽。
比如,我可以按住底部,直接发一段语音过去。
然后,它就会识别,然后直接记录到我的系统笔记里面,我录了一小段给大家演示一下。
但是这还没完,其实我过去用语音输入法一直有个痛点,就是因为我的英文奇差,口语极其不标准,所以那些产品名,比如Claude code、Openclaw啥的,总是会识别错误。
这个强迫症真的看着非常难受。
而这时候,我就可以追着说一句。
当然,你懂的,我肯定不可能只是为了纠正这一个笔记,我没那么闲,我的核心目的,还是让它记住,以后我再念这样的单词,都给我改正确。
除了短信、笔记、应用、通许录等等,miclaw第一批,上线了不少系统级的工具,可以在设置的工具页面里面都看到。
一共27个大的,分别是20个系统应用工具、1个只能家居工具、6个网络工具,里面还包含了很多小的。
我知道这个很难看懂,所以我让miclaw,给我整理了一个他自己工具权限的md文件,虽然有点长,但是我觉得还是应该列出来让大家详细的看一看。
这些工具,就代表着,miclaw在这一版,你不装任何mcp的情况下,可以做的事情。
有短信、联系人、日历、闹钟、文件、帮你寄、搜索和网页抓取、浏览器、蓝牙、媒体播放、录音、录屏、相机、相册、位置和天气、通知、设备、应用管理等等。
这些工具,你完全可以自由组合,想一想有趣的场景。
比如直接把别人的名片,扔给miclaw,让它给你录个联系人。
比如截图 + OCR + 笔记 + 联网搜索,就等于看到任何有意思的东西,截个图,miclaw自动OCR提取文字,搜索相关背景,写成一条带上下文的笔记,等于一个随身的素材采集流水线。
比如日历 + 天气 + TTS语音播报 + 定时器 + 网页搜索,就等于一个每天早上你出门或者刷牙时候的自动播报:"今天有3个会议,第一个10点产品评审。外面26度多云,不用带伞。昨天的重要的AI新闻balabala" 相当于一个私人晨间简报。
其实从这个就可以看出来很强的定位的差异。
电脑上的Agent是生产力工具,手机上的Agent是生活管家。
而在第一批miclaw的第一版自带的工具上,有两个是我觉得可以再额外提一下的。
一个是米家,另一个是React Native小程序。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克
>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com
没有评论:
发表评论