在大语言模型最初诞生之际,在大多数人看来,它就像个没有肢体,只会说话的大脑。但 MCP 到来后,一切便发生了翻天覆地的变化。
MCP 通过指定协议,为 LLM 装上了四肢,让它除了能够主动思考之外,还能与各种网页、本地文件进行更深层的互动,执行一些更复杂的操作。
在 MCP 这项技术被推广开来后,GitHub 上便诞生了多不胜数的优质工具。但较为可惜的是,绝大部分工具只停留在 Web 端交互,系统层面上的操作相对较少。
无独有偶,近日,我在 GitHub 上看到有开发者为此需求打造了一款工具,填补了这块空白。
它便是:Windows MCP,一款可在 Windows 系统上使用的轻量级 MCP 服务器。
GitHub:https://github.com/CursorTouch/Windows-MCP
配合上各种大模型,它可以做到:自动打开本地应用、完成鼠标点击、输入数据、抓取页面等多项操作。
整个过程让 AI 参与决策,并配合它的核心能力,对数据进行加工,在系统层面,智能定制多种需求。
下面是 Windows MCP 的一次实际演示:它基于提示词,自动打开浏览器,搜索天气信息,并智能抓取网页。
整个过程完全不用我们动手,就像有个看不见的智能助手在帮我们操纵这一切。
这就是 Windows-MCP 厉害之处,一切结果所见即所得,在系统层面上进行协作。而不是将 AI 藏匿于接口,在黑盒中运行。
借助工具自带属性,它可以做到:
基础操作:模仿鼠标操作和键盘输入
系统控制:打开本地应用、复制粘贴、执行系统命令
信息获取:网页内容抓取、保存页面截图
另外,该工具不需要安装复杂的视觉识别组件,可在任意 MCP 客户端上直接安装使用。
并适配 Windows 7 到 Windows 11 系统,推荐安装到 Gemini CLI、Claude Desktop 这些 MCP 客户端上。
基于此,可实现多种不同场景需求。
比如,你可以用它来读取 Excel 表中的数据,进行数据对比分析后,自动打开 Word 文档,生成一份详细的调研报告,并分发给同事进行参考。
安装使用
Windows-MCP 的安装步骤颇为简单,以 Claude Desktop 举例,三步搞定:
1、先把代码下载到本地:
git clone https://github.com/CursorTouch/Windows-MCP.git
cd Windows-MCP
2、构建扩展文件:
npx @anthropic-ai/dxt pack
3、配置 Claude Desktop:
打开设置 → 扩展 → 安装扩展,选择生成的 DXT 文件即可完成安装。
以上,便是该项目的完整安装过程,更为详细的参数配置,可到 README 查看。
之前不少基于 MCP 的自动化工具,大多只能操作浏览器,功能相对有限。
虽然 Windows-MCP 这次把操控范围扩展到整个系统,功能更为强大与灵活,但与之对应的,把一切交给 AI,操作风险也会增加。
实际体验时,最好先对提示词进行严格把控,并在虚拟环境上进行测试。
有一定动手能力的,这个项目建议多玩一下,可探索性还是比较强的。
就目前而言,虽然 Windows MCP 还是一款处于初期的产品,但围绕这个方向,我相信后续能够挖掘出更多有用场景,在系统层面,打造一款专属于你个人 AI 智能助手。
好了,今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
没有评论:
发表评论