2025年8月1日星期五

Windows MCP,开源了!

在大语言模型最初诞生之际,在大多数人看来,它就像个没有肢体,只会说话的大脑。但 MCP 到来后,一切便发生了翻天覆地的变化。

MCP 通过指定协议,为 LLM 装上了四肢,让它除了能够主动思考之外,还能与各种网页、本地文件进行更深层的互动,执行一些更复杂的操作。

在 MCP 这项技术被推广开来后,GitHub 上便诞生了多不胜数的优质工具。但较为可惜的是,绝大部分工具只停留在 Web 端交互,系统层面上的操作相对较少。

无独有偶,近日,我在 GitHub 上看到有开发者为此需求打造了一款工具,填补了这块空白。

它便是:Windows MCP,一款可在 Windows 系统上使用的轻量级 MCP 服务器。

图片

GitHub:https://github.com/CursorTouch/Windows-MCP

配合上各种大模型,它可以做到:自动打开本地应用、完成鼠标点击、输入数据、抓取页面等多项操作。

整个过程让 AI 参与决策,并配合它的核心能力,对数据进行加工,在系统层面,智能定制多种需求。

下面是 Windows MCP 的一次实际演示:它基于提示词,自动打开浏览器,搜索天气信息,并智能抓取网页。

整个过程完全不用我们动手,就像有个看不见的智能助手在帮我们操纵这一切。

这就是 Windows-MCP 厉害之处,一切结果所见即所得,在系统层面上进行协作。而不是将 AI 藏匿于接口,在黑盒中运行。

借助工具自带属性,它可以做到:

基础操作:模仿鼠标操作和键盘输入

系统控制:打开本地应用、复制粘贴、执行系统命令

信息获取:网页内容抓取、保存页面截图

另外,该工具不需要安装复杂的视觉识别组件,可在任意 MCP 客户端上直接安装使用。

并适配 Windows 7 到 Windows 11 系统,推荐安装到 Gemini CLI、Claude Desktop 这些 MCP 客户端上。

图片

基于此,可实现多种不同场景需求。

比如,你可以用它来读取 Excel 表中的数据,进行数据对比分析后,自动打开 Word 文档,生成一份详细的调研报告,并分发给同事进行参考。

安装使用

Windows-MCP 的安装步骤颇为简单,以 Claude Desktop 举例,三步搞定:

1、先把代码下载到本地:

git clone https://github.com/CursorTouch/Windows-MCP.gitcd Windows-MCP

2、构建扩展文件:

npx @anthropic-ai/dxt pack

3、配置 Claude Desktop:

打开设置 → 扩展 → 安装扩展,选择生成的 DXT 文件即可完成安装。

图片

以上,便是该项目的完整安装过程,更为详细的参数配置,可到 README 查看。

之前不少基于 MCP 的自动化工具,大多只能操作浏览器,功能相对有限。

虽然 Windows-MCP 这次把操控范围扩展到整个系统,功能更为强大与灵活,但与之对应的,把一切交给 AI,操作风险也会增加。

实际体验时,最好先对提示词进行严格把控,并在虚拟环境上进行测试。

有一定动手能力的,这个项目建议多玩一下,可探索性还是比较强的。

就目前而言,虽然 Windows MCP 还是一款处于初期的产品,但围绕这个方向,我相信后续能够挖掘出更多有用场景,在系统层面,打造一款专属于你个人 AI 智能助手。

好了,今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

没有评论:

发表评论

Windows MCP,开源了!

在大语言模型最初诞生之际,在大多数人看来,它就像个没有肢体,只会说话的大脑。但 MCP 到来后,一切便发生了翻天覆地的变化。 MCP 通过指定协议,为 LLM 装上了四肢,让它除了能够主动思考之外,还能与各种网页、本地文件进行更深层的互动,执行一些更复杂的操作。 在 MCP ...