AI I024: Windows MCP，开源了！

2025年8月1日星期五

在大语言模型最初诞生之际，在大多数人看来，它就像个没有肢体，只会说话的大脑。但 MCP 到来后，一切便发生了翻天覆地的变化。

MCP 通过指定协议，为 LLM 装上了四肢，让它除了能够主动思考之外，还能与各种网页、本地文件进行更深层的互动，执行一些更复杂的操作。

在 MCP 这项技术被推广开来后，GitHub 上便诞生了多不胜数的优质工具。但较为可惜的是，绝大部分工具只停留在 Web 端交互，系统层面上的操作相对较少。

无独有偶，近日，我在 GitHub 上看到有开发者为此需求打造了一款工具，填补了这块空白。

它便是：Windows MCP，一款可在 Windows 系统上使用的轻量级 MCP 服务器。

GitHub：https://github.com/CursorTouch/Windows-MCP

配合上各种大模型，它可以做到：自动打开本地应用、完成鼠标点击、输入数据、抓取页面等多项操作。

整个过程让 AI 参与决策，并配合它的核心能力，对数据进行加工，在系统层面，智能定制多种需求。

下面是 Windows MCP 的一次实际演示：它基于提示词，自动打开浏览器，搜索天气信息，并智能抓取网页。

整个过程完全不用我们动手，就像有个看不见的智能助手在帮我们操纵这一切。

这就是 Windows-MCP 厉害之处，一切结果所见即所得，在系统层面上进行协作。而不是将 AI 藏匿于接口，在黑盒中运行。

借助工具自带属性，它可以做到：

基础操作：模仿鼠标操作和键盘输入

系统控制：打开本地应用、复制粘贴、执行系统命令

信息获取：网页内容抓取、保存页面截图

另外，该工具不需要安装复杂的视觉识别组件，可在任意 MCP 客户端上直接安装使用。

并适配 Windows 7 到 Windows 11 系统，推荐安装到 Gemini CLI、Claude Desktop 这些 MCP 客户端上。

基于此，可实现多种不同场景需求。

比如，你可以用它来读取 Excel 表中的数据，进行数据对比分析后，自动打开 Word 文档，生成一份详细的调研报告，并分发给同事进行参考。

Windows-MCP 的安装步骤颇为简单，以 Claude Desktop 举例，三步搞定：

1、先把代码下载到本地：

git clone https://github.com/CursorTouch/Windows-MCP.gitcd Windows-MCP

2、构建扩展文件：

npx @anthropic-ai/dxt pack

3、配置 Claude Desktop：

打开设置 → 扩展 → 安装扩展，选择生成的 DXT 文件即可完成安装。

以上，便是该项目的完整安装过程，更为详细的参数配置，可到 README 查看。

之前不少基于 MCP 的自动化工具，大多只能操作浏览器，功能相对有限。

虽然 Windows-MCP 这次把操控范围扩展到整个系统，功能更为强大与灵活，但与之对应的，把一切交给 AI，操作风险也会增加。

实际体验时，最好先对提示词进行严格把控，并在虚拟环境上进行测试。

有一定动手能力的，这个项目建议多玩一下，可探索性还是比较强的。

就目前而言，虽然 Windows MCP 还是一款处于初期的产品，但围绕这个方向，我相信后续能够挖掘出更多有用场景，在系统层面，打造一款专属于你个人 AI 智能助手。

好了，今天的分享到此结束，感谢大家抽空阅读，我们下期再见，Respect！

AI I024