本文提供AI编程工具Codex从安装到实战的完整教程,涵盖Windows/Mac安装、免费账号注册、国内API接入、CC Switch配置、必装插件与Skill开发,以及电脑操控、网站开发等10+自动化案例,适合零基础用户快速上手并规避数据丢失风险。
Tags:
这是我的第 343 篇原创,一直致力于从实战维度去分享工具、Agent、技巧、资讯
大家好 !我是唐舰长
舰长分享 Codex 有一段时间了,这次做了一篇整理文章,从安装到畅玩
让你从新手上手也能完美用上 Codex
没有 gpt 账号、不会接国内 API、使用 Codex 的插件、不知道从哪入手,以及我踩过的坑和经验,都会在这篇文章中分享出来
01|安装 Codex app
Codex app 安装还是比较简单,就跟下载软件一样
下载地址:https://chatgpt.com/codex/cloud
一定要下载应用,应用的界面用 Codex 体感会更好,更适合小白
Mac 电脑下载的就是一个 dmg 的包,可以直接安装。Windows 电脑则是一个指向下载包,意思是还需要去 Windows 的系统商店里下载
这里因为考虑到很多小伙伴的电脑情况,Windows 如果下载不了,解决办法就只有重装系统(遇到过太多小伙伴的系统商店都打不开)
也可以在你的电脑终端「cmd 」中去执行下面这行指令:
winget install Codex -s msstore
下载成功之后就打开 Codex app
Mac 电脑直接在「启动台」搜索 Codex 就可以打开,Windows 电脑也需要在左下角开始或者点击搜索按钮搜「Codex」然后打开。很多情况 Windows 电脑下载后会找不到软件在哪,因为它不会变成快捷指令放到桌面上
02|登入账号、了解界面
Codes 的使用方法有很多,可以直接连接中转平台的 API 模型,也可以连接国内模型就能直接使用。但如果你接的是除官方以外的 API,那你用 codex 的功能就没有那么的全面。
所以,舰长还是推荐大家一定要用官方账号登入,后面在去切换 API 接入的方式。这样就能实现用着全面的功能,接入便宜的 API
打开软件后,基本都是这样的界面(如果是英文,需要开启某个工具)
登入官方账号,不需要购买20 刀的套餐,就是一个普通的免费账号就行,我们的目的只是为了可以开启 Codex 的全部功能。
账号还是比较好获取的,用微软邮箱等等都能注册,但难点就是,刚注册的账号是需要电话验证的,而且这个电话验证还不支持+86 的电话进行验证
当然,也简单~
手机下载某鱼 app,然后搜就可以
基本就能搞定验证的问题了,老的账号基本上都不需要的,尤其是大家新注册的账号,基本上都需要度过这一关
登入进去之后,先不着急使用,因为你是免费的账号基本上也没有什么额度用不了,发消息可能也不回你,下面我们需要接入到国内或者其他 API 才行(下一个板块就会分享)。
在这之前先了解一下基本界面:
玩 Codex 一定要有创建项目文件夹的习惯,这样你的内容不会丢失,而且在同一个项目文件中基本知道你要做什么项目。
如果是普通搜索、普通的处理任务就可以在对话区域创建对话,不会干扰到项目的运行
如果是一些你想持续去做的事情,最好使用项目文件夹的方式去管理
点击新对话就是在对话中创建聊天
在项目文件处创建对话,就会在项目创建聊天
反正只需要记住,你想真正干活的,就用项目文件的方式去管理,这样你也多个对话窗口也能统一管理,不用担心以后找不到
你在 Codex 中创建「项目文件夹」也会同步在你的电脑里创建一个文件夹,你生成的任何文件、信息、聊天记录记忆也会保存在这个本地文件中,非常方便管理
这个时候在点开「插件」看一眼,如果你选择的就是用官方账号登入
这里面近 174 个插件你都能用,但一上来也不用想着全部用上,这个板块在下面我也会分享推荐使用的几个插件
03|配置模型到 Codex 中使用
下载CC Switch 软件
这是一个可以快速配置 codes 模型,而且还可以快速接入我们国内模型的一个软件
网址:https://github.com/farion1231/cc-switch/releases/tag/v3.16.1
打不开这个网址说明你缺少一个工具,因为这个是 github 上的项目,必须要才可以下载
划到页面最下面就能看到很多版本的软件下载地址(CC Switch是一个软件)
基本上 Mac 电脑和 Windows 电脑的两个下载的版本给大家框出来了
下载下来是不需要登入CC Switch账号的,打开 Codex 的配置,可以看到已经支持非常多的国内模型,只需要去对应的平台获取 API 然后填写即可
国内模型之前不好接入就是因为大部分模型就是 chat 接口,而 Codex 不支持这个接口,最新版的CC Switch 是会基于你接入的国内模型,走本地路由把Responses 改为 chat 接口,这样就能适配 Codex 的模型请求方式:
上面这张图就是新版CC Switch中 Codex 的配置及后续运行逻辑
这里我分享的内容是登入上 codex 账号后,也就是第二个板块分享的内容,然后在接入国内模型
下面有几个步骤,分别将文字信息和图片流程列出来,大家可以直接看
1.用账号登入一次,免费的账号也行(在 02 板块已经分享过)
2.在CC Switch的设置中,保留账号登入记忆(非常重要!!)
3.添加国内模型API
4.如果接入的模型是 chat 接口方式,需打开本地路由
5.切换到添加的国内模型并重启 Codex
在CC Switch的设置中,保留账号登入记忆
打开CC Switch点击设置
在「通用页面」下滑找到「Codex 应用增强」并开启
开启过后,你登录的 Codex 账号信息就会保留。这样的话,不管我们用什么中转 API,你都能基于该账号的权限,去使用它的完整功能(插件全开)
添加国内模型API
点到 Codex 并点击「+新增」
这上面这一行各种图标代表着可以配置各种的终端 Agent(Claude code 、gemini、Openclaw 等等)点到哪一个配置哪一个
进来之后就能看到非常多的模型供应商,在这些模型供应商中,找到你需要添加的模型(尽量不要自己去自定义配置)
就以 DeepSeek 为例吧,打开 DeepSeek 的 API 网站,登入账号并获取 API key(https://platform.deepseek.com/usage)
拿到的 APIkey,直接填写到专属 DeepSeek 导入到供应商页面
填写 API key,点击添加即可
如果接入的模型是 chat 接口方式,需打开本地路由
打开 CC switch 然后找到「路由」并进行开启
启用并重启本地的 Codex进行使用
打开之后既然拥有账号登入还能直接使用 DeepSeek 模型(对了,要重启你的 Codex,Windows 电脑需要在右下角关闭退出软件)
聊天记录保存
上面就是纯分享,对于刚使用 Codex 还没有一些数据的小伙伴可以直接跟着操作
如果!你已经正常使用 Codex,且像我一样有一堆历史记录的,一定要小心,我下面会分享怎么避免
包括我刚刚上面那种接入 DeepSeek 的截图也能看出来,我左侧的聊天记录全部消失,只剩下几个文件夹
而我之前的文件夹中有很多数据:
以下是老用户,经常使用 Codex 用户的内容分享
第一步
在本地找到对应的 config 文件
Mac:主文件夹(打开隐藏文件夹)——.codex——config.toml
Win:C 盘——用户——.codex——config.toml
第二步
打开文件,并查看字段名称
model_provider = "OpenAI"和[model_providers.OpenAI] 这两个是不是都是显示的 OpenAI,如果不是 OpenAI 也没有关系,记住你的那个显示词(需要在配置 DeepSeek 的API 的使用同步修改)
第三步
打开 CC-switch添加中转模型,流程和上面一致,复制 API 并写入,重点是要把页面滑到下面来
model_provider = "custom"和[model_providers.custom]
CC switch 默认就是custom也是这个导致很多人丢失数据,那做法就是在添加 DeepSeek 这个供应商之前,把你原本的那个词(比如我的是 OpenAI)修改到相对应的位置(最好是复制,别手敲)然后在点击添加,基本上就能解决数据丢失的问题
我刚开始配置的时候也没有注意,就直接点击了添加并且进行切换。当我打开之后,看到我的 codex 里面什么数据都没有了,我才后知后觉地发现这个问题。
04|Codex 插件
大家如果第一次打开插件市场,大部分人都会懵。一堆英文名,一堆看起来很厉害的工具。好像都牛,但不知道自己到底用不用得上。
我就站在每一位用户需求角度,给大家梳理一份真正实用的 Codex 插件和工具清单
你不用全装,先把本次分享的几个插件用好,Codex 的价值基本就出来了
Codex 官方插件很多,我这边整理的表里就已经有了 174 个,而效率不是越多越好,找到你实用的即可
1.必装插件|Computer Use
让 Codex 操作电脑
Computer Use 是让无数人心动下载 codex的插件,之前在只有Mac 电脑支持时热度就不低,现在 Windows 也已经支持
它能看屏幕、点按钮、输入文字,操作你电脑上的应用,默认我们每一个人在电脑面前操作。如果说你有很多在电脑面前操作的事情,都可以交给他,速度慢点,但好在不需要你去做,可以多点时间做别的,
面前市面上是可以用过 API 的方式去接入到软件中,但很多的网页,APP 就不支持 API,那用Computer Use就能解决这样的问题。
使用场景:
帮你点网页后台
从一个软件复制内容到另一个软件
操作 WPS、浏览器、桌面工具
帮你跑一遍软件流程
做一些重复点击的事情
在 Mac 电脑中体验最好,因为它不会占用你的鼠标,你还可以使用电脑去做别的事情,但是 Windows 就不能同步操作。
2.必装插件|办公三件套
Documents / Spreadsheets / Presentations
装上这几个插件,做出来的 word 、ppt、excel 效果是真的很不错
就像我这种 Excel 表格效果就是 Codex 做的,颜色配比都很舒服。之前有一个 word 文件,客户需要我在 word 当中的表格中填写数据
Codex 只会在表格中写,word 的其他文字内容是不会破坏的
3.必装必装插件|Cloudinary
本地文件转在线链接
本地文件转在线链接这场景,你如果正在使用 Codex 肯定会遇到,为什么呢?
因为 Codex APP 是本地的软件,他可以读取我们本地的文件夹,但是在一些程序的调用上,只支持在线链接,而本地文件转在线链接一直都是一个繁琐的事情。
这个用的少肯定没有太多的体感,本地文件和在线文件两者都非常重要。重点是Cloudinary他是一个免费的转在线链接的工具(必装)
使用场景:
本地文件太大,可以转为在线链接方式
本地音频转在线音频链接、本地图片转在线链接
4.必装插件|设计、内容创作
在 Codex 中有很多偏向于设计的插件,都是比较不错
HyperFrames by HeyGen:火了很久的生成视频插件,给到一些知识性的内容,或者给到一些图片、视频、音频等素材直接帮你剪辑成一个视频出来,并且还能配上字幕等等。
Figma: 设计稿和代码打通,用代码去生成画布,在画布中设计师还可以微调,调整过后还能让 Codex 安装要求再去改代码
5.必装插件|小白开发全套
Vercel / Supabase / Cloudflare:想做网站、小工具再看
拿 Codex 去做开发才是最好的选择,但是碍于不是开发出身会受到限制,但如果你用上这几个插件,即便你不懂代码也能开发出像样的可分享链接产品并非 html 文件或者(127.0.0.1:3000)这种无法对外分享的程序
Vercel 可以搞定管前端部署、Supabase 可以作为后端数据库、认证、存储、Cloudflare 可以搞定域名、CDN、边缘服务。
这几个串起来,就是从想法到上线的基础链路,以前你让 AI 写代码,最多得到一堆文件。但用上这组工具以后,Codex 可以继续帮你把东西跑起来、部署出去。
适合什么场景?
做个人网站
做产品介绍页
做 AI 小工具
做后台管理系统
把 Codex 写出来的项目上线
6.skill|飞书工具:适合文档、表格、会议和团队协作
如果你平时用飞书,这类工具就很值得关注,飞书现在有官方 CLI,也有官方 MCP。
你可以简单理解成:
Codex 有机会直接操作飞书里的文档、表格、消息、日程和会议
它能覆盖的东西很多:
消息、文档、多维表格、电子表格、幻灯片、日历、邮箱、任务、会议、知识库、审批、OKR。
安装方法:
帮我安装飞书 CLI:https://open.feishu.cn/document/no_class/mcp-archive/feishu-cli-installation-guide.md
适合什么场景?
查飞书文档,整理成文章素材
读取多维表格,生成运营报表
根据会议纪要提炼待办
给群里发通知
从知识库里找资料
如果你经常在飞书里写文档、开会、管任务,这个很值得添加
这样就可以在 Codex 中去获取飞书中的文档内容或者群发通知等等
7.skill|企业微信工具:适合消息、通讯录、待办和日程
企业微信也有官方 CLI,叫 @wecom/cli
微信的 cli 安装会稍微复杂一些,但是也是让Codex 协助你安装。帮微信 cli 的开源项目发给 Codex,并让他引导我们继续安装
协助我安装微信的 cli,项目地址:https://github.com/WecomTeam/wecom-cli
使用场景:
查成员和通讯录
拉取会话消息
下载群里的文件、图片、语音
创建待办和日程
创建文档或智能表格
上面就先分享飞书和企业微信,钉钉也有,但操作更为复杂一些,但是有 Codex 的帮助肯定方便很多。这里分享的都是办公领域的
基本上国内的公司都是用这三大厂商作为日常办公,把这些平台的操控方法给到 Codex,让 Codex 帮助你进行安装
8.skill|APIZ 聚合中转平台
这是一个付费工具,但很便宜
网址:https://apiz.ai/#/?ref=QD65UHGK
因为 APIZ 本质上是一个本地 CLI 工具,可以调用很多 AI 生成能力(图片、音频、视频)
像大名鼎鼎的 Image2 模型,在这个平台中仅只有 4 分钱一张图片。无论是做海报、配图、朋友圈、小红书、封面。任何设计到图片的生成,都能使用这个模型去做,效果还特别好
官方 Codex 是有一个 Image2 的插件的,也就是它原来官方自己的生图模型,但碍于价格和接入比较麻烦,选择 APIZ 是最好。
他还支持
parse:解析公开视频分享链接,拿无水印地址generate:提交 AI 生成任务tasks:查看和等待异步任务transfer:把外部图片、音频转存到 APIZ CDNspeak:文字转语音models:查看模型目录voices:查看音色account:查账号和余额
给一个某视频平台的链接,帮你下载无水印视频、提取字幕文案等等功能都具备;对做内容的人来说,这个很香,全程没有任务技术卡点,接口调用方式自动加载
05|Codex Skill
很多人对这个「skill」有种很熟悉却又陌生的感觉,熟悉的是很多之前的同事 skill、前任 skill 热度都非常的高
但这些热度很高的 skill,不一定能适合你,所以这个板块就是针对 skill 进行分享,大致内容为:
1.Agent Skill 到底是什么
2.理解一个 Skill 由哪些文件组成
3.通过一个案例,理解 skill 的结构
4.结合自己的高频任务,开始设计第一个专属 Skill
5.Skill 资源在哪找
6.Skill 商业化如何做
从理解到制作到创收思路,打造适合你的 skill,或者找到适合你的 skill
1、Skill 简单说,是什么
「Agent Skill」
如果你第一次听到这个词,先不要把它想成什么高深的开发技术
可以先把它理解成:你给 AI 配的一份岗位说明书,再加上一套操作手册和工具箱
Skill 做的就是这件事。它不是让 AI 变聪明一次,而是让 AI 记住一套你认可的方法,并且在合适的时候自动调用
大家可以先想一下,你有没有一件事,是每周、每天都要重复做,而且你心里其实有固定标准的?比如写周报、做选题、改文案、整理表格、备课、做直播脚本。这样的事情,就非常适合做成 Skill
2、Skill 和普通提示词有什么区别
很多人听到这里会想:这不就是把提示词写长一点,存起来反复用吗?
这个问题问得特别好!Skill 的底层确实离不开提示词,因为我们和大模型沟通,本来就离不开文字指令。但它不只是提示词。它更像一个可管理、可扩展、可执行的工作包。
普通提示词的问题是,你每次都要复制粘贴;内容一长,容易混乱;不同任务的要求堆在一起,还会互相干扰。Skill 的优势是,它可以分层存放信息,AI 需要什么才看什么,需要工具时才执行工具。
所以我们今天记住一句话:提示词像一句临时交代,Skill 像一个固定岗位。临时交代可以解决一次问题,固定岗位可以长期稳定交付
这也是这么多大佬都来深造 skill 的原因
3、一个 Skill 到底长什么样
最简单的 skill,其实就是一个文件夹+SKILL.md组成
name-skill/
└── SKILL.md # 核心说明文件(必需)
一个最简单的 Skill,只需要一个文件,叫 SKILL.md。这个文件里通常有两块内容
第一块是 备注,也就是这个技能的名字和简介。它告诉 AI:我是谁,我适合什么时候被使用。
第二块是 说明,也就是具体做事的说明。它告诉 AI:如果你要用我,就按什么流程做,注意什么标准,最后输出什么结果
如果 Skill 继续变复杂,就可以加更多文件夹。常见的是 references、scripts 和 assets
name-skill/
├── SKILL.md # 核心说明文件(必需)
├── scripts/ # 可执行脚本、Python、API(可选)
│ ├── APIZ.sh
│ └── render_poster.py
├── references/ # 参考文档(可选)
│ ├── acommunity-copy-rules.md
│ └── offline-event-rules.md
└── assets/ # 静态资源(可选)
└── logo.svg
references 用来放比较长的参考资料,比如品牌规范、平台尺寸、合同审查规则、课程大纲模板
scripts 用来放可执行脚本,比如生成图片、处理表格、批量改文件、调用某个 API
assets 用来放素材,比如 Logo、字体、模板、示例图、参考文件
用一位老师的厨师炒菜案例来解释,厨师做菜,讲究的是 1 流程、2 配方、3 工具、4 。结合起来做出一份好菜
而 skill 的制作也是需要 1skill.md(流程)、2references(配方)、3scripts(工具)、4assets(材料)。结合起来做出一个好用的 skill
不是说简单的 skill 就不是好菜,比如做菜的厨师,只做一个拍黄瓜,拍黄瓜不需要锅(工具),只需要材料。只要能做出来,一个 skill 只要适合你的口味(需求),那就是一个好的菜(好skill)
4、 Agent 是如何使用 skill
Agnet 调用 Skill 的核心机制总结成三层
第一层:简介层(AI 第一次检索本地的 skill 总文件夹)
AI 每次会先看到这些简短说明,用来判断自己有哪些技能、什么时候该调用
第二层:指令层(在进入到详细的 skill.md中查看)
就是 SKILL.md 的完整说明,只有当 AI 判断这个任务需要某个 Skill 时,它才会加载这部分
第三层:资源层
就是 references、scripts、assets,只有任务进一步需要资料、脚本或素材时,AI 才会去读取或执行
这就是为什么 Skill 比一大段提示词更适合长期使用。它不但更省信息量,也更不容易被无关要求干扰
5、普通人最适合做哪些 Skill
到这里大家可能会问:我又不是开发者,我到底该做什么 Skill?
我的建议很简单:不要先想着做一个大而全的万能技能,先从你最高频、最稳定、最有标准的一件事开始
自媒体博主:可以做选题拆解 Skill、文章配图 Skill、短视频口播稿 Skill
老师或培训师:可以做备课 Skill、课堂练习 Skill、课后作业点评 Skill
运营人员:可以做社群活动 Skill、复盘报告 Skill、活动海报文案 Skill
职场人:可以做周报采访 Skill、会议纪要整理 Skill、表格清洗 Skill
专业服务人员:可以做合同初审 Skill、客户需求访谈 Skill、方案大纲 Skill
判断一个任务适不适合做成 Skill,可以问三个问题:第一,它是不是经常发生?第二,我是不是有固定标准?第三,它是不是经常需要同一批资料、模板或工具?如果三个答案都是是,那就很适合
比如:
【企业微信每日日报发送群聊】适合去做
【电商作图】适合去做
【小红书作品笔记】适合去做
6、三句话设计你的第一个 Skill
在 Codex 的兑换界面输入“/”然后找到「skill Creator」这个创建技能的技能,然后给 Codex 发下面这些信息
不用写代码,只要先回答三句话
我想让 AI 帮我重复完成的任务是:__________。
这件事做得好,必须符合这几个标准:__________。
这件事经常要用到的资料、模板或工具是:__________。
比如我以松果阅读社为例,就可以这样填:
任务:策划亲子阅读活动,并写社群招募文案。
标准:语气温暖、流程清楚、家长能一眼看到收获,不能制造焦虑。
资料:活动流程规范、社群文案模板、品牌 Logo、海报模板。
这三句话写完,你的 Skill 雏形就出来了,AI 会帮你补充: SKILL.md、references、scripts 和 assets。
7、现成 skill 资源哪里找
方法一:Codex 系统里面的官方 skill
方法二:安装外部 skill
外部 skill 需要先安装一个检查 skill,防止有漏洞、危险的 skill 盗用你的数据,窃取你的密钥等等
Skill强力推荐一:skill-vetter——技能审查
因为我们会通过帮助我们安装,对于毒skill没有判断能力,优先安装这个技能
安装:npx clawhub@latest install skill-vetter
skill 聚合网站:
https://www.skills.sh/
https://clawhub.ai/skills
https://github.com/JayLZhou/Awesome-Agent-Skills
https://redfox.hk/skills
方法三:.自媒体平台搜索
一些好的 skill 会有很多人出视频、文章进行分享,只需要根据你的需求去搜索关键词即可。一些博主开源的 skill 也基本上都会在公众号上发布,比如卡兹克的 AIhot(热点)、袋鼠帝的电商 skill、花叔的写作skill 等等
9、如何通过 skill 实现创收
这个是很多人最感兴趣的一部分,下面板块我会进行分享
自己去创作出很多的 skill 去开源上传 github,是可以带来影响力,深层次的价值。但远远不如直接创收来的快速,每个人基本上都有自己圈子,有自己工作的赛道,有同行、有同事。
可以说,只要能够将做出来的 skill 引入你自己圈子,那也是一个可观的创收
单一的 skill 还不足以能快速实现,最好的还是用 AI 制作网站,现在制作网站的成本已经非常低了,全程由 AI 托管制作都可以
而把成熟的 skill、自己的 skill 转成网站的形式去使用,那就是一个不错的选择
就比如一些做的很不错的自媒体 skill,做到你自己网站里,可以筛选爆款、分析账号等等,就能带来不菲的收益
06|Codex 上手案例一:Computer Use使用案例
Computer Use是什么?可以操控你的鼠标
"能操控鼠标是吧?然后呢?"
然后就没有然后了。工具摆在那里,不知道往哪用
所以这个板块我不讲原理、不讲配置,直接上场景。我自己实际跑通的 10 个使用场景,每一个都是日常工作中真实会遇到的事情。有些看起来很小,但积累起来就是每天省出来的一两个小时
Computer Use 的核心逻辑很简单:它不是去调接口、找元素、写代码,而是直接操控你的鼠标和键盘,像一个人坐在你电脑前帮你干活
能看屏幕、能打字、能点击。你能手动做的事情,它基本都能做
1.服装店铺库存更新
这个场景是我觉得 Computer Use 最被低估的能力之一
在 AI 时代,很多工具可以帮我们生成一张全新的 Excel 数据表。但问题是:实际工作中我们需要的不是"生成新表",而是"基于已有的数据模板去修改数据"
比如你有一张库存总表,格式固定、公式固定、关联关系固定。你不需要 AI 重新建一张表,你需要它在现有的表上更新今天的数据
Computer Use 就能做到这一点。它会打开你现有的 Excel 文件,定位到对应的单元格,输入新的数据,保存退出
实际应用场景:每天店铺扫码机器会导出一份当日的售出数据。拿到这份数据后,让 Computer Use 打开库存总表,对照售出数据逐项扣减库存数量,更新完成后保存
这样每天的库存都是实时的,不需要人工对账。线下门店、线上店铺都适用,也可以应用在在线协同表格上。
2.邮箱自动化
邮箱里需要自动化的事情太多了:整理未读邮件、回复常规邮件、提取发票信息做报销、从邮件中收集汇总信息……
这些事情每一件都不难,但加在一起就很烦
Computer Use 可以做的事情:
打开邮箱客户端或网页版,扫描未读邮件,根据你设定的规则判断哪些需要回复。对于需要回复的邮件,先拟定发送内容放到草稿箱中,等你确认后一键发送。
不是直接帮你发出去,而是先放草稿,让你自己确定自己选择发送,直接省事很多
草稿拟好之后长这样,你觉得没问题直接点发送就行:
对于发票类邮件,它还能自动提取附件中的金额、日期、开票方等关键信息,汇总到一张表里,方便你后续做报销。
3.抖音素材采集
做自媒体的小伙伴经常需要采集平台上的素材——热门视频标题、评论区内容、竞品账号数据等等
很多人搞不定接口,也不想花钱买第三方工具
那最直接的方式就是:让 Computer Use 帮你操控浏览器,像人一样去搜索、浏览、复制、保存
给它一个关键词,它会打开抖音网页版,输入搜索,逐条浏览结果,把标题、点赞数、评论数这些信息抓取下来,整理成表格保存到本地
帮我打开我的抖音网页版,在 edge 中,收集 AI 视频剧相关内容,并采集 20 条视频保存到 excel 中
「浏览器插件」
同样的逻辑也适用于小红书:搜索关键词、采集笔记标题、正文摘要、互动数据,汇总输出
速度肯定比接口慢,但胜在零门槛、零成本,不需要任何开发能力。对于日常的小批量素材采集,完全够用
4.抖音作品上传
采集完素材、做完内容,下一步就是发布
做过自媒体的小伙伴流程都清楚:选视频文件、填标题、加话题标签、选封面、设置发布时间、点击发布
每一步都不复杂,但如果你一天要发 3-5 条视频,这个流程走下来也要花不少时间
让 Computer Use 来做:指定本地视频文件路径和对应的标题、标签信息,它会自动打开创作者后台,上传视频,填写信息,设置定时发布
你只需要提前把视频文件和对应的文案准备好,剩下的流程交给它跑就行
5.自媒体账号数据分析
做自媒体一定要看数据,但每天手动登各个平台后台去看数据、截图、记录,实在太费时间了
Computer Use 可以做的事情:按顺序打开各个平台的创作者后台,进入数据分析页面,抓取关键指标(播放量、涨粉数、互动率等),汇总到一张本地表格里
「插件电脑操控」帮我打开 Edge 浏览器里的公众号页面,进行文章的数据分析。如果数据较差,请告诉我应该如何解决,并推荐相应的方案。
每天早上跑一遍,你就有了一份多平台的数据日报。不需要自己一个一个平台去翻
时间长了还能做趋势对比,看哪个平台涨得快、哪类内容数据好
6.电脑文件瘦身
很多人的电脑文件非常乱,桌面一堆截图、下载文件夹里塞满了 PDF、Word、视频,各种格式混在一起。以前整理文件就是自己搞,一个一个看、一个一个拖
现在直接让 Computer Use 帮你干这个事:
扫描指定文件夹,按文件类型分类归档,大文件标记出来,重复文件识别出来,过期的临时文件清理掉
整个过程它会自己打开文件,创建对应的分类文件夹,把文件一个一个拖进去。你只需要告诉它规则,剩下的事情交给它
比如:我让她帮我把电脑里的视频文件全部筛选+分类,方便我后续上传云端和删除
7.百度网盘文件迁移
百度网盘是很多人的云端仓库,尤其是视频文件比较大,放在本地电脑上太占空间,迁移到网盘里是最好的选择
让 Computer Use 来做这件事就很简单:
指定本地文件夹路径,打开百度网盘客户端或网页版,自动选择文件上传,上传完成后确认,再回到本地把已上传的文件做标记或删除。
上传和下载这种重复操作,最适合交给它
同时结合我第一个案例电脑瘦身的案例,结合起来用,一边分类一边上传,这样数据在云端,本地内存也出来了
8.图片文件批量识别改名
这个场景太常见了
电脑上几百张图片,全是 IMG_20250601_001、微信图片、下载的多文字等等,这些名字时间一长根本不知道哪张是哪张,想找一张特定的图要翻半天或者根本不找重新做
Computer Use 可以做什么?逐张打开图片,识别图片内容,然后根据内容自动重命名。
9.企业微信和飞书的消息检查与回复
这个场景针对的是日常办公通讯,个微没办法弄,那企业微信和飞书也是日常的工作聊天软件,这是可以操控的呀
很多人一忙起来就忘了看消息,等回过神来发现企业微信或飞书里堆了一堆未读。有些是需要立即回复的,有些是可以晚点处理的
让 Computer Use 定时检查未读消息,按优先级分类。对于常规的、可以标准化回复的消息(比如"收到""已确认""稍后处理"),直接帮你拟好回复。对于需要你亲自判断的,标记出来提醒你。
其实我觉得有价值的地方在于我们在外面不行随时随地的看消息,可以让 Codex 先判断,拟好消息,我们只需要看着那个对话框里的消息拟定的好不好,如果不错就让 Codex 操控电脑帮我发
群里的小伙伴问“老师,怎么知道我在codex里面是在调用ccswitch的API,还是直接在使用别的?”
正常回答我肯定是让他自己去看,AI 怎么回复的?
可以先看本地 ~/.codex/config.toml:如果 model_provider 指向的是你在 CC Switch/中转里配置的 provider,或者 base_url 是本地/中转地址,那就是走 CC Switch;如果是 OpenAI 官方 provider,没有自定义 base_url,并且走官方账号额度,那就是直连 GPT。
最简单的验证方法:切换或关闭 CC Switch 后,看 Codex 是否跟着变化;会变化基本就是走 CC Switch。今晚直播我会把 config 和实际判断方法演示一遍。
这回复的也太完整太细致了,直接让他帮我发过去,搞定
10.电商产品上架 + 出图自动化
最后一个场景留给做电商的朋友,因为我没有专业做电商,但我知道很多小伙伴都在做,所以给大家列个例子出来,Computer user 是可以帮电商的小伙伴做上架、出图等等
产品上架这个事情,流程非常固定:登录后台、创建商品、填写标题描述、上传主图详情图、设置价格库存、选择分类、提交审核
一个新品上架走一遍可能要 15-20 分钟,如果是一批新品上架,半天就没了
整个链路打通之后,上架效率至少提升 3-5 倍
我的使用习惯是:
把每天固定要做的重复操作列出来,挑出最费时间且最没技术含量的那几个,交给 Computer Use
它真的能干很多事情,每天的一些固定流程可以全部由它来干,我们可以泡杯咖啡、思考别的事情。固定的事情就交给 Codex 来干就行
省下来的时间去做真正需要我思考和判断的事情,这才是工具该有的用法——不是替你想,而是替你动手
07|Codex 上手案例二:0 基础开发小网站
其实用 Codex 做网页开发很简单,生成一个 html 网页,可能只需要一句话就行,难的是 html 是一个文件无法快速传播和控制,上传到服务器中还要搞定域名、服务器等等
本次这次问题都能得到解决,以及如何让 AI 生成的网站没有那么AI 味,UI 效果较好;没有做过开发也能快速学习、理解、复刻
1.做什么
很多小伙伴其实都会卡在做什么,有时间、有Codex,但是不知道做什么
我给大家分享一个思路,你做的那些 skill(技能)或者别人的优质 skill,除了能自己使用,还能不能商业化呢?
就比如一个简单生成图片 skill、生成自媒体平台数据的 skill、创作类的 skill
这些 skill 对于能用上的小伙伴不算什么,简单。那如果想要分享给其他人使用呢,很难,除非把 skill 的整个文件发过去,然后在让别人安装到自己的 Agent 上
对于有基础的人来说还行,若是没有基础就没办法了。所以就可以基于这些 skill 去做一个网站做一个平台,让别人进行使用。
2.开发前准备
能不能用 Skill 转网站的这个思路来实现,这个问题也是作为一个小白,要思考的问题
所以需要先验证
一样,还是直接问 Codex 的可行性,发现确实可以做,因为可以抽出 skill 中的一些脚本,一些接口的调用逻辑
数据库用什么
做网站只要涉及到需要登入账号、数据缓存、对话码这些,就需要用到数据库(SQLite/MySQL)
提到数据库很多人就会放弃了,包括我以前也是,因为压根没有专业学习
但是在 Codex 中开发者完全不用担心这个问题,点击插件搜索「Supabase」
Supabase 是什么、能干什么:
一句话:Supabase 是「开源版 Firebase」,基于 PostgreSQL 的托管后端平台(BaaS),让你不用写服务器代码,直接用数据库、登录、文件存储、实时推送、AI 向量检索。
免费版本500MB,基本够用
好处就是在 Codex 中 Codex 可以直接操作插件,不需要我们去授权、连接
网站托管用什么
网站的托管重要性不多说,没有托管上线的只能叫 html 文件,无法分享。除非自己去搞定服务器和域名,那样也不是一个小白能轻松解决的事情
所以我们用「vercel 」在这个平台中就能将的网站托管上,不需要搞定服务器域名,这个平台自带。而且免费版足够使用。
插件中搜「vercel 」,然后点击添加之后再 需要注册账号+手机验证(国内即可)没有这一步的就是安装失败多试几次
前端 UI 怎么设计的更好看
很多 AI 去设计前端都太差了,就比如我一开始的页面是下面这个:
这效果太差了,很明显的 AI 味。而通过专业 UI 设计后,就是我一开始展现的效果,无论是 UI 还是动态都高级很多,这也不是什么秘密。也是一个开源的 skills
是 GSAP 官方推出的 skill,功能十分好用
安装方法:
帮我安装这个 skill:https://github.com/greensock/gsap-skills
SKills 用什么
除非你自己已经开发了很多实用的 skill,不然完全可以用已经有的一些 skill 去做,比如我这次要做一个热点聚合的网站,我用的就是「红狐数据」平台上 skill(https://redfox.hk/)
这是一个自媒体API 平台,你想要的几大自媒体平台他都有 API 接口,同时还有一堆 Skill 可以用,价格非常低。可以说自媒体用这个平台就够了
而我这次用的就是
https://redfox.hk/skills/no/KJq7uXHY
https://redfox.hk/skills/no/8dAG7qks
这两个 skill,一个是热点聚合、一个是公众号热门文章查询。也是我现在网站上有的功能;还有其他的实用 skill,大家可以自行尝试一下。
安装方法:
先帮我安装这个 skill,看看需要我配置什么信息进来。https://github.com/redfox-data/redfox-community/tree/main/skills/trending-hub
把 skill 的 github 地址复制给 Codex,然后输入内容。因为这个平台是收费的需要给 Codex 提供一个 API,为了防止他不提醒我们,单独加一句「看看需要我配置什么信息进来」
然后就提示我们需要给 API,这个时候去平台上获取一下即可然后发给 codex
API 只需要给一次,其他 Skill 安装的时候就不需要给了,把你想要在你的网站上实现的功能的相关 skill 安装到你的 Codex 中
3.正式开发
开发项目要有一个习惯,就是在 Codex 中创建一个项目文件夹,这样后面项目管理起来比较方便
有了项目文件夹后,就把上面的自媒体平台的一些 skill 进行安装,方便后续开发的时候用得上
写产品 PRD
我现在想要基于这个热点的 skill 获取,做一个网站,公众号的也嵌套在这个网站里面。也就是说两个页面,一个页面是热点的获取,一个页面是公众号的内容的获取。我需要按照我们刚刚上面所说的,按照 8 点、16 点、24 点,进行加载。加载完之后,将数据保存到我们的数据库里面。前端就一直显示 8 点、16 点、24 点这三个时间段的数据,让每个用户都看同样的内容。
这个热点获取,它里面分很多的榜对吧,很多的榜,你需要把这些榜都做成一个框啊,每一个榜都要做成一个框出来,能让我立马看到抖音的是什么热点,公众号什么热点,小红书是什么热点啊,这样去做。公众号的获取页面则是使用一个按钮操控,通过关键词进行搜索。具体流程如下:
1. 用户搜索一个关键词,点击搜索;
2. 选择搜索条件;
3. 将搜索到的信息全部提取出来。
这是目前我需要做到的效果,最后请帮我放到这个Vercel网站上,登录的话,就用邮箱进行账号登录,不需要验证,只需要注册邮箱+密码的方式。不登录也是可以看热点信息的,但是想要使用公众号的信息收取,就必须要登录。前端生成使用这个gsap-skills技能,效果也要好啊,我不能马马虎虎的。数据库、网站部署、前端这些都有插件和 skill,都可以基于这些插件和 skill 帮助你一起去做。整个网站是基于热点收集和公众号文章搜索,作为底层原理去做。还需要制作一个兑换码页面和管理这兑换码生成页面出来。
你先帮我做一个 PRD 文档
上面是我发给 Codex 的信息,也就是一些基本项目和路径告诉他,生成一个 PRD 文档,然后在让 Codex 基于这个 PRD 文档去开发网站,效果会比较稳定。
但需要注意顺序,要求中提到一些基于 skill 去做网站,起码你需要先把这些 skill 安装到你的 Codex 中,Vercel插件和Supabase插件也需要提前安装好。
等 PRD 生成好后,文件咱就不看了,看一下他的简要概述能符合你的要求就行,不符合或者理解错了,在多说几次
点击 Codex 对话中的分支
为什么要分支呢?其实是为了防止上下文过长,最近 Codex 也经常出现什么 URL 调用使用失败,重试 5 次之类的内容。手动分出来可以提高稳定性。
然后就是审查了,因为在开发时会遇到很多他不敢做的事情,需要你自己确定比较烦,可以开成自动审查
这样基本上在他开发的时候我们去做一些别的事情,让它自己干活就行
基于 prd 帮我开始构建项目,最终实现部署到「Vercel插件」上,「Supabase插件」数据库插件也给你安排上。直接开始做,需要什么,遇到什么卡点先自己解决。
在这里,需要自己将这两个插件添加到对话中(放到文字信息框中),然后再发给Codex
跑了 20 几分钟就完成了项目的开发,但是告诉我们账号登入和数据库还没有做好
在运行的过程中可能会打开「Supabase数据库」的网站,需要你手动点击授权,一般在运行过程中Codex 是不会等你授权完成的,那在他这次的任务完成之后还需要让告诉他你已经授权过
一般情况我们用 codex 接的是中转的 GPT5.5 的模型,到这基本上已经完成了项目开发,它会给你一个网址,在浏览器中打开就可以体验
因为模型能力问题,用 5.5 基本上不会有太多的 BUG,做出来就能用:
4.成本与数据
很多人看到"3 小时做一个网站"会觉得不真实,所以我把整个项目的成本全部摊开来给大家看:
时间成本:
前期准备:我差不多找平台和 skill 花了 1 个小时
PRD 文档生成 + 确认:约 15 分钟
Codex 自动开发(包含数据库、前端、部署):1 个半小时
其中大部分时间其实是在等它跑、看它做、确认效果。真正需要我动手的操作非常少,基本就是点授权、看效果、提修改意见。
花费成本:
没有服务器费用、没有域名费用、没有运维成本。一个能注册登录、能查数据、能定时更新的完整网站,总成本不到一杯奶茶钱。这就是现在做独立项目的门槛
很多人学了 Codex、学了 AI 工具,最后都停在了"会用"这个阶段。会聊天、会问问题、会生成代码片段,但始终没有一个完整的作品出来。
对自己的好处:
做项目的过程会逼着你把散装的知识串成链路。数据库怎么连、前端怎么渲染、部署怎么配、定时任务怎么跑——这些东西只看教程永远是碎片,只有做过一个完整项目才能真正理解它们之间的关系。
做完一个,第二个就快了。第三个就更快。到后面你会发现,任何一个想法从概念到上线,你都能在一天之内搞定
对别人的好处:
你做的东西能解决别人的问题。就像这个热点聚合网站,对我来说是一个练手项目,但对需要每天追热点的自媒体人来说,它是一个实实在在的工具。
能解决问题的东西就有价值,有价值就能商业化。哪怕只是加一个兑换码系统收个 9.9,那也是从 0 到 1 的商业闭环。
对简历的好处:
这个才是很多人忽略的重点。
你用 Codex 做出来的项目,写到简历上不是写"我会用 AI 工具",而是这样写:
独立开发项目:热点情报聚合平台
1.独立完成产品设计、全栈开发与部署上线,覆盖需求分析、架构设计、前后端开发、数据库设计、自动化运维全流程
2.基于 Next.js + Supabase + Vercel 构建,实现用户认证体系、定时数据采集、多平台热点聚合、公众号文章检索等核心功能
3.接入第三方数据 API,设计定时任务实现每日三时段自动数据更新与持久化存储
4.前端采用 GSAP 动效框架,实现高质量交互体验与响应式布局
5.设计兑换码权限管理系统,支持付费功能的分级访问控制
这就是一个完整的独立开发者的项目经历。有产品思维、有技术选型、有落地能力、有商业化设计
面试官不会问你"这个是不是 AI 写的",他只会看到:这个人能独立把一个想法从概念变成线上产品
这就是"独立开发"四个字的含金量,未来是紫领人才的世界,一个合格的紫领就是要有自己想法,还能有自己的能力
以上就是本次分享的全部内容,希望这篇文章能够帮助大家~
Codex 更多的就是开始那么点门槛,跨过去之后就是把现成的功能用好就行
如果对您有帮助,感谢您的观看
关注公众号并添加舰长微信,领取智能体学习资料,并参与智能体技术直播讲解
另外非常欢迎大家加入**[唐舰长AI落地智能体交流群]****,主要交流群每周都会进行公益直播教大家搭建AI智能体工作流**