文章分享了作者使用Chrome内置Gemini AI一周后的核心心得。重点不是启用方法,而是四个提升效率的实际场景:1. 长文速筛,用AI生成大纲快速判断价值;2. 视频内容提取,无需字幕直接获取要点;3. 跨标签页信息对比与聚合;4. 无缝集成AI绘图。同时指出其不适于深度对话、隐私页面及复杂自动化。核心价值在于"零距离"获取网页上下文,减少切换负担。
本文字数 2578,阅读大约需 5 分钟
一周前,Google 终于把 Gemini 装进了 Chrome。
消息一出,于是能看到各种教程刷屏,都在教怎么启用这个功能。
很多新功能的命运都是这样:「发布时万众瞩目,一周后无人问津」。
不是功能不好,是很多人没找到真正适合自己的使用场景。
启用只是第一步,关键是怎么把它用起来,用出价值。
工具的价值,从来不在于功能有多炫,而在于它能否真正解决自己的实际问题。
这篇文章,我不打算再教你怎么启用,而是分享我自己实际在用的四个实用场景。
或许能给你一些启发。
先说一个本质问题:为什么需要浏览器内置 AI?
我们已经有了 ChatGPT、Claude、Gemini、Kimi 等众多 AI……为什么还需要一个「浏览器内置的 AI」?
我的答案是:上下文零损耗。
举个例子你就明白了👇
看起来只是省了几步操作。
但实际上,省掉的是上下文切换的认知负担。
你不需要在「阅读」和「提问」之间反复跳转,不需要担心复制漏了关键信息,也不需要手动整理多个来源的内容。
AI 就在你浏览的那个页面上,它能看到你看到的一切。
这种「零距离」的协作方式,是独立 AI 窗口做不到的。
场景一:长文速筛——快速判断一篇文章值不值得读
信息过载是这个时代的通病。
每天刷到的文章、推送、链接,多到根本看不完。
很多时候,花了 10 分钟读完一篇长文,最后发现——「就这?」
时间已经花出去了,收不回来。
之前我是怎么做的?
靠「快速浏览」来判断。
先扫一眼标题,再看看小标题,翻到结尾看看结论……
但这种方式很容易出问题:要么漏掉真正有价值的内容,要么被标题党骗进去,浪费时间。
现在我是怎么做的?
打开一篇文章,按下 Ctrl + G(Windows)或 Control + G(Mac),唤起侧边栏的 Gemini。
然后直接发送这段提示词:
请将提供的文稿整理为一篇结构完整的大纲笔记,帮助我快速把握文章的全貌。
要求:
1. 骨架与血肉:既要提炼文章的逻辑框架,又要保留关键细节和论述,确保信息完整。
2. 保留原味:尽量保留原文的关键词汇和生动表达,拒绝过度抽象或概念化。
3. 格式:仅输出最终的大纲笔记,不要包含任何行动建议或额外废话。这里,我没有让它直接帮我总结全文,而是以完整大纲笔记的形式进行输出。
这样做的好处是,通过阅读输出的大纲笔记,我能知道这篇文章到底在讲什么,同时还能获取到关于文章的更多细节。
用于判断:「如果值得读,再细读;如果不值得,直接关掉,省下很多时间」。
这个场景,我几乎每天都在用。
场景二:视频速筛——不用看完,也能知道值不值得看
如果说长文还能快速浏览,视频就完全不行了。
一个 30 分钟的访谈、一个 1 小时的演讲,你不看完,根本不知道里面讲了什么。
而且视频没法「跳读」,只能从头看到尾。
之前我是怎么做的?
想快速了解一个视频的内容,得先想办法拿到逐字稿。
要么找带字幕的视频,用插件提取字幕;要么把视频下载下来,用通义听悟之类的工具转录。
即使借助 NotebookLM,能直接获取字幕,但步骤上还是有些繁琐,需要切换多个页面。
现在我是怎么做的?
直接在 YouTube 页面上唤起 Gemini。
然后发送下面这段提示词:
请将该视频拆解为一份详细的结构化大纲笔记(需要包含对应的时间戳)。
要求:
1. 完整还原文章的逻辑脉络和核心论点。
2. 保留原文中的关键术语和精彩引用,不要过度概括。
3. 旨在帮我判断该视频是否值得细看,因此需兼顾深度与可读性。不需要下载,不需要插件,不需要逐字稿。
它会自动读取视频内容,然后输出一份结构化的大纲笔记。
通过阅读这份大纲笔记,我就能快速知道这个视频的主要内容是什么。
看到感兴趣的点,还可以直接点击对应的时间戳,进度条直接跳到对应位置。
这个使用场景,彻底改变了我获取视频内容的方式。
场景三:多标签页对比——跨页面信息一次聚合
选购、调研、比价时,最烦的就是在多个页面之间来回切换,手动对比信息。
比如,我想了解几个页面的综合信息,得开好几个标签页,然后在它们之间反复跳转,一边看一边记。
容易漏信息,也容易记混。
现在我是怎么做的?
打开 3-5 个相关页面。
唤起 Gemini,通过 @符号,选中目标页面,然后输入自己想问的任何问题。
它会自动读取所有打开的标签页,然后一次性输出结构化的结果。
这个场景,特别适合需要快速获取信息、做决策的时候。
场景四:无缝使用 Nano Banana Pro
Gemini in Chrome 集成了 Nano Banana Pro 的能力。
可以直接在侧边栏里完成生图或编辑图,不需要切换工具。
比如,这篇文章的封面图,就是通过这种方式生成的。
我在写完初稿后,直接在侧边栏里输入:
请根据当前页面,创建一张 Excalidraw 手绘风格公众号封面图,请给我具体的图片。很快,图就出来了。
虽然这个功能不是刚需,但它确实让整个创作流程更流畅了。
不用再打开另一个网页,不用再在多个工具之间跳转。
一切都在浏览器里完成。
什么时候不该用 Gemini in Chrome
说了这么多好处,也得说说它的局限,以下是我个人觉得目前并不适合使用 Gemini in Chrome 的部分场景。
1、深度对话、复杂推理
Gemini in Chrome 的侧边栏,更适合「快问快答」。
如果你需要多轮深度对话,比如让 AI 帮你梳理一个复杂的思路,或者反复迭代一篇文章,还是用独立窗口的 Gemini 或 Claude 更合适。
侧边栏的空间有限,长对话会很不方便。
2、隐私敏感页面
在银行、医疗这类页面上,是否要让 AI「看到」你的内容,需要自己斟酌。
虽然 Google 承诺不会存储敏感信息,但谨慎一点总没错。
3、Auto Browse 自动化操作
这个功能目前还在早期,适合低风险的简单任务。
复杂操作还需观望,我自己试下来,觉得目前的 use case 比较鸡肋。
如何启用 Gemini in Chrome
说了这么多实用场景,如果你还没启用,这里简单说一下步骤。
根据 Google 官方文档(https://support.google.com/gemini?p=mws_gic_ga),使用 Gemini in Chrome 需要满足这些条件:
具体步骤:
1、更新 Chrome 至最新版,同时将浏览器语言设置为英文;
2、在 Chrome 地址栏输入 chrome://flags,搜索「glic」(gemini live in chrome),把相关权限都启用;
3、确保你的 IP 在美国
4、重启 Chrome
再次打开 Chrome,右上角可能就能看到 Gemini 的 logo 了。
不同账号、不同环境,可能会存在差异,如果没有生效。
Mac 用户,可以打开终端,输入这条命令强行设定:
open -n -a "Google Chrome" --args --variations-override-country=usWindows 用户可以通过一个脚本一键开启,脚本地址获取地址:https://github.com/lcandy2/enable-chrome-ai
文档里有详细的安装步骤,照着一步步做即可。
写在最后
早在几个月前,OpenAI 也推出了类似的产品——Atlas 浏览器,功能上和 Gemini in Chrome 很相似。
但从我个人的使用体验来看, 更喜欢用 Chrome 一些,因为 Gemini 在语言质量上更自然一些。
如果你本身就喜欢 Gemini 的风格,Gemini in Chrome 会让你更喜欢。
这篇文章分享的四个场景,是我这段时间实际在用的。
它们不一定都适合你,但希望能给你一些启发,也能找到自己的最佳实践。
以上,就是本文全部内容,如果觉得这篇文章对你有启发,点赞、比心、分享三连就是对我最大的支持,谢谢~
• 用 Gemini 解锁 YouTube 新用法,信息获取效率提升 10 倍
• 有了 NotebookLM 后,还需要 Obsidian 吗?
• 我试了 NotebookLM 学习法后,彻底抛弃传统学习方式
• NotebookLM 的这个更新,比 Gemini 3 Flash 更让我兴奋
• 我用 NotebookLM 解锁 PPT 的 5 种玩法,实现了 PPT 自由