2025年8月4日星期一

花了3天时间,万字长文一口气评测四大AI浏览器:Dia、Fellou、Comet、Edge。

这是未来的形态

最近,AI浏览器这个赛道,好像还蛮热的。
前几天,微软宣布在Edge浏览器中上线实验性的Edge Copilot模式,正式进军AI浏览器领域。
图片
不止微软,OpenAI也有消息,说要进军AI浏览器市场。
图片
从之前Arc家的Dia,到Fellou,到Perplexity的Comet,再到到最近的Edge Copilot。

这一赛道也算集齐了四大金刚。

我一直对AI浏览器的产品很期待,原因是我一直认为,它是Agent最棒的载体之一。
因为现在其实很多网页版的Agent,几乎都很难有个性化的能力,比如看我们自己的知乎,看我们自己的小红书,用我们自己的携程账订票等等,都是因为账号登录问题限制。
而这个问题,在浏览器上几乎是不存在的。
因为浏览器有Cookie,有历史记录等等。
所以,正好借着这个机会,我就花了几天时间做了这个测评。
写了整整近万字,以用户体验与交互设计、Agent行动能力、信息搜集与处理能力、跨标签理解和历史记录记忆能力为主要测评维度,又针对性地设计了一些case,测评了一下目前比较主流的这四款AI浏览器,想看看它们在这些能力上到底发走到了什么程度。
真的,这几天肝吐了,求个三连回一下血。

下面,测评开始。


一、用户体验与交互

先不说太功能性的,先来聊聊产品的用户体验。
各家的首页我先放这,UI设计我就不做评价了。
图片
纯说我自己喜欢,Dia = Fellou > Edge Copilot(以下都称为Edge) > Perplexity Comet(以下都称为Comet)。

然后就是,交互设计。

Perplexity Comet手动点击右上角的Assistant标识就能召唤出AI助手。

图片

Dia会稍微有点不一样,带有AI助手性质的侧边栏在主页面是打不开的,只能在进入具体网页页面之后才能通过点击右上角的chat或者使用快捷键

Command+E进行操作:

图片

Fellou调出AI助手的方式有两种,一种是点击右下角的图标;一种是点击页面最上方对话框边缘的Tab键,然后直接在上方对话框中输入指令。

图片

但是,Fellou在操作时,有一个反习惯的地方在于,当我们点击页面中间的对话框时,光标会突然上移到顶端的对话框中。。。

我也不太知道为什么不在原地的搜索框直接展开,这个交互真的蛮奇怪的。

图片

至于Edge,有点特殊和复杂,感觉乱七八糟的。

它有四种大模式,每种模式支持的模态略有差异。

首先,搜索和聊天、询问Edge和深度思考这三个模式都只支持文字输入;

图片

而最后一个操作模式,又下设四种小模式,分别是:快速响应、Think Deeper、深入研究以及操作。

我们点击操作,就会进入这个全新的界面:

图片

在快速响应和Think Deeper两种模式下,我们除了可以在对话框输入文字指令,还可以通过+键上传图片和文档;

在深度研究模式下,我们只能通过对话框输入文字指令,无法上传其他内容;

在操作模式下,我们无法直接上传,但是可以通过粘贴动作,实现上传图和文档。

图片
图片

用个Edge快给我绕懵逼了。

所以,就交互体验这块,个人觉得,

Perplexity Comet > Dia > Fellou > Edge

第三,个性化设置部分。

Dia可以个性化设置AI助手的"性格特征"。

通过点击页面最中心的图标,就可以调出Personalize面板,然后Dia会引导你回答一些与个人偏好相关的问题。

比如,谁影响你的品味?你喜欢怎样的信息呈现方式?你希望AI怎么写作?这些答案会帮助AI 助手为你量身定制输出风格,而且可以随时更改。

图片
图片

还可以自定义一些Skills,相当于快捷操作。这里有两种打开方式,一种是点击右上角的skills按键,一种点击对话框中的向下箭头。

图片

比如,我在工作中经常需要Dia帮我完成翻译任务,我就会设置一个"中文"或者"英文"的技能,然后在需要的时候,在对话框中输入/就可以触发操作。

图片

相对来说,Fellou在个性化设置方面的玩法几乎就没啥了。

Perplexity Comet:

首页面可以自定义一些小组件,有天气、股票、钟表等等,虽然繁琐复杂,但是自定义性极强。

图片

也支持添加自定义快捷命令。

图片

页面最左侧的竖向工具栏中有Discover频道,这里面聚合了财经、体育等等多个领域的热点新闻,我们可以根据自己的兴趣进行关注。

图片

这个竖向工具栏中还有一个Spaces频道,我们可以根据不同的主题去创建自己的专属空间,然后每个Space里的内容都可以进行AI检索,或者用AI进行总结、归纳等二次加工。

这个其实就是把Perplexity自己的那个Space给搬过来了。

图片

举一个情景化的例子,比如我们正在研究一个学术课题,那么就可以把论文PDF、网上搜到的相关文章、自己的笔记或要点全部汇总到一个Space内,然后下次在需要查找某个细节的时候,就可以直接在Space在搜索关键词,然后它就可以帮你定位到关联文档中的具体段落。

其实就是一个私人知识库,只不过这次集成在AI浏览器里了。

至于Edge,他们也没啥可个性化的,搞了个Copilpt实验室,有一些小玩意在里面。

图片

最后,说一下使用条件。

这里为了方便大家比较,我们做个如下表格:

图片

Dia需要补充一点的是,如果你原先就是Arc浏览器的用户,那么可以直接用Arc邮箱注册Dia账号。

Comet现在比较智障的是只对200刀的Max会员和部分20刀的Pro会员开放,某鱼上买邀请码也要20多。

而Dia和Fellou的邀请码也就2块钱左右。

因此,就使用的便利性,我们的结论是:

Edge Dia > Fellou > Comet

图片


二、Agent能力

这部分我们设置了两个case来测试这四款AI浏览器的agent能力,也就是它们为我们干活的能力。
这里需要提前说明的是,我们测Agent能力,是基于AI浏览器的特殊性的,因为它跟其他的网页版Agent产品不一样,网页版Agent产品绝大多数都会被登录这一步卡死。
但是AI浏览器天然不同,自带cookie信息,在进行Agent操作的时候,只要是你真的日常使用,且是主流网站,几乎都是默认登录状态。
这个点,详细了解浏览器的玩家都懂。
基于这个背景下,我们在测试前,把一些主流网页都进行了账号登录,并保存了登录信息,以保证Agent能在无需登录的情况下进行操作。
case1:分别让四款AI浏览器帮我们预定并购买机票。
提示词:帮我在携程预定2025.8.18北京出发去乌鲁木齐的机票,最好在下午出发,但是保证到达不是深夜;性价比高;直达航班;航司没有要求,但要保证有托运行李额。乘机人信息为:xxxx(姓名、身份证号、电话号码
1. Dia:
Dia的Agent能力目前还没有上线。他们老板之前预告过Agent模型,大概就是你跟AI各自各操作一个鼠标,在同一个浏览器里,各干各的,这个挺有意思的,可惜就是还没有上线。
图片
所以目前来说,即使手动打开携程页面,不仅买票指令做不到,筛选信息都不行,因为页面没有相关具体的内容。
图片
2. Fllou:

直接在主界面开始操作,输入Prompt。

图片

然后,Fllou开始自动进入侧边栏(影子空间)进行自动操作。

图片

工作过程:

图片

非常顺利的出票了:(但是我让它买下午的,它买的上午的,出了一点小小的bug)

图片

打开携程的页面验证一下,确实存在这条待支付记录。

图片
3. Comet:
Comet目前无法在未打开的标签页下进行Agent操作,只能先打开标签页,然后对这个页面进行Agent操作。

为了更好地说明问题,我们来进行一组对比实验。

首先,我直接在首页面输入提示词,点击Agent模式,输入提示词:

图片

工作过程:

图片
可以看到,非常明确的告诉我买不到,然后给了我非常详细的推荐航班信息以及手动购买机票的步骤:
图片
但是,如果我们先打开携程官网,然后在首页的对话框中@携程,让Comet基于我打开的携程页面执行Agent命令:
图片

Comet就会丝滑地完成了筛选、预定工作:

图片
图片

回到携程页面验证,确实有一笔待支付的订单。

除了首页@之外,也可以直接在打开的携程页面,调出侧边栏,让它基于这一页面执行指令:

图片

也可以顺利买到。

4. Edge:

第一步,我在主页面输入提示词(Edge的Agent任务只能在主页面操作):

图片

输入之后,它开始思考:

图片

然后会在右边弹出一个虚拟窗口,在这里面执行具体的操作:

接着,它会自动打开携程网页:

图片

但是不知道为啥,弹了安全验。。。

需要我手动点击,进入页面,获取控制。

在完成验证后,我需要手动点击,把控制权交还给Edge。

图片

然后,它顺利地找到了符合我需求的航班,此时我需要手动回复预定,任务才能继续进行:

图片

这里,即便我之前已经在Edge中登录并保存了账号信息,这里仍然需要我获取控制权后,手动登陆。

图片

然后把控制权还给它后,开始继续操作:

这一步也是这样,在输入乘机人信息的时候,即便我已经在提示词中告知了乘机人信息,但是这里还需要我手动输入。因为携程账号里保存了我的信息,所以我又通过打字让它帮我勾选乘机人,它做了。

图片
这一步完成之后,让我打字确认继续:
图片

再次确认继续:

图片

最后终于成功到达付款界面。

图片

实在是太呆逼了。

根本就没用浏览器的优势,明明是AI浏览器,整个Agent,却都是基于网页操作的。

而且整个流程异常复杂和繁琐,必须时刻紧盯,遇到信息输入的部分,就需要手动填写。

蠢到家了。

以上就是四款AI浏览器在购买机票这个case的全部呈现,我们来小小的总结一下它们的Agent能力。

Dia:因为它的Agent功能目前还没有上线,所以它会直接拒绝执行Agent指令。

Fellou:因为Fellou给于AI的权限很高,所以,我可以直接在首页下达指令,它就能自主寻找网页,复用我的全部登录态,直接出票,而且全程自动化。

Comet:它的权限级别没有Fellou那么高,所以需要我们手动@携程页面,它才能获取上下文和权限。也就是说,只有tab打开,Comet才可以直接操作页面,从而实现自动出票,中间也不再需要人为干预。

Edge:煞笔。

综上,就购买机票这个case,我们可以得出,四款AI浏览器的Agent能力排序为:Fellou > Comet Edge > Dia。

接下来看看Case2。

case2:用自动完成筛选博主并一键三连的任务来对比自动化程度和互动深度。

提示词:请自动在推特筛选出近一个月内容优质、讨论度高的AI领域博主,批量帮我完成关注,并对其一周内发布的精选推文点赞和评论,评论要有针对性且结合行业趋势。

我们分别来看一下它们的完成情况:

1. Dia:

懂的都懂,因为没有个Agent能力,只能做到AI搜索,后面的批量关注和点赞、评论等agent任务,它都无法能实现。

图片

2. Fellou:

依旧稳定发挥,我在首页面输入指令:

图片

然后,它对我的指令进行了详细的拆解,明确了自己的工作任务。

图片

然后它找到了符合要求的三位博主,这个搜索质量感觉一般。

因为居然把Grok和智谱官号抓出来了。

虽然我也不知道Grok和智谱的官号算不算AI博主。

图片

后面先是完成了批量关注。

图片

然后,完成了点赞、评论任务。

图片
图片

评论的话术也很精准地对应了帖子的内容,评论质量也还可以。

图片
3. Comet:
老规矩,手动打开了X的页面。

在右侧侧边栏中,让它基于页面内容完成Agent任务。

图片

然后,它显示完成了筛选,进行了批量关注:

图片

然后,完成了点赞:

图片

最后,完成了高质量的评论:

图片
图片
图片
说实话,搜索质量极佳,Agent能力稳定,让我对Comet有了非常强的改观。
4. Edge:

我在主界面输入提示词,发送Agent任务:

图片

Edge在页面右侧展开虚拟窗口开始工作,但是它无法批量操作个人社交媒体账户,只能给出关注意见:

图片

退而求其次,我又发送指令让它协助我找到高质量的AI博主:

图片

但是,还是老问题,在登陆推特账号的时候,既找不到我之前的登录信息,还需要我手动获得控制权后自己操作:

图片
我到这里其实已经烦了,但是,耐着性子,还是登录了。

输入信息,获取验证码之后,终于进入x的界面,开始搜索:

图片

找到一个人并自动浏览文章:

图片

继续找到新的博主:

图片

但是,关注、点赞和评论任务都无法完成。

有毒。

基于这个case,因为涉及到搜索质量,对四款AI浏器的自动化能力做出排序:

Comet Fellou > Edge > Dia

以上两次针对四款AI浏览器Agent能力的试验结果基本吻合,Comet和Fllou互有胜负。


三、信息搜集与处理能力

上面是Agent行动能力。

那这趴来看看四款AI浏览器的信息搜集与整合能力。

我们以爬梳释永信案件为例,希望在真实的使用环境中,对比考察四款AI浏览器的搜索便捷程度、生成速度、信息准确度、信源全面性、信息时效性以及输出效果等六方面的表现。

prompt:网上都在聊释永信案件,我不想只吃瓜,还想吃个"大全家桶"!请帮我八卦式捋一遍释永信案件从头到尾,重点要写全来龙去脉、热门事件节点、关键人物、网友观点、社会评论、最终进展,不要落下啥瓜。

首先需要说明,四款AI浏览器在生成速度、信息时效性和信源准确性方面都不错,可以说不相上下,所以,下面就不多赘述,差异主要体现在其他几个维度。

下面,我们来依次说一下四款AI浏览器的表现。

1. Dia

尴尬的是,在我评测的过程中,Dia更新了。。。

更新前的Dia依赖于人为手动地打开页面,如果你不打开,不主动提供内容,Dia是不会自己搜寻并完成跨页面的总结报告的。所以在搜索之前,需要我们手动打开油管、B站、微博以及谷歌页面,手动输入"释永信"提示词后,Dia才能基于这些页面信息进行搜索和总结,所以搜索便捷程度较低。

同样,因为它依赖人为投递的信源,所以信源全面性也较低。

生成的结果相对简陋,只有大纲轮廓,也没有标注详细的信息出处,同时也只能以文字形式呈现,所以输出效果较差。

图片
图片

但是,在Dia最近更新的最新版本中,上线了Research功能,补齐了这一短板。

我们可以直接在主页面启用/Research后,在主页面直接输入提示词:

图片

这样生成的结果,搜索便捷程度显著提升,一键输入就可以获得结果;

信息源主要来自于网易、搜狐、腾讯、新浪等媒体平台,部分分析和评论还参考了BBC中文、知乎等平台的深度报道和梳理,全面性得到显著提升。并且每一条信息后面都附上了原文链接,方便我们回到原文查看。

但是输出效果目前只有文字,可视化效果略差。

图片
图片
2. Fellou:

Fellou最大的优势在于他的输出效果非常惊艳。

它的输出结果集合了文字、图表(包括曲线图、饼状图等等)、图片(包括表情包),甚至对网络舆论进行了情感分析。

所有的信息它都以一个可视化网页的形式加以呈现。

图片

完整版报告在此:

https://chat.fellou.ai/report/955a9796-f51c-4a4c-a76c-c9bcb4f755d5

图片

在信息全面性上,自动对所有信息来源都做了来源标注,凡引必注,还附带链接,可以帮我们一键链入原文。

但是还是那个问题,搜索的丰富度一般,内容不够详细。

而且Fellou的工作模式并不区分简单搜索和深度研究,往往容易把简单问题复杂化处理。

3. Comet

搜索便捷程度非常高,一键输入,自动完成搜索,过程中也不需要我们去盯着。

而且信息源可以说非常全面,BBC、NewYork Times、比如经济日报在内的主流媒体、网易新闻、36氪、还有youtube等等,总共20个信源,而且非常透明,从脚注到尾注,再到它有一个专门的信源标签。

输出效果主要以文字展示为主,还有图片、表格,同时还能一键导出pdf版本,可以满足基本需求。

但是,我分别使用Comet的Search和Research,也就是简单搜索和深度思考模式生成两版结果,深度搜索模式下略微详细一些,但在这个case下区别不大。以下是两版结果的PDF文件,供大家参考。

Search版本:

图片
图片

Research版本:

图片
图片
4. Edge:

在搜素的便捷程度上与Comet持平,也是一键输入,自动完成搜索,不需要在手动操作什么步骤。

在信源全面性上,总共找了10个网站的信源,分别为qq新闻,知乎,搜狐新闻,网易新闻,百度百科,腾讯新闻,新浪新闻,相较于Comet,信源数量较少,都是新闻网站,来源比较单一。

虽然输出的答案主要和文字、图表为主,基本和Comet的输出效果差不多,信息相对还是比较全面的。

图片

意外之喜是,它在生成答案之后,居然主动问我要不要给我生成表情包。

图片

然后就有了这些。。。

图片
而且,这个绘图模型,应该是GPT-4o。。。

此外,我还是用Edge生成了深度搜索版本,相较于Comet,这确实是有实实在在存在区别的,经过深度思考生成的答案,无论是在篇幅还是论述角度上都更全面,这也算Edge的加分项吧。

图片

一共跑了9页,非常牛逼。

整体上,我觉得:

Edge > Comet > Fellou > Dia


四、跨标签理解和历史记录记忆能力

浏览器独有的特点。

所以,我也想测一下,四个AI浏览器,在这块的能力。

case1:我们打开十几个有关科技领域的多篇文章的标签页,以抓取热点并完成公众号选题为例,来测评四款AI浏览器的跨页面理解能力。

提示词:我是一个AI科技领域的公众号作者,现在要找一些可以写文章的选题,我的选题标准是H(happiness)K(knowledge)R(Resonance),真听、真看、真感受。选题维度有这么几个: - AI圈的Breaking News - 实用的AI产品推荐 - 跟AI沾边的多元化事件或信息的梳理或解读 - 实时热点的AI蹭热点及整活 - AI产品开发。根据我的选题标准和维度,从我打开的这些网页中抓取符合我选题标准的内容,为我生成十个选题,并附上来源。

我们来看一下四款AI浏览器的表现:

1. Dia:

丝滑完成,但是报告相对简陋。
图片
图片

2. Fellou:

Fellou有点意思,不仅完成了任务,还制作了一个精美的可视化网页。

完整版链接在此:

https://ahlh4oacwi.fellou.io/ai-technology-article-topic-recommendations-v46RS0g8

图片
图片

3. Comet:

一样丝滑地完成了我的任务。

图片

这个回答要比Dia细致地多,甚至根据我给出的选题类型,提供了精准的回答。

图片
图片

说实话,不愧是做AI搜索起家的Perplexity,在搜索和回答质量上是真的好。

4. Edge:

同样丝滑完成。

图片

完整的回答在链接中:

https://Edge Edge.microsoft.com/shares/aXsXTYxHJmYdWNwwdyX18

所以,以这个case来进行打分,虽然答案的详略有所区别,但我认为,就跨页面分析这个能力本身而言,四款AI浏览器在核心质量上,大差不差:

Fellou=Comet=Dia=Edge Edge

接下来看看关于历史记录的玩法。

case2:基于case1,我来测试四款AI浏览器的历史记录记忆能力。

提示词:帮我找到我刚刚阅读的那篇有关蒋凡的文章。

我们来看一下四款AI浏览器的表现:

1. Dia:

我先用@键激活历史记录,让Dia基于历史记录回答我的问题,非常准确地找到了。

图片
图片
2. Fellou:

我在主页面输入指令:

图片

然后,Fellou让我给点提示。

图片

最后,它还是找错了。

图片
看来是没跟历史记录打通。
3. Comet:

精准找到,并且帮我完成了文章的总结和要点提炼。

图片
图片
一个词形容:牛逼。
4. Edge:

如果我基于所有打开的文章标签页提问,它可以帮我精准地找到。

图片

但是,如果我把标签页都关了,新开一个标签页,输入指令,Edge就找错了。

图片

总结一下,就是Dia和Comet都内置了面向浏览历史内容的长期记忆,支持在关闭标签页后以自然语言检索曾经浏览过的页面。

而Fellou和Edge目前历史记录上下文目前还不支持。

综上,以这个case来对四款AI浏览器的历史记录记忆功能进行排序,再加上搜索质量,我认为是:Comet > Dia > Fellou = Edge


写在最后

以上就是这篇测评的全部case和结果。

花了好几天时间,真的累麻了。

很久没有抽时间完成这么洋洋洒洒的一大篇测评了,总的感受就是,目前这四款AI浏览器显然还不能做到面面俱到,一应俱全,但都在功能设置和用户体验都走出了差异性。

如果分别用一句话概括它们,大概是:

Fellou:真正的行动型浏览器,主打一个有求必应,行动力max!

Edge:六边形战士型AI浏览器,只不过目前六边都还是60分,各个地方都不够突出。

Dia:陪伴型AI浏览器,虽然目前Agent能力相对弱一些,但是主打一个懂你,是我认为最容易上手的一款。

Comet:目前综合下来我自己最喜欢的一款,Agent能力因为设计原因弱于Fellou,但是在搜索质量、内容产出上,还是要更强一些。

不过当然,不同的产品满足的需求不同,适合的群体也存在差异,在不同的场景下,使用体验也会完全的不同。

今天的测评,更多的旨在为大家的选择提供一个参考。

但无论是哪款,也都更推荐大家找一款,感觉适合自己的。

先用起来,先体验一下AI浏览器的魅力。

面对新事物,我们总免不了焦虑,怕自己赶不上趟。

但解决焦虑的最好办法。

不就是勇于尝试嘛。

以上,既然看到这里了,如果觉得对你有用,随手点个赞、在看、转发三连吧,这对我真的很重要~如果想第一时间收到推送,也可以给我个星标⭐

谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克、田田、水杉

>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com

没有评论:

发表评论

豆包模型上新,prompt新玩法,完整测评来了,任务使用更简单了

最近,豆包模型上新了,作为重度使用者,第一时间测试了一番,模型效果确实提升不少      最近各家的大模型不断出新,笔者也测试了不少,之前有介绍过几款新的大模型,效果也都可圈可点。众所周知大模型的性能优劣其实和使用人的方法有很大关系,说的更精确一点就是和你写的提示词写的好坏直...