谷歌火力全开!Gemini-2.5-pro-preview-05-06暴打Claude3.7,超多实战演示!
谷歌火力全开!Gemini-2.5-pro-preview-05-06暴打Claude3.7,超多实战演示!
你的默认编程模型是什么?或许可以换一换了。
刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro -pro-preview-05-06。
其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸主 Claude 3.7 Sonnet (20250219)!
诺贝尔奖得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro -pro-preview-05-06 已经在 Gemini APP、Vertex AI 和 Google AI Studio 中开放,并且其尤其擅长构建交互式 Web 应用。
核心亮点:从草图到功能完备的应用
用户只需使用一个提示词即可构建 Web 应用、游戏和模拟程序等,甚至用户仅需提供一张手绘草图 + 功能描述,就能得到一个带有自己设计的 UI 的功能完备的应用。
下面的演示展示了该模型根据草图构建应用的能力:
Maynor也做了简单的尝试,将我们手绘的一张图片变成了一个简单的应用: 可以看到,只需一张描述画板应用的简单草图加上一句简单的提示词,Gemini 2.5 Pro 就创建出了一个功能完备的 Web 应用。
对比Cladue3.7:可以看到Gemini在代码生成上比起Cladue3.7毫不逊色,甚至略胜一筹!
例如,让 Gemini 2.5 Pro Preview -pro-preview-05-06 用 p5.js 编写了一个直接可玩的记忆配对游戏:
Gemini 2.5 Pro 与 Claude 3.7 Sonnet 对比及实际用法
下面将通过多个实际案例对比 Gemini 2.5 Pro 和 Claude 3.7 Sonnet 的表现。
1. 生成纳瓦尔宝典金句 (知识卡片)
任务:从29种风格中随机选几种生成纳瓦尔宝典金句知识卡片。
知识卡片生成提示词:https://a7uxmstk6o.feishu.cn/wiki/HucUwm2r4i0W9IkiiDBc4dtVnMc
Gemini 2.5 Pro 生成效果:
Claude 3.7 Sonnet 生成效果:
对比:从这任务看,美观度确实显著提升,但比Claude 3.7 还稍微差些。
查看全部金句:https://www.32kw.com/view/c494b5c
2. 生成一个AI对话机器人
任务:生成AI对话机器人。 Gemini 2.5 Pro 表现:以前用Gemini 2.5 Pro旧版,经常要抽卡。现在一次成功,牛逼! 体验网址:https://www.32kw.com/view/05908ad(注:此任务未直接与Claude 3.7对比,主要强调Gemini 2.5 Pro新版的改进)
3. 咪蒙风格标题生成
任务:用纳瓦尔最近一期访谈3小时的播客文本,生成10个咪蒙风格标题(流量密码)。
播客文本来源:https://www.youtube.com/watch?v=KyfUysrNaco&t=10321s
Gemini 2.5 Pro 生成效果:
Claude 3.7 Sonnet 生成效果:
对比:感觉和Claude的生成的效果接近,甚至更好。
4. 生成英语学习网站
任务:把任何内容变成英语学习网站,包含功能:闪卡背单词 -> 中英双语阅读 -> 阅读测试 -> 打卡海报。 Gemini 2.5 Pro 生成效果: 体验网址:https://www.32kw.com/view/ad1c3d3(注:此任务未直接展示Claude 3.7的对比结果)
5. 生成3D教育网站
任务:给定任何主题或内容,生成 3D 教学网站。
3D 可视化提示词:https://a7uxmstk6o.feishu.cn/wiki/Oqi6woH9ziXR83k02dPcUO7hnfd
Gemini 2.5 Pro 表现:一次运行成功,但生成效果非常简陋。 体验地址:https://www.32kw.com/view/39a25b2 Claude 3.7 Sonnet 对比:Claude 3.7 sonnet生成的更牛逼。 Claude 体验地址:https://www.32kw.com/view/d48116c Gemini 2.5 Pro 表现:任务失败,生成的3D游戏化网页,无法正常运行。 Gemini 2.5 Pro 生成效果: 体验网址:https://www.32kw.com/view/18b4a6f 案例一:埃菲尔铁塔
案例二:茶叶蛋制作过程
案例三:北京四合院结构拆解
6. PRD和原型生成
任务:一段提示词生成PRD和高保真原型。 Gemini 2.5 Pro 生成效果: 体验地址:https://www.32kw.com/view/61e0b16 Claude 3.7 Sonnet 对比:个人感觉,Claude 3.7 sonnet生成的效果更好,原型更"高保真"。 Claude PRD和原型体验地址:https://www.32kw.com/view/570fc9b
7. PPT网页生成
任务:给出任何主题或内容,让AI生成PPT网页。
提示词:https://a7uxmstk6o.feishu.cn/wiki/GydUwhKNzioZZtkB321cLmijnjh
Gemini 2.5 Pro 生成效果:
Gemini 生成在线体验:https://www.32kw.com/view/773b193#/
Claude 3.7 Sonnet 对比:这个任务生成质量比 Claude 3.7 Sonnet 好很多。
Claude 生成在线体验:https://32kw.com/view/69303e2
8. 解读书籍网站生成
任务:生成解读书籍的网站。 Gemini 2.5 Pro 生成效果: 在线体验:https://www.32kw.com/view/30e0801 Claude 3.7 Sonnet 生成效果如下: 在线体验:https://www.32kw.com/view/04df9b2(注:此任务未明确指出哪个更好,仅展示两者效果供参考)
PS: 如需示例涉及的提示词,可添加微信:coder-maynor 备注知识库 免费领取
Gemini 2.5 Pro -pro-preview-05-06 vs Claude 3.7 Sonnet 对比总结表
整体编程能力 | LMArena 编程排行榜第一,WebDev Arena 显著优势超过 Claude 3.7 Sonnet | Gemini 2.5 Pro 编程能力大幅提升,表现更优 | |
从草图生成应用 | 功能完备的 Web 应用,代码生成能力强 | Gemini 在此任务中表现出色,甚至略胜一筹 | |
生成纳瓦尔宝典金句 | Gemini 美观度有提升,但 Claude 3.7 略胜一筹 | ||
咪蒙风格标题生成 | 两者效果接近,Gemini 可能略好 | ||
生成3D教育网站 (北京四合院) | Claude 3.7 在此特定案例中表现更好 | ||
PRD和原型生成 | Claude 3.7 生成的原型更"高保真" | ||
PPT网页生成 | 生成质量好很多 | Gemini 在此任务中表现远超 Claude 3.7 | |
解读书籍网站生成 | |||
AI对话机器人生成 | 新版一次成功 (旧版需多次尝试) | Gemini 2.5 Pro 新版有显著改进 |
如何使用 Gemini 2.5 Pro最新版?
有以下几种主要方式可以体验 Gemini 2.5 Pro:
官方网站: 需要魔法上网。 免费用户有使用次数限制。 升级到 Gemini Advanced (包含 2.5 Pro) 需要每月 20 美元。 地址: https://gemini.google.com/ 特点: image-20250427172016223
添加客服微信:coder_momo
可购买Gemini 成品号 15 个月独享,仅99元质保到8月底!
官网镜像站 (国内推荐):
通常价格更低 (官网一半价格)。 提供 Gemini 2.5 Pro 无限次使用。 访问可能更便捷,国内可直接使用。 还可以使用chatgpt、claude、deepseek、grok等其他顶级Ai模型。 新用户添加客服微信: coder_momo
免费领取2天体验时长。地址: https://agi.maynor1024.live/list/#/ 特点: image-20250509123957625 中转 API 服务 (第三方):
按量计费,用多少扣多少额度。 适合集成到自己的应用或低频使用场景。 国内可直接调用。 地址: https://apipro.maynor1024.live/ 特点: image-20250427172128704
没有评论:
发表评论