2025年5月9日星期五

谷歌火力全开!Gemini-2。5-pro-preview-05-06暴打Claude3。7,超多实战演示!

谷歌火力全开!Gemini-2.5-pro-preview-05-06暴打Claude3.7,超多实战演示!


谷歌火力全开!Gemini-2.5-pro-preview-05-06暴打Claude3.7,超多实战演示!

image-20250508225505276
image-20250508225505276

你的默认编程模型是什么?或许可以换一换了。

刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro -pro-preview-05-06

img
img

最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸主 Claude 3.7 Sonnet (20250219)!

img
img
img
img

诺贝尔奖得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro -pro-preview-05-06 已经在 Gemini APP、Vertex AI 和 Google AI Studio 中开放,并且其尤其擅长构建交互式 Web 应用。

核心亮点:从草图到功能完备的应用

用户只需使用一个提示词即可构建 Web 应用、游戏和模拟程序等,甚至用户仅需提供一张手绘草图 + 功能描述,就能得到一个带有自己设计的 UI 的功能完备的应用

下面的演示展示了该模型根据草图构建应用的能力:image-20250508232320165

Maynor也做了简单的尝试,将我们手绘的一张图片变成了一个简单的应用: 可以看到,只需一张描述画板应用的简单草图加上一句简单的提示词,Gemini 2.5 Pro 就创建出了一个功能完备的 Web 应用

对比Cladue3.7:image-20250508232625423可以看到Gemini在代码生成上比起Cladue3.7毫不逊色,甚至略胜一筹!

例如,让 Gemini 2.5 Pro Preview -pro-preview-05-06 用 p5.js 编写了一个直接可玩的记忆配对游戏:image-20250508230359144image-20250508230506273


Gemini 2.5 Pro 与 Claude 3.7 Sonnet 对比及实际用法

下面将通过多个实际案例对比 Gemini 2.5 Pro 和 Claude 3.7 Sonnet 的表现。

1. 生成纳瓦尔宝典金句 (知识卡片)

  • 任务:从29种风格中随机选几种生成纳瓦尔宝典金句知识卡片。

  • 知识卡片生成提示词:https://a7uxmstk6o.feishu.cn/wiki/HucUwm2r4i0W9IkiiDBc4dtVnMc

  • Gemini 2.5 Pro 生成效果图片

  • Claude 3.7 Sonnet 生成效果图片

  • 对比:从这任务看,美观度确实显著提升,但比Claude 3.7 还稍微差些

  • 查看全部金句:https://www.32kw.com/view/c494b5c图片

2. 生成一个AI对话机器人

  • 任务:生成AI对话机器人。
  • Gemini 2.5 Pro 表现:以前用Gemini 2.5 Pro旧版,经常要抽卡。现在一次成功,牛逼!图片
  • 体验网址:https://www.32kw.com/view/05908ad(注:此任务未直接与Claude 3.7对比,主要强调Gemini 2.5 Pro新版的改进)

3. 咪蒙风格标题生成

  • 任务:用纳瓦尔最近一期访谈3小时的播客文本,生成10个咪蒙风格标题(流量密码)。

  • 播客文本来源:https://www.youtube.com/watch?v=KyfUysrNaco&t=10321s

  • Gemini 2.5 Pro 生成效果图片

  • Claude 3.7 Sonnet 生成效果图片

  • 对比:感觉和Claude的生成的效果接近,甚至更好

4. 生成英语学习网站

  • 任务:把任何内容变成英语学习网站,包含功能:闪卡背单词 -> 中英双语阅读 -> 阅读测试 -> 打卡海报。
  • Gemini 2.5 Pro 生成效果图片图片图片
  • 体验网址:https://www.32kw.com/view/ad1c3d3(注:此任务未直接展示Claude 3.7的对比结果)

5. 生成3D教育网站

  • 任务:给定任何主题或内容,生成 3D 教学网站。

  • 3D 可视化提示词:https://a7uxmstk6o.feishu.cn/wiki/Oqi6woH9ziXR83k02dPcUO7hnfd

    • Gemini 2.5 Pro 表现一次运行成功,但生成效果非常简陋图片
    • 体验地址:https://www.32kw.com/view/39a25b2
    • Claude 3.7 Sonnet 对比Claude 3.7 sonnet生成的更牛逼图片
    • Claude 体验地址:https://www.32kw.com/view/d48116c
    • Gemini 2.5 Pro 表现任务失败,生成的3D游戏化网页,无法正常运行。图片
    • Gemini 2.5 Pro 生成效果图片
    • 体验网址:https://www.32kw.com/view/18b4a6f
    • 案例一:埃菲尔铁塔

    • 案例二:茶叶蛋制作过程

    • 案例三:北京四合院结构拆解

6. PRD和原型生成

  • 任务:一段提示词生成PRD和高保真原型。
  • Gemini 2.5 Pro 生成效果图片图片图片
  • 体验地址:https://www.32kw.com/view/61e0b16
  • Claude 3.7 Sonnet 对比:个人感觉,Claude 3.7 sonnet生成的效果更好,原型更"高保真"图片
  • Claude PRD和原型体验地址:https://www.32kw.com/view/570fc9b

7. PPT网页生成

  • 任务:给出任何主题或内容,让AI生成PPT网页。

  • 提示词:https://a7uxmstk6o.feishu.cn/wiki/GydUwhKNzioZZtkB321cLmijnjh

  • Gemini 2.5 Pro 生成效果图片图片

  • Gemini 生成在线体验:https://www.32kw.com/view/773b193#/

  • Claude 3.7 Sonnet 对比这个任务生成质量比 Claude 3.7 Sonnet 好很多图片图片

  • Claude 生成在线体验:https://32kw.com/view/69303e2

8. 解读书籍网站生成

  • 任务:生成解读书籍的网站。
  • Gemini 2.5 Pro 生成效果图片图片
  • 在线体验:https://www.32kw.com/view/30e0801
  • Claude 3.7 Sonnet 生成效果如下图片图片图片图片
  • 在线体验:https://www.32kw.com/view/04df9b2(注:此任务未明确指出哪个更好,仅展示两者效果供参考)

PS: 如需示例涉及的提示词,可添加微信:coder-maynor 备注知识库 免费领取


Gemini 2.5 Pro -pro-preview-05-06 vs Claude 3.7 Sonnet 对比总结表

特性/任务
Gemini 2.5 Pro -pro-preview-05-06
Claude 3.7 Sonnet (20250219)
文章结论/观察
整体编程能力LMArena 编程排行榜第一,WebDev Arena 显著优势超过 Claude 3.7 Sonnet
曾是 WebDev Arena 霸主
Gemini 2.5 Pro 编程能力大幅提升,表现更优
从草图生成应用功能完备的 Web 应用,代码生成能力强
 (基于手绘草图+提示词)
对比图中显示也能生成,但文章强调 Gemini 在此方面表现突出
Gemini 在此任务中表现出色,甚至略胜一筹
生成纳瓦尔宝典金句
美观度显著提升
美观度稍好一些
Gemini 美观度有提升,但 Claude 3.7 略胜一筹
咪蒙风格标题生成
生成效果不错
生成效果不错
两者效果接近,Gemini 可能略好
生成3D教育网站 (北京四合院)
一次成功,但效果简陋
生成效果更牛逼
Claude 3.7 在此特定案例中表现更好
 (Gemini 在茶叶蛋案例中失败)
PRD和原型生成
生成PRD和原型
生成效果更好,原型更"高保真"
Claude 3.7 生成的原型更"高保真"
PPT网页生成生成质量好很多
生成质量相对较差
Gemini 在此任务中表现远超 Claude 3.7
解读书籍网站生成
展示了生成效果
展示了生成效果
文章未明确对比优劣,均能完成任务
AI对话机器人生成新版一次成功 (旧版需多次尝试)
未在此任务中直接对比
Gemini 2.5 Pro 新版有显著改进
 (强调自身迭代进步)

如何使用 Gemini 2.5 Pro最新版?

有以下几种主要方式可以体验 Gemini 2.5 Pro:

  1. 官方网站:
    • 需要魔法上网
    • 免费用户有使用次数限制
    • 升级到 Gemini Advanced (包含 2.5 Pro) 需要每月 20 美元
    • 地址: https://gemini.google.com/
    • 特点:
    • image-20250427172016223
      image-20250427172016223

添加客服微信:coder_momo  可购买Gemini 成品号 15 个月独享,仅99元质保到8月底!

  1. 官网镜像站 (国内推荐):

    • 通常价格更低 (官网一半价格)。
    • 提供 Gemini 2.5 Pro 无限次使用
    • 访问可能更便捷,国内可直接使用
    • 还可以使用chatgpt、claude、deepseek、grok等其他顶级Ai模型。
    • 新用户添加客服微信:coder_momo 免费领取2天体验时长。
    • 地址: https://agi.maynor1024.live/list/#/
    • 特点:
    • image-20250509123957625
      image-20250509123957625
  2. 中转 API 服务 (第三方):

    • 按量计费,用多少扣多少额度。
    • 适合集成到自己的应用或低频使用场景。
    • 国内可直接调用
    • 地址: https://apipro.maynor1024.live/
    • 特点:
    • image-20250427172128704
      image-20250427172128704

没有评论:

发表评论

炸裂!Meta、xAI、OpenAI齐放大招,这一周科技圈太疯了

如果说去年是"模型年",今年则是"融合年":AI和机器人、硬件、软件、平台生态、交互方式正在全面整合进人类社会。 点击蓝字关注我吧! 作为一个每天蹲点刷外网、守着AI和机器人消息入眠的科技狂热爱好者,我可以负责任地说: 这一周,AI和机...