2025年4月15日星期二

刚刚,OpenAI发布GPT-4。1  (国内可用)

刚刚,OpenAI发布GPT-4.1  (国内可用)

支持百万Token上下文,更适合文字、编程、金融、教育等领域

今天凌晨1点,OpenAI正式发布全新一代AI模型——GPT-4.1。同时还带来了GPT-4.1 Mini和GPT-4.1 Nano,在多模态处理、代码能力、指令遵循与成本控制方面都实现了巨大飞跃
尤其是对100万Token上下文的支持,远超前代产品,在金融分析、小说创作、法律教育等领域,将产生深远影响。

值得注意:由于GPT-4.1的发布,OpenAI也宣布即将淘汰GPT-4.5,由此可见GPT-4.1的强劲实力。

GPT-4.1发布会

GPT-4.1 主要亮点

特性
GPT‑4o
GPT‑4.1
提升幅度
最大上下文长度
128,000 Tokens
1,000,000 Tokens近8倍
代码理解/处理能力
一般
顶级大幅提升
指令遵循 多轮对话
优秀
更强提升10%+
多模态图像理解
良好
更佳
 (Mini表现优异)
持续提升
成本/效率
较优
更低/更稳
更适合大规模应用

01. 编程能力全面领先

  • SWE-bench Verified 软件技能基准,GPT‑4.1 完成率高达 54.6%,大幅超越 GPT‑4o (仅33.2%)。
  • 代码diff编辑与自动修补,GPT‑4.1 在Aider的polyglot diff基准得分是GPT-4o的两倍以上,比GPT-4.5高出8个百分点。
  • 支持最长32,768 tokens输出,开发者可按需选择"只输出diff行"或"重写整个文件"两种方式,带来更灵活、低成本的API体验。
  • 前端开发能力显著增强,真实测评中80%人工评审更喜欢GPT-4.1生成的网站。


在SWE-bench Verified中,模型通过编写补丁修复真实软件问题


Aider polyglot diff性能:支持只输出变动行(diff)或重写整个文件


02. 指令遵循更可靠,复杂对话更流畅

OpenAI全面优化了多轮指令遵循能力,涵盖:

  • 格式遵循:严格按要求输出XML、YAML、Markdown等格式;
  • 负面指令:能稳健过滤禁止行为;
  • 顺序/内容要求:按指定顺序提问、确保包含指定内容;
  • 排序/防幻觉:按要求排序,无法回答时能准确回复"不知道";
  • 长对话历史引用:准确回忆先前用户信息;
  • 复杂任务指令紧密配合开发者真实需求

GPT‑4.1在指令遵循困难任务上相较前代有显著提升


真实开发场景下的格式与内容、长度等多维复杂指令遵循评估


多轮对话能力提升

  • MultiChallenge测试:多轮对话上下文信息利用率提高10.5%
  • IFEval测试:准确率由81.0%提升到87.4%,全面优于以往模型。


多轮对话中正确复用前文信息能力


03. 百万 Token 长上下文处理能力

GPT‑4.1全系列支持 100 万Token 超长上下文,远超前代(128,000)!
—— 理想适用于大型代码库、超长文档、法律金融等专业场景。

  • 100万Token等于8份完整React代码库
  • 能精准检索"隐藏信息",不受其在长文档中的位置影响。
  • OpenAI-MRCR基准测试:模型可从超长上下文中准确辩识多个极为相似请求,表现显著优于GPT-4o。
  • Graphwalks多步推理数据集,验证了GPT-4.1复杂逻辑路径和全局多步推理的绝对能力。


百万Token上下文中的needle准确定位


从超长输入中辨析多个近似请求


模拟大规模节点BFS推理能力


04. 多模态视觉能力显著进步

  • GPT-4.1系列大幅提升了图像理解、视觉数学题解答等领域的能力,Mini版在多项标准测试超越4o。
  • 包括图表、图示、数学题、视频理解等多模态题型的处理均有显著突破。

MMMU图文混合推理

MathVista视觉数学题

科研论文图表问答

根据无字幕长视频答题

如何在国内无障碍体验新一代 GPT-4.1?

我们的 ChatGPT 平台已全线支持 GPT-4.1
只需登录SaaSGPT,选择"gpt-4.1"模型,即可流畅体验(无需科学上网)。

使用网址:https://agi.maynor1024.live/list/#/home

对话演示

模型选择界面

🎉 为什么选择我们?(与官网对比)

官网OpenAI ChatGPT
我们平台
需翻Q,有风险
无需翻Q,稳定使用
需20美元/月(约160元)
比官网便宜一半多
需Visa卡,难购买易封号
无需担心支付与被封,售后无忧
聊天记录不便迁移/丢失
记录随授权码随时迁移,私密安全
被封号基本无补救
如遇账号异常我们承担损失
无免费体验
注册即送一天免费体验,推荐可叠加时长

我们的承诺

  • 技术团队专业、已稳定运营一年
  • 成本透明,绝大多数费用投入账号与服务维护
  • 体验好请帮忙转发分享,用户多我们才能走得更远!

常见问题&优势总结

  1. 无需翻Q,随时登陆快速体验(彻底规避封号及政策风险)
  2. 价格远低于官网,友好适合学生&开发者
  3. 无需Visa卡/美金,无支付障碍/被封风险
  4. 聊天记录实时跟随绑定,兼具私密和可迁移
  5. 注册后即赠送一天免费体验,推荐可无限叠加体验时长
  6. 遇到封号等问题,平台100%兜底,不影响你的数据和体验

如果你觉得体验好,请帮我们推广
你的每一次推荐和口碑宣传,都是我们持续投入的最大动力!


立即体验GPT-4.1新纪元

感受划时代AI带来的全新智能生产力!

如何在国内无障碍体验新一代 GPT-4.1?

使用网址:https://agi.maynor1024.live/list/#/home

对话演示

没有评论:

发表评论

保姆教程:扣子本地部署,配置模型,本地工作流构建

介绍怎样建立本地的工作流       扣子终于来源了,哈哈,之前一直是线上玩,没办法本地部署,大家都觉得不能在企业应用保密性不好,这次扣子直接来源了,企业也可以本地部署自己的扣子平台,相对dify和n8n,扣子的优势是显而易见的,生态也比较完善,今天就给大家分享一下,扣子本地...