本期AI日报报道多项重要更新:阿里云Qwen3.7-Max在Code Arena获1541分,位列全球第二AI编程模型,支持长任务与工具调用;腾讯混元开源Hy-MT2翻译模型并上线腾讯混译小程序,支持语音和离线翻译;面壁智能开源MiniCPM5-1B端侧模型,INT4量化后仅0.5GB,可在手机浏览器运行。适合AI开发者、企业技术决策者关注模型进展与开源工具。
Tags:
AI 日报 · 2026年05月26日
AI资讯
1、阿里云CTO解读智能体原生云转型路径
2、Qwen3.7-Max登全球第二AI编程模型
3、skill-cleaner开源:给智能体技能提示词做体检瘦身
4、MiniCPM5-1B开源:端侧1B模型登顶AA-Index
5、谷歌AlphaProof Nexus攻克56年悬案
6、Kling AI助力《大卫之家》首创AI入剧与原生4K
7、腾讯混元开源Hy-MT2翻译模型登榜并上线小程序
8、Anthropic新模型冲击金融业,欧央行急推网安升级
9、微软Copilot协作功能曝文件泄露隐患
10、曝OpenAI GPT-5.6将至:150万Token长上下文
11、苹果据称用定制1.2T谷歌模型重塑Siri
12、Anthropic呼吁外部监督:AI需向善与公平
13、Grok Build Beta向SuperGrok与Premium+开放
14、Qwen3.7-Max上线隐式缓存:自动提速降本
15、教皇通谕警示AI失控:守护人类尊严
16、RTDMD统一蒸馏与奖励学习,4步生成刷新SOTA
17、厘清Harness与Scaffold:智能体如何被“跑起来”
最新开源
1、开源U-Net脑肿瘤MRI分割:PyTorch实战
2、NovaMind:基于Groq加速的Llama3聊天机器人
📰 最新资讯
01 · 阿里云CTO解读智能体原生云转型路径
🏷 行业动态
在QwenConference2026上,阿里云CTO李飞飞提出从“云原生”迈向“智能体原生”的战略升级,旨在加速AI普惠落地。其核心框架由模型、智能体云、工具与服务、以及规模化能力四大基石构成,为企业构建面向智能体应用的新型云底座与生态。
主要亮点:
• 从云原生转向智能体原生,重塑云平台定位 • 四大基石:模型、智能体云、工具服务与规模 • 强调AI普及与规模化落地的工程体系与生态
详情链接:
https://x.com/alibaba_cloud/status/2059174528786268669
02 · Qwen3.7-Max登全球第二AI编程模型
🏷 模型发布/更新
阿里云宣布Qwen3.7-Max在Code Arena获得1541分,位列全球第二AI编程模型,仅次于Claude。模型面向生产环境,支持长达35小时的持续任务与1000+次工具调用,可在数小时内交付相当于两周的项目成果,强化企业级自动化开发效率与落地能力。
主要亮点:
• Code Arena得分1541,全球排名第二仅次Claude • 面向生产环境,可持续运行35小时长任务 • 支持1000+次工具调用,加速交付两周项目
详情链接:
https://x.com/alibaba_cloud/status/2059163881361048011
03 · skill-cleaner开源:给智能体技能提示词做体检瘦身
🏷 开源项目
“龙虾之父”Peter 开源 skill-cleaner,用脚本化审计诊断 AI 智能体技能提示词的冗余与浪费,覆盖预算核算、重复与未用技能排查、根目录审计及描述精简优化。它以标准 token 预算逻辑减少上下文占用,并有实践表明将描述从90+词压到40词内可提升技能选择准确率,助力更省钱更可靠的智能体工程化落地。
主要亮点:
• 五大审计能力:预算、重复、未用、目录、精简 • 标准token预算核算,减少上下文窗口被冗长描述挤占 • 实测将技能描述压缩至40词内,提升技能选择准确率
详情链接:
https://www.ithome.com/0/955/269.htm
04 · MiniCPM5-1B开源:端侧1B模型登顶AA-Index
🏷 开源项目
面壁智能开源端侧大模型MiniCPM5-1B,仅1B参数却在AA-Index超越所有2B以下模型,性能优于三个月前的Qwen3.5-2B且参数减半。INT4量化后权重约0.5GB,可在手机与浏览器运行,并同步开源权重、训练数据与部署方案,降低端侧AI落地门槛。
主要亮点:
• 1B参数登顶AA-Index,超越所有2B以下模型 • INT4量化后仅0.5GB,手机与浏览器可运行 • 开源权重、数据集与部署方案,训练框架ForgeTrain加持
详情链接:
https://www.ithome.com/0/955/267.htm
05 · 谷歌AlphaProof Nexus攻克56年悬案
🏷 技术突破
谷歌推出的 AI 数学证明框架 AlphaProof Nexus 宣称成功攻克两道悬置长达 56 年的数学难题,展示了机器辅助形式化证明与自动推理能力的显著进展。该成果有望加速数学研究与可信软件验证,推动 AI 从生成答案走向可验证的严谨推导。
主要亮点:
• 攻克两道悬置56年的数学难题,验证能力跃升 • 以形式化证明为核心,强化推理可检验与可复现 • 或带动数学研究与软件验证流程自动化升级
详情链接:
https://www.ithome.com/0/955/261.htm
06 · Kling AI助力《大卫之家》首创AI入剧与原生4K
🏷 产品更新
《大卫之家》主创Jon Erwin称Kling AI是前两季核心力量,实现多项行业首创:在已完结剧集中首次使用AI生成场景,并推出原生4K模型;其运动控制能力让AI画面仍能保留演员真实情绪与表演质感,推动影视制作流程与画质标准升级。
主要亮点:
• 在已完结剧集中首次引入AI生成场景 • 推出原生4K模型,提升影视级画质标准 • 运动控制保留演员情绪与表演真实感
详情链接:
https://x.com/Kling_ai/status/2059121691385622761
07 · 腾讯混元开源Hy-MT2翻译模型登榜并上线小程序
🏷 模型发布/开源项目
腾讯混元发布并开源翻译模型Hy-MT2,在Hugging Face趋势榜表现亮眼:1.8B版登顶、30B-A3B(MoE)版位列前四,下载超7K。同时推出“腾讯混译”微信小程序,支持语音输入、离线翻译及风格指令自定义,推动高质量翻译更易用、可落地。
主要亮点:
• Hy-MT2登HF趋势榜:1.8B第一、30B-A3B第四 • 配套“腾讯混译”小程序上线,支持语音与离线翻译 • 模型代码与权重开源,便于社区复用与二次开发
详情链接:
https://x.com/TencentHunyuan/status/2059104921778352626
08 · Anthropic新模型冲击金融业,欧央行急推网安升级
🏷 行业动态
据IT之家报道,Anthropic推出的新模型在能力与应用边界上引发金融圈震动,促使欧洲央行紧急召开会议,要求金融机构加速升级网络防御体系。事件凸显先进AI对风控、交易与安全攻防的双刃剑效应,或推动监管与安全投入同步加码。
主要亮点:
• Anthropic新模型能力跃升,引发金融机构风险再评估 • 欧洲央行紧急开会,要求银行加快网络防御升级 • AI加速攻防对抗,监管与安全预算或同步上调
详情链接:
https://www.ithome.com/0/955/090.htm
09 · 微软Copilot协作功能曝文件泄露隐患
🏷 行业动态
消息称微软 Copilot 的 Cowork/协作相关能力存在文件泄露风险,可能在权限边界、链接共享或索引检索环节暴露企业文档。该问题凸显生成式AI接入办公数据后的安全治理难点,或促使厂商加强权限校验、审计与默认最小暴露策略,影响企业部署节奏与合规评估。
主要亮点:
• 协作场景下可能越权获取或暴露内部文件 • 反映AI助手接入企业数据的权限与审计缺口 • 或推动微软与行业强化默认最小权限与隔离策略
详情链接:
https://www.promptarmor.com/resources/microsoft-copilot-cowork-exfiltrates-files
10 · 曝OpenAI GPT-5.6将至:150万Token长上下文
🏷 行业动态
开发者在OpenAI Codex后端日志中发现未官宣GPT-5.6(iris-alpha),据称将把上下文窗口扩展至150万token,较GPT-5.5提升约43%,且在90万token输入下仍能稳定响应。若6月落地,将显著增强长文档与复杂任务处理,并或引发Claude、Gemini、Grok同期竞速更新。
主要亮点:
• Codex日志现身GPT-5.6内部代号iris-alpha • 上下文增至150万token,较5.5提升约43% • 传6月发布,界面生成能力同步增强
详情链接:
https://www.ithome.com/0/955/078.htm
11 · 苹果据称用定制1.2T谷歌模型重塑Siri
🏷 行业动态
消息称苹果为升级下一代Siri,采用定制版1.2T参数Google大模型作为核心驱动,规模远超传闻中的Gemini 3.5 Flash。部分简单查询将转向端侧处理,但最大挑战是保障日常交互的低延迟与稳定性。此举或加速Apple Intelligence与Gemini生态融合,推高大模型竞争门槛。
主要亮点:
• 定制1.2T参数谷歌模型或成Siri核心引擎 • 简单查询预计端侧运行,降低时延与依赖云端 • WWDC等多项发布在即,苹果与Gemini整合受关注
详情链接:
https://x.com/kimmonismus/status/2058997271803674991
12 · Anthropic呼吁外部监督:AI需向善与公平
🏷 行业动态
Anthropic联合创始人Chris Olah在教皇AI通谕发布会上警示:前沿AI实验室受商业、研究与地缘政治压力牵引,可能偏离“做正确的事”,因此需要更强外部监督。他强调模型更像“生长”而非工程构建,内在机理复杂难解,并抛出全球收益分配、人类繁荣与模型本质三大议题。
主要亮点:
• 前沿实验室多重压力叠加,外部监督成关键 • AI模型非工程化制造,更像由语言思想“生长” • 聚焦公平收益、人类繁荣与模型本质三大问题
详情链接:
https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
13 · Grok Build Beta向SuperGrok与Premium+开放
🏷 产品更新
xAI 宣布 Grok Build Beta 版面向所有 SuperGrok 与 X Premium+ 用户开放,提供 Plan Mode 规划式工作流,支持 Imagine 生成图像与视频,并可通过 CLI 构建自动化与编排器。此举强化从生成到落地的开发闭环,推动企业级 AI 生产力工具加速普及。
主要亮点:
• Beta 扩展至 SuperGrok 与 X Premium+ 用户 • Plan Mode 支持可控规划与任务分解式构建 • CLI 提供自动化与编排器开发入口与能力
详情链接:
https://x.com/xai/status/2058973760708091907
14 · Qwen3.7-Max上线隐式缓存:自动提速降本
🏷 产品更新
通义千问宣布Qwen3.7-Max已上线隐式缓存能力,默认自动生效、无需任何配置,即可在常见重复上下文场景中提升响应速度并降低推理成本。对追求更高且更可控命中率的应用,还可采用显式缓存方案与最佳实践,加速规模化落地。
主要亮点:
• 隐式缓存默认启用,无需设置即可生效 • 开箱即用提升推理速度,同时降低调用成本 • 需要更高确定命中率时可切换显式缓存方案
详情链接:
https://x.com/Alibaba_Qwen/status/2058932656797368619
15 · 教皇通谕警示AI失控:守护人类尊严
🏷 行业动态
教皇里奥十四世在通谕《Magnifica Humanitas》中直指AI与无约束技术权力的系统性风险:AI驱动战争升级、劳动结构被重塑、社会经济震荡加剧。文件呼吁建立新的法律与伦理框架,弥补对个人与弱势群体的保护缺口,以在AI加速普及中捍卫人类尊严与“深刻的人性”。
主要亮点:
• 将AI驱动战争列为首要风险,警惕自动化升级冲突 • 强调AI冲击就业与劳动关系,引发更广泛社会动荡 • 呼吁建立新法律伦理框架,强化个人保护与尊严底线
详情链接:
https://www.theverge.com/news/936945/pope-leo-letter-encyclical-ai-anthropic-labor-warfare
16 · RTDMD统一蒸馏与奖励学习,4步生成刷新SOTA
🏷 研究论文
论文提出RTDMD两阶段框架,将分布匹配蒸馏与奖励引导强化学习统一到少步流生成器中,通过最小化到奖励倾斜教师分布的KL散度自然分解训练目标。配合AC-DMD一致性正则与SubGRPO降方差,仅4步推理就在SD3/SD3.5/FLUX.2上拿下偏好、美学与组合指标新SOTA,为高质极速生成开路。
主要亮点:
• KL到奖励倾斜教师分布,统一分布匹配与奖励最大化 • AC-DMD子区间蒸馏+一致性正则,稳定追踪生成器分布 • 推导混合策略梯度与SubGRPO,降低方差提升少步效果
详情链接:
https://arxiv.org/abs/2605.26108
17 · 厘清Harness与Scaffold:智能体如何被“跑起来”
🏷 技巧与观点
文章拆解智能体常被混用的术语:大模型本身无记忆、无循环;Scaffold负责定义行为边界与工具语义,Harness负责执行调用、编排工具与控制循环。两者叠加才让模型变成可运行的Agent,并以Claude Code、Codex展示同模不同Harness带来的体验差异,给出“Agent=Model+Harness”的实用心智模型。
主要亮点:
• 指出模型无记忆无循环,智能体能力来自外部编排 • Scaffold定义行为与工具语义,塑造可控的交互边界 • Harness掌管调用与循环,同一模型不同Harness体验迥异
详情链接:
https://huggingface.co/blog/agent-glossary
🔭 最新开源
01 · 开源U-Net脑肿瘤MRI分割:PyTorch实战
🏷 开源项目
该GitHub项目基于PyTorch实现U-Net架构,对MRI脑部扫描进行脑肿瘤分割,并结合计算机视觉流程完善训练与推理。它为医学影像AI提供可复用的端到端范例,降低临床分割任务入门门槛,助力研究验证与工程落地。
主要亮点:
• 基于U-Net的MRI脑肿瘤分割完整实现 • 采用PyTorch与CV技巧覆盖训练到推理流程 • Notebook形式便于复现、教学与快速二次开发
详情链接:
https://github.com/DevShrivastava152004/NeuroSeg-MRI-Brain-Tumour-Segmentation-via-Deep-Learning
02 · NovaMind:基于Groq加速的Llama3聊天机器人
🏷 开源项目
NovaMind 是一款开源 AI 聊天机器人,基于 Groq 推理加速与 Llama 3 70B,集成意图分类、情感分析与实体识别等 NLP 能力,并提供网页端 UI。它展示了大模型在低延迟部署与结构化语义理解融合上的实践路径,便于快速搭建可用对话应用原型。
主要亮点:
• Groq 推理加速驱动 Llama 3 70B 对话 • 集成意图分类、情感分析与实体识别能力 • 自带 Web UI,便于快速部署与演示
详情链接:
https://github.com/KHALEDNOAMAN/NovaMind-Chatbot
以上内容由 AI 汇总,数据来源于网络公开平台。
没有评论:
发表评论