用Seedance2.0人脸审核与宫格分镜让剧情更连贯。适用于视频创作者,工作流详见飞书链接。
Tags:
https://my.feishu.cn/wiki/KrKow7S6ziML2IkuhWdc0vlQnnc?from=from_copylink
https://my.feishu.cn/wiki/KrKow7S6ziML2IkuhWdc0vlQnnc?from=from_copylink
1、Xoople获1.3亿美元B轮融资,卫星采集AI地面真值数据
2、红熊AI获2.1亿A轮,记忆科学加速全模态大模型
3、OpenAI控诉马斯克反竞争并促美方调查
4、中国大模型调用量暴增31%,连赢美国五周
5、微软探索高温超导配电,数据中心趋近零损耗
6、清华AIR开源OpenBioMed Skills重塑药研AI流程
7、通义千问深度研究升级:一站式智能财经分析
8、中国大模型周调用量破12.9万亿,增速领跑全球
9、AI芯片拉动存储涨价,三星Q1利润暴增
10、《纽约客》曝奥尔特曼操权引爆OpenAI信任危机
11、MiniMax 2.7本周末开源,Token成本继续下探
12、奥特曼首谈Sora停用:算力短缺成主因
13、阿里千问3.6 Plus登顶OpenRouter调用榜破万亿
14、宇树移动机器人专利:半椭圆机身单雷达全景感知
15、活体大鼠神经元实现实时AI时序计算新突破
16、迪士尼前工程师携Midjourney推会呼吸仿生机器人
17、剑桥研究:AI数据中心热岛效应或升温9.1℃
18、Anthropic锁定谷歌博通多吉瓦TPU产能
19、Entropy Corridor推理干预:不重训实时纠偏幻觉
20、OpenAI联手Anthropic与Google反制模型复制
21、博通携手谷歌共研TPU至2031并供Anthropic算力
22、苹果ICLR论文:无关语句让大模型算数崩盘
23、Meta新AI官首模将发,Llama开源转混合
24、GAIR开源daVinci-LLM-3B并公开全训练轨迹
25、Seedance 2.0上线Arcads:JSON提示精控视频
26、OpenAI开源IH挑战:用指令层级强化大模型安全
1、90个本地大模型项目合集:Gemma 4+Ollama实战
2、AI奖学金与助学贷款智能推荐平台开源
3、三行代码修复LLM提示词含名GDPR风险
4、本地语音克隆管线开源:12GB显卡可跑
5、OCaml机器学习示例合集:小而精的入门仓库
6、本地优先企业级RAG与LLMOps一体化管线
7、像素置换重排:不生成也能匹配参考图
8、ResuMate开源:五模型协同智能润色简历
🏷 行业动态
西班牙卫星初创Xoople完成1.3亿美元B轮融资,由Nazca Capital领投。公司瞄准企业级AI“可信数据”痛点,打造专用卫星星座采集高精度地面真值数据,为训练与验证模型提供可靠基准,有望提升遥感与行业AI的可用性与决策质量。
主要亮点:
🏷 行业动态
红熊AI宣布完成2.1亿元A轮融资,由华禹创投领投,老股东与多家机构跟投,创始团队亦追加投资,投后估值突破15亿元。公司以“记忆科学”技术赋能全模态大模型,意在构建可持续技术护城河,推动大模型能力长期化与产品化落地。
主要亮点:
🏷 行业动态
OpenAI已向加州与特拉华州总检察长举报,称马斯克借诉讼及联合竞争对手等方式阻挠其发展与AGI使命推进。双方诉讼预计本月开庭。该事件或加剧AI头部竞争的监管审视,影响融资、合作与行业治理走向。
主要亮点:
🏷 行业动态
最新一周(4月6日当周)中国AI大模型调用量达12.96万亿Token,环比增长31.48%,已连续五周超过美国。同期全球调用量为27万亿Token,环比增长18.9%。中国增速显著高于全球平均,反映应用落地、算力供给与生态活跃度同步提升,对产业竞争格局形成强化。
主要亮点:
🏷 技术突破
微软研究高温超导技术,用“零电阻”输电重塑云端配电架构,以应对AI时代数据中心的高功率、高密度负载。该方案可显著减少线缆电能损耗与热积聚,缓解散热压力并突破输电距离限制,未来或替代传统铜铝布线,提升数据中心能效与扩容能力。
主要亮点:
🏷 开源项目
清华AIR与水木分子开源OpenBioMed Skills,将药研专家决策流程沉淀为可执行的Agent Skill代码。首批45项核心技能覆盖生化药研、蛋白设计、单细胞组学与数据检索等领域,降低生物医药研发工程门槛,推动研发链路从工具化迈向全流程智能化与可复用自动化。
主要亮点:
🏷 产品更新
通义千问“深度研究”新增专业财经分析模块,采用Agentic架构接入同花顺实时金融数据,覆盖全球万只股票行情与百万份财报及公司资料,可从需求解析、数据检索到信息整合全链路自主分析,提升投研效率与决策质量,推动AI投研产品化落地。
主要亮点:
🏷 行业动态
中国AI大模型应用规模迎来爆发:周调用量达12.96万亿Token,环比增长31.48%,在全球竞速中显著领先美国。阿里、小米等企业稳居榜单前列,显示中国在算力与应用落地协同推进,正以更高频、更大规模的调用推动产业加速升级。
主要亮点:
🏷 行业动态
三星电子发布Q1业绩预告,预计营业利润达57.2万亿韩元,显著超出市场预期并同比大幅增长。核心驱动来自AI基础设施需求爆发,带动AI芯片相关存储需求与价格上行,推动公司利润强劲反弹,也强化了存储行业景气回升信号。
主要亮点:
🏷 行业动态
《纽约客》调查称,超百名OpenAI内部人士与前高管指控CEO奥尔特曼长期存在欺骗与权力操控,并在关键事件中影响决策走向,导致组织内信任裂痕扩大。事件或加剧治理合规压力,影响公司战略稳定、对外合作信心与AI行业的伦理治理讨论。
主要亮点:
🏷 开源项目
国产大模型MiniMax 2.7因OpenClaw插件走红,官方确认本周末开源,意在进一步降低开发者使用与部署成本。模型自3月发布后迭代迅速、调用量领先,并在软件工程与专业办公两大能力上同步增强,或加速生态扩展与行业落地。
主要亮点:
🏷 行业动态
奥特曼透露Sora“熄火”并非技术卡壳,而是算力与芯片资源极度紧缺。OpenAI需将有限GPU优先投向更高优先级项目,引发内部资源竞争。此事凸显生成式视频落地对计算资源的高消耗,或加速行业在算力采购、调度与效率优化上的竞赛。
主要亮点:
🏷 行业动态
阿里Qwen3.6-Plus在OpenRouter周榜拿下全球大模型调用量第一,并连续四天位居日榜榜首。其单日调用量首次突破1万亿Token,成为平台首个达成该里程碑的模型,体现千问在真实流量与生态采纳上的强势竞争力。
主要亮点:
🏷 技术突破
宇树科技一项移动机器人专利获授权,王兴兴团队以“上细下粗”的半椭圆球形机身结合独特感知系统,实现单雷达全景感知。该方案显著简化感知架构,降低硬件与算力成本,并提升数据处理效率,有望推动移动机器人更低成本、更易量产的落地应用。
主要亮点:
🏷 技术突破
日本团队训练大鼠皮层神经元,在实时机器学习框架下生成复杂时序信号,并与高密度微电极阵列、微流控结合构建“闭环储备池计算”系统。结果展示生物神经元可参与AI信息处理,为类脑计算与低功耗智能硬件打开新路径。
主要亮点:
🏷 产品更新
Animotion Robotics创始人朱圣杰联手Midjourney联合创始人John Jiang发布首款DIY仿生机器人Éloi,瞄准“会呼吸”的拟生命体体验,探索具身智能在物理世界的自然交互与情感连接。团队融合迪士尼机器人经验与AI芯片能力,或为家庭与创客生态带来新范式。
主要亮点:
🏷 研究论文
剑桥大学研究发现,AI数据中心除高耗能外,其运行废热会形成明显热岛效应,使周边地表温度最高升约9.1℃,影响半径可达10公里,潜在波及超3.4亿人。该结论为算力基础设施选址、散热技术与环保监管提出更紧迫的约束与优化方向。
主要亮点:
🏷 行业动态
Anthropic与谷歌、博通签约,提前锁定多吉瓦级下一代TPU算力,计划自2027年起逐步上线,用于训练与部署更前沿的Claude模型。此举直面智能体服务24小时运行带来的算力暴涨,以更稳定的硬件供给支撑模型迭代与业务扩张。
主要亮点:
详情链接:
https://x.com/testingcatalog/status/2041280355412385841
🏷 技术突破
Entropy Corridor提出非侵入式推理时技术,认为幻觉源于模型过度自信而非不确定性。它通过约束双向范围内的分层激活熵,定位并处理“过度自信层”,实现从检测走向实时纠正。在TruthfulQA上幻觉率减半且真实性保持,延迟开销低于2%,为低成本部署提供新路径。
主要亮点:
详情链接:
https://x.com/elfatone82/status/2041258848992768289?s=46
🏷 行业动态
OpenAI、Anthropic与Google宣布协同行动,针对中国市场的模型权重窃取与架构抄袭等复制问题强化知识产权与资产保护。此举显示头部实验室在安全与合规上形成共识,也折射全球AI竞争加剧下,技术壁垒、治理机制与跨机构联防将成为行业新常态。
主要亮点:
详情链接:
https://www.bloomberg.com/news/articles/2026-04-06/openai-anthropic-google-unite-to-combat-model-copying-in-china
🏷 行业动态
博通与谷歌签署长期协议,共同开发未来TPU,并为谷歌下一代AI机架提供网络与关键硬件,合作延续至2031年。同时Anthropic自2027年起将获得约3.5GW TPU算力访问。该合作打通芯片、机架与算力供给链路,强化AI基础设施的稳定扩容能力。
主要亮点:
详情链接:
https://x.com/gaganghotra_/status/2041285522950385930
🏷 研究论文
苹果在ICLR 2025提出GSM-NoOp评测,给GSM8K题目替换数字或插入无关描述,测试25款模型。多模型准确率因“干扰句”大幅下滑(如GPT-4o 94.9%→63.1%),暴露其更像关键词驱动的模式匹配而非真正推理,对金融、法律与教育应用构成风险。
主要亮点:
详情链接:
https://x.com/ylecun/status/2041295545495380356
🏷 模型发布
Meta将在新任首席AI官亚历山大·王带领下发布首个新模型家族。受Llama 4表现与竞争压力影响,开源策略改为“混合”:最大模型保持专有,部分版本在安全与专有成分剥离后再开源。代号Avocado的文本模型因不及Gemini 3推迟至5月,成败关乎千亿美元级投入与生态信任。
主要亮点:
详情链接:
https://x.com/gaganghotra_/status/2041290614462091770
🏷 开源项目
GAIR发布30亿参数基础模型daVinci-LLM-3B,不仅开源权重,还罕见公开完整训练轨迹、各阶段检查点与数据处理决策,使预训练更透明可复现。项目含200+消融实验,覆盖数据配比、训练动态与评估有效性;采用两阶段课程学习,总计约8万亿token,强化数学与代码推理,利于社区验证与改进。
主要亮点:
详情链接:
https://huggingface.co/SII-GAIR-NLP/davinci-llm-model
🏷 产品更新
Seedance 2.0 视频生成模型已登陆 Arcads AI,并针对 JSON 结构化提示词深度优化,可在摄影参数、运动动力学、环境与光照、物理模拟及情绪氛围等维度精确控片。其支持3秒视频参考、最多9张参考图与音频参考输入,强化多模态可控生成,有望提升商用视频生产效率与一致性。
主要亮点:
详情链接:
https://x.com/EHuanglu/status/2041132328655954201
🏷 开源项目
OpenAI发布IH-Challenge数据集,用强化学习训练模型在指令冲突中按“系统>开发者>用户>工具”优先级执行。基于该方法的GPT-5 Mini-R在CyberSecEval 2与提示词注入评测更强,显著提升对恶意工具指令和外部注入的鲁棒性,同时保持帮助率稳定,为智能体时代的可控行为提供关键机制。
主要亮点:
详情链接:
https://finance.sina.cn/stock/jdts/2026-04-06/detail-inhtpzzx6007103.d.html?vt=4
🏷 开源项目
该仓库汇集90个可落地的本地LLM生产级项目,基于Gemma 4与Ollama,提供完整Python作品集与实践范式,覆盖从部署、推理到应用集成的关键链路,为企业与开发者提供低成本、可控的数据本地化方案,推动本地AI应用快速迭代。
主要亮点:
详情链接:
https://github.com/kennedyraju55/90-local-llm-projects
🏷 开源项目
Bharathwajpm 在 GitHub Trending 发布开源项目 studynanba-ai,以 AI 为学生提供奖学金与助学贷款的个性化推荐与申请指引。项目采用 TypeScript 构建,强调可落地的教育金融咨询体验,有望降低信息差并提升申请决策效率。
主要亮点:
详情链接:
https://github.com/Bharathwajpm/studynanba-ai
🏷 开源项目
该开源项目聚焦LLM提示词中意外携带人名等可识别信息导致的跨境传输与GDPR合规风险,提出仅用三行Python即可完成自动清理/替换方案,帮助开发者在提示工程与调用链路中快速降敏,降低合规成本与数据泄露隐患。
主要亮点:
详情链接:
https://github.com/mahadillahm4di-cyber/mh-gdpr-ai.eu
🏷 开源项目
GitHub Trending 项目 tdorsi/voice-gen 开源一套完全本地的语音克隆流程,结合 MOSS-TTS 与 QLoRA,在约 12GB 显存的 GPU 上即可训练/适配与推理。它降低了语音克隆门槛,减少对云端依赖,利于隐私与离线部署,并推动个人与中小团队快速验证语音应用。
主要亮点:
详情链接:
https://github.com/tdorsi/voice-gen
🏷 开源项目
Fuwn 开源了一个以 OCaml 为主的小型机器学习示例合集,聚焦用函数式语言实现常见 ML 流程与代码范式。虽体量不大,但有助于补齐 OCaml 在 ML 生态中的实践参考,降低学习与迁移成本,并为教学、原型验证提供轻量素材。
主要亮点:
详情链接:
https://github.com/Fuwn/ocaml-machine-learning
🏷 开源项目
Sentinel-LLM 提供生产级、本地优先的 RAG+LLMOps 全流程方案,集成 Airflow 自动化文档摄取、Qdrant 向量存储与 RAGAS 幻觉评估护栏,并覆盖端到端可观测性与模型生命周期管理,助力企业更稳健地落地可控、可监测的生成式AI应用。
主要亮点:
详情链接:
https://github.com/Isha-Das-06/Sentinel-LLM
🏷 开源项目
Pixel-permutator 提供一种“只重排不合成”的图像变换思路:在不创建、删除或生成像素的前提下,将输入图像像素排列调整为更接近参考图。项目强调确定性与内存安全,并以神经特征引导与预览可视化提升可控性,适用于风格/布局迁移与可解释实验。
主要亮点:
详情链接:
https://github.com/er-del/Pixel-permutator
🏷 开源项目
ResuMate 是一款免费开源的 AI 简历增强工具,采用 5 代理流水线:Claude、Gemini、Grok、Perplexity 分析各段落,由 GPT-4o 综合择优改写。它把多模型评审机制产品化,提升简历优化的一致性与可解释性,对求职工具与多代理应用范式有示范效应。
主要亮点:
详情链接:
https://github.com/AliHuzain/resumate
以上内容由 AI 汇总,数据来源于网络公开平台。
在视频生成领域,传统透视视频模型受限于视角和场景覆盖范围,难以实现高质量的长距离场景漫游。为了解决这一问题,加州大学尔湾分校、加州大学圣地亚哥分校及Adobe Research等机构的研究人员共同提出了OmniRoam,这是一种可控全景视频生成框架,通过利用全景表示的丰富单帧场景覆盖率和长期时空一致性,实现了高质量的长距离场景漫游。OmniRoam不仅在视觉质量、轨迹可控性和长期全局一致性方面表现出色,还拓展了实时生成和3D重建的应用边界。
这是一个基于网络的交互式系统,用于使用 OmniRoam 模型生成全景视频。该系统为视频生成的预览、自动生成和优化阶段提供了用户友好的界面。
OmniRoam旨在解决透视视频模型在场景建模中的局限性,通过提出一种可控全景视频生成框架,实现了高质量的长距离场景漫游。该框架利用全景表示的丰富单帧场景覆盖率和长期时空一致性,通过预览和精修两个阶段,逐步生成高分辨率、长时间的全景视频。此外,OmniRoam还引入了闭环一致性评估指标,科学量化场景级视频生成中的长期全局一致性。
OmniRoam 的技术架构巧妙结合了几何约束与扩散模型,主要包含三大核心模块:
OmniRoam作为一种可控全景视频生成框架,通过全局到局部的生成策略、相机轨迹控制的解耦设计、混合数据集构建以及闭环一致性评估指标,实现了高质量的长距离场景漫游。其在视觉质量、轨迹可控性和长期全局一致性方面均表现出色,并拓展了实时生成和3D重建的应用边界。随着代码的正式开源,OmniRoam有望推动视频生成领域的发展,为沉浸式3D漫游、虚拟现实、增强现实等领域带来更加便捷和高效的视频生成工具。
感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~
用Seedance2.0人脸审核与宫格分镜让剧情更连贯。适用于视频创作者,工作流详见飞书链接。 Tags: Seedance2.0 人脸审核 宫格分镜 视频工作流 剧情剪辑技巧 工作流在飞书里 : http...