西湖大学张岳实验室开源的AutoFigure-Edit学术插图生成框架,可从长篇科学文本一键生成可编辑的SVG插图,支持参考图风格迁移。基于五阶段流水线和推理式渲染,用户研究显示48%的生成结果可直接用于论文发表。适合科研人员快速制作高质量论文插图,体验地址:https://deepscientist.cc。
Tags:
在科研领域,高质量的科学插图是传达复杂概念和研究成果的关键。然而,传统绘图工具要么需要高超的设计技能,要么生成的图片难以编辑,让科研人员头疼不已。西湖大学张岳实验室推出的AutoFigure-Edit系统,彻底改变了这一现状!作为一个端到端的AI论文绘图工具,AutoFigure-Edit不仅能从长篇科学文本中自动生成完全可编辑的SVG插图,还支持通过参考图引导风格迁移,让科研绘图变得前所未有的简单和高效。
相关链接
论文:https://arxiv.org/abs/2603.06674 源码:https://github.com/ResearAI/AutoFigure-Edit 体验:https://deepscientist.cc
论文介绍
西湖大学张岳实验室在ICLR 2026 上展示了其首个能够从长篇科学文本中自动生成出版级学术插图的智能体框架AutoFigure,并在此基础上进一步推出了AutoFigure-Edit。这一系统不仅解决了AI生成图"生成不可编辑、编辑要重新生成"的尴尬局面,还通过多项技术创新,让科研绘图真正"活"了起来。
方法概述
从像素到矢量的跨越 AutoFigure-Edit生成的插图不再是静态的PNG图片,而是完全可编辑的SVG文件。这意味着用户可以在浏览器内直接拖拽元素、修改文字、更换颜色,所有元素都按需定制,极大提高了绘图的灵活性和效率。
参考图引导的风格迁移 用户只需上传一张喜欢的风格图,AI就能自动学习其配色、字体、图标风格,并应用到生成的科学插图上。这一功能彻底摆脱了模糊的Prompt描述,让风格控制变得直观且简单。
五阶段流水线 AutoFigure-Edit的核心是一个创新的五阶段流水线:
风格条件生图:使用文本和参考图生成初始栅格图像。 分割与结构索引:利用SAM3技术识别视觉组件并构建结构骨架。 资产提取:提取透明背景的视觉资产。 SVG模板生成与精炼:生成结构化的SVG布局模板。 资产注入:将视觉资产注入模板,形成完全可编辑的SVG。 推理式渲染范式 AutoFigure-Edit继承了AutoFigure的"推理式渲染"范式,将"逻辑布局"和"美学渲染"彻底解耦,确保生成的插图既正确又美观。
AUTOFIGURE-EDIT 的代表性输出。(a)-(b) 是根据不同领域的长篇科学描述生成的位图 (PNG) 图形。(c) 展示了 AUTOFIGURE-EDIT 的 PNG 转 SVG 转换示例,包括原始位图(底部)及其对应的矢量化 SVG 结果(底部)。(d) 是 AUTOFIGURE-EDIT 的 Web 界面,允许用户选择预定义的样式模板或上传自定义参考图像。
实验结果
自动化评估
团队在FigureBench基准测试上对AutoFigure-Edit进行了全面评估,结果显示其在所有核心维度上都显著领先于现有方法。使用参考图后,Win-Rate从76.0%提升到83.0%,内容保真度全面提升。
用户研究
基于真实使用场景的用户研究显示,217位参与者通过在线网站生成了262个插图,并进行了多维度评价。48%的用户认为生成结果可直接用于论文发表,无需修改,证明了系统的真实科研工作流可用性。
风格迁移与编辑能力 AutoFigure-Edit展示了强大的风格迁移和编辑能力,同一研究内容可以适配不同的视觉风格和出版需求,极大提高了科研绘图的多样性和灵活性。
结论
AutoFigure-Edit的出现,不仅解决了科研人员在绘图过程中遇到的诸多难题,还通过多项技术创新,重新定义了科学可视化的边界。它不仅赋能AI科学家实现全流程自主研究,还降低了科研创作门槛,让高质量科学插图触手可及。
学术插图不应是科研路上的拦路虎,AutoFigure-Edit正在让AI不仅"读懂"你的研究,更能"画出"你的洞见。下次DDL前,不妨试试让AutoFigure-Edit帮你搞定那些繁琐的插图工作,让你的时间花在思考科学问题上,而不是在PPT里画框对线。
感谢你看到这里,添加小助手 AIGC_Tech 加入官方 AIGC读者交流群,下方扫码加入 AIGC Studio 星球,获取前沿AI应用、AIGC实践教程、大厂面试经验、AI学习路线以及IT类入门到精通学习资料等,欢迎一起交流学习💗~
没有评论:
发表评论