2026年2月25日星期三

GitHub精选开源工具:论文配图自动生成、零代码自动化与AI开发框架推荐

本文整理了7个实用的GitHub开源项目,涵盖学术研究、自动化工具与AI开发三大场景。包括可根据文字自动生成可编辑论文配图的AutoFigure-Edit、无需编程即可实现网页自动化的WebRPA,以及专为Claude Code等AI编程工具设计的规范管理框架Trellis。适合研究人员、非技术用户及开发者参考使用,所有项目均为开源且可直接获取。

Tags:

01
论文配图自动生成:AutoFigure-Edit
写论文最头疼的是什么?画图啊!尤其是那些流程图、架构图,画一张得折腾半天。
最近在 GitHub 上发现一个叫 AutoFigure-Edit 的开源项目,专门解决这个问题。它入选了 ICLR 2026,属于学术圈的正经工具。
图片
说白了,这玩意儿就是把你的论文方法部分文字丢进去,它能自动生成专业的论文配图,而且是可编辑的 SVG 格式。
它的核心工作流程是这样的:先用 LLM 根据文字生成一个草图,然后用 SAM3 做图像分割识别出各个图标区域,再通过 RMBG-2.0 去背景,最后组装成完整的矢量图。
图片
最牛的是它支持风格迁移,你可以丢一张参考图进去,它会模仿那个风格来画你的图。这对于想要统一论文配图风格的人来说,简直是救星。
项目还内置了一个 Web 界面,生成的图可以直接在浏览器里编辑,拖拖拽拽就能调整,非常方便。
图片
开源地址:https://github.com/ResearAI/AutoFigure-Edit
02
零代码网页自动化:WebRPA
说到网页自动化,大部分人第一反应是写 Python 爬虫。但对于不会编程的人来说,这就很痛苦了。
WebRPA 这个项目很有意思,它是一个可视化的网页自动化工具,通过拖拽模块就能构建自动化工作流,完全不用写代码。
这个项目内置了整整 260 个功能模块,覆盖了网页操作、数据采集、文件处理、媒体转换、AI 对话等各种场景。而且它自带 Python 3.13 和 Node.js 环境,解压就能用。
它的功能非常全面:浏览器自动化用的是 Playwright,支持 CSS 选择器、XPath 等多种定位方式;数据处理支持 JSON、正则表达式、Excel 读写;媒体处理基于 FFmpeg,能搞定 50 多种视频音频格式转换;AI 能力支持 OpenAI、智谱、通义千问等多家服务商。
图片
图片
图片
特别值得一提的是它的触发器系统,支持 Webhook、定时任务、文件监控、热键监听等 10 种触发方式,可以做出很复杂的自动化流程。
作者是个大一新生,能把项目做到这个完整度,确实挺厉害的。
开源地址:https://github.com/pmh1314520/WebRPA
03
Claude Code 效率神器:Trellis
如果你经常用 Claude Code 写代码,那 Trellis 这个项目一定要看看。
它是一个专门为 Claude Code、Cursor、Codex 设计的 AI 框架工具箱,核心卖点是让 AI 能够持久记住你的项目规范和最佳实践
图片
很多人的痛点是,每次跟 AI 聊天都要重新描述一遍代码规范、组件风格、文件结构之类的。Trellis 通过自动注入机制解决了这个问题,你写一次规范,它就会在每次对话开始时自动加载进去。
它还支持并行会话功能,可以在不同的 worktree 里同时跑多个 AI 任务,互不干扰。这对于需要同时开发多个功能的场景特别有用。
图片
项目结构设计得挺清晰的,spec 目录存放规范文档,workspace 目录是个人工作空间,不同人协作也不会冲突。还有一个很实用的功能是用 /trellis:record-session 记录工作日志,下次启动时 AI 能自动读取之前的上下文。
图片
图片
跟普通的 CLAUDE.md 文件相比,Trellis 的分层架构更灵活,只会加载当前任务相关的规范,不会把所有东西都塞给 AI。
开源地址:https://github.com/mindfold-ai/Trellis
04
QQ 机器人接入:qqbot
想把 AI 接到 QQ 上?sliverp 开源的这个 qqbot 项目可以帮到你。
它是 OpenClaw 框架的一个插件,通过 QQ 开放平台的长连接事件订阅机制,实现消息和事件的回调处理。
整个配置流程其实不算复杂。首先去 QQ 开放平台注册账号、创建机器人,拿到 AppID 和 AppSecret。然后用 openclaw plugins install @sliverp/qqbot@latest 安装插件,把凭证配置好就能用了。
图片
项目文档写得很详细,从账号注册、实名认证到机器人创建的每一步都有截图说明,对新手很友好。
图片
需要注意的是,QQ 开放平台的机器人目前只支持私聊,不支持群聊。不过对于个人使用来说,私聊够用了。
开源地址:https://github.com/sliverp/qqbot
05
生产级 AI Agent 框架:CountBot
CountBot 是一个用 21K 行代码实现的生产级 AI Agent 框架,今年 2 月刚开源。
项目的定位是字数统计工具,但它的架构设计得很通用,采用了工具即智能体的理念,为后续扩展 AI 文本分析、写作辅助等功能预留了空间。

技术栈方面,它基于 Flutter 开发,支持 Windows、macOS、Linux 三端,还适配了鸿蒙 HarmonyOS 6.0。对于想学习跨端开发的同学来说,这个项目是个不错的参考。
作为一个生产级框架,它的代码组织、模块划分、错误处理都比较规范,可以作为学习 AI Agent 架构设计的参考案例。
开源地址:https://github.com/countbot-ai/CountBot
06
OpenClaw 骨架模板:ai-openclaw-skeletons
这个项目是 OpenClaw 生态的一部分,提供了 AI Agent 开发的骨架模板。
OpenClaw 是一个开源的全能 AI 助手框架,在 GitHub 上有超过 16 万 Star,主打的是让 AI 真正能干活,而不只是聊天。
图片
ai-openclaw-skeletons 这个仓库提供了一系列项目模板,可以帮助开发者快速搭建基于 OpenClaw 的 AI 应用。如果你想在 OpenClaw 生态里做二次开发,这个骨架项目可以帮你省去很多初始化工作。
开源地址:https://github.com/1596941391qq/ai-openclaw-skeletons

07

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

没有评论:

发表评论

中小企业AI数据标注平台开源:支持图像文本音频视频标注,完整中文界面本地部署

Stegosaurus-Label是一款专为中小企业设计的开源数据标注平台,完整支持图像、文本、音频、视频多模态数据标注与项目管理。平台提供全中文界面、企业级权限管理及本地化部署能力,帮助中小企业低成本切入AI数据标注服务市场,适用于自动驾驶、医疗影像、金融零售等行业场景的标注需...