2025年12月10日星期三

万字论文一键转PPT,港大团队开源!

熬夜写完代码,跑完实验,好不容易把论文或技术报告写出来了。这时候我们最想做的事,就是关机睡觉。

但现实往往很骨感,突然,导师来一句:"明天组会,做个 PPT 讲讲"。这种时候,相信大家心里都非常难受。

要把几万字的文档浓缩成几页 PPT,还得找图、排版、对齐,这一搞就是大半宿。

于是怒上 GitHub,经过一番疯狂搜索,终于找到了一个由香港大学数据智能实验室开源的硬核项目:Paper2Slides

img

简单说,它能把我们写好的 PDF、Word 或者 Markdown 文档,直接一键生成精美的 PPT 或者海报。

而且,它不是那种简单的文本摘要工具。

市面上自动生成 PPT 的工具其实不少,但这个项目的思路有点不一样。它没瞎编,而是使用了 RAG(检索增强生成) 技术。

image-20251210142928805

它会老老实实地去"读"我们的论文,理解文档结构,把里面的关键数据、架构图、表格给精准地"抠"出来,然后填进 PPT 里。

生成的每一页 PPT,还能在原文里找到出处。这就很好地避免了 AI 经常出现的"一本正经胡说八道"的老毛病。

最让我觉得好玩的,是它的画风。

除了中规中矩的学术风,它还支持通过提示词来自定义风格。

作者演示了"哆啦A梦"和"吉卜力"风格,生成的 PPT 甚至带插画,配色也全是莫兰迪色系。

说实话,要是组会能拿出这种 PPT,绝对能把导师看愣,视觉效果确实很顶。

image-20251210143035494

除此之外,我还得夸一下它的"断点续传"功能。

大家应该都有过这种经历:跑一个长任务,结果跑了一半断网或者报错,只能重头再来,非常搞心态。

这个工具会在每个阶段自动保存进度。

无论是读论文、做大纲,还是生成图片。哪怕程序崩了,再次运行命令,它也能接着上次的进度跑。

不用从零开始,这点做得非常务实。

image-20251210143253112

安装方面,它是基于 Python 的。把源码拉下来,装好依赖就能用。

不过要注意,想让它跑起来,我们需要在 .env 文件里配好 API Key(支持 OpenAI、Google Gemini 等)。

核心一条命令非常简单,指定输入文件和输出风格即可:

# 一行命令,把 PDF 转成哆啦A梦风格的 PPTpython -m paper2slides --input paper.pdf --output slides --style doraemon

当然,如果我们不想敲命令行。它还提供一个简单的 Web 界面,点几下鼠标就可以。

img

总的来说。

对于我们这种经常需要赶 Deadline,或者不想在排版上浪费时间的开发者来说。

这个工具值得收藏备用,关键时刻能帮我们省下不少睡眠时间。

GitHub 项目地址:https://github.com/HKUDS/Paper2Slides

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

没有评论:

发表评论

nexu开源客户端接入Seedance 2。0,微信聊天生成AI视频+免费领2个额度

nexu开源客户端全球首批接入Seedance 2.0 API,支持在微信/飞书等聊天窗口通过一句话生成15秒2K电影级视频,告别即梦排队8小时。适合电商卖家、内容创作者、独立开发者等。限时福利:给GitHub项目点Star可免费领取2个视频生成额度,先到先得。需下载nexu客户...