熬夜写完代码,跑完实验,好不容易把论文或技术报告写出来了。这时候我们最想做的事,就是关机睡觉。
但现实往往很骨感,突然,导师来一句:"明天组会,做个 PPT 讲讲"。这种时候,相信大家心里都非常难受。
要把几万字的文档浓缩成几页 PPT,还得找图、排版、对齐,这一搞就是大半宿。
于是怒上 GitHub,经过一番疯狂搜索,终于找到了一个由香港大学数据智能实验室开源的硬核项目:Paper2Slides。
简单说,它能把我们写好的 PDF、Word 或者 Markdown 文档,直接一键生成精美的 PPT 或者海报。
而且,它不是那种简单的文本摘要工具。
市面上自动生成 PPT 的工具其实不少,但这个项目的思路有点不一样。它没瞎编,而是使用了 RAG(检索增强生成) 技术。
它会老老实实地去"读"我们的论文,理解文档结构,把里面的关键数据、架构图、表格给精准地"抠"出来,然后填进 PPT 里。
生成的每一页 PPT,还能在原文里找到出处。这就很好地避免了 AI 经常出现的"一本正经胡说八道"的老毛病。
最让我觉得好玩的,是它的画风。
除了中规中矩的学术风,它还支持通过提示词来自定义风格。
作者演示了"哆啦A梦"和"吉卜力"风格,生成的 PPT 甚至带插画,配色也全是莫兰迪色系。
说实话,要是组会能拿出这种 PPT,绝对能把导师看愣,视觉效果确实很顶。
除此之外,我还得夸一下它的"断点续传"功能。
大家应该都有过这种经历:跑一个长任务,结果跑了一半断网或者报错,只能重头再来,非常搞心态。
这个工具会在每个阶段自动保存进度。
无论是读论文、做大纲,还是生成图片。哪怕程序崩了,再次运行命令,它也能接着上次的进度跑。
不用从零开始,这点做得非常务实。
安装方面,它是基于 Python 的。把源码拉下来,装好依赖就能用。
不过要注意,想让它跑起来,我们需要在 .env 文件里配好 API Key(支持 OpenAI、Google Gemini 等)。
核心一条命令非常简单,指定输入文件和输出风格即可:
# 一行命令,把 PDF 转成哆啦A梦风格的 PPTpython -m paper2slides --input paper.pdf --output slides --style doraemon
当然,如果我们不想敲命令行。它还提供一个简单的 Web 界面,点几下鼠标就可以。
总的来说。
对于我们这种经常需要赶 Deadline,或者不想在排版上浪费时间的开发者来说。
这个工具值得收藏备用,关键时刻能帮我们省下不少睡眠时间。
GitHub 项目地址:https://github.com/HKUDS/Paper2Slides
今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
没有评论:
发表评论