2025年12月15日星期一

用Nano Banana做PPT爆火,开源项目狂揽3K+星标!

前有 vibe coding ,随着 nano banana 升级 pro, vibe PPT 也跟着来了。

最近我在 GitHub 上挖到一个项目:banana slides 。

图片

主打的理念就是:

Vibe your PPT like vibing code.

这是一个基于 nano banana pro 的原生 AI PPT 生成应用。

一句话,它就能自动生成整套 PPT ,大纲、页面描述、排版全部搞定。

比如:

生成一套人类对生态环境的影响的PPT。

效果 be like :

图片

还有这样:

图片

这样:

图片

是不是还不错?

用户可以通过上传参考风格图片、示例模板来自定义样式,甚至还支持语音修改。

它还能自动解析上传的素材,比如自动提取附件图表,同样支持一句话快速调整。

最终导出 PPTX / PDF 格式的文件。

项目前后端是 React + Python Flask ,支持 Docker 一键部署。

上线半个月已经收获了 3.1k 星标。

图片
图片

开源指路:

https://github.com/Anionex/banana-slides

一、项目介绍

背景

AI PPT 并不是一个新想法,大家可能已经在不同平台上体验过类似功能。

常见的流程是:在对话框描述需求,它生成大纲,接着我们选一个模板,它在大纲的基础上把内容填进模板里。

但这种传统 AI PPT 常常会有一些通病。

第一个也是最重要的一个问题是 PPT 的质量。文字内容一般还行,但一旦涉及图表、视觉素材,效果就很难令人满意。

生成之后常常还需要多轮手动修改,一趟操作下来并没有想象中那么高效。

并且基本只能从固定的一些模板中选,先不说成品观感同质化严重,很多时候我都找不到想要风格的模板。

nano banana pro 推出之后,除了各种新奇玩法刷屏,用它来做 PPT 也在外网上小小地火了一把。

图片
图片

图片图片

这也是作者做这个项目的动机。

  • 传统的AI ppt生成器难以同时满足我们"快"和"美"的两大PPT制作需求。

  • 我尝试使用🍌pro进行ppt页面生成,发现生成的结果无论是质量、美感还是一致性,都做的非常好,且几乎能精确渲染 prompt 要求的所有文字+遵循参考图的风格。

核心功能

灵活的创作方式

banana slides 支持想法、大纲、页面描述三种使用方式,满足不同创作习惯。

图片
  • 一句话生成:输入一个主题,AI 自动生成结构清晰的大纲和逐页内容描述。
  • 自然语言编辑:支持以 Vibe 形式口头修改大纲或描述,AI 实时响应调整。
  • 大纲/描述模式:既可一键批量生成,也可手动调整细节。

素材解析

支持 PDF / Docx / MD / txt 等多种格式素材,后台会自动解析内容,并自动识别文本中的关键点、图片链接和图表信息,为 PPT 生成提供丰富素材。

图片

banana slides 同时支持上传参考图片或模板,轻松定制风格。

多轮 vibe 修改

PPT 生成之后,banana slides 支持对不满意的区域进行进一步修改。

除了局部重绘,它也支持对 PPT 整页进行优化,生成高清、风格统一的页面。

图片

开箱即用的格式导出

banana slides 支持一键导出为 PPTX 或者 PDF 文件,并且默认 16:9 比例,排版无需二次调整,可以直接拿来演示。

图片
图片

未来开发计划

banana slides 目前已经完成的功能如下:

图片

还有更多功能即将推出:

图片

二、快速上手

Docker 一键部署

这是最简单的部署方式,可以一键启动前后端服务。

如果你使用 Windows ,部署前请先安装 Windows Docker Desktop ,检查系统托盘中的 Docker 图标,确保 Docker 正在运行,然后使用相同的步骤操作。

  • 克隆代码仓库。
git clone https://github.com/Anionex/banana-slides
cd banana-slides
  • 配置环境变量。

创建 .env 文件(参考 .env.example):

cp .env.example .env

编辑 .env 文件,配置必要的环境变量:

项目中大模型接口以 AIHubMix 平台格式为标准,推荐使用 AIHubMix 获取 API 密钥,减小迁移成本

# AI Provider格式配置 (gemini / openai)
AI_PROVIDER_FORMAT=gemini

# Gemini 格式配置(当 AI_PROVIDER_FORMAT=gemini时使用)
GOOGLE_API_KEY=your-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com
# 代理示例: https://aihubmix.com/gemini

# OpenAI 格式配置(当 AI_PROVIDER_FORMAT=openai 时使用)
OPENAI_API_KEY=your-api-key-here
OPENAI_API_BASE=https://api.openai.com/v1
# 代理示例: https://aihubmix.com/v1
...
  • 启动服务
docker compose up -d
  • 访问应用

前端:http://localhost:3000

后端 API:http://localhost:5000

  • 查看日志
# 查看后端日志(实时查看最后50行)
sudo docker compose logs -f --tail 50 backend

# 查看所有服务日志
sudo docker compose logs -f --tail 50

# 查看前端日志
sudo docker compose logs -f --tail 50 frontend
  • 停止服务
docker compose down
  • 更新项目

拉取最新代码并重新构建和启动服务:

git pull
docker compose down
docker compose build --no-cache
docker compose up -d

从源码部署

环境要求

  • Python 3.10 或更高版本
  • uv - Python 包管理器
  • Node.js 16+ 和 npm
  • 有效的 Google Gemini API 密钥

后端安装

  • 克隆代码仓库
git clone https://github.com/Anionex/banana-slides
cd banana-slides
  • 安装 uv(如果尚未安装)
curl -LsSf https://astral.sh/uv/install.sh | sh
  • 安装依赖

在项目根目录下运行:

uv sync

这将根据 pyproject.toml 自动安装所有依赖。

  • 配置环境变量

复制环境变量模板:

cp .env.example .env

编辑 .env 文件,配置你的 API 密钥:

项目中大模型接口以 AIHubMix 平台格式为标准,推荐使用 AIHubMix 获取 API 密钥,减小迁移成本。

# AI Provider格式配置 (gemini / openai)
AI_PROVIDER_FORMAT=gemini

# Gemini 格式配置(当 AI_PROVIDER_FORMAT=gemini时使用)
GOOGLE_API_KEY=your-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com
# 代理示例: https://aihubmix.com/gemini

# OpenAI 格式配置(当 AI_PROVIDER_FORMAT=openai 时使用)
OPENAI_API_KEY=your-api-key-here
OPENAI_API_BASE=https://api.openai.com/v1
# 代理示例: https://aihubmix.com/v1
PORT=5000
...

前端安装

  • 进入前端目录
cd frontend
  • 安装依赖
npm install
  • 配置API地址

前端会自动连接到 http://localhost:5000 的后端服务。如需修改,请编辑 src/api/client.ts

启动后端服务

cd backend
uv run python app.py

后端服务将在 http://localhost:5000 启动。

访问 http://localhost:5000/health 验证服务是否正常运行。

启动前端开发服务器

cd frontend
npm run dev

前端开发服务器将在 http://localhost:3000 启动。

打开浏览器访问即可使用应用。

三、最后

随着模型的升级换代,应用层的体验也在持续跃迁。

banana slides 适用场景非常广。

小白可以拿来零门槛快速生成高质量的 PPT 。

PPT 专业选手可以用它生成的布局和图文素材组合作个参考,拿来找灵感也不错。

无论你是大学生、老师,还是经常需要开会汇报的打工人,都推荐上手试试~

>/ 本期作者:Tashi  & JackCui

>/ JackCui:AI领域从业者,毕业于东北大学,大厂算法工程师,热爱技术分享。

没有评论:

发表评论

建议收藏!全网最强 AI 资源包:GPT-5。2、Claude 4。5、科研绘图神器,通通国内直连!

🚀 建议收藏!全网最强 AI 资源包:GPT-5.2、Claude 4.5、科研绘图神器,通通国内直连! 🚀 建议收藏!全网最强 AI 资源包:GPT-5.2、Claude 4.5、科研绘图神器,通通国内直连! 在这个 AI 迭代以"小时"计的时代,掌...