逛 GitHub 的时候,发现了一个 AI 会议总结 & 录音笔记工具。
刚刚在 GitHub 上开源,就获得了 1.7K 的 Star。
它非常适合注重隐私的小团队、初创公司或个人,需要高效的会议记录和知识沉淀工具,又不想把会议录音交给第三方公司。
可以基于这个开源项目搭一个应用,数据全在自己手里。
01
项目简介
Speakr 是一款开源免费、支持完全本地化部署的 AI 会议助手,专为解决传统会议记录效率低、隐私风险高的问题而设计。
开源地址:https://github.com/murtaza-nasir/speakr
自动化处理录音内容,让你能快速获取文字记录、智能摘要,甚至通过聊天交互方式提取会议关键信息,同时确保数据100%私密存储。以下是其核心特点:
① 自动转文字:
把录音(MP3, WAV 都行,甚至能直接在浏览器里录)扔给 Speakr,它就能帮你把里面的讲话内容一字一句地转成文字稿。
02
如何部署
Speakr 支持两种部署方式,标准模式和 ASR 模式,ASR 模式带说话人分离。
以 ASR 模式安装举例,你可以通过如下命令进行初始化和配置:
# 创建项目目录
mkdir speakr-asr && cd speakr-asr
# 创建 docker-compose.yml
cat > docker-compose.yml <<EOF
services:
# 主应用服务
app:
image: learnedmachine/speakr:latest
container_name: speakr
restart: unless-stopped
ports:
- "8899:8899"
env_file:
- .env
volumes:
- ./uploads:/data/uploads
- ./instance:/data/instance
depends_on:
- whisper-asr
# ASR 转录服务
whisper-asr:
image: onerahmet/openai-whisper-asr-webservice:latest-gpu
container_name: whisper-asr
ports:
- "9000:9000"
environment:
- ASR_MODEL=large-v3
- ASR_ENGINE=whisperx
- HF_TOKEN=your_huggingface_token
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: 1
restart: unless-stopped
EOF
# 创建配置文件
cat > .env <<EOF
# API 设置
TEXT_MODEL_BASE_URL=https://api.openai.com/v1
TEXT_MODEL_API_KEY=your_openai_api_key
TEXT_MODEL_NAME=gpt-4-turbo
# ASR 设置
USE_ASR_ENDPOINT=true
ASR_BASE_URL=http://whisper-asr:9000
ASR_DIARIZE=true
ASR_MIN_SPEAKERS=2
ASR_MAX_SPEAKERS=5
# 管理员账户
ADMIN_USERNAME=admin
ADMIN_EMAIL=admin@example.com
ADMIN_PASSWORD=changeme
# 高级设置
ALLOW_REGISTRATION=false
EOF
# 启动服务
docker compose up -d
Docker 启动之后,可以访问地址:http://localhost:8899 来访问搭建好的应用。
它把强大的 AI 转录、总结和对话能力,通过一个美观的界面,打包成一个你可以完全掌控在自己手中的软件。
Speakr 绝对值得一试,它能成为你个人或团队的强大 AI 会议助理。
03
都看到这了,关注下吧。
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。
没有评论:
发表评论