逛 GitHub 的时候,发现了一个 AI 会议总结 & 录音笔记工具。
刚刚在 GitHub 上开源,就获得了 1.7K 的 Star。
它非常适合注重隐私的小团队、初创公司或个人,需要高效的会议记录和知识沉淀工具,又不想把会议录音交给第三方公司。
可以基于这个开源项目搭一个应用,数据全在自己手里。
01
项目简介
Speakr 是一款开源免费、支持完全本地化部署的 AI 会议助手,专为解决传统会议记录效率低、隐私风险高的问题而设计。
开源地址:https://github.com/murtaza-nasir/speakr自动化处理录音内容,让你能快速获取文字记录、智能摘要,甚至通过聊天交互方式提取会议关键信息,同时确保数据100%私密存储。以下是其核心特点:
① 自动转文字:
把录音(MP3, WAV 都行,甚至能直接在浏览器里录)扔给 Speakr,它就能帮你把里面的讲话内容一字一句地转成文字稿。
02
如何部署
Speakr 支持两种部署方式,标准模式和 ASR 模式,ASR 模式带说话人分离。
以 ASR 模式安装举例,你可以通过如下命令进行初始化和配置:
# 创建项目目录mkdir speakr-asr && cd speakr-asr# 创建 docker-compose.ymlcat > docker-compose.yml <<EOFservices:# 主应用服务app:image: learnedmachine/speakr:latestcontainer_name: speakrrestart: unless-stoppedports:- "8899:8899"env_file:- .envvolumes:- ./uploads:/data/uploads- ./instance:/data/instancedepends_on:- whisper-asr# ASR 转录服务whisper-asr:image: onerahmet/openai-whisper-asr-webservice:latest-gpucontainer_name: whisper-asrports:- "9000:9000"environment:- ASR_MODEL=large-v3- ASR_ENGINE=whisperx- HF_TOKEN=your_huggingface_tokendeploy:resources:reservations:devices:- driver: nvidiacount: 1restart: unless-stoppedEOF# 创建配置文件cat > .env <<EOF# API 设置TEXT_MODEL_BASE_URL=https://api.openai.com/v1TEXT_MODEL_API_KEY=your_openai_api_keyTEXT_MODEL_NAME=gpt-4-turbo# ASR 设置USE_ASR_ENDPOINT=trueASR_BASE_URL=http://whisper-asr:9000ASR_DIARIZE=trueASR_MIN_SPEAKERS=2ASR_MAX_SPEAKERS=5# 管理员账户ADMIN_USERNAME=adminADMIN_EMAIL=admin@example.comADMIN_PASSWORD=changeme# 高级设置ALLOW_REGISTRATION=falseEOF# 启动服务docker compose up -d
Docker 启动之后,可以访问地址:http://localhost:8899 来访问搭建好的应用。
它把强大的 AI 转录、总结和对话能力,通过一个美观的界面,打包成一个你可以完全掌控在自己手中的软件。
Speakr 绝对值得一试,它能成为你个人或团队的强大 AI 会议助理。
03
都看到这了,关注下吧。
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。
没有评论:
发表评论