2025年8月16日星期六

GitHub 上开源的 AI 录音笔记神器,真的绝了。

逛 GitHub 的时候,发现了一个 AI 会议总结 & 录音笔记工具。

刚刚在 GitHub 上开源,就获得了 1.7K 的 Star。

它非常适合注重隐私的小团队、初创公司或个人,需要高效的会议记录和知识沉淀工具,又不想把会议录音交给第三方公司。

可以基于这个开源项目搭一个应用,数据全在自己手里。

图片

01

项目简介

Speakr 是一款开源免费、支持完全本地化部署的 AI 会议助手,专为解决传统会议记录效率低、隐私风险高的问题而设计。

图片
开源地址:https://github.com/murtaza-nasir/speakr

自动化处理录音内容,让你能快速获取文字记录、智能摘要,甚至通过聊天交互方式提取会议关键信息,同时确保数据100%私密存储。以下是其核心特点:

① 自动转文字:

把录音(MP3, WAV 都行,甚至能直接在浏览器里录)扔给 Speakr,它就能帮你把里面的讲话内容一字一句地转成文字稿。

② 智能总结:
光有文字稿可能还太长?
Speakr 能自动阅读整个转录稿,生成一个简洁的标题和内容摘要,让你一眼抓住会议核心。
图片
③ 聊天问答:
这个最酷。
你可以像跟朋友聊天一样,在 Speakr 的界面上问:"刚才讨论的预算具体是多少?" 或者 "小明对项目A提了哪些建议?"。
Speakr 会理解你问题的意思,从会议记录里找出相关部分回答你
图片
④ 区分说话人:
如果会议上有好几个人讲话,Speakr 还能尝试区分谁说了哪句话。转写出来会标记「说话人1」、「说话人2」。
之后你可以在一个专门的界面里,把这些「说话人1」改成「张三」,「说话人2」改成「李四」。
以后系统还能记住这些人名,方便下次自动识别。
图片
⑤ 录音:
图片
图片

02

如何部署

Speakr 支持两种部署方式,标准模式和 ASR 模式,ASR 模式带说话人分离。

以 ASR 模式安装举例,你可以通过如下命令进行初始化和配置:

# 创建项目目录mkdir speakr-asr && cd speakr-asr
# 创建 docker-compose.ymlcat > docker-compose.yml <<EOFservices:  # 主应用服务  app:    image: learnedmachine/speakr:latest    container_name: speakr    restart: unless-stopped    ports:      - "8899:8899"    env_file:      - .env    volumes:      - ./uploads:/data/uploads      - ./instance:/data/instance    depends_on:      - whisper-asr
  # ASR 转录服务  whisper-asr:    image: onerahmet/openai-whisper-asr-webservice:latest-gpu    container_name: whisper-asr    ports:      - "9000:9000"    environment:      - ASR_MODEL=large-v3      - ASR_ENGINE=whisperx      - HF_TOKEN=your_huggingface_token    deploy:      resources:        reservations:          devices:            - driver: nvidia              count: 1    restart: unless-stoppedEOF
# 创建配置文件cat > .env <<EOF# API 设置TEXT_MODEL_BASE_URL=https://api.openai.com/v1TEXT_MODEL_API_KEY=your_openai_api_keyTEXT_MODEL_NAME=gpt-4-turbo
# ASR 设置USE_ASR_ENDPOINT=trueASR_BASE_URL=http://whisper-asr:9000ASR_DIARIZE=trueASR_MIN_SPEAKERS=2ASR_MAX_SPEAKERS=5
# 管理员账户ADMIN_USERNAME=adminADMIN_EMAIL=admin@example.comADMIN_PASSWORD=changeme
# 高级设置ALLOW_REGISTRATION=falseEOF
# 启动服务docker compose up -d

Docker 启动之后,可以访问地址:http://localhost:8899 来访问搭建好的应用。

    它把强大的 AI 转录、总结和对话能力,通过一个美观的界面,打包成一个你可以完全掌控在自己手中的软件。

    Speakr 绝对值得一试,它能成为你个人或团队的强大 AI 会议助理。

    03

    都看到这了,关注下吧。

    这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

    #逛逛GitHub #开源 #GitHub #AI

    没有评论:

    发表评论

    发现 4 个贼牛的 GitHub 项目,相当牛逼。

    01 一键克隆任何网站 开源 5 天就获得了 10000+ 的 Star, 这个 GitHub 开源项目为啥这么火爆? 它的项目描述: 在几秒钟将任何网站克隆重建为 React 应用。 开源地址:https: //gi thub.com/mendableai/ open -l...