AI I024: 免费语音转文本工具整合包Voxtral Mini，可以将语音音频转录为文本，同时还具备语义理解与摘要能力，工具已打包，一键启动

2025年7月23日星期三

免费语音转文本工具整合包Voxtral Mini，可以将语音音频转录为文本，同时还具备语义理解与摘要能力，工具已打包，一键启动

AI应用帮，帮你用AI

公众号：AI应用帮

「 文中提供获取方式 」

▼

本期带来语音转文本工具整合包 —— Voxtral Mini

Voxtral 是由法国初创公司 Mistral AI 开源的语音智能模型系列，包含 24B 参数的 Voxtral Small 与 3B 参数的 Voxtral Mini，专为长音频场景打造。该模型支持多语言支持（支持中文、英语、西班牙语、日语、法语、葡萄牙语、阿拉伯语、俄语、德语、荷兰语、意大利语等语言），具备高精度语音转录、语义理解与摘要能力，同时成本低于同类闭源方案一半，可在生产环境中稳定部署，助力会议、播客等场景的智能音频处理。

这里分享的是3B的Voxtral Mini模型。

开源地址：https://huggingface.co/mistralai/Voxtral-Mini-3B-2507/tree/main

# 一键启动整合包下载地址：

https://aiyy.info/voxtral-mini/

视频教程

# 配置要求：

电脑需满足以下配置：

操作系统：Windows 10/11 64位

内存：20G以上（内存不足可以通过增加虚拟内存方式解决，可自行搜索操作教程）

显卡：要求12G及以上显存的英伟达（NVIDIA）显卡，音频越长对显存要求越高，长音频建议分割处理

CUDA ：显卡驱动更新到最新后，支持的CUDA版本大于等于12.8版本（如不知道显卡支持的CUDA版本，可在此链接查看：https://aiyy.info/supported-cuda-versions/）

整个包解压之后约43.4G，留足硬盘空间

# 如何查看显卡品牌型号和显存：

打开任务管理器
点击"性能"
点击"GPU"
右上角可以看到显卡型号，下方可以看到显存大小

# 使用教程：

① 打开下载页面（https://aiyy.info/voxtral-mini/）点击页面右侧下载按钮，下载整合包之后解压，建议使用winrar解压（解压软件在文件包中，或者可以自己下载安装，下载地址：https://www.winrar.com.cn/）

不要用Windows自带解压！！不要用360解压！！

注意：文件夹路径和文件名称（包括视频、图片、音频等文件名称）不要出现中文字符，否则部分软件会因识别不出而报错

② 双击"一键启动.bat"，稍等片刻会在浏览器中自动打开操作界面

③ 上传音频文件，选择转录语言，（可选）设置最大输出长度，点击开始转录，转录结果位于右侧。

注意：音频越长对显存要求越高，长音频建议分割处理

如下方示例

以上就是本期分享的内容，所需工具在下方网址中👇👇👇可以自取👇👇👇

后期持续分享AI应用、AI落地项目及实用工具

更多AI软件获取方式

👇👇👇👇👇👇👇👇👇👇👇👇👇👇👇👇

aiyy.info

（浏览器地址栏中输入上方网址，或点击左下角【阅读原文】可直接跳转）

关注下方公众号

及时获取更多资讯

菜单栏可见Ai应用集合

--------收集不易先点在看后 领取--------

版权声明：本公众号尊重原创。所获取资源，皆由本公众号在网络上收集整理，仅供交流学习用，禁止商用，版权属于原作者。若因为种种原因，未能与原作者联系的，若涉及版权问题，敬请原作者联系我们，本公众号立即撤下资源并进行相应处理。

👇 点击下方【阅读原文】可直接进入

没有评论:

发表评论

订阅：博文评论 (Atom)