Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载

Moonshine 是由 Useful Sensors 公司推出的一系列「语音到文本(speech-to-text, STT)转换模型」,旨在为资源受限设备提供快速而准确的「自动语音识别(ASR)服务」。Moonshine 的设计特别适合于需要即时响应的应用场景,如实时转录和语音命令识别。相比同类产品,如 OpenAI 的 Whisper,Moonshine 在处理速度上提高了五倍,并且在多个标准数据集上展示了更低的词错误率(WER)。
Moonshine 在多个维度上超越了现有的语音识别解决方案,特别是在处理速度和准确度方面。据官方报告,Moonshine 的处理速度「比 OpenAI 的 Whisper 快五倍」,并且在词错误率方面也表现得更好。这种显著的优势使得 Moonshine 成为资源受限环境下语音识别的理想选择。


更小体积的模型:
moonshine/base 模型参数大小为 61 MB。moonshine/tiny 模型仅需 27 MB RAM。适用于内存非常有限的设备。


更快的处理速度
Moonshine 的处理速度比 Whisper 快 1.7 倍。对于 10 秒的短音频片段,处理速度可达 Whisper 的五倍。高效处理能力和低资源需求确保实时或接近实时的语音转文字功能。


优点说完了,说说缺点,目前只支持英文,期待后期更多语种的支持。有类似英语转换需求的可以体验下,速度确实快,准确率也高。


使用教程:(CPU可运行,建议独立显卡N卡使用,速度更快)
上传一段需要识别的音频,选择模型,点转写即可

一键整合包下载:点赞收藏,后台私信 语音识别

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/6468.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【实验八】前馈神经网络(4)优化问题

1 参数初始化 模型构建 模型训练 优化 完整代码 2 梯度消失问题 模型构建 模型训练 完整代码 3 死亡Relu问题 模型构建 模型训练 优化 完整代码 1 参数初始化 实现一个神经网络前,需要先初始化模型参数。如果对每一层的权重和偏置都用0初始化&#xff0…

华为-宝塔-MongoDB无法登录

1、宝塔防火墙服务器安全组放开端口号 2、用数据库对应的用户名和密码登录 2-1:不指定验证数据库时用root账号密码登录 2-2:如果设置了验证数据库就用验证数据库对应的账号和密码登录

Scala入门基础(16)scala的包

Scala的包定义包定义包对象Scala的包的导入导入重命名 一.Scala的包 package(包:一个容器。可以把类,对象,包,装入。 好处: 区分同名的类;类很多时,更好地管理类;控制…

Android IPC机制(一)多进程模式

1. 什么是进程? 进程是操作系统分配资源(如 CPU、内存等)的基本单位。简单来说,进程是一个正在执行的程序的实例。每个进程都有自己的内存空间、数据栈和其他辅助数据,用于跟踪进程的执行状态。在 Android 中&#xff…

【笔记】铜导线在高频下的损耗

参考资料:Litz Wire: Practical Design Considerations for Todays High Frequency Applications,kyle jensen,2020 1.高频条件下因为集肤效应,需要选择多股线 否则高频下因为集肤效应和接近效应,所引发的交流阻抗上升&#xff…

火语言RPA流程组件介绍--指纹浏览器管理

🚩【组件功能】:指纹浏览器配置管理创建、删除、判断是否存在 配置预览 配置说明 操作类型 有“创建、删除、判断是否存在”3种类型供选择。 指纹浏览器配置名称 支持T或# 默认FLOW输入项 填写指纹环境分身名称。 操作方式 有“名称、Id”2种方式…

windows自启动 映像劫持 屏保

Windows权限维持—自启动&映像劫持&粘滞键&辅助屏保后门 自启动 自启动路径加载 受控windows机器选择当前用户C盘目录下将文件放到这里每到电脑服务器重启就会自动加这次路径下文件 C:\Users\月\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startu…

SSH实验3拒绝root用户远程登录

打开配置文件: 默认为root用户密码登录: 加一行PermitRootLogin no,拒绝登录: 再打开这个配置文件: yes改为no: 查看SELinux 当前处于宽松模式,并且关闭防火墙: 重启sshd&#xff1a…

mysql 主从复制

一、通过二进制文件binlog进行主从同步 开启防火墙3306端口 1.设置主服务器:/etc/my.cnf log-binbinlog #二进制文件名称,需要开启 binlog-formatROW; # row,statement,mixed mysql默认采用statement statement:主要记录了sql。日志…

Python作业记录

复制过来的代码的换行有问题,但是也不是什么大问题。 后续我会进行补充和修改。 请将如下英文短句根据单词切分成列表: The continent of Antarctica is rising. It is due to a geological phenomenon called post-glacial uplift 并在切分好的列表…

Spring Boot框架下的水电管理系统开发

1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及,互联网成为人们查找信息的重要场所,二十一世纪是信息的时代,所以信息的管理显得特别重要。因此,使用计算机来管理大学城水电管理系统的相关信息成为必然。开…

vue3+less使用主题定制(多主题定制)可切换主题

假如要使用两套主题:蓝色、红色 例如: 首先确保自己的vue3项目有less,这边不多做接入解释 1、在src目录下建一个styles文件夹,在syles文件夹下面新建两个less文件:theme.less和variables.less; theme.le…

PyQt5实战——翻译器的UI页面设计以及代码实现(七)

个人博客:苏三有春的博客 系类往期文章: PyQt5实战——多脚本集合包,前言与环境配置(一) PyQt5实战——多脚本集合包,UI以及工程布局(二) PyQt5实战——多脚本集合包,程序…

【种完麦子,我就往南走,去西双版纳,过个冬天!】

麦子奶奶:冰哥,你好。 大冰:你好,咱俩不定谁大呢。 麦子奶奶:嗯,我大,我60多了,你各方面都是哥。 大冰:阿姨好 麦子奶奶:我想出去看看祖国的大好河山&…

koa + sequelize做距离计算(MySql篇)

1.核心思路 1.利用sequelize的fn方法调用MySql原生函数(st_distance_sphere、point) 2.这里利用到了MySql的原生函数,不懂可以去看看mysql的函数知识 2.核心代码 //st_distance_sphere、point函数用来计算当前经纬度和目的地经纬度 //col…

编译工具与文件学习(一)-YAML、repos、vcstoolcolcon

YAML YAML(YAML Ain’t Markup Language)是一种人类可读的数据序列化格式,常用于配置文件、数据交换和存储结构化数据。YAML 的设计目标是简洁、易读,并且能够表示复杂的数据结构。 YAML 文件的基本语法 基本结构: Y…

【数据结构】Java 集合 Set 接口及其实现类的定义简介

接口继承接口,类实现接口。 Set 是一个接口,实现了 Collection 接口(都带有泛型)。它可以被继承或实现。在Java 集合章节的知识点中,学习其子类对象的实现以及关系。 类关系图 可以在IDEA中直接生成 集合 Set 类关系…

【青牛科技】应用方案 | D75xx-150mA三端稳压器

概 述 D75XX系列是一套三端高电流低压稳压器。它们可以提供 150mA 的输出电流和允许输入电压高达30V。它们有几个固定的输出电压范围为3.0 V至5.0 V。CMOS 技术确保低电压降和低静态电流。 虽然这些设备主要设计为固定电压调节器,但它们可以与外部元件一起使用&…

(三)使用Vite创建Vue项目,了解Vue3生命周期

(三)使用Vite创建Vue项目 序章Vite官网安装方式一安装方式二 Vue3生命周期生命周期的详细解释 序章 其实这个没什么难点,步骤也非常简单,首先我们在本地的目录上创建一个x项目文件夹,然后在控制台上敲一些命令即可。 Vite官网 Vi…

批量清除Word Excel PPT文件打开密码

工作中经常要处理很多带密码的Excel文件,如果一个一个手动删除密码,那工作量就很大了。 网上找了很多方法,都没有找到一个好用的能批量删除密码的软件。 下载地址:https://pan.quark.cn/s/e3bffeec5458 于是就写了一个批量删除E…