如何在算家云搭建RVC-WebUI(语音转换)

一、Retrieval-based-Voice-Conversion-WebUI简介

Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架,适用于制作“变声器”,实现语音转换。

具有以下特点

  • 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了解复杂的语音处理技术,即可实现语音转换。
  • 低延迟与高效能:RVC 模型在实时语音转换中表现出低延迟的特点,同时能够在相对较差的显卡上也能快速训练,提高了模型的普及性和实用性。
  • 少量数据训练:使用少量数据(推荐至少 10 分钟低底噪语音数据)进行训练,即可得到较好的语音转换效果,降低了数据收集的难度和成本。
  • 音色克隆:RVC 模型支持克隆说话
  • 人的声音,包括歌曲的翻唱和实时的变声,具有优秀的变声效果。
  • 杜绝音色泄漏:通过 top1 检索替换输入源特征为训练集特征,有效杜绝了音色泄漏的问题。
  • 可以通过模型融合来改变音色(借助 ckpt 处理选项卡中的 ckpt-merge)
  • 可调用 UVR5 模型来快速分离人声和伴奏

二、模型搭建流程

测试环境

已在RTX3090,Python 3.10,CUDA12.2上测试

1. 容器镜像一键使用

(1)在算家云“应用社区”中搜索或找到“Retrieval-based-Voice-Conversion-WebUI”,或者在左侧“音频生成”选项功能中单击选择“语音转换”

image.png

image.png

image.png

(2)进入“租用实例”页面后之后会自动匹配模型,选择 3090 卡或其他性能优于 3090 的显卡,点击“立即创建”即可创建实例

1726729621267.jpg

2.启动项目

(1)实例创建成功之后,点击“项目实例”再点击“WebssH”开启终端(小黑屏)

image.png

使用下列命令运行项目:

cd /Retrieval-based-Voice-Conversion-WebUI-main/
conda activate retrieval
export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python infer-web.py

image.png

3.开启外部访问

返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。

image.png

有两种访问方式可以选择:本地私密访问和对外开放端口。

(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”

image.png

(2)对外开放端口:请按照下图操作

image.png

4.获取访问地址,并开始使用

打开浏览器,在地址栏 Ctrl+V 粘贴复制的访问地址进行访问,即可开始使用 RVC。

image.png

以上就是在算家云搭建 RVC-WebUI 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

复制下方网址,进入算家云,选择模型,一键开启 AI 之旅!

算家云应用社区 www.suanjiayun.com/container/#/mirror

首页.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/143649.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

系统分析师11:企业信息化战略与实施

1 内容概要 信息与信息化的概念信息系统战略规划政府信息化与电子政务企业信息化与电子商务企业应用集成 2 信息与信息化的概念 2.1 信息的概念及特点 2.1.1 信息的定义 香农:信息就是不确定性的减少。维纳:信息就是信息,既不是物质&…

企业导师面对面,产教融合实训基地搭建人才成长快车道

产教融合实训基地是指以特定专业群为服务对象,由高职院校和企业双方共同投入、共同利用,并由若干实验实训室和模块产线组成的综合性实训基地。这一基地不仅具备工学结合的功能,还融合了教育、产业和科技创新的要素,形成了一种特殊…

大田上的路径跟踪论文汇总

文章目录 2022Path tracking control method and performance test based on agricultural machinery pose correction(Computers and Electronics in Agriculture)An optimal goal point determination algorithm for automatic navigation of agricult…

最新Kali Linux超详细安装教程(附镜像包)

一、镜像下载: 链接:https://pan.baidu.com/s/1BfiyAMW6E1u9fhfyv8oH5Q 提取码:tft5 二、配置虚拟机 这里我们以最新的vm17.5为例。进行配置 1.创建新的虚拟机:选择自定义 2.下一步 3.选择稍后安装操作系统 4.选择Debian版本 因…

Mastering Qt 番外 —— 添加源码调试

笔者最近正在尝试深入的学习Qt框架,经常需要明确我经常使用的类底下发生了什么,因此笔者决定仔细研究一下如何进行源码级别的调试 此篇文章将会介绍如何使用Qt Creator这个IDE进行调试。最终效果如下 EasyWay 笔者采用的是这个最简单明了的方式&#xff…

springboot调用python脚本实现ocr图片文字识别功能

OCR简介: OCR(Optical Character Recognition),即光学字符识别,是一种利用计算机自动识别和解析图像中的文字信息的技术。它能够将纸质文档、图片、照片等载体上的文字信息转化为计算机可编辑和处理的文本数据。 一,准备工作 1,java环境 2,springboot项目 3,python环境 …

如何增强水凝胶湿粘附力?藤壶启发与溶剂交换策略相结合!

大家好,今天我们来聊聊一项关于水凝胶的有趣研究——《Barnacle inspired strategy combined with solvent exchange for enhancing wet adhesion of hydrogels to promote seawater-immersed wound healing》发表于《Bioactive Materials》。在湿或水下环境中&…

rem与px转换工具

rem与px都是css样式单位,通常px是我们比较熟悉的单位,所以根据设计稿转换rem的话,一般都需要根据html的设置的px字号来转换,本工具可以实现rem与px之间的转换

50个必须知道的VS代码扩展

我们即将浏览50个必须知道的VS Code扩展,这些扩展将大幅提高您的生产力,并帮助您像专业人士一样编码! 1. TabNine TabNine 是一个基于AI的自动完成工具,它可以根据您的代码上下文和模式建议完成,通过智能自动完成提高…

从源码到应用:互联网医院系统与预约问诊APP开发实战指南

对于开发者来说,如何从源码出发构建一个高效、稳定的互联网医院系统和预约问诊APP,是一个具有挑战性但又充满潜力的任务。本文将深入探讨互联网医院系统源码的核心技术和开发要点,结合预约问诊APP的实现路径,分享从源码到应用的开…

大工程师客户端下载 官方地址

https://download.3dsource.cn/3DSource_Client.exe

原装二手MS2724C安立(Anritsu)MS2724B手持式频谱分析仪

安立ANRITSU MS2724C MS2724B手持式频谱分析仪 Anritsu MS2724C 高性能手持式频谱分析仪为无线专业人士提供了在恶劣的 RF 和物理环境中进行最苛刻的测量所需的性能。使用主要仪器功能可以轻松进行测量:频率、跨度、幅度和带宽。专用的常用功能键和熟悉的计算器型键…

vs code 跳转很慢

查看结构体、接口等非常之慢。c/c语言服务功能使用了智能引擎所致,设置为模糊检索即可。 修改如下: 1.打开"文件",选"首选项","设置" 2.弹出的窗口中搜索 "C_Cpp.intelliSenseEngine" …

青柠视频云——视频丢包(卡顿、花屏、绿屏)排查

一、问题说明 近期有客户反馈,接入平台的设备经常出来卡顿、花屏、录屏的情况,出现这样的场景很是尴尬。 客户是私有化部署在公网环境,于是我们联系客户,对问题进行追踪排查。 二、场景复现 我们现场情况确认的过程中,…

纷享销客“子流程”创新——企业流程管理的革新之选

Jack是一家电子商务企业的销售经理,近期他的公司订单量激增,但随之而来的退货流程却成了一个棘手的问题。每天,成百上千的退货请求涌向客服部门,而退货流程的每一步:从接收退货申请、物流派单、商品检验入库&#xff0…

数据结构之“队列”

文章目录 1.队列的概念2. 队列的操作2.1 队列的定义2.2 队列的初始化Init2.3 入队列2.4 出队列2.5 取队头数据2.6 取队尾数据2.7 获取队列有效元素的个数2.8 销毁队列 1.队列的概念 1.1 栈也是一种特殊的线性表。 1.2 栈和队列的区别: (1)几端…

ASR1602 CAT1无线通讯模块在电动车电池中的应用

随着城市交通拥堵问题的加剧和环保意识的提升,两轮电动车成为越来越多人的首选出行工具。作为其核心部件,电池的性能和安全性直接影响到两轮电动车的整体使用体验。为了提升电池管理系统的智能化水平,CAT1模组正逐渐被引入到两轮车电池中&…

超声波清洗机哪个品牌好用又实惠?精选业内四款优质清洗机推荐

超声波清洗机作为一种创新的清洁解决方案,凭借其深入微观的清洁效能、简便的操作方式以及对物品的细腻呵护,正逐渐成为广受喜爱的清洁良品。不过,市面上品牌林立、型号多样,价格亦波动不一,这无疑为消费者选购时平添了…

XSP08Q快充协议芯片应用场景及工作原理 支持电压档位:5V、9V、12V、15V、20V

XSP08Q是一款Type-C接口的诱电取电快充协议芯片,它兼容多种快充协议,包括PD、QC、FCP、SCP、AFC、等,支持5V、9V、12V、15V、20V等多种电压档位。 工作原理 这款芯片的工作原理是在充电过程中全程监测电压、电流、功率等参数 ,一…