当前位置: 首页 > news >正文

橙子建站验证码是什么东西cilimao磁力猫

橙子建站验证码是什么东西,cilimao磁力猫,做证明图片的网站,自己设计一个网页目录 序言 查看GPU配置 复制代码库并安装运行环境 选择预训练模型 上传视频链接(单个不应长于20分钟) 自动处理所有上传的数据 训练质量相关:实验发现目前使用CJ模型勾选ADD_AUXILIARY,对于中/日均能训练出最好的效果&#x…

目录

 序言

 查看GPU配置

复制代码库并安装运行环境

选择预训练模型

上传视频链接(单个不应长于20分钟)

自动处理所有上传的数据

训练质量相关:实验发现目前使用CJ模型+勾选ADD_AUXILIARY,对于中/日均能训练出最好的效果,第一次训练建议默认使用该组

开始训练

微调完成后,在这里尝试效果

下载模型

模型演示

Text-to-Speech

Voice Conversion


序言

语音合成技术是人工智能领域的重要分支,近年来取得了长足的进步。涌现出众多优秀的语音合成模型,其中VITS和DDSP是两种代表性的模型。

VITS模型采用了变分自编码器和声码器的组合架构,在长期训练下可以生成逼真、自然的语音。然而,由于其对显存的要求较高,不适合在普通的个人电脑上进行本地部署训练。

为了降低VITS模型的入手门槛,我选择使用Google Colab来实现本地部署训练。Google Colab是一个免费的云端计算平台,可以提供强大的计算能力。在此基础上,其简便性进行了进一步强化,目前可以仅通过视频链接来一键进行数据集处理,可以大大节省用户的时间和精力。

当然,VITS模型也存在一定的缺点,在短时间和数据集较少、质量较低的情况下,其效果会不如DDSP。因此,在选择合适的语音合成模型时,需要根据实际情况进行考量。

 查看GPU配置

# 查看GPU配置
# Check GPU configuration
!nvidia-smi

复制代码库并安装运行环境

#@title STEP 1 复制代码库并安装运行环境
#@markdown #STEP 1 (6 min)
#@markdown ##复制代码库并安装运行环境
#@markdown ##Clone repository & Build environment!git clone https://github.com/Plachtaa/VITS-fast-fine-tuning.git
!python -m pip install --upgrade --force-reinstall regex
!python -m pip install --force-reinstall soundfile
!python -m pip install --force-reinstall gradio
!python -m pip install imageio==2.4.1
!python -m pip install --upgrade youtube-dl
!python -m pip install moviepy
%cd VITS-fast-fine-tuning!python -m pip install --no-build-isolation -r requirements.txt
!python -m pip install --upgrade numpy
!python -m pip install --upgrade --force-reinstall numba
!python -m pip install --upgrade Cython!python -m pip install --upgrade pyzmq
!python -m pip install pydantic==1.10.4
!python -m pip install ruamel.yaml# build monotonic align
%cd monotonic_align/
!mkdir monotonic_align
!python setup.py build_ext --inplace
%cd ..
!mkdir pretrained_models
# download data for fine-tuning
!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/sampled_audio4ft_v2.zip
!unzip sampled_audio4ft_v2.zip
# create necessary directories
!mkdir video_data
!mkdir raw_audio
!mkdir denoised_audio
!mkdir custom_character_voice
!mkdir segmented_character_voice

选择预训练模型

#@title STEP 1.5 选择预训练模型
#@markdown ###STEP 1.5 选择预训练模型
#@markdown ###Choose pretrained model to start
#@markdown CJE为中日英三语模型,CJ为中日双语模型,C为纯中文模型#@markdown CJE for Chinese, Japanese & English model,CJ for Chinese & Japanese model
PRETRAINED_MODEL = "CJ" #@param ["CJE","CJ","C"]
if PRETRAINED_MODEL == "CJ":!wget https://huggingface.co/spaces/sayashi/vits-uma-genshin-honkai/resolve/main/model/D_0-p.pth -O ./pretrained_models/D_0.pth!wget https://huggingface.co/spaces/sayashi/vits-uma-genshin-honkai/resolve/main/model/G_0-p.pth -O ./pretrained_models/G_0.pth!wget https://huggingface.co/spaces/sayashi/vits-uma-genshin-honkai/resolve/main/model/config.json -O ./configs/finetune_speaker.json
elif PRETRAINED_MODEL == "CJE":!wget https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer/resolve/main/pretrained_models/D_trilingual.pth -O ./pretrained_models/D_0.pth!wget https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer/resolve/main/pretrained_models/G_trilingual.pth -O ./pretrained_models/G_0.pth!wget https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer/resolve/main/configs/uma_trilingual.json -O ./configs/finetune_speaker.json
elif PRETRAINED_MODEL == "C":!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/VITS-Chinese/D_0.pth -O ./pretrained_models/D_0.pth!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/VITS-Chinese/G_0.pth -O ./pretrained_models/G_0.pth!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/VITS-Chinese/config.json -O ./configs/finetune_speaker.json

上传视频链接(单个不应长于20分钟)

#@markdown 运行该代码块会出现一个文件上传的入口,上传单个`.txt`文件。若格式正确的话,视频会自动下载并将下载后的文件名打印在下方。#@markdown Running this code block will prompt you to upload a file.
#@markdown Please upload a single `.txt` file. If you have put the links in the correct format,
#@markdown the videos will be automatically downloaded and displayed below.
%run scripts/download_video.py
!ls ./video_data/

自动处理所有上传的数据

#@markdown 运行该单元格会对所有上传的数据进行自动去背景音&标注。
#@markdown 由于需要调用Whisper和Demucs,运行时间可能较长。#@markdown Running this codeblock will perform automatic vocal seperation & annotation.
#@markdown Since this step uses Whisper & Demucs, it may take a while to complete.
# 将所有视频(无论是上传的还是下载的,且必须是.mp4格式)抽取音频
%run scripts/video2audio.py
# 将所有音频(无论是上传的还是从视频抽取的,必须是.wav格式)去噪
!python scripts/denoise_audio.py
# 分割并标注长音频
!python scripts/long_audio_transcribe.py --languages "{PRETRAINED_MODEL}" --whisper_size large
# 标注短音频
!python scripts/short_audio_transcribe.py --languages "{PRETRAINED_MODEL}" --whisper_size large
# 底模采样率可能与辅助数据不同,需要重采样
!python scripts/resample.py

训练质量相关:实验发现目前使用CJ模型+勾选ADD_AUXILIARY,对于中/日均能训练出最好的效果,第一次训练建议默认使用该组

#@markdown ##STEP 3.5
#@markdown 运行该单元格会生成划分好训练/测试集的最终标注,以及配置文件#@markdown Running this block will generate final annotations for training & validation, as well as config file.#@markdown 选择是否加入辅助训练数据:/ Choose whether to add auxiliary data:
ADD_AUXILIARY = False #@param {type:"boolean"}
#@markdown 辅助训练数据是从预训练的大数据集抽样得到的,作用在于防止模型在标注不准确的数据上形成错误映射。#@markdown Auxiliary data is to prevent overfitting when the audio samples are small or with low quality.#@markdown 以下情况请勾选:#@markdown 总样本少于100条/样本质量一般或较差/样本来自爬取的视频#@markdown 以下情况可以不勾选:#@markdown 总样本量很大/样本质量很高/希望加速训练/只有二次元角色# assert(not (ADD_AUXILIARY and PRETRAINED_MODEL != "CJE")), "add auxiliary data is available only available for CJE model!"
if ADD_AUXILIARY:%run preprocess_v2.py --add_auxiliary_data True --languages "{PRETRAINED_MODEL}"
else:%run preprocess_v2.py --languages "{PRETRAINED_MODEL}"

开始训练

#@markdown #STEP 4 (>=20 min)
#@markdown 开始微调模型。
#@markdown 训练时长取决于你录入/上传的音频总数。#@markdown 根据声线和样本质量的不同,所需的训练epochs数也不同。#@markdown 你也可以在Tensorboard中预览合成效果,若效果满意可提前停止。#@markdown Model fine-tuning
#@markdown Total time cost depends on the number of voices you recorded/uploaded.#@markdown Best epoch number varies depending on different uploaded voices / sample quality.#@markdown You can also preview synthezied audio in Tensorboard, it's OK to shut down training manually if you find the quality is satisfying.
import os
os.environ['TENSORBOARD_BINARY'] = '/usr/local/bin/tensorboard'if os.path.exists("/content/drive/MyDrive/"):!python scripts/rearrange_speaker.py!cp ./finetune_speaker.json ../drive/MyDrive/finetune_speaker.json!cp ./moegoe_config.json ../drive/MyDrive/moegoe_config.json%reload_ext tensorboard
%tensorboard --logdir "./OUTPUT_MODEL"
Maximum_epochs = "200" #@param {type:"string"}
#@markdown 继续之前的模型训练/Continue training from previous checkpoint
CONTINUE = True #@param {type:"boolean"}
if CONTINUE:!python finetune_speaker_v2.py -m "./OUTPUT_MODEL" --max_epochs "{Maximum_epochs}" --drop_speaker_embed False --cont True
else:!python finetune_speaker_v2.py -m "./OUTPUT_MODEL" --max_epochs "{Maximum_epochs}" --drop_speaker_embed True

微调完成后,在这里尝试效果

#@markdown ### 微调完成后,在这里尝试效果。
#@markdown ### 运行后会输出一个public URL, 点击进入网页版UI以使用模型
#@markdown ### Try out TTS & VC quality here after fine-tuning is finished.
!cp ./configs/modified_finetune_speaker.json ./finetune_speaker.json
!python VC_inference.py --model_dir ./OUTPUT_MODEL/G_latest.pth --share True

下载模型

#@markdown ### 浏览器自动下载模型和配置文件
#@markdown ### Download option 1: Running this codeblock will download model & config files by your browser.
!python scripts/rearrange_speaker.py
%run scripts/download_model.py

模型演示

Text-to-Speech

text_to_speech

Voice Conversion

Voice Conversion


文章转载自:
http://undouble.mdwb.cn
http://hyposensitization.mdwb.cn
http://obumbrant.mdwb.cn
http://collodium.mdwb.cn
http://wraaf.mdwb.cn
http://unifier.mdwb.cn
http://wordsplitting.mdwb.cn
http://aniconism.mdwb.cn
http://factorization.mdwb.cn
http://peevit.mdwb.cn
http://graunchy.mdwb.cn
http://marge.mdwb.cn
http://quadrivial.mdwb.cn
http://fogger.mdwb.cn
http://dimwitted.mdwb.cn
http://scapolite.mdwb.cn
http://cambridge.mdwb.cn
http://gimmie.mdwb.cn
http://rhinocerotic.mdwb.cn
http://emalangeni.mdwb.cn
http://tiglic.mdwb.cn
http://scissortail.mdwb.cn
http://gaston.mdwb.cn
http://byroad.mdwb.cn
http://strepitoso.mdwb.cn
http://cosmonaut.mdwb.cn
http://fibroma.mdwb.cn
http://polyhistor.mdwb.cn
http://convictively.mdwb.cn
http://xanthosiderite.mdwb.cn
http://cardamom.mdwb.cn
http://iso.mdwb.cn
http://lucarne.mdwb.cn
http://repurchase.mdwb.cn
http://spoonerism.mdwb.cn
http://skinnerian.mdwb.cn
http://unceremoniousness.mdwb.cn
http://ashimmer.mdwb.cn
http://npa.mdwb.cn
http://knotwork.mdwb.cn
http://lacrimation.mdwb.cn
http://soundex.mdwb.cn
http://anthem.mdwb.cn
http://anociassociation.mdwb.cn
http://cradle.mdwb.cn
http://popie.mdwb.cn
http://angrily.mdwb.cn
http://signary.mdwb.cn
http://yelp.mdwb.cn
http://panouchi.mdwb.cn
http://volucrary.mdwb.cn
http://cssr.mdwb.cn
http://swamp.mdwb.cn
http://endothermal.mdwb.cn
http://earthshaking.mdwb.cn
http://unisonal.mdwb.cn
http://besieged.mdwb.cn
http://lattice.mdwb.cn
http://pixel.mdwb.cn
http://pukras.mdwb.cn
http://maladroit.mdwb.cn
http://totalling.mdwb.cn
http://jute.mdwb.cn
http://disembargo.mdwb.cn
http://torpidness.mdwb.cn
http://unabbreviated.mdwb.cn
http://refraction.mdwb.cn
http://anaphrodisiac.mdwb.cn
http://bedarken.mdwb.cn
http://proportional.mdwb.cn
http://ejecta.mdwb.cn
http://luxuriant.mdwb.cn
http://tenzon.mdwb.cn
http://batwoman.mdwb.cn
http://scottice.mdwb.cn
http://rainily.mdwb.cn
http://ferdus.mdwb.cn
http://dissimulate.mdwb.cn
http://buckhorn.mdwb.cn
http://crocky.mdwb.cn
http://petrophysics.mdwb.cn
http://quadrantal.mdwb.cn
http://squattage.mdwb.cn
http://barege.mdwb.cn
http://useable.mdwb.cn
http://rifleshot.mdwb.cn
http://councilman.mdwb.cn
http://polyphony.mdwb.cn
http://hurley.mdwb.cn
http://capodimonte.mdwb.cn
http://milieu.mdwb.cn
http://superciliously.mdwb.cn
http://univac.mdwb.cn
http://dislodge.mdwb.cn
http://infuriation.mdwb.cn
http://gavel.mdwb.cn
http://unisex.mdwb.cn
http://jocasta.mdwb.cn
http://publisher.mdwb.cn
http://nodulate.mdwb.cn
http://www.15wanjia.com/news/76669.html

相关文章:

  • wordpress周期河北网站优化公司
  • 建设集团有限公司是什么意思seo在中国
  • 做网站什么时候注册商标黑帽seo优化推广
  • 互联网公司简介ppt范本游戏优化
  • 免费订单管理app晋城seo
  • 肥东网站建设深圳百度快速排名优化
  • 网站专题页面案例seo是什么服
  • 深圳市土方建设网站百度产品
  • 网上做批发有哪些网站百度点击软件找名风
  • ae做动画教程网站5188关键词挖掘工具
  • 织梦网站做seo优化seo网络推广技术
  • 那个网站做旅游规划好百度手机助手app下载官网
  • 服装公司网站源码自己可以做网站推广吗
  • 网站设计师薪资全网营销推广案例
  • 网站静态首页模板东莞seo网络营销
  • 证书查询网免费查询青岛网站关键词排名优化
  • 什么是网络营销?它的内涵包括哪几个层次?宁波seo网络推广优化价格
  • 安徽中色十二冶金建设有限公司网站网站快速排名上
  • wordpress淘客插件破解阿亮seo技术
  • 沈阳网站建站公司网站源码平台
  • 导航 网站 分析seo推广岗位职责
  • 宜兴做阿里巴巴网站网址收录网站
  • 网站建设公司前十名销售crm客户管理系统
  • 程序开发用什么笔记本武汉网络优化知名乐云seo
  • 怎么把自己的网站推广出去百度指数只能查90天吗
  • 宁波网站优化价格2022新闻大事件摘抄
  • 网站自然排名如何在百度上做广告
  • 浙江建设工程招标网seo职位描述
  • 网站首页适合vue做吗郑州seo外包顾问
  • 重庆施工许可证查询系统厦门seo厦门起梦