当前位置：首页 > news >正文

橙子建站验证码是什么东西cilimao磁力猫

news 2025/7/31 14:30:26

橙子建站验证码是什么东西,cilimao磁力猫,做证明图片的网站,自己设计一个网页目录序言查看GPU配置复制代码库并安装运行环境选择预训练模型上传视频链接（单个不应长于20分钟） 自动处理所有上传的数据训练质量相关：实验发现目前使用CJ模型勾选ADD_AUXILIARY，对于中/日均能训练出最好的效果&#x…

目录

序言

查看GPU配置

复制代码库并安装运行环境

选择预训练模型

上传视频链接（单个不应长于20分钟）

自动处理所有上传的数据

训练质量相关：实验发现目前使用CJ模型+勾选ADD_AUXILIARY，对于中/日均能训练出最好的效果，第一次训练建议默认使用该组

开始训练

微调完成后，在这里尝试效果

下载模型

模型演示

Text-to-Speech

Voice Conversion

序言

语音合成技术是人工智能领域的重要分支，近年来取得了长足的进步。涌现出众多优秀的语音合成模型，其中VITS和DDSP是两种代表性的模型。

VITS模型采用了变分自编码器和声码器的组合架构，在长期训练下可以生成逼真、自然的语音。然而，由于其对显存的要求较高，不适合在普通的个人电脑上进行本地部署训练。

为了降低VITS模型的入手门槛，我选择使用Google Colab来实现本地部署训练。Google Colab是一个免费的云端计算平台，可以提供强大的计算能力。在此基础上，其简便性进行了进一步强化，目前可以仅通过视频链接来一键进行数据集处理，可以大大节省用户的时间和精力。

当然，VITS模型也存在一定的缺点，在短时间和数据集较少、质量较低的情况下，其效果会不如DDSP。因此，在选择合适的语音合成模型时，需要根据实际情况进行考量。

查看GPU配置

# 查看GPU配置
# Check GPU configuration
!nvidia-smi

复制代码库并安装运行环境

#@title STEP 1 复制代码库并安装运行环境
#@markdown #STEP 1 (6 min)
#@markdown ##复制代码库并安装运行环境
#@markdown ##Clone repository & Build environment!git clone https://github.com/Plachtaa/VITS-fast-fine-tuning.git
!python -m pip install --upgrade --force-reinstall regex
!python -m pip install --force-reinstall soundfile
!python -m pip install --force-reinstall gradio
!python -m pip install imageio==2.4.1
!python -m pip install --upgrade youtube-dl
!python -m pip install moviepy
%cd VITS-fast-fine-tuning!python -m pip install --no-build-isolation -r requirements.txt
!python -m pip install --upgrade numpy
!python -m pip install --upgrade --force-reinstall numba
!python -m pip install --upgrade Cython!python -m pip install --upgrade pyzmq
!python -m pip install pydantic==1.10.4
!python -m pip install ruamel.yaml# build monotonic align
%cd monotonic_align/
!mkdir monotonic_align
!python setup.py build_ext --inplace
%cd ..
!mkdir pretrained_models
# download data for fine-tuning
!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/sampled_audio4ft_v2.zip
!unzip sampled_audio4ft_v2.zip
# create necessary directories
!mkdir video_data
!mkdir raw_audio
!mkdir denoised_audio
!mkdir custom_character_voice
!mkdir segmented_character_voice

选择预训练模型

#@title STEP 1.5 选择预训练模型
#@markdown ###STEP 1.5 选择预训练模型
#@markdown ###Choose pretrained model to start
#@markdown CJE为中日英三语模型，CJ为中日双语模型，C为纯中文模型#@markdown CJE for Chinese, Japanese & English model，CJ for Chinese & Japanese model
PRETRAINED_MODEL = "CJ" #@param ["CJE","CJ","C"]
if PRETRAINED_MODEL == "CJ":!wget https://huggingface.co/spaces/sayashi/vits-uma-genshin-honkai/resolve/main/model/D_0-p.pth -O ./pretrained_models/D_0.pth!wget https://huggingface.co/spaces/sayashi/vits-uma-genshin-honkai/resolve/main/model/G_0-p.pth -O ./pretrained_models/G_0.pth!wget https://huggingface.co/spaces/sayashi/vits-uma-genshin-honkai/resolve/main/model/config.json -O ./configs/finetune_speaker.json
elif PRETRAINED_MODEL == "CJE":!wget https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer/resolve/main/pretrained_models/D_trilingual.pth -O ./pretrained_models/D_0.pth!wget https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer/resolve/main/pretrained_models/G_trilingual.pth -O ./pretrained_models/G_0.pth!wget https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer/resolve/main/configs/uma_trilingual.json -O ./configs/finetune_speaker.json
elif PRETRAINED_MODEL == "C":!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/VITS-Chinese/D_0.pth -O ./pretrained_models/D_0.pth!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/VITS-Chinese/G_0.pth -O ./pretrained_models/G_0.pth!wget https://huggingface.co/datasets/Plachta/sampled_audio4ft/resolve/main/VITS-Chinese/config.json -O ./configs/finetune_speaker.json

上传视频链接（单个不应长于20分钟）

#@markdown 运行该代码块会出现一个文件上传的入口，上传单个`.txt`文件。若格式正确的话，视频会自动下载并将下载后的文件名打印在下方。#@markdown Running this code block will prompt you to upload a file.
#@markdown Please upload a single `.txt` file. If you have put the links in the correct format,
#@markdown the videos will be automatically downloaded and displayed below.
%run scripts/download_video.py
!ls ./video_data/

自动处理所有上传的数据

#@markdown 运行该单元格会对所有上传的数据进行自动去背景音&标注。
#@markdown 由于需要调用Whisper和Demucs，运行时间可能较长。#@markdown Running this codeblock will perform automatic vocal seperation & annotation.
#@markdown Since this step uses Whisper & Demucs, it may take a while to complete.
# 将所有视频（无论是上传的还是下载的，且必须是.mp4格式）抽取音频
%run scripts/video2audio.py
# 将所有音频（无论是上传的还是从视频抽取的，必须是.wav格式）去噪
!python scripts/denoise_audio.py
# 分割并标注长音频
!python scripts/long_audio_transcribe.py --languages "{PRETRAINED_MODEL}" --whisper_size large
# 标注短音频
!python scripts/short_audio_transcribe.py --languages "{PRETRAINED_MODEL}" --whisper_size large
# 底模采样率可能与辅助数据不同，需要重采样
!python scripts/resample.py

训练质量相关：实验发现目前使用CJ模型+勾选ADD_AUXILIARY，对于中/日均能训练出最好的效果，第一次训练建议默认使用该组

#@markdown ##STEP 3.5
#@markdown 运行该单元格会生成划分好训练/测试集的最终标注，以及配置文件#@markdown Running this block will generate final annotations for training & validation, as well as config file.#@markdown 选择是否加入辅助训练数据：/ Choose whether to add auxiliary data:
ADD_AUXILIARY = False #@param {type:"boolean"}
#@markdown 辅助训练数据是从预训练的大数据集抽样得到的，作用在于防止模型在标注不准确的数据上形成错误映射。#@markdown Auxiliary data is to prevent overfitting when the audio samples are small or with low quality.#@markdown 以下情况请勾选：#@markdown 总样本少于100条/样本质量一般或较差/样本来自爬取的视频#@markdown 以下情况可以不勾选：#@markdown 总样本量很大/样本质量很高/希望加速训练/只有二次元角色# assert(not (ADD_AUXILIARY and PRETRAINED_MODEL != "CJE")), "add auxiliary data is available only available for CJE model!"
if ADD_AUXILIARY:%run preprocess_v2.py --add_auxiliary_data True --languages "{PRETRAINED_MODEL}"
else:%run preprocess_v2.py --languages "{PRETRAINED_MODEL}"

开始训练

#@markdown #STEP 4 (>=20 min)
#@markdown 开始微调模型。
#@markdown 训练时长取决于你录入/上传的音频总数。#@markdown 根据声线和样本质量的不同，所需的训练epochs数也不同。#@markdown 你也可以在Tensorboard中预览合成效果，若效果满意可提前停止。#@markdown Model fine-tuning
#@markdown Total time cost depends on the number of voices you recorded/uploaded.#@markdown Best epoch number varies depending on different uploaded voices / sample quality.#@markdown You can also preview synthezied audio in Tensorboard, it's OK to shut down training manually if you find the quality is satisfying.
import os
os.environ['TENSORBOARD_BINARY'] = '/usr/local/bin/tensorboard'if os.path.exists("/content/drive/MyDrive/"):!python scripts/rearrange_speaker.py!cp ./finetune_speaker.json ../drive/MyDrive/finetune_speaker.json!cp ./moegoe_config.json ../drive/MyDrive/moegoe_config.json%reload_ext tensorboard
%tensorboard --logdir "./OUTPUT_MODEL"
Maximum_epochs = "200" #@param {type:"string"}
#@markdown 继续之前的模型训练/Continue training from previous checkpoint
CONTINUE = True #@param {type:"boolean"}
if CONTINUE:!python finetune_speaker_v2.py -m "./OUTPUT_MODEL" --max_epochs "{Maximum_epochs}" --drop_speaker_embed False --cont True
else:!python finetune_speaker_v2.py -m "./OUTPUT_MODEL" --max_epochs "{Maximum_epochs}" --drop_speaker_embed True

微调完成后，在这里尝试效果

#@markdown ### 微调完成后，在这里尝试效果。
#@markdown ### 运行后会输出一个public URL, 点击进入网页版UI以使用模型
#@markdown ### Try out TTS & VC quality here after fine-tuning is finished.
!cp ./configs/modified_finetune_speaker.json ./finetune_speaker.json
!python VC_inference.py --model_dir ./OUTPUT_MODEL/G_latest.pth --share True

下载模型

#@markdown ### 浏览器自动下载模型和配置文件
#@markdown ### Download option 1: Running this codeblock will download model & config files by your browser.
!python scripts/rearrange_speaker.py
%run scripts/download_model.py

模型演示

Text-to-Speech

text_to_speech

Voice Conversion

Voice Conversion

文章转载自：
http://undouble.mdwb.cn
http://hyposensitization.mdwb.cn
http://obumbrant.mdwb.cn
http://collodium.mdwb.cn
http://wraaf.mdwb.cn
http://unifier.mdwb.cn
http://wordsplitting.mdwb.cn
http://aniconism.mdwb.cn
http://factorization.mdwb.cn
http://peevit.mdwb.cn
http://graunchy.mdwb.cn
http://marge.mdwb.cn
http://quadrivial.mdwb.cn
http://fogger.mdwb.cn
http://dimwitted.mdwb.cn
http://scapolite.mdwb.cn
http://cambridge.mdwb.cn
http://gimmie.mdwb.cn
http://rhinocerotic.mdwb.cn
http://emalangeni.mdwb.cn
http://tiglic.mdwb.cn
http://scissortail.mdwb.cn
http://gaston.mdwb.cn
http://byroad.mdwb.cn
http://strepitoso.mdwb.cn
http://cosmonaut.mdwb.cn
http://fibroma.mdwb.cn
http://polyhistor.mdwb.cn
http://convictively.mdwb.cn
http://xanthosiderite.mdwb.cn
http://cardamom.mdwb.cn
http://iso.mdwb.cn
http://lucarne.mdwb.cn
http://repurchase.mdwb.cn
http://spoonerism.mdwb.cn
http://skinnerian.mdwb.cn
http://unceremoniousness.mdwb.cn
http://ashimmer.mdwb.cn
http://npa.mdwb.cn
http://knotwork.mdwb.cn
http://lacrimation.mdwb.cn
http://soundex.mdwb.cn
http://anthem.mdwb.cn
http://anociassociation.mdwb.cn
http://cradle.mdwb.cn
http://popie.mdwb.cn
http://angrily.mdwb.cn
http://signary.mdwb.cn
http://yelp.mdwb.cn
http://panouchi.mdwb.cn
http://volucrary.mdwb.cn
http://cssr.mdwb.cn
http://swamp.mdwb.cn
http://endothermal.mdwb.cn
http://earthshaking.mdwb.cn
http://unisonal.mdwb.cn
http://besieged.mdwb.cn
http://lattice.mdwb.cn
http://pixel.mdwb.cn
http://pukras.mdwb.cn
http://maladroit.mdwb.cn
http://totalling.mdwb.cn
http://jute.mdwb.cn
http://disembargo.mdwb.cn
http://torpidness.mdwb.cn
http://unabbreviated.mdwb.cn
http://refraction.mdwb.cn
http://anaphrodisiac.mdwb.cn
http://bedarken.mdwb.cn
http://proportional.mdwb.cn
http://ejecta.mdwb.cn
http://luxuriant.mdwb.cn
http://tenzon.mdwb.cn
http://batwoman.mdwb.cn
http://scottice.mdwb.cn
http://rainily.mdwb.cn
http://ferdus.mdwb.cn
http://dissimulate.mdwb.cn
http://buckhorn.mdwb.cn
http://crocky.mdwb.cn
http://petrophysics.mdwb.cn
http://quadrantal.mdwb.cn
http://squattage.mdwb.cn
http://barege.mdwb.cn
http://useable.mdwb.cn
http://rifleshot.mdwb.cn
http://councilman.mdwb.cn
http://polyphony.mdwb.cn
http://hurley.mdwb.cn
http://capodimonte.mdwb.cn
http://milieu.mdwb.cn
http://superciliously.mdwb.cn
http://univac.mdwb.cn
http://dislodge.mdwb.cn
http://infuriation.mdwb.cn
http://gavel.mdwb.cn
http://unisex.mdwb.cn
http://jocasta.mdwb.cn
http://publisher.mdwb.cn
http://nodulate.mdwb.cn

http://www.15wanjia.com/news/76669.html

相关文章：

wordpress周期河北网站优化公司

建设集团有限公司是什么意思seo在中国

做网站什么时候注册商标黑帽seo优化推广

互联网公司简介ppt范本游戏优化

免费订单管理app晋城seo

肥东网站建设深圳百度快速排名优化

网站专题页面案例seo是什么服

深圳市土方建设网站百度产品

网上做批发有哪些网站百度点击软件找名风

ae做动画教程网站5188关键词挖掘工具

织梦网站做seo优化seo网络推广技术

那个网站做旅游规划好百度手机助手app下载官网

服装公司网站源码自己可以做网站推广吗

网站设计师薪资全网营销推广案例

网站静态首页模板东莞seo网络营销

证书查询网免费查询青岛网站关键词排名优化

什么是网络营销?它的内涵包括哪几个层次?宁波seo网络推广优化价格

安徽中色十二冶金建设有限公司网站网站快速排名上

wordpress淘客插件破解阿亮seo技术

沈阳网站建站公司网站源码平台

导航网站分析seo推广岗位职责

宜兴做阿里巴巴网站网址收录网站

网站建设公司前十名销售crm客户管理系统

程序开发用什么笔记本武汉网络优化知名乐云seo

怎么把自己的网站推广出去百度指数只能查90天吗

宁波网站优化价格2022新闻大事件摘抄

网站自然排名如何在百度上做广告

浙江建设工程招标网seo职位描述

网站首页适合vue做吗郑州seo外包顾问

重庆施工许可证查询系统厦门seo厦门起梦