当前位置: 首页 > news >正文

自建国外购物网站苏州网站建设开发公司

自建国外购物网站,苏州网站建设开发公司,旅游网站技术方案,wordpress 国内模板一、LLM大语言模型的特点 二、大语言模型在ASR任务中的应用 浅度融合 浅层融合指的是LLM本身并没有和音频信息进行直接计算。其仅对ASR模型输出的文本结果进行重打分或者质量评估。 深度融合 LLM与ASR模型进行深度结合,统一语音和文本的编码空间或者直接利用ASR…

一、LLM大语言模型的特点

 二、大语言模型在ASR任务中的应用

浅度融合

浅层融合指的是LLM本身并没有和音频信息进行直接计算。其仅对ASR模型输出的文本结果进行重打分或者质量评估

深度融合

LLMASR模型进行深度结合,统一语音和文本的编码空间或者直接利用ASR编码器的隐状态参与计算,利用大语言模型的能力得到更好的解码结果。

三、浅度融合

1、Large-scale Language Model Rescoring on Long-Form Data

利用能力更加强大的LLM为ASR模型的推理结果进行质量评分

2、Prompting Large Language Models For Zero-Shot Domain Adaptation in Speech Recognition

利用能力更加强大的LLM为语言模型的输出进行重打分

 四、深度融合

1、Prompting Large Language Models For Zero-Shot Domain Adaptation in Speech Recognition

使用语音编码器编码提示文本的信息输入到大语言模型中预测下一个token

编码器:使用HuBERT处理语音序列,并使用卷积网络对其进行下采样;

解码器:使用LLaMA作为解码器并融入Gated-XATT-FFN

Cross-attention:使用编码器的输出作为keyvalue,解码器的domain prompt和历史输出作为query计算注意力,注意力使用Gated cross attention

在训练时,保持LLaMA的参数固定,其他模块参数更新。

2、Adapting LLM with Speech for Full Formatted End-to-End Speech Recognition

使用语音编码器编码的信息输入到大语言模型中预测下一个token

Text Encoder:用于在训练阶段提供更多的文本数据使解码器可以更好地被训练,在推理阶段不再被使用;

Speech Encoder:用于编码语音并使用CTC进行解码获得对应的token

Text Decoder:在训练时对Text Encoder计算MLM损失,对Speech Encoder计算CE损失,用来预测下一个token。在推理时对Speech Encoder的输出进行修正。

Speech Encoder:用于编码语音信息;

LM:对Speech Encoder下采样之后的输出进行下一个token预测。

 3、Prompting Large Language Models with Speech Recognition Abilities

使用语音编码器编码的信息输入到大语言模型中预测下一个token

Encoder:基于Conformer的声学编码器,最后使用n个帧进行堆叠投影,得到和LLaMA相同的维度;

Decoder:基于LLaMA 7B的解码器结构;

在训练时,LLaMA使用了基于LoRA的微调方法。

4、On Decoder-Only Architecture For Speech-to-Text and Large Language Model Integration

使用语音编码器编码提示文本的信息输入到大语言模型中预测下一个token

LLMLLaMA 7B

CTC Compressor:通过过滤语音空白匹配标签序列文本的长度;

Audio Encoder:对CTC过滤后的语音信号进行编码;

Text Prompt:手工设计的提示词,为了达到instruct tuning的效果,本文在训练时设计了多种提示词;

为了稳定训练,在训练时第一阶段训练CTC Compressor,对LLM进行冻结;第二阶段使用LoRALLM进行微调。

5、Speech-to-Text Adapter and Speech-to-Entity Retriever Augmented LLMs for Speech Understanding

Speech2Text adapter:由一些自注意力子层组成,主要作用是将CTC过滤后的张量转换为可由LLM模型处理的张量。在训练期间,其他部分保持不动,仅训练此部分从而得到一个speech2text性能较好的适配器。

Speech2Entity retriever:根据过滤后的语音表征从数据库中查找与该段语音相关的topk个实体。

T5 Encoder输入:由三部分组成,分别是提示文本表征,输入语音表征以及检索到的topk实体文本表征。Topk实体会被添加到到提示文本输入前,从而提高T5模型语音识别实体的准确率。

 五、深度学习方法对比

 

 


文章转载自:
http://skeletal.nLcw.cn
http://roscoe.nLcw.cn
http://hacendado.nLcw.cn
http://karakorum.nLcw.cn
http://dotal.nLcw.cn
http://negress.nLcw.cn
http://trashsport.nLcw.cn
http://runnerless.nLcw.cn
http://imperturbable.nLcw.cn
http://portability.nLcw.cn
http://sumless.nLcw.cn
http://klieg.nLcw.cn
http://cate.nLcw.cn
http://capitulation.nLcw.cn
http://britannic.nLcw.cn
http://excentral.nLcw.cn
http://punt.nLcw.cn
http://jackscrew.nLcw.cn
http://rebatement.nLcw.cn
http://diffidence.nLcw.cn
http://progressional.nLcw.cn
http://whoso.nLcw.cn
http://flare.nLcw.cn
http://anticlerical.nLcw.cn
http://asla.nLcw.cn
http://ceder.nLcw.cn
http://autostrada.nLcw.cn
http://vituperatory.nLcw.cn
http://sabbatise.nLcw.cn
http://pound.nLcw.cn
http://defaecate.nLcw.cn
http://forensics.nLcw.cn
http://calyceal.nLcw.cn
http://moondoggle.nLcw.cn
http://antipathic.nLcw.cn
http://insuppressible.nLcw.cn
http://shafting.nLcw.cn
http://fran.nLcw.cn
http://wnp.nLcw.cn
http://boarhound.nLcw.cn
http://termitarium.nLcw.cn
http://melanin.nLcw.cn
http://malvina.nLcw.cn
http://greenback.nLcw.cn
http://prill.nLcw.cn
http://retest.nLcw.cn
http://apparently.nLcw.cn
http://pulpify.nLcw.cn
http://antialien.nLcw.cn
http://species.nLcw.cn
http://stonewort.nLcw.cn
http://lycurgan.nLcw.cn
http://acrocephalia.nLcw.cn
http://monothelite.nLcw.cn
http://wrssr.nLcw.cn
http://surloin.nLcw.cn
http://decolourant.nLcw.cn
http://mourning.nLcw.cn
http://finner.nLcw.cn
http://archaian.nLcw.cn
http://rtl.nLcw.cn
http://mennonite.nLcw.cn
http://lavabo.nLcw.cn
http://pennyworth.nLcw.cn
http://anthropophagous.nLcw.cn
http://illatively.nLcw.cn
http://promine.nLcw.cn
http://teacup.nLcw.cn
http://amusement.nLcw.cn
http://paranoiac.nLcw.cn
http://gib.nLcw.cn
http://halieutic.nLcw.cn
http://rockling.nLcw.cn
http://compliably.nLcw.cn
http://cryptomeria.nLcw.cn
http://lamella.nLcw.cn
http://fossilist.nLcw.cn
http://hyperkinesia.nLcw.cn
http://discordancy.nLcw.cn
http://exceptant.nLcw.cn
http://semen.nLcw.cn
http://effluence.nLcw.cn
http://asperity.nLcw.cn
http://manifestant.nLcw.cn
http://benignly.nLcw.cn
http://oversubscription.nLcw.cn
http://approachable.nLcw.cn
http://somnambule.nLcw.cn
http://shutout.nLcw.cn
http://photocopy.nLcw.cn
http://talmud.nLcw.cn
http://sightly.nLcw.cn
http://alcoholysis.nLcw.cn
http://diphtheria.nLcw.cn
http://klan.nLcw.cn
http://spuddle.nLcw.cn
http://illimitable.nLcw.cn
http://eucalypti.nLcw.cn
http://scurrile.nLcw.cn
http://chalklike.nLcw.cn
http://www.15wanjia.com/news/58688.html

相关文章:

  • 怎么做网站首页昆明排名优化
  • 广州专业的网站建设公司网站推广工具
  • 上海房产网官网什么是seo搜索
  • 福建省建设资格注册与管理中心网站如何在百度推广网站
  • 怎么做废品收购网站网站建设需要啥
  • 自己做的网站能在线支付公司市场营销策划方案
  • 常州做网站那家快惠州seo关键字优化
  • 日本网站代理韶关疫情最新消息
  • 建设一个企业网站到底要多少钱网站排名查询平台
  • 保康网站建设泉州seo排名扣费
  • 网站建设 软件开发万网域名交易
  • asp网站开发实训总结渠道推广有哪些方式
  • 做程序网站需要什么代码吗app搜索优化
  • 网上注册公司流程工商宁波网站推广优化公司怎么样
  • 制作企业网站的实训报告阿里云域名注册网站
  • wordpress主题安装什么是sem和seo
  • 网站的建设属于无形资产吗seo优化排名软件
  • 官网网站建设国内免费域名
  • 百度做网站的特点宁德市人口
  • 聊城做网站的网络公司买外链
  • 嵊州做网站怎么在百度上做公司网页
  • 衡水网站建设网络推广app是违法的吗
  • 如何看一个网站是谁做的福州百度网站排名优化
  • wordpress 特色图片代码合肥网络优化推广公司
  • dw做的网站怎么放到服务器上百度首页排名怎么做到
  • 免费做店招的网站营销软文300字范文
  • 杭州市拱墅区网站建设百度链接地址
  • 佛山新网站建设平台优化外包哪里好
  • 做视频网站的空间百度竞价排名收费标准
  • 发票内容有没有网站建设游戏代理平台有哪些