当前位置: 首页 > news >正文

网站建设-丹东浙江专业网站seo

网站建设-丹东,浙江专业网站seo,建设网站找哪里,网站建设入驻tag:评价指标,摘要,nlp Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值&#x…

tag:评价指标,摘要,nlp

Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值,以衡量自动生成的摘要或翻译与参考摘要之间的“相似度”。

rouge-N

指N-gram的个数

在中文中计算时,需要用空格将每个字分开(如同英文句子中每个单词之间的空格一样)

举个例子

from rouge import Rouge  
rouge = Rouge()  
title = '今天是星期四'  
pred_title = '今天是周四'  
pred_title2 = '周四是今天'  
print(rouge.get_scores(' '.join(list(pred_title)), ' '.join(list(title))))  # [{'rouge-1': {'r': 0.6666666666666666, 'p': 0.8, 'f': 0.7272727223140496}, 'rouge-2': {'r': 0.4, 'p': 0.5, 'f': 0.4444444395061729}, 'rouge-l': {'r': 0.6666666666666666, 'p': 0.8, 'f': 0.7272727223140496}}]print(rouge.get_scores(' '.join(list(pred_title2)), ' '.join(list(title))))
# [{'rouge-1': {'r': 0.6666666666666666, 'p': 0.8, 'f': 0.7272727223140496}, 'rouge-2': {'r': 0.2, 'p': 0.25, 'f': 0.22222221728395072}, 'rouge-l': {'r': 0.3333333333333333, 'p': 0.4, 'f': 0.36363635867768596}}]

rouge-1

指单个词的匹配度

  • 召回r=单个词重合数/len(title),即找到了多少个字,r=4(重合字为:今天是四)/6=0.67
  • 精准p=单个词重合数/len(pred_title),即找到的字里面有多少个是对的,p=4/5=0.8
  • f即为r和p的计算,f=(2PR)/(P+R)=0.737
  • 两个例子完全相同,不在乎顺序问题

rouge-2

指每两个字的匹配度

  • 召回r=每两个字的重合数/len(title),即找到了多少个字,r=2(今天、天是)/5(今天、天是、是星、星期、期四)=0.4;在title2时,r=1(今天)/5(今天、天是、是星、星期、期四)=0.2
  • 精准p=每两个字的重合数/len(pred_title),即找到的字里面有多少个是对的,p=2/4=0.5;在title2时,p=1(今天)/4(周四、四是、是今、今天)=0.25
  • f即为r和p的计算,f=(2PR)/(P+R)

rouge-L

LCS(longest common subsequence,最长公共子序列)的首字母,因为Rouge-L使用了最长公共子序列。但需要注意的是,这是考虑了顺序的最长公共子序列(因为这个顺序问题很多博客都没说困惑了好久)。

  • 召回r=3(今天是四)/len(title)=4/6;在title2时,r=2(今天)/6=1/3
  • 精准p=3(今天是四)/len(pred_title)=4/5;在title2时,r=2(今天)/5=0.4
  • f即为r和p的计算

优点:不要求词的连续匹配,只要求按词的出现顺序匹配即可,能够像n-gram一样反映句子级的词序。自动匹配最长公共子序列,不需要预先定义n-gram的长度。
缺点:只计算一个最长子序列,最终的值忽略了其他备选的最长子序列及较短子序列的影响。

看完这个例子就可以很清楚的了解到,如果预测出来的顺序一样,如title例子,此时rouge1=rouge-L;但到了title2时,由于考虑了顺序问题,此时最长公共子序列不再是“今天是四”而是“今天”,两个例子中rouge-1没有变化,但rouge2和rouge-L都发生了变化。

http://www.15wanjia.com/news/52720.html

相关文章:

  • 北京市地方税务局网站开发区分局什么网站百度收录快
  • 做外贸用什么网站好嘉兴seo外包平台
  • 企业web网站设计服务营销策划方案
  • 杭州网站设计 site百度搜索排行
  • 网站建设的标签指的是网站建设方案推广
  • 企业网站源码推荐站长之家0
  • 北京做网站找谁推广赚钱的app
  • 自己怎么做个网站经典软文
  • 做视频资源网站有哪些难点seo网络营销推广
  • 博客自助建站河南郑州网站推广优化
  • 天津小型网站建设永州网站seo
  • 官方做任务网站国内的搜索引擎有哪些
  • wordpress 多个主题seo网站排名优化教程
  • 房子做水电的时候是不是要先埋网站网络营销策划书论文
  • 杭州市政府门户网站建设百度公司电话热线电话
  • 娱乐网站建设公司排名seo营销推广全程实例
  • 中组部两学一做网站小程序模板
  • 什么网站可以做模型挣钱百度浏览器主页网址
  • wordpress 封ip南京百度seo公司
  • wordpress视频直播插件seo职位要求
  • 网站建设设计公司成都网站seo外包
  • 网站如何做a b测试seo是什么意思中文翻译
  • 怎么利用QQ空间给网站做排名店铺推广软文300字
  • 上海建设工程管理网站产品推广软文300字
  • 做网站建设工资多少网站排名优化外包公司
  • 网络营销型网站内容营销策略
  • 学网站设计培训电话看片子用什么app免费苹果手机
  • 自建网站代理服务器销售管理软件
  • 网站外链建设的15个小技巧广告免费发布信息
  • 网站建设开发免费咨询新手做seo怎么做