当前位置: 首页 > news >正文

做网站的外包能学到什么今日刚刚发生的新闻

做网站的外包能学到什么,今日刚刚发生的新闻,福田欧曼服务站电话,关于市场营销的案例#AI夏令营 #Datawhale #夏令营 1.赛事简介 目前神经机器翻译技术已经取得了很大的突破,但在特定领域或行业中,由于机器翻译难以保证术语的一致性,导致翻译效果还不够理想。对于术语名词、人名地名等机器翻译不准确的结果,可以通…

#AI夏令营 #Datawhale #夏令营

1.赛事简介

目前神经机器翻译技术已经取得了很大的突破,但在特定领域或行业中,由于机器翻译难以保证术语的一致性,导致翻译效果还不够理想。对于术语名词、人名地名等机器翻译不准确的结果,可以通过术语词典进行纠正,避免了混淆或歧义,最大限度提高翻译质量。

2.赛事任务

基于术语词典干预的机器翻译挑战赛选择以英文为源语言,中文为目标语言的机器翻译。本次大赛除英文到中文的双语数据,还提供英中对照的术语词典。参赛队伍需要基于提供的训练数据样本从多语言机器翻译模型的构建与训练,并基于测试集以及术语词典,提供最终的翻译结果,数据包括:

·训练集:双语数据:中英14万余双语句对

·开发集:英中1000双语句对

·测试集:英中1000双语句对

·术语词典:英中2226条

3.baseline

(1)对中英双语句对进行分词:

import nltk
import jieba
def read_file(filepath):with open(filepath, 'r', encoding='utf-8') as file:lines = file.readlines()return lines# 分词英语文本
def tokenize_en(lines):return [' '.join(nltk.word_tokenize(line)) for line in lines]# 分词中文文本
def tokenize_zh(lines):return [' '.join(jieba.cut(line)) for line in lines]

(2)统计句长分布

train_en.tok

train_zh.tok

句长普遍较短,且中英句长分布有区别。

(3)filter

利用分词后的语料训练源语言和目标语言的语言模型,打分后删除低分语句。

(4)训练

http://www.15wanjia.com/news/36116.html

相关文章:

  • 网站专题效果图怎么做友情链接交换教程
  • 自己学习做网站百度推广图片
  • 访问的网站显示建设中重庆百度推广排名优化
  • 网站seo快速排名软件网站模板定制
  • 做淘宝优惠网站免费b站软件下载
  • 玉林网站推广软文营销策划方案
  • 前程无忧深圳招聘网站域名状态查询工具
  • 怎么看网站是不是h5做的新手怎么做电商
  • 网站建设不用备案的天津seo外包团队
  • 做网站的前景竞价托管一般多少钱
  • 广东网站设计推荐焊工培训内容
  • 百度网站数据统计怎么做深圳最新通告今天
  • 电商网站开发用什么语言表达企业网络推广服务
  • 网站建设这个搜索引擎优化与推广技术
  • 一个公网ip可以做几个网站广州最新发布最新
  • 深圳建网站技术百度网盘app下载安装
  • wordpress get_the_permalink优化的近义词
  • 做企业网站可以没有后台吗kj6699的seo综合查询
  • 腾讯服务器做网站湛江seo网站管理
  • html个人网页代码泉州seo代理商
  • 做百度竞价网站修改影响排名吗足球联赛排名
  • 上海市工程建设信息网官方网站seo优化评论
  • 如何搭建公司内部网站线在科技成都网站推广公司
  • 响应式网站用什么语言网络服务商主要包括哪些
  • 做标签刷单平台网站天津百度推广
  • 酷狗音乐网站开发语言哪里做网络推广好
  • 易语言可以做网站嘛产品推广方案怎么写
  • wordpress网站添加背景音乐搜索引擎营销简称
  • html怎么设置网页背景图片网站优化的方式有哪些
  • 网站建设技术参数什么平台可以免费打广告