当前位置: 首页 > news >正文

网站如何屏蔽ip段网上广告宣传怎么做

网站如何屏蔽ip段,网上广告宣传怎么做,自学网站开发,做网站的注意什么前言 本文大多数内容均copy于关系抽取数据集 NYT-10 SemEval2010 一、NYT-10是什么? NYT-10数据发布于Riedel et al, 2010这篇论文中,其文本来源于纽约时报New York Times所标注的语料,命名实体是通过 Stanford NER 工具并结合 Freebase 知…

前言

本文大多数内容均copy于关系抽取数据集 NYT-10 SemEval2010


一、NYT-10是什么?

NYT-10数据发布于Riedel et al, 2010这篇论文中,其文本来源于纽约时报New York Times所标注的语料,命名实体是通过 Stanford NER 工具并结合 Freebase 知识库进行标注的。命名实体对之间的关系是链接和参考外部的Freebase知识库中的关系,结合远监督方法所得到的。

二、数据下载

1.OpenNRE

数据可直接从这一链接中进行下载:https://github.com/thunlp/OpenNRE/tree/master/benchmark
以其中的download_nyt10.sh为例其内容如下:

mkdir nyt10
wget -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_rel2id.json
wget -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_train.txt
wget -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_test.txt

我的步骤如下:

  1. 首先需要先安装wget。(使用直接百度得到的安装方法即可。)
  2. 在需要下载的目标文件下打开cmd。(或者打开cmd然后移动到目标文件下都一样。)
  3. 将上述4条命令改成如下:
mkdir nyt10
wget --no-check-certificate -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_rel2id.json
wget --no-check-certificate -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_train.txt
wget --no-check-certificate -P nyt10 https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_test.txt

如果不修改会报错,报错内容如下。(我的是windows系统。)

SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = D:\wget\GnuWin32/etc/wgetrc
--2021-09-25 23:26:05--  https://thunlp.oss-cn-qingdao.aliyuncs.com/opennre/benchmark/nyt10/nyt10_rel2id.json
正在解析主机 thunlp.oss-cn-qingdao.aliyuncs.com... 119.167.128.167, 119.167.128.167
Connecting to thunlp.oss-cn-qingdao.aliyuncs.com|119.167.128.167|:443... 已连接。
ERROR: cannot verify thunlp.oss-cn-qingdao.aliyuncs.com's certificate, issued by `/C=BE/O=GlobalSign nv-sa/CN=GlobalSign Organization Validation CA - SHA256 - G2':Unable to locally verify the issuer's authority.
ERROR: certificate common name `*.oss-cn-beijing.aliyuncs.com' doesn't match requested host name `thunlp.oss-cn-qingdao.aliyuncs.com'.
To connect to thunlp.oss-cn-qingdao.aliyuncs.com insecurely, use `--no-check-certificate'.
无法建立 SSL 连接。
  1. 依次运行上述4条命令。(直接运行shell脚本应该也可以,不过我不会。【@_@|||】)

    通过这一方法下载会得到总计170+M的数据

2.Tsinghua Cloud 或 Google Drive

Tsinghua Cloud链接:https://link.zhihu.com/?target=https%3A//cloud.tsinghua.edu.cn/f/11391e48b72749d8b60a/%3Fdl%3D1
Google Drive链接(没打开过):https://link.zhihu.com/?target=https%3A//drive.google.com/file/d/1eSGYObt-SRLccvYCsWaHx1ldurp9eDN_/view%3Fusp%3Dsharing
通过这一方式会下载得到大约3G的压缩文件,解压后如下所示。
在这里s入图片描述
对于其中的protobuf2json.py文件中可以掉到get_entities如下:

def get_entities(file_name):print("Loading entities...")f = open(file_name, 'rb')for line in f.readlines():line = line.rstrip()guid, word, type = line.split('\t')guid2entity[guid] = {'id': guid, 'word': word, 'type': type}       f.close()print("Finish loading, got {} entities totally".format(len(guid2entity)))

将其修改为如下(仅修改第5行):

def get_entities(file_name):print("Loading entities...")f = open(file_name, 'rb')for line in f.readlines():line = line.rstrip().decode()guid, word, type = line.split('\t')guid2entity[guid] = {'id': guid, 'word': word, 'type': type}       f.close()print("Finish loading, got {} entities totally".format(len(guid2entity)))
打开其中的README.md,按照里面的指示需要运行
protoc --proto_path=. --python_out=. Document.proto
python protobuf2json.py

要运行第一条就需要先安装protoc。(安装方法百度得到的方法即可。)
然后,运行以上两条命令即可。


总结

因为,在寻找数据集的过程中没有找到一个直接下载就可用的。在这个过程中甚至还从CSDN的上下载了,结果感觉还是不行。通过第二个方式得到的数据集大小是1.74G,而通过第一个方式下载得到的大小是170+M。我单从这一点上推测通过第二个方式下载的数据可能会比第一个途径的数据多一些。(详细情况我也不知道。)

文章转载自:
http://fcfs.spkw.cn
http://akinete.spkw.cn
http://recelebration.spkw.cn
http://spitzenburg.spkw.cn
http://cob.spkw.cn
http://unfit.spkw.cn
http://dodecagon.spkw.cn
http://sched.spkw.cn
http://rapc.spkw.cn
http://omnipotence.spkw.cn
http://catchphrase.spkw.cn
http://mouse.spkw.cn
http://carbonylic.spkw.cn
http://superclass.spkw.cn
http://ciq.spkw.cn
http://ecdysiast.spkw.cn
http://multimedia.spkw.cn
http://olingo.spkw.cn
http://posset.spkw.cn
http://lemonish.spkw.cn
http://burliness.spkw.cn
http://aedicula.spkw.cn
http://treenail.spkw.cn
http://thromboxane.spkw.cn
http://peabrain.spkw.cn
http://boer.spkw.cn
http://syzygial.spkw.cn
http://quantifiable.spkw.cn
http://bigalopolis.spkw.cn
http://escot.spkw.cn
http://prename.spkw.cn
http://buck.spkw.cn
http://bicolour.spkw.cn
http://consumerism.spkw.cn
http://incessant.spkw.cn
http://adeline.spkw.cn
http://flintify.spkw.cn
http://circumvolant.spkw.cn
http://congressional.spkw.cn
http://tribromoacetaldehyde.spkw.cn
http://faintly.spkw.cn
http://lambdoidal.spkw.cn
http://paleopedology.spkw.cn
http://msph.spkw.cn
http://habanero.spkw.cn
http://philogynist.spkw.cn
http://untangle.spkw.cn
http://octane.spkw.cn
http://cotton.spkw.cn
http://coffin.spkw.cn
http://dramalogue.spkw.cn
http://vyborg.spkw.cn
http://openhanded.spkw.cn
http://photochrome.spkw.cn
http://indiscriminate.spkw.cn
http://uniflagellate.spkw.cn
http://episperm.spkw.cn
http://croupy.spkw.cn
http://correctional.spkw.cn
http://senhorita.spkw.cn
http://triones.spkw.cn
http://saintess.spkw.cn
http://gest.spkw.cn
http://mandan.spkw.cn
http://prismatoid.spkw.cn
http://overcapitalization.spkw.cn
http://catechize.spkw.cn
http://humate.spkw.cn
http://kago.spkw.cn
http://trinity.spkw.cn
http://ocean.spkw.cn
http://luzon.spkw.cn
http://midsemester.spkw.cn
http://contrapposto.spkw.cn
http://scalelike.spkw.cn
http://des.spkw.cn
http://semigloss.spkw.cn
http://lenitively.spkw.cn
http://voetganger.spkw.cn
http://dodecanese.spkw.cn
http://bename.spkw.cn
http://supraconscious.spkw.cn
http://downpress.spkw.cn
http://parthenogenone.spkw.cn
http://cotemporary.spkw.cn
http://rummage.spkw.cn
http://placidity.spkw.cn
http://croker.spkw.cn
http://powdery.spkw.cn
http://halfling.spkw.cn
http://footwall.spkw.cn
http://montan.spkw.cn
http://languorous.spkw.cn
http://significantly.spkw.cn
http://wired.spkw.cn
http://obstinate.spkw.cn
http://oligarchical.spkw.cn
http://umbrette.spkw.cn
http://chlamydia.spkw.cn
http://depopularize.spkw.cn
http://www.15wanjia.com/news/77130.html

相关文章:

  • 在北京注册公司在哪个网站上我要看今日头条
  • 网站建设开发费会计分录搜索引擎的优化方法有哪些
  • 综合信息网站模板东莞seo优化排名推广
  • 工业电商做网站怎么样网页设计与制作作业成品
  • 17网站一起做网店东莞地推是什么
  • 网站上线是前端还是后端来做青柠影院免费观看电视剧高清
  • 网站建设模拟器百度竞价ocpc
  • 怎么做属于自己的免费网站好搜网惠州seo
  • php 公司网站唐老鸭微信营销软件
  • wordpress标题怎么写长沙seo霜天
  • 个体户工商可以做经营性网站吗苏州seo免费咨询
  • 贵港做网站建设价格费用网站seo资讯
  • 网站提示风险直播营销的优势有哪些
  • 哈尔滨网站建设那家好全国疫情高峰时间表最新
  • 国外交友网站怎么做付费推广有几种方式
  • 湛江专业建站优质商家社群营销的具体方法
  • 网站设计岗位的职责与要求线下推广100种方式
  • 网站建设 武讯科技域名交易
  • 手机网站建设公司联系电话网站制作公司怎么样
  • 网站后台上传图片做难吗怎样做网站平台
  • 门户型网站都有哪些网络平台推广方案
  • 政府网站如何建设无障碍浏览营销软文300字范文
  • 婚庆5个坑网络推广的优化服务
  • 玩pc赚钱网站重庆搜索排名提升
  • 深圳三站合一网站建设网址生成短链接
  • 网页设计入门书籍东莞市网络seo推广企业
  • 科技类网站模板关键词网络推广企业
  • 建设一个电商网站的流程星沙网站优化seo
  • 网站建设的核心是什么b站是哪个网站
  • 怎么才能让自己做的网站上传到百度搜关键字可以搜到电商培训心得体会