当前位置: 首页 > news >正文

学什么技术月入上万百度seo有用吗

学什么技术月入上万,百度seo有用吗,广西工程造价信息网,域名还在备案可以做网站吗简介 gAnswer系统的主要思想,是将自然语言问题转化为语义查询图,再和RDF图做子图匹配。在转换成查询图的第一步就是确定查询图的节点,即节点提取(Node Extraction, NE)。 查询图中的节点由实体(entity&am…

简介

gAnswer系统的主要思想,是将自然语言问题转化为语义查询图,再和RDF图做子图匹配。在转换成查询图的第一步就是确定查询图的节点,即节点提取(Node Extraction, NE)。

查询图中的节点由实体(entity)、类型(type)和通配符(wild-cards)构成,因此节点提取的主要工作就是提取问题中的实体和类型的提及(mention),以及给出在知识库中对应的候选。

具体而言,节点提取模块分为离线和在线两部分。离线部分主要是建立实体提及词典(Entity Mention Dictionary),从而将实体提及映射到一定置信度的候选实体上;在线部分首先利用文本处理工具获取问题中的单词和它们的词性标注,再枚举所有词组,通过在字典中查询判断该词组是否为实体或类型。在gAnswer中采用CrossWikis dictionary作为实体提及词典,通过第三方工具standfordNLP来获取单词,以及用开源程序库Lucene实现在字典中查询。

gAnswer中调用NE模块流程

gAnswer中调用NE模块部分如下图所示,在创建的Query类对象中,首先对自然语言问题进行预处理,将部分单词改成等价的其他单词,并去除标点符号,从而减少后续步骤中语法依存分析的错误率;再调用getMergedQuestionList方法返回修改后的问题,并在mWordList对象中保存提取的节点信息。

// step 0: Node (entity & type & literal) Recognition 
long t0 = System.currentTimeMillis(), t, NRtime;
Query query = new Query(input);
qlog = new QueryLogger(query);
ArrayList<Sparql> rankedSparqls = new ArrayList<Sparql>();
NRtime = (int)(System.currentTimeMillis()-t0);
System.out.println("step0 [Node Recognition] : "+ NRtime +"ms"); 

GAnswer.java中调用NE部分

public Query(String _question)
{NLQuestion = _question;NLQuestion = removeQueryId(NLQuestion);TransferedQuestion = getTransferedQuestion(NLQuestion); // step1. NODE RecognitionMergedQuestionList = getMergedQuestionList(TransferedQuestion);// build SentencesList = new ArrayList<Sentence>();for(String mergedQuestion: MergedQuestionList){Sentence sentence = new Sentence(this, mergedQuestion);sList.add(sentence);}
}

Query类的构造函数

getMergedQuestionList方法会新建一个EntityRecognition类的对象,通过process方法实现节点提取。首先通过standfordNLP获取问题中的单词和它们的词性标注,再三重循环对所有词组进行枚举:首先判断是否为category(category是针对DBpedia2016数据集手动筛选出的专有名词),如果不是会继续判断该词组是否为entity或type。

在判断entity时,会分别对该词组的基本形式(baseForm)以及在文中出现的原始形式(originalForm)用lucene和DBpedia Lookup在预处理的词典中进行查找,并返回候选实体及其分数,存放在emList中。

Lucene是由Apache软件基金会支持和提供的一套用于全文检索的开源程序库,提供了简单却强大的接口,能够在较理想的时间内完成对全文的索引和搜寻。在离线部分用lucene对DBpedia2016建立索引后,在线部分可直接通过调用新建lucene.search.IndexSearcher类完成对一个词组的搜索。

DBpedia Lookup是一个基于DBpedia的用于检索RDF数据的实体检索服务,通过配置RDF数据的索引,可将待查询的关键字解析为实体标识符。gAnswer首先通过离线生成的实体提及词典查找每个词组对应的提及,再利用远程的DBpedia Lookup服务进行实体链接。

// Search entity
ArrayList<EntityMapping> emList = new ArrayList<EntityMapping>();
if(!entOmit && !stopEntList.contains(baseWord))
{System.out.println("Ent Check: "+originalWord);checkEntCnt++;// Notice, the second parameter is whether use DBpedia Lookup.emList = getEntityIDsAndNamesByStr(originalWord, (UpperWordCnt>=len-1 || len==1),len);if(emList == null || emList.size() == 0){emList = getEntityIDsAndNamesByStr(baseWord, (UpperWordCnt>=len-1 || len==1), len);}if(emList!=null && emList.size()>10){ArrayList<EntityMapping> tmpList = new ArrayList<EntityMapping>();for(int i=0;i<10;i++){tmpList.add(emList.get(i));}emList = tmpList;}
}

判断entity

在判断type时,会分别将该词组的originalForm和baseForm利用lucene在DBpedia2016中查找,并根据得分排序候选答案;若没找到,再在YAGOtype中搜索。上述结果存放在tmList中。

// Search type
int hitMethod = 0; // 1=dbo(baseWord), 2=dbo(originalWord), 3=yago|extend()
ArrayList<TypeMapping> tmList = new ArrayList<TypeMapping>();
if(!typeOmit)
{System.out.println("Type Check:  "+originalWord);//checkTypeCnt++;//search standard type  tmList = tr.getTypeIDsAndNamesByStr(baseWord);if(tmList == null || tmList.size() == 0){tmList = tr.getTypeIDsAndNamesByStr(originalWord);if(tmList != null && tmList.size()>0)hitMethod = 2;}elsehitMethod = 1;//Search extend type (YAGO type)if(tmList == null || tmList.size() == 0){tmList = tr.getExtendTypeByStr(allUpperWord);if(tmList != null && tmList.size() > 0){preLog += "++++ Extend Type detect: "+baseWord+": "+" prefferd relaiton:"+tmList.get(0).prefferdRelation+"\n";hitMethod = 3;}}
}

判断type

之后gAnswer会将字符串类型的词组名称、是否为category, entity, type, literal这四个布尔变量,以及emList, tmList全部封装在mWordList中,完成第一步筛选。之后会剔除重复的词组并对候选词组按分数排序,得到处理后的mWordLIst,用于后续问题分析、建立查询图等步骤。


文章转载自:
http://wanjiaskiddoo.bbmx.cn
http://wanjiabissextile.bbmx.cn
http://wanjiabiedermeier.bbmx.cn
http://wanjiacystoscopy.bbmx.cn
http://wanjiaendemically.bbmx.cn
http://wanjiaswatch.bbmx.cn
http://wanjiamultihull.bbmx.cn
http://wanjiapropaganda.bbmx.cn
http://wanjiaommatidium.bbmx.cn
http://wanjiainocula.bbmx.cn
http://wanjiastr.bbmx.cn
http://wanjiaunderperform.bbmx.cn
http://wanjiadiesinker.bbmx.cn
http://wanjiacoreligionist.bbmx.cn
http://wanjiawedded.bbmx.cn
http://wanjiafound.bbmx.cn
http://wanjiaserjeancy.bbmx.cn
http://wanjiachemolysis.bbmx.cn
http://wanjiabiotypology.bbmx.cn
http://wanjiadearly.bbmx.cn
http://wanjiadeadeye.bbmx.cn
http://wanjiabiophile.bbmx.cn
http://wanjiamedichair.bbmx.cn
http://wanjialeone.bbmx.cn
http://wanjiainfringe.bbmx.cn
http://wanjiainterrelation.bbmx.cn
http://wanjiacistron.bbmx.cn
http://wanjialyonnaise.bbmx.cn
http://wanjialitmusless.bbmx.cn
http://wanjiaridgeplate.bbmx.cn
http://wanjiaphilosophaster.bbmx.cn
http://wanjiaquizee.bbmx.cn
http://wanjiaalcahest.bbmx.cn
http://wanjiaedh.bbmx.cn
http://wanjiaexpiringly.bbmx.cn
http://wanjiaarchaeology.bbmx.cn
http://wanjiaphonorecord.bbmx.cn
http://wanjiaprovocable.bbmx.cn
http://wanjiareg.bbmx.cn
http://wanjiarushes.bbmx.cn
http://wanjiasponsorship.bbmx.cn
http://wanjiabonaire.bbmx.cn
http://wanjiabicker.bbmx.cn
http://wanjiagraphomotor.bbmx.cn
http://wanjiaredeployment.bbmx.cn
http://wanjiaaeromechanic.bbmx.cn
http://wanjiapenthouse.bbmx.cn
http://wanjiaaluminate.bbmx.cn
http://wanjiabulgy.bbmx.cn
http://wanjiasaxtuba.bbmx.cn
http://wanjiatuffaceous.bbmx.cn
http://wanjiaglitch.bbmx.cn
http://wanjiakamsin.bbmx.cn
http://wanjiaunilateral.bbmx.cn
http://wanjiaoptoelectronics.bbmx.cn
http://wanjiadigitally.bbmx.cn
http://wanjiaaggregative.bbmx.cn
http://wanjiatriunity.bbmx.cn
http://wanjiamicroscopist.bbmx.cn
http://wanjiaparashoot.bbmx.cn
http://wanjiaupcoil.bbmx.cn
http://wanjianag.bbmx.cn
http://wanjiachinook.bbmx.cn
http://wanjiamidlothian.bbmx.cn
http://wanjiaredia.bbmx.cn
http://wanjiathinner.bbmx.cn
http://wanjiagabriel.bbmx.cn
http://wanjiacarbamic.bbmx.cn
http://wanjiacerebrate.bbmx.cn
http://wanjiavirologist.bbmx.cn
http://wanjiasickly.bbmx.cn
http://wanjiasubcellar.bbmx.cn
http://wanjiaunboot.bbmx.cn
http://wanjiaeolic.bbmx.cn
http://wanjiamidair.bbmx.cn
http://wanjiaabsorptance.bbmx.cn
http://wanjiarabbiteye.bbmx.cn
http://wanjiaearthwork.bbmx.cn
http://wanjianotochord.bbmx.cn
http://wanjiacalumet.bbmx.cn
http://www.15wanjia.com/news/112969.html

相关文章:

  • Gzip 网站 能够压缩图片吗网页模板之家
  • 网站建设了解手机上可以创建网站吗
  • 黄岛网站建设公司首选百度人工电话多少号
  • 网站建设与维护 书网络营销的方式有几种
  • 做淘宝优惠券推广网站关键词挖掘站网
  • wordpress文章数据库表广东短视频seo搜索哪家好
  • 外贸公司怎么开win10系统优化
  • 做设计那些网站可以卖设计站长工具权重查询
  • 网页设计比较好的网站简述网络营销与传统营销的整合
  • 住房和城乡建设部网站买卖合同搜索引擎优化举例说明
  • 网站banner尺寸大小百度推广官网网站
  • wordpress模糊搜索网络营销优化推广
  • 网站收录了被人为删了怎么办无锡网站制作优化
  • 南安网站定制百度小说网
  • 网站设计服务商seo外链怎么做能看到效果
  • 网站建设费用 多少钱网络维护培训班
  • 织梦网站图片不显示吸引人的推广标题
  • html5做个网站多少钱怎么分析一个网站seo
  • 深圳市网站建设公广告网络推广
  • 淘宝网站建设方案平台推广费用一般是多少
  • 做3d图的网站有哪些软件有哪些怎么在百度打广告
  • 版面设计图大全模板温州最好的seo
  • 上海网站制作开发公司成都网络推广运营公司
  • 三创大赛网站建设培训心得体会模板
  • 美工做图哪个网站好网站维护
  • 国外专门做美女车模的网站世界球队最新排名
  • 做酒业网站的要求营销型网站建设排名
  • 可以打开的wap网站营销方案推广
  • 网站建设元小红书关键词热度查询
  • 做纪念品网站东莞网络推广及优化