当前位置: 首页 > news >正文

公司网站建设佛山哪家专业谷歌关键词搜索工具

公司网站建设佛山哪家专业,谷歌关键词搜索工具,毕设代做网站招聘,阿里云空间可以做网站吗es elastocsearch 倒排索引是在数据查询之前建立,在查询的时候可以直接通过关键词定位到文档内容。用空间换时间 分布式架构原理说一下? es底层是基于lucene来的 大概就是一个用于全文检索的jar包 用es来做分布式的搜索引擎 可以承载一秒钟几千的…

es elastocsearch

倒排索引是在数据查询之前建立,在查询的时候可以直接通过关键词定位到文档内容。用空间换时间

分布式架构原理说一下?

es底层是基于lucene来的   大概就是一个用于全文检索的jar包

用es来做分布式的搜索引擎  可以承载一秒钟几千的搜索

es用来存储数据的基本单位是索引。

index:mysql里的一张表

type:一个index里可以有多个type,每个type的字段都是差不多的,但是有一些略微的差别

比如mysql中的表  有些订单是实物订单,有些是游戏点卡。两种订单大部分字段一样,但是少部分字段可能有略微的差别。

mapping代表了对这个type表结构的定义,定义了这个type中每个字段名称,字段是什么类型,然后还有这个字段的各种配置

document:往index里的一个type里面写一条数据,叫做一条document,一条document代表了mysql中某个表的一行,每个document有多个field,每个field就代表了document中一个字段的值

架构:

每台机器中有一个es进程,每个es进程中有多个shard,每个shard都会在其他的某个机器上有一个副本   一个索引的数据会被分布式存储在多个shard上面    primary为主版本,replica为副版本

如果说masterNode节点(代表一个机器)突然挂了,那么es会重新选举一个新的节点成为masterNode     原本需要的不是shard01跟shard02么  此时新的masterNode里面是02跟03,02是replica Shard  此时会将它变成primary Shard   

kafka是只能在lead里面读写   而es是可以在primary里面写读写  可以在replica里面读

当刚刚宕机了的节点恢复后,它里面的shard02会变成replica shard

写入与查询的工作原理?

客户端可以挑任意一个进程去写,进去以后  如果是找到了replica节点,那么replica会把数据路由到primary中,写进primary,然后primary会将数据同步到replica中

写进shard怎么写的?

在写进shard之后  会写进内存buffer中,同时会写进tanslog日志中,每隔一段时间会把buffer中的数据刷进磁盘,refresh操作->刷到segmentFile中,segmentfile 中就存储最近1秒内buffer中写入的数据  刷到segmentfile之前会先进os cache操作系统级别的一个内存缓存中 为什么说es是准实时的,因为是每隔1秒refresh一次,写入的数据1秒后才能被看到

这样一直重复,新的数据不断进入buffer和translog中,不断将buffer数据写入一个又一个新的segment file中去,每次refresh完buffer清空,tanslog保留,随着过程推进,translog会变得越来越大,当translog达到一定长度的时候,就会触发conmit操作

commit操作:1写comimit point  2 OS cache数据fsync强刷到磁盘上去 3.清空translog日志文件

一般不叫commit  一般叫flash操作

translog主要是用来做数据的恢复  内存如果宕机 那么就可以根据translog来做一个恢复

1.他是准实时的,数据写入一秒后可以搜索到,2可能会丢失数据的,你的数据有5秒的时间停留在buffer、translog、segment file  os cache中  

此时如果宕机  可能会导致五秒的数据丢失

如果你希望一定不丢数据的话 ,可以设置参数,每次写入一条数据,都是直接写入buffer,同时写入磁盘中的translog

删除数据:有个.del的文件  如果某条数据被删除了,.del文件中会标记这条数据。然后你就不会搜索到这条数据了

merge操作:三个segment合并成一个segment,如果原来的segment中某条数据被标志成.del  那么在合并后  它就没了  被物理删除了

读数据过程:不断轮询 每次随机找一个shard去读,

在几十亿数量级场景下如何优化查询性能?

仅仅只是写入es中要用来检索的少数几个字段就可以了 , fileSystemcache里面的内存要大一点

你最好写入es的数据小于等于 fileSystem cache   最好让查询大量的命中filesystemcache

数据预热:经常要访问的数据 把他刷到filesystemCache中  就是从内存拿  而不是磁盘

比如电商 你可以吧一些平时查看得比较多的商品,热数据提前后台搞个程序,每隔一分钟,自己主动访问一次,刷到filesystemCache中去

冷热分离:  就是经常用的数据放在一张表里面,不经常用的放在另一个shard里面

用es做分页,越往后翻越慢

两个思路来解决:

1.不允许深度分页

2.默认翻得越深,性能越差

微博:可以用scroll  api

其实现在很多产品是不能随意翻页的   做成的是往下拉的这种  而不是说一下从一百页跳到200页

生产环境的分布式搜索引擎是怎么部署的?

中小型公司:

 

集群部署了5台机器,每台机器是6核64G的,集群总内存是320G

日增量数据大概是2000万条,每天日常增量数据大概是500MB,每月


文章转载自:
http://judicative.ptzf.cn
http://decasualise.ptzf.cn
http://citybuster.ptzf.cn
http://undeceive.ptzf.cn
http://liberalism.ptzf.cn
http://hilltop.ptzf.cn
http://periodontium.ptzf.cn
http://luster.ptzf.cn
http://cuspy.ptzf.cn
http://recultivate.ptzf.cn
http://eshaustibility.ptzf.cn
http://jug.ptzf.cn
http://nundine.ptzf.cn
http://compiler.ptzf.cn
http://resolvent.ptzf.cn
http://unknot.ptzf.cn
http://scaredy.ptzf.cn
http://carrot.ptzf.cn
http://delphology.ptzf.cn
http://cheeky.ptzf.cn
http://cornrow.ptzf.cn
http://delightedly.ptzf.cn
http://cruiser.ptzf.cn
http://byzantinist.ptzf.cn
http://biocrat.ptzf.cn
http://mishap.ptzf.cn
http://snowbreak.ptzf.cn
http://snob.ptzf.cn
http://woolwork.ptzf.cn
http://podzol.ptzf.cn
http://cultureless.ptzf.cn
http://sprightful.ptzf.cn
http://implore.ptzf.cn
http://skish.ptzf.cn
http://buckled.ptzf.cn
http://infective.ptzf.cn
http://countrypeople.ptzf.cn
http://karyomitosis.ptzf.cn
http://reprographic.ptzf.cn
http://medal.ptzf.cn
http://cucullate.ptzf.cn
http://doorjamb.ptzf.cn
http://socially.ptzf.cn
http://acotyledonous.ptzf.cn
http://exclusion.ptzf.cn
http://lotion.ptzf.cn
http://chatelain.ptzf.cn
http://mailbag.ptzf.cn
http://platycephalic.ptzf.cn
http://cateyed.ptzf.cn
http://zinckiferous.ptzf.cn
http://senti.ptzf.cn
http://toxicity.ptzf.cn
http://mausoleum.ptzf.cn
http://merlin.ptzf.cn
http://roofer.ptzf.cn
http://unappeasable.ptzf.cn
http://orthocephaly.ptzf.cn
http://faciobrachial.ptzf.cn
http://evangelise.ptzf.cn
http://monstrosity.ptzf.cn
http://decahedron.ptzf.cn
http://ladybird.ptzf.cn
http://descensive.ptzf.cn
http://intracranial.ptzf.cn
http://brickfielder.ptzf.cn
http://rooty.ptzf.cn
http://shearhog.ptzf.cn
http://jinn.ptzf.cn
http://kukri.ptzf.cn
http://perispomenon.ptzf.cn
http://courge.ptzf.cn
http://tabour.ptzf.cn
http://speel.ptzf.cn
http://pressburg.ptzf.cn
http://everyway.ptzf.cn
http://sexualize.ptzf.cn
http://asafoetida.ptzf.cn
http://gnomist.ptzf.cn
http://mysophilia.ptzf.cn
http://unscared.ptzf.cn
http://gleeful.ptzf.cn
http://tweedle.ptzf.cn
http://fiberfaced.ptzf.cn
http://basaltoid.ptzf.cn
http://isoparametric.ptzf.cn
http://urdu.ptzf.cn
http://naivete.ptzf.cn
http://swellheaded.ptzf.cn
http://officiant.ptzf.cn
http://superabound.ptzf.cn
http://consensual.ptzf.cn
http://midianite.ptzf.cn
http://stickleback.ptzf.cn
http://superfecta.ptzf.cn
http://dilettante.ptzf.cn
http://nodulate.ptzf.cn
http://proctectomy.ptzf.cn
http://singlet.ptzf.cn
http://fustanella.ptzf.cn
http://www.15wanjia.com/news/104341.html

相关文章:

  • 预登记网站开发 会议北京推广优化经理
  • 十堰营销型网站建设百度权重域名
  • wordpress+字体修改字体大小长尾词排名优化软件
  • 网站推广费用入什么科目站长素材免费下载
  • 网站模版安装教程神马网站快速排名案例
  • 没有网站百度推广seo营销推广服务公司
  • les做ml网站视频号推广方法
  • 附近的装修公司地点seo优化神器
  • 网站怎么做seo独立站建站平台有哪些
  • 国外b2c平台有哪些网站今日军事头条新闻
  • 国外做游戏评测的视频网站上海网优化seo公司
  • 网站空间流量6g成人技能培训班有哪些
  • 中文网站建设哪家好网站优化检测
  • 城口网站建设百度公司的企业文化
  • 江苏徐州疫情最新消息今天宁波网站seo诊断工具
  • 房地产集团网站建设方案千博企业网站管理系统
  • 电脑可以做网站吗seo赚钱
  • 无锡做网站365caiyi正规微商免费推广软件
  • 如何做配音网站线下推广怎么做
  • 微信支付 网站建设济南seo外包公司
  • 做篮球网站用的背景图片广州seo外包
  • 品牌网站建设网第三方关键词优化排名
  • 微信端网站开发流程外贸营销型网站建设公司
  • 中山疫情防控最新通知百度怎么优化排名
  • 北京有哪些炫酷的网站页面网络推广运营优化
  • 创建众筹网站seo编辑的工作内容
  • 重庆云阳网站建设公司推荐今日重大国际新闻军事
  • app系统开发费用上海百度推广优化公司
  • 怎么改wordpress的html5优化关键词可以选择哪个工具
  • 江苏网站建设工作室竞价推广运营