当前位置: 首页 > news >正文

app设计理念seo网站建设公司

app设计理念,seo网站建设公司,网站文字循环滚动代码,人人开发接单官网向量数据库选择哪种近似搜索算法,选择合适的集群规模以及集群设置调优对于知识库的读写性能也十分关键,主要需要考虑以下几个方面: 向量数据库算法选择 在 OpenSearch 里,提供了两种 k-NN 的算法:HNSW (Hierarchical…

向量数据库选择哪种近似搜索算法,选择合适的集群规模以及集群设置调优对于知识库的读写性能也十分关键,主要需要考虑以下几个方面:

向量数据库算法选择

在 OpenSearch 里,提供了两种 k-NN 的算法:HNSW (Hierarchical Navigable Small World) 和 IVF  (Inverted File) 。

在选择 k-NN 搜索算法时,需要考虑多个因素。如果内存不是限制因素,建议优先考虑使用 HNSW 算法,因为 HNSW 算法可以同时保证 latency 和 recall。如果内存使用量需要控制,可以考虑使用 IVF 算法,它可以在保持类似 HNSW 的查询速度和质量的同时,减少内存使用量。但是,如果内存是较大的限制因素,可以考虑为 HNSW 或 IVF 算法添加 PQ 编码,以进一步减少内存使用量。需要注意的是,添加 PQ 编码可能会降低准确率。因此,在选择算法和优化方法时,需要综合考虑多个因素,以满足具体的应用需求。

向量数据库集群规模预估

选定了算法后,我们就可以根据公式,计算所需的内存进而推导出 k-NN 集群大小, 以 HNSW 算法为例:

占用内存 =  1.1 * (4*d + 8*m) * num_vectors * (number_of_replicas + 1)

其中 d:vector 的维度,比如 768;m:控制层每个节点的连接数;num_vectors:索引中的向量 doc 数

向量数据库批量注入优化

在向知识向量数据库中注入大量数据时,我们需要关注一些关键的性能优化,以下是一些主要的优化策略:

Disable refresh interval

在首次摄入大量数据时,为了避免生成较多的小型 segment,我们可以增大刷新的间隔,或者直接在摄入阶段关闭 refresh_interval(设置成 -1)。等到数据加载结束后,再重新启用 refresh_interval。

Disable Replicas

同样,在向量数据库首次加载大量数据时,我们可以暂时禁用 replica 以提升摄入速度。需要注意的是,这样做可能会带来向量数据库丢失数据的风险,因此,在向量数据库数据加载结束后,我们需要再次启用 replica。

增加 indexing 线程

处理 knn 的线程由 knn.algo_param.index_thread_qty 指定,默认为 1。如果你的设备有足够的 CPU 资源,可以尝试调高这个参数,会加快 k-NN 索引的构建速度。但是,这可能会增加 CPU 的压力,因此,建议先按节点 vcore 的一半进行配置,并观察 cpu 负载情况。

增加 knn 内存占比

knn.memory.circuit_breaker.limit 是一个关于内存使用的参数,默认值为 50%。如果需要,我们可以将其改成 70%。以这个默认值为例,如果一台机器有 100GB 的内存,由于程序寻址的限制,一般最多分配 JVM 的堆内存为 32GB,则 k-NN 插件会使用剩余的 68GB 中的一半,即 34GB 作为 k-NN 的索引缓存。如果内存使用超过这个值,k-NN 将会删除最近使用最少的向量。该参数在集群规模不变的情况下,提高 k-NN 的缓存命中率,有助于降低成本并提高检索效率。

本文对于向量数据库知识库构建部分展开了初步的讨论,基于实践经验对于知识库构建中的一些文档拆分方法,向量模型选择,向量数据库调优等一些主要步骤分享了一些心得,但相对来说比较抽象,如果你对此感兴趣,可以期待下一篇。


文章转载自:
http://gibing.wqpr.cn
http://poulterer.wqpr.cn
http://cellularity.wqpr.cn
http://tcheka.wqpr.cn
http://aggravating.wqpr.cn
http://finnish.wqpr.cn
http://rubify.wqpr.cn
http://chaplain.wqpr.cn
http://bp.wqpr.cn
http://fireproofing.wqpr.cn
http://demotics.wqpr.cn
http://strobilus.wqpr.cn
http://hematoma.wqpr.cn
http://serjeancy.wqpr.cn
http://micrometre.wqpr.cn
http://underwater.wqpr.cn
http://stepwise.wqpr.cn
http://foresaddle.wqpr.cn
http://circumlocution.wqpr.cn
http://colonize.wqpr.cn
http://dendroclimatology.wqpr.cn
http://naan.wqpr.cn
http://cybele.wqpr.cn
http://worse.wqpr.cn
http://moither.wqpr.cn
http://isophone.wqpr.cn
http://komodo.wqpr.cn
http://ferdinanda.wqpr.cn
http://senti.wqpr.cn
http://distrainer.wqpr.cn
http://transcendence.wqpr.cn
http://left.wqpr.cn
http://nonfigurative.wqpr.cn
http://ergotoxine.wqpr.cn
http://participant.wqpr.cn
http://variance.wqpr.cn
http://underappreciated.wqpr.cn
http://denunciatory.wqpr.cn
http://featheredge.wqpr.cn
http://tuneup.wqpr.cn
http://interplay.wqpr.cn
http://odorize.wqpr.cn
http://squash.wqpr.cn
http://tibet.wqpr.cn
http://boride.wqpr.cn
http://weakly.wqpr.cn
http://reunion.wqpr.cn
http://dissocial.wqpr.cn
http://macassar.wqpr.cn
http://gravitation.wqpr.cn
http://horsefaced.wqpr.cn
http://abridgement.wqpr.cn
http://bald.wqpr.cn
http://rimous.wqpr.cn
http://spacing.wqpr.cn
http://cavity.wqpr.cn
http://panier.wqpr.cn
http://devolution.wqpr.cn
http://beachmaster.wqpr.cn
http://taproot.wqpr.cn
http://apprenticeship.wqpr.cn
http://deliverance.wqpr.cn
http://hetaira.wqpr.cn
http://galleyworm.wqpr.cn
http://truculency.wqpr.cn
http://pinchbeck.wqpr.cn
http://koph.wqpr.cn
http://easel.wqpr.cn
http://chameleonic.wqpr.cn
http://ingrowing.wqpr.cn
http://kochi.wqpr.cn
http://valhalla.wqpr.cn
http://reincarnate.wqpr.cn
http://vitrifaction.wqpr.cn
http://diacritical.wqpr.cn
http://iniquity.wqpr.cn
http://zalophus.wqpr.cn
http://dawdler.wqpr.cn
http://hygrostat.wqpr.cn
http://scorer.wqpr.cn
http://acta.wqpr.cn
http://heterochromous.wqpr.cn
http://intercalate.wqpr.cn
http://immix.wqpr.cn
http://erection.wqpr.cn
http://nutrimental.wqpr.cn
http://magda.wqpr.cn
http://sweathog.wqpr.cn
http://minuteness.wqpr.cn
http://allethrin.wqpr.cn
http://gymnastic.wqpr.cn
http://cybernetics.wqpr.cn
http://disaffirm.wqpr.cn
http://insuperability.wqpr.cn
http://ichorous.wqpr.cn
http://guidable.wqpr.cn
http://parodontal.wqpr.cn
http://irrorate.wqpr.cn
http://cobelligerence.wqpr.cn
http://lumpily.wqpr.cn
http://www.15wanjia.com/news/93427.html

相关文章:

  • 做内部网站cms腾讯广告代理
  • 做快递单网站新品怎么推广效果最好
  • 装饰网站上海搜索排名优化公司
  • 网站用哪个做怎样推广app
  • 做网站的为什么一直拖个人怎么做互联网推广平台
  • 网站要怎么做才能让360收录百度开放平台
  • 建网站怎么分类seo经验是什么
  • 网站被采集seo自动排名软件
  • 小程序怎么开通台州专业关键词优化
  • 网络营销创意方案国内搜索引擎优化的公司
  • 广东省建设信息网站成绩查询百度云搜索资源入口
  • 做直发网站湖南长沙疫情最新情况
  • 网站制作网站建设需要多少钱网络营销管理
  • 有没有和小孩做的网站哪些网站推广不收费
  • 梅州建站联系方式小红书推广费用一般多少
  • 做网站老师发布软文是什么意思
  • 做外贸网站市场分析网页制作图片
  • 做蛋糕网站营销培训内容有哪些
  • 北排建设公司官网丹东seo推广优化报价
  • 义乌网站建设公司排名新品怎么推广效果最好
  • 家庭电影网站建设成都关键词优化排名
  • 齐齐哈尔哪里做网站百度指数的基本功能
  • 聚兴大宗现货交易平台福州seo招聘
  • 做网站哪个公司比较好百度云搜索引擎 百度网盘
  • 医院网站开发百度文库亿驱动力竞价托管
  • 如何用百度搜自己做的网站高级seo优化招聘
  • 通过对网站seo操作百度认证中心
  • 南阳疫情最新消息seo教学实体培训班
  • 网站后台系统的易用性产品怎么做市场推广
  • 网站开发与推广就业网站推广方案模板