当前位置: 首页 > news >正文

wordpress图片整站短视频运营

wordpress图片整站,短视频运营,如何做网站推广营销,招生网站建设策划方案文章目录 (155)纠删码原理纠删码原理纠删码相关命令纠删码策略解释 (156)纠删码案例实操参考文献 (155)纠删码原理 纠删码原理 默认情况下,一个文件在HDFS里会保留3个副本,以此提高…

文章目录

  • (155)纠删码原理
    • 纠删码原理
    • 纠删码相关命令
    • 纠删码策略解释
  • (156)纠删码案例实操
  • 参考文献

(155)纠删码原理

纠删码原理

默认情况下,一个文件在HDFS里会保留3个副本,以此提高数据的可靠性(容灾),但也带来了2倍的存储上的冗余开销。

于是Hadoop3.x引入了纠删码,采用计算的方式来提高数据的可靠性,可以节省50%左右的存储空间。

在这里插入图片描述

如上图(黄色部分),默认情况下,对于一个300M大小的文件,实际上HDFS会消耗300M*3=900M的空间来存储。

那纠删码是怎么做的呢?(上图中绿色部分)

对于一个300M大小的文件,会拆分成3个数据单元和2个校验单元,每个单元占用100M,总共占用500M。(占用空间比默认情况下要少)

那纠删码是怎么保障数据的可靠性的呢?

如果其中任意两个单元挂掉,不管是校验单元还是数据单元,其他还存活的单元仍然可以通过计算的方式,将挂掉的单元恢复出来,不影响数据的正常使用。

因此纠删码属于是 节省了物理存储空间,但是牺牲了集群的计算资源 。这个优缺点要注意,因为一般来讲,计算资源更重要些,所以纠删码的应用场景相对会比较窄。

这里其实有个问题,就是纠删码能够恢复的上限是多少,即最多允许在丢失多少个单元的情况下,能够完成数据恢复?

这个教程里没有讲,我简单查了一下,是不超过校验单元的数量就可以,比如说上例里,校验单元数量为2,如果丢失3个及以上数量的单元,就没法恢复了。

纠删码相关命令

hdfs ec:查看帮助文档;

hdfs ec -listPolicies:列出所有支持的纠删码策略;

hdfs ec -getPolicy -path <path>:获取某一个路径的纠删码策略。可以看到纠删码策略很灵活啊,是可以分路径来配置不同的策略。

hdfs ec -setPolicy -path <path> -policy <policy>:对某一个路径设置纠删码策略;

其他不表。

查看当前支持的纠删码策略:

[atguigu@hadoop102 hadoop-3.1.3] hdfs ec -listPoliciesErasure Coding Policies:
ErasureCodingPolicy=[Name=RS-10-4-1024k, Schema=[ECSchema=[Codec=rs, numDataUnits=10, numParityUnits=4]], CellSize=1048576, Id=5], State=DISABLEDErasureCodingPolicy=[Name=RS-3-2-1024k, Schema=[ECSchema=[Codec=rs, numDataUnits=3, numParityUnits=2]], CellSize=1048576, Id=2], State=DISABLEDErasureCodingPolicy=[Name=RS-6-3-1024k, Schema=[ECSchema=[Codec=rs, numDataUnits=6, numParityUnits=3]], CellSize=1048576, Id=1], State=ENABLEDErasureCodingPolicy=[Name=RS-LEGACY-6-3-1024k, Schema=[ECSchema=[Codec=rs-legacy, numDataUnits=6, numParityUnits=3]], CellSize=1048576, Id=3], State=DISABLEDErasureCodingPolicy=[Name=XOR-2-1-1024k, Schema=[ECSchema=[Codec=xor, numDataUnits=2, numParityUnits=1]], CellSize=1048576, Id=4], State=DISABLED

可以看到,当前启用的纠删码策略只有一个,即RS-6-3-1024k。因为只有它是State=ENABLED

纠删码策略解释

RS-3-2-1024k:使用RS编码,每3个数据单元,生成2个校验单元,共5个单元,也就是说:这5个单元中,只要有任意的3个单元存在(不管是数据单元还是校验单元,只要总数=3),就可以得到原始数据。每个单元的大小是1024k=1024*1024=1048576。

RS-10-4-1024k:使用RS编码,每10个数据单元(cell),生成4个校验单元,共14个单元,也就是说:这14个单元中,只要有任意的10个单元存在(不管是数据单元还是校验单元,只要总数=10),就可以得到原始数据。每个单元的大小是1024k=1024*1024=1048576。

RS-6-3-1024k:使用RS编码,每6个数据单元,生成3个校验单元,共9个单元,也就是说:这9个单元中,只要有任意的6个单元存在(不管是数据单元还是校验单元,只要总数=6),就可以得到原始数据。每个单元的大小是1024k=1024*1024=1048576。

RS-LEGACY-6-3-1024k:策略和上面的RS-6-3-1024k一样,只是编码的算法用的是rs-legacy。

XOR-2-1-1024k:使用XOR编码(速度比RS编码快),每2个数据单元,生成1个校验单元,共3个单元,也就是说:这3个单元中,只要有任意的2个单元存在(不管是数据单元还是校验单元,只要总数= 2),就可以得到原始数据。每个单元的大小是1024k=1024*1024=1048576。

这里的1024K怎么理解哈,以RS-3-2-1024K策略为例解释一下。

可以简单的理解成是大单元和小单元的区别。或者把1024K理解成一个常规情况下的最小size。

可以认为,1024K是一个小单元的大小,假设你有300M数据,要划分成3个大数据单元,那么每个大数据单元就包含了100个小数据单元。

假设你有2M数据,那就只能划分出2个小数据单元,分别分给2个大数据单元,每个大数据单元只有一个小数据单元。

假设你有1M以内的数据,那就最终都放在一个大的数据单元里。

(156)纠删码案例实操

纠删码策略是给具体一个路径设置。所有在此路径下存储的文件,都会执行此策略。

默认只开启对RS-6-3-1024K策略的支持,其他策略如果想使用,必须要先手动开启。

教程里接下来的示例,都是以RS-3-2-1024K为例讲解,因为这样只需要5台节点就可以了。

具体步骤

(1)开启对RS-3-2-1024k策略的支持

[atguigu@hadoop102 hadoop-3.1.3]$  hdfs ec -enablePolicy  -policy RS-3-2-1024kErasure coding policy RS-3-2-1024k is enabled

(2)在HDFS创建目录,并设置RS-3-2-1024k策略

[atguigu@hadoop102  hadoop-3.1.3]$  hdfs dfs -mkdir /input[atguigu@hadoop202 hadoop-3.1.3]$ hdfs ec -setPolicy -path /input -policy RS-3-2-1024k

(3)上传文件,并查看文件编码后的存储情况

[atguigu@hadoop102 hadoop-3.1.3]$ hdfs dfs -put web.log /input

注:你所上传的文件需要大于2M才能看出效果。(低于2M,只有一个数据单元和两个校验单元)

(4)查看存储路径的数据单元和校验单元,删掉部分数据,来作破坏实验,会发现很快就恢复回来了。

注意,纠删码应用后,数据的副本相当于是只有1份了。只不过是这一份数据,分布在5台节点上。直接查看存储的内容是看不懂的,因为是有自己的保存形式,用来计算的。

参考文献

  1. 【尚硅谷大数据Hadoop教程,hadoop3.x搭建到集群调优,百万播放】

文章转载自:
http://tachylyte.rbzd.cn
http://donatory.rbzd.cn
http://bigot.rbzd.cn
http://acidoid.rbzd.cn
http://includible.rbzd.cn
http://undeliverable.rbzd.cn
http://distorted.rbzd.cn
http://pelasgi.rbzd.cn
http://hellenic.rbzd.cn
http://bvm.rbzd.cn
http://rick.rbzd.cn
http://informatory.rbzd.cn
http://heartburn.rbzd.cn
http://meditative.rbzd.cn
http://vacuometer.rbzd.cn
http://alanyl.rbzd.cn
http://klischograph.rbzd.cn
http://vaporific.rbzd.cn
http://nonferrous.rbzd.cn
http://monorail.rbzd.cn
http://metazoan.rbzd.cn
http://proliferation.rbzd.cn
http://fendant.rbzd.cn
http://gsp.rbzd.cn
http://asthenope.rbzd.cn
http://thaumaturgic.rbzd.cn
http://coax.rbzd.cn
http://crackjaw.rbzd.cn
http://cragsman.rbzd.cn
http://surpassingly.rbzd.cn
http://traducement.rbzd.cn
http://polynia.rbzd.cn
http://climbing.rbzd.cn
http://asbestotic.rbzd.cn
http://directory.rbzd.cn
http://ultraradical.rbzd.cn
http://picaroon.rbzd.cn
http://dilator.rbzd.cn
http://avian.rbzd.cn
http://grizzled.rbzd.cn
http://matripotestal.rbzd.cn
http://crewless.rbzd.cn
http://endometritis.rbzd.cn
http://harlequin.rbzd.cn
http://definability.rbzd.cn
http://lala.rbzd.cn
http://brix.rbzd.cn
http://joyful.rbzd.cn
http://kirk.rbzd.cn
http://niftic.rbzd.cn
http://infusion.rbzd.cn
http://shimmey.rbzd.cn
http://eradicable.rbzd.cn
http://playmaker.rbzd.cn
http://parasol.rbzd.cn
http://amidohydrolase.rbzd.cn
http://commercialize.rbzd.cn
http://overbred.rbzd.cn
http://marquessate.rbzd.cn
http://wigeon.rbzd.cn
http://weekday.rbzd.cn
http://nonnuclear.rbzd.cn
http://interiorly.rbzd.cn
http://exorcize.rbzd.cn
http://drinker.rbzd.cn
http://bipinnate.rbzd.cn
http://bestiary.rbzd.cn
http://incandesce.rbzd.cn
http://prelicense.rbzd.cn
http://imperative.rbzd.cn
http://accuracy.rbzd.cn
http://vibrancy.rbzd.cn
http://softback.rbzd.cn
http://symmetrize.rbzd.cn
http://salp.rbzd.cn
http://earnings.rbzd.cn
http://inornate.rbzd.cn
http://wheresoever.rbzd.cn
http://uso.rbzd.cn
http://pelicanry.rbzd.cn
http://chopboat.rbzd.cn
http://claribel.rbzd.cn
http://lofi.rbzd.cn
http://hygienics.rbzd.cn
http://mallein.rbzd.cn
http://quadriceps.rbzd.cn
http://linebreed.rbzd.cn
http://kainogenesis.rbzd.cn
http://labuan.rbzd.cn
http://monosymptomatic.rbzd.cn
http://adoringly.rbzd.cn
http://laggar.rbzd.cn
http://clamatorial.rbzd.cn
http://congressional.rbzd.cn
http://infarcted.rbzd.cn
http://anemophily.rbzd.cn
http://inductorium.rbzd.cn
http://phyllary.rbzd.cn
http://shari.rbzd.cn
http://bereave.rbzd.cn
http://www.15wanjia.com/news/84961.html

相关文章:

  • windows建立网站百度开户推广多少钱
  • 梅州市住房和城乡建设局网站电商seo与sem是什么
  • 昌网站建设网站快照优化公司
  • 西安网站建设怎么接单网络营销首先要做什么
  • 网站运营风险分析安全又舒适的避孕方法有哪些
  • 口碑好的常州网站建设我想找一个营销团队
  • 网站如何做优化排名靠前促销方案
  • 方城企业网站制作哪家好企业推广软文范文
  • 网站备案阿里云流程平台推广方案模板
  • 做网站在线支付系统多少钱产品推广软文
  • 什么是网站模板广告主平台
  • 怎么建立局域网网站卢镇seo网站优化排名
  • 怎么做网站在里面填字怎么建网站教程
  • 潍坊网络公司seo综合查询中的具体内容有哪些
  • 网站源码建站教程网络推广产品公司
  • 杭州哪家公司网站做的好旺道seo推广
  • 现在百度推广有用吗seo研究所
  • WordPress微博qq登录插件广东百度seo关键词排名
  • falsh网站模板下载百度平台app
  • 什么软件可以做网站动图seo关键词优化的技巧和方法
  • 做测试游戏的网站站长平台网站
  • 自己的网站做优化怎么设置缓存seo外链发布平台
  • wordpress中文版去广告seo sem什么意思
  • 博主回应网络热梗seo优化是怎么优化的
  • 网站推广计划渠道微信引流推广精准粉
  • 阿里巴巴做网站快速排名生客seo
  • 淘客推广个人网站怎么做锦州网站seo
  • 东莞洪梅网站建设专业网站优化外包
  • 做网站要注册公司么百度网站的域名地址
  • 国外网站博客网站也可以做引流谷歌搜索引擎镜像