当前位置: 首页 > news >正文

嘉兴网站建设999 999广州seo排名收费

嘉兴网站建设999 999,广州seo排名收费,wordpress调用post,杭州营销型网站建设文章目录 环境数据迁移需求迁移过程记录 环境 Hive集群AHive集群B跳转机一台 数据迁移需求 本次迁移数据100G,15亿条,数据流转方向从集群A经过跳转机到集群B,通过HDFS拉取和重新建表导入的方式完成数据库迁移。 迁移过程记录 - 当前操作…

文章目录

  • 环境
  • 数据迁移需求
  • 迁移过程记录

环境

  • Hive集群A
  • Hive集群B
  • 跳转机一台

数据迁移需求

本次迁移数据100G,15亿条,数据流转方向从集群A经过跳转机到集群B,通过HDFS拉取和重新建表导入的方式完成数据库迁移。

迁移过程记录

- 当前操作在集群A

  1. 通过执行desc formatted,查看并记录数据库的:①存储位置,②文件存储压缩格式,③表字段;
  2. 对迁移的数据库执行count(*)操作,记录数据量,整体把握,最后做校验;

- 当前操作在跳转机

  1. 获取1.②位置之后,通过hdfs hds -du -h命令检查原始表数据在HDFS中的存储大小,确认是否能拉取到跳转机;
  2. 执行df -h检查跳转机可用存储空间,执行hdfs dfs -get命令,将存储的数据库源文件从集群A的HDFS拉取到跳转机本地;
  3. 执行ls | wc -l命令,检查拉取的数据库源文件数量,此步骤操作是为了校验文件数量;
  4. 如果不是压缩存储的文件,比如CSV,请执行head命令,查看源文件首行是否包含表字段,如果包含表字段,需要在建表时添加TBLPROPERTIES ('skip.header.line.count'='1');
  5. 执行hdfs dfs -put命令,将数据库源文件上传至集群B的HDFS,并执行hdfs hds -du -h检查存储大小是否一致,请提前mkdir准备好存储目录;

- 当前操作在集群B

  1. 根据1.③编辑建表语句并执行,根据压缩存储格式的不同,MapReduce在执行时的输入输出结果也不同;
不指定格式
InputFormatorg.apache.hadoop.hive.ql.io.RCFileInputFormat
OutputFormatorg.apache.hadoop.hive.ql.io.RCFileOutputFormat
指定TEXTFILE格式
InputFormatorg.apache.hadoop.mapred.TextInputFormat
OutputFormatorg.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat

本次迁移方案数据源文件为.snappy.parquet压缩存储格式,新建的表为TEXTFILE格式,指定了分隔符为,;

  1. 通过beeline执行LOAD DATA INPATH 'hdfs location' into table table_name命令,将HDFS中的数据源文件导入Hive表,至此完成迁移;
  2. 若对存储格式在后续有新的需求,可以在完成导入后,通过创建新的附带存储格式的表,再执行insert overwrite table table_name_new select * from table_name_old;命令,完成Hive存储格式的转换;
  3. 对于数据完整性、一致性的考虑:可以在完成后再次执行count(*),校验数据量,此方法是为了避免出现因格式不同,忽略CSV首行字段问题,或者建表语句错误,剔除了有效数据导致数据缺失的危险行为。
http://www.15wanjia.com/news/32057.html

相关文章:

  • 黄山网站优化上海网络推广专员
  • 专业手机网站制作公司微信如何投放广告
  • 泉州网站制作多少钱seo免费诊断电话
  • 去哪里可以做网站东莞建设企业网站
  • 同江佳木斯网站制作东营网站建设制作
  • 只买域名不建网站化妆品软文推广范文
  • 微信公众号怎么做编辑整站优化的公司
  • 网页设计师都在什么网站上面找素材广东省自然资源厅
  • 网站的费用可以做无形资产seo免费推广软件
  • 有做货 物的网站吗推广平台免费b2b网站大全
  • 商标注册查询网址关键词优化需要从哪些方面开展?
  • 网站维护费网页制作三大软件
  • bootstrap做网站百度手机网页版
  • 苏州网站建设渠道西安网站关键词排名
  • 客户网站建设公司如何自己做网络推广
  • 凤阳做网站热搜关键词查询
  • 陇南网站制作营销型网站策划书
  • 校园网站设计代码建设网站的网站首页
  • 规范机关单位网站建设上海百度
  • 焦作网站建设设计百度网盘app官网
  • dreameaver注册用户网站怎么做厦门seo关键词排名
  • 淘宝客推广怎么做网站备案外呼系统电销
  • 个人网站做得优秀的网站推广的主要方式
  • 北京响应式网站建设报价雅虎搜索引擎入口
  • 如何制作社交网站爱站网关键词查询网站
  • 海淀商城网站建设湖南长沙今日疫情
  • 网站图片宽度厦门网站优化
  • 营销网站定制开网站需要什么流程
  • 开发网站类型百度推广的方式有哪些
  • 营销型网站建设企业0元入驻的电商平台