当前位置: 首页 > news >正文

丰台体育馆网站建设百度推广点击软件

丰台体育馆网站建设,百度推广点击软件,网页游戏排行榜3d,网站开发计入什么科目Flume的三大核心组件: Source:数据源 Channel:临时存储数据的管道 Sink:目的地 Source:数据源:通过source组件可以指定让Flume读取哪里的数据,然后将数据传递给后面的 channel Flume内置支持读…

Flume的三大核心组件:
Source:数据源
Channel:临时存储数据的管道
Sink:目的地

Source:数据源:通过source组件可以指定让Flume读取哪里的数据,然后将数据传递给后面的
channel

Flume内置支持读取很多种数据源,基于文件、基于目录、基于TCP\UDP端口、基于HTTP、Kafka的等等、并且他也是支持自定义的

常用的数据源:

1) Exec Source:实现文件监控,可以实时监控文件中的新增内容,类似于linux中的tail -f 效果。
        在这需要注意 tail -F 和 tail -f 的区别
        tail -F
        等同于–follow=name --retry,根据文件名进行追踪,并保持重试,即该文件被删除或改后,如果再次创建相同的文件名,会继续追踪
        1tail -f
        等同于–follow=descriptor,根据文件描述符进行追踪,当文件改名或被删除,追踪停止
在实际工作中我们的日志数据一般都会通过log4j记录,log4j产生的日志文件名称是固定的,每天定时给文件重命名
        假设默认log4j会向access.log文件中写日志,每当凌晨0点的时候,log4j都会对文件进行重命名,在access后面添加昨天的日期,然后再创建新的access.log记录当天的新增日志数据。
这个时候如果想要一直监控access.log文件中的新增日志数据的话,就需要使用tail -F
2)NetCat TCP/UDP Source: 采集指定端口(tcp、udp)的数据,可以读取流经端口的每一行数据
3)Spooling Directory Source:采集文件夹里新增的文件
4)Kafka Source:从Kafka消息队列中采集数据

其中execsource 和 kafkasource在实际工作中是最常见的,可以满足大部分的数据采集需求。

Channel:接受Source发出的数据,可以把channel理解为一个临时存储数据的管道
Channel的类型有很多:内存、文件,内存+文件、JDBC等

1)Memory Channel:使用内存作为数据的存储
优点是效率高,因为就不涉及磁盘IO
缺点有两个
        1:可能会丢数据,如果Flume的agent挂了,那么channel中的数据就丢失了。
        2:内存是有限的,会存在内存不够用的情况
2)File Channel:使用文件来作为数据的存储
优点是数据不会丢失
缺点是效率相对内存来说会有点慢,但是这个慢并没有我们想象中的那么慢,
所以这个也是比较常用的一种channel。
3)Spillable Memory Channel:使用内存和文件作为数据存储,即先把数据存到内存中,如果内存中数据达到阈值再flush到文件中
优点:解决了内存不够用的问题。
缺点:还是存在数据丢失的风险

Sink:从Channel中读取数据并存储到指定目的地
Sink的表现形式有很多:打印到控制台、HDFS、Kafka等,

注意:Channel中的数据直到进入目的地才会被删除,当Sink写入目的地失败后,可以自动重写,
不会造成数据丢失,这块是有一个事务保证的。

常用的sink组件有:
1)Logger Sink:将数据作为日志处理,可以选择打印到控制台或者写到文件中,这个主要在测试的时候使用
2)HDFS Sink:将数据传输到HDFS中,这个是比较常见的,主要针对离线计算的场景
3)Kafka Sink:将数据发送到kafka消息队列中,这个也是比较常见的,主要针对实时计算场景,数据不落盘,实时传输,最后使用实时计算框架直接处理。

http://www.15wanjia.com/news/13235.html

相关文章:

  • 做淘宝客网站备案要怎么写网页制作费用大概多少
  • 苏州企业网站建站系统新东方烹饪培训学校
  • 网站建设做账域名信息查询网站
  • 温州移动互联网开发成都黑帽seo
  • 手机公司网站建设比较好的百度网盘下载慢怎么解决
  • 做网站的手机软件日本粉色iphone
  • 国内设计欣赏网站企业网络营销策划方案
  • 给公司做网站 优帮云上海百度推广官网
  • 网站搭建学什么软件做百度推广代运营有用吗
  • 网页和网站的关系什么叫友情链接
  • 淘宝可以到哪些网站做推广深圳seo优化培训
  • wordpress如何修改登录地址合肥seo培训
  • 网站建设的神秘网站
  • 重庆网站建设哪家专业单页网站制作教程
  • 杭州 手机网站百度站长工具seo
  • c 网站做微信支付功能seo团队
  • 婚庆网站开发背景什么关键词可以搜到那种
  • 个人网站公司网站区别经营区别今日新闻国际最新消息
  • 石家庄营销网站建设价格网站建设平台
  • 网站建设进度计划广州seo怎么做
  • 邢台专业做网站营销型网站定制
  • 旅游网站源码下载手机端关键词排名优化
  • 口碑好的网站建设收费下载班级优化大师app
  • 杭州做网站外包公司哪家好谷歌外链
  • 现在建个企业网站要多少钱百度搜索推广和信息流推广
  • 进入不wordpress前端seo是什么
  • 怎么用视频做网站首页百度网盘下载速度慢破解方法
  • 政务性网站制作公司营销网址
  • 南平网站建设wzjseo百度账号快速登录
  • 用wordpress建的网站信息流优化师简历怎么写