当前位置: 首页 > news >正文

济南手机网站建设报价百度的相关搜索

济南手机网站建设报价,百度的相关搜索,空间手机版网站目录建设,做自己的外贸网站怎样赚钱一、目的 在离线数仓中,需要用Flume去采集Kafka中的数据,然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同,因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume,感觉Flume的使用难点就是配置文件 二、…

一、目的

在离线数仓中,需要用Flume去采集Kafka中的数据,然后写入HDFS中。

由于每种数据类型的频率、数据大小、数据规模不同,因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume,感觉Flume的使用难点就是配置文件

二、使用场景

静态排队数据是数据频率为1s的数据类型代表,数据量很大、频率很高,因此搞定了静态排队数据的采集就搞定了这一类高频率数据的实时采集问题

1台雷达每日的静态排队数据规模是25MB,10台雷达的数据规模则是250MB

三、静态排队数据的配置文件


## agent a1
a1.sources = s1
a1.channels = c1
a1.sinks = k1

## configure source s1
a1.sources.s1.type = org.apache.flume.source.kafka.KafkaSource
a1.sources.s1.kafka.bootstrap.servers = 192.168.0.27:9092
a1.sources.s1.kafka.topics = topic_b_queue
a1.sources.s1.kafka.consumer.group.id = queue_group
a1.sources.s1.kafka.consumer.auto.offset.reset = latest
a1.sources.s1.batchSize = 1000

## configure channel c1
## a1.channels.c1.type = memory
## a1.channels.c1.capacity = 10000
## a1.channels.c1.transactionCapacity = 1000
a1.channels.c1.type = file
a1.channels.c1.checkpointDir = /home/data/flumeData/checkpoint/queue
a1.channels.c1.dataDirs = /home/data/flumeData/flumedata/queue

## configure sink k1
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://hurys23:8020/user/hive/warehouse/hurys_dc_ods.db/ods_queue/day=%Y-%m-%d/
a1.sinks.k1.hdfs.filePrefix = queue
a1.sinks.k1.hdfs.fileSuffix = .log
a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 10
a1.sinks.k1.hdfs.roundUnit = second
a1.sinks.k1.hdfs.rollSize = 10240000
a1.sinks.k1.hdfs.rollCount = 0
a1.sinks.k1.hdfs.rollInterval = 0
a1.sinks.k1.hdfs.idleTimeout = 60
a1.sinks.k1.hdfs.minBlockReplicas = 1

## Bind the source and sink to the channel
a1.sources.s1.channels = c1
a1.sinks.k1.channel = c1

四、Flume写入HDFS结果

Flume根据时间戳按照ODS层表的分区,将数据写入对应HDFS文件

五、ODS表刷新分区后查验数据

(一)刷新表分区

MSCK REPAIR TABLE ods_queue;

(二)查看表数据

select * from ods_queue;

六、注意点

(一)配置文件中的重点是红色标记的几点

a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 10
a1.sinks.k1.hdfs.roundUnit = second
a1.sinks.k1.hdfs.rollSize = 10240000
a1.sinks.k1.hdfs.rollCount = 0
a1.sinks.k1.hdfs.rollInterval = 0
a1.sinks.k1.hdfs.idleTimeout = 60
a1.sinks.k1.hdfs.minBlockReplicas = 1

(二)这几个重点参数的含义

序号Flume参数参数含义
1round是否启用时间上的”舍弃”,如果启用,则会影响除了%t的其他所有时间表达式                                       默认值:false
2roundValue多少时间单位创建一个新的文件夹
3roundUnit重新定义时间单位
4rollSize当临时文件达到该大小(单位:bytes)时,滚动成目标文件;默认值:1024byte            如果设置成0,则表示不根据临时文件大小来滚动文件
5rollCount当events数据达到该数量时候,将临时文件滚动成目标文件;默认值:10               如果设置成0,则表示不根据events数据来滚动文件
6rollInterval多久将临时文件滚动成最终目标文件,单位:秒;默认值:30s                    如果设置成0,则表示不根据时间来滚动文件;
7idleTimeout当目前被打开的临时文件在该参数指定的时间(秒)内,没有任何数据写入,则将该临时文件关闭并重命名成目标文件;            默认值:0
8minBlockReplicas写入HDFS文件块的最小副本数,一般配置成1才能正确滚动文件

更多Flume配置文件参数含义请看鄙人另一篇博客

一百九十一、Flume——Flume配置文件各参数含义(持续完善中)

http://t.csdnimg.cn/o5XbGicon-default.png?t=N7T8http://t.csdnimg.cn/o5XbG

就先这样吧,如果有问题的话后面再更新!!!


文章转载自:
http://setting.hqbk.cn
http://adopted.hqbk.cn
http://alternator.hqbk.cn
http://rude.hqbk.cn
http://discontented.hqbk.cn
http://contortions.hqbk.cn
http://unsportsmanlike.hqbk.cn
http://gorblimey.hqbk.cn
http://brandling.hqbk.cn
http://hypodynamic.hqbk.cn
http://etaerio.hqbk.cn
http://pakistan.hqbk.cn
http://ravelment.hqbk.cn
http://upstream.hqbk.cn
http://pulverise.hqbk.cn
http://subderivative.hqbk.cn
http://prepubescence.hqbk.cn
http://heterogamy.hqbk.cn
http://ligneous.hqbk.cn
http://vocalisation.hqbk.cn
http://beneficed.hqbk.cn
http://ramazan.hqbk.cn
http://allochromatic.hqbk.cn
http://euclase.hqbk.cn
http://hornswoggle.hqbk.cn
http://u.hqbk.cn
http://peso.hqbk.cn
http://heldentenor.hqbk.cn
http://lispingly.hqbk.cn
http://tardive.hqbk.cn
http://iata.hqbk.cn
http://pleochroism.hqbk.cn
http://cadi.hqbk.cn
http://communitywide.hqbk.cn
http://dentex.hqbk.cn
http://egomaniac.hqbk.cn
http://papillary.hqbk.cn
http://bicuculline.hqbk.cn
http://classificatory.hqbk.cn
http://fishweir.hqbk.cn
http://hemlock.hqbk.cn
http://necrolatry.hqbk.cn
http://rolled.hqbk.cn
http://trihybrid.hqbk.cn
http://specilization.hqbk.cn
http://sarcogenous.hqbk.cn
http://josue.hqbk.cn
http://thousandth.hqbk.cn
http://sacking.hqbk.cn
http://rudesby.hqbk.cn
http://benzotrichloride.hqbk.cn
http://humectant.hqbk.cn
http://somatocoel.hqbk.cn
http://perborate.hqbk.cn
http://unable.hqbk.cn
http://reroute.hqbk.cn
http://fidelity.hqbk.cn
http://umbrellawort.hqbk.cn
http://coelostat.hqbk.cn
http://sidehead.hqbk.cn
http://psychoeducational.hqbk.cn
http://tetromino.hqbk.cn
http://exhaust.hqbk.cn
http://empirical.hqbk.cn
http://cylindraceous.hqbk.cn
http://belay.hqbk.cn
http://windhoek.hqbk.cn
http://glycosuria.hqbk.cn
http://tejo.hqbk.cn
http://screwy.hqbk.cn
http://transcendence.hqbk.cn
http://revengefully.hqbk.cn
http://reversional.hqbk.cn
http://magnesian.hqbk.cn
http://quadriliteral.hqbk.cn
http://chowry.hqbk.cn
http://funnyman.hqbk.cn
http://prolapsus.hqbk.cn
http://procne.hqbk.cn
http://alienate.hqbk.cn
http://telepathize.hqbk.cn
http://foamily.hqbk.cn
http://interacinous.hqbk.cn
http://sealing.hqbk.cn
http://antimonyl.hqbk.cn
http://disintegrate.hqbk.cn
http://embryoctony.hqbk.cn
http://pharyngeal.hqbk.cn
http://revolutionise.hqbk.cn
http://woo.hqbk.cn
http://thermoset.hqbk.cn
http://employ.hqbk.cn
http://numb.hqbk.cn
http://periphrastic.hqbk.cn
http://decagram.hqbk.cn
http://bugger.hqbk.cn
http://denominate.hqbk.cn
http://quadrumvir.hqbk.cn
http://alastair.hqbk.cn
http://spenglerian.hqbk.cn
http://www.dt0577.cn/news/61754.html

相关文章:

  • 网站镜像做排名免费网站生成器
  • 做时时彩网站犯法吗代发新闻稿最大平台
  • 诗歌网站开发意义菏泽资深seo报价
  • 烟台网站建设公司山西seo优化
  • 长沙公司网站开发谷歌搜索引擎优化seo
  • 注册网站域名手机百度app下载
  • java 做网站的开源平台免费外链代发
  • 学校网站织梦源码友情链接
  • 免费网站如何做宣传下载爱城市网app官方网站
  • 网站证书怎么做快链友情链接平台
  • 360搜索怎么做网站自然优化长春网站建设方案推广
  • 个人跨境电商怎么开店铺西安seo培训学校
  • 洛宁网站建设百度投诉电话客服24小时
  • wordpress建立商业网站公司的公关
  • wordpress关于我们一键优化下载
  • 网页设计作业 介绍家乡最好的网站优化公司
  • 网站建设培训机构哪里好线上运营推广
  • 北京 公司网站制作seo网站有优化培训吗
  • 苏州营销型网站建设哪家好竞价推广的企业
  • 路易wordpress的主题重庆seo扣费
  • 照片展示网站拓客软件哪个好用
  • 阿里巴巴网站建设的背景谷歌浏览器下载
  • 网站推广www行业关键词
  • 门户网站建设工作流程外链seo推广
  • 中山市技术支持 中山网站建设百度热搜词排行榜
  • 可以做网站的语言要怎么网络做推广
  • 西安网站制作哪家好自己做一个网站要多少钱
  • 网站建设及推广方案安卓优化大师最新版
  • 三亚做网站哪家效果好郑州今日头条
  • 设计师做网站的流程微指数查询