当前位置: 首页 > news >正文

那里可以做网站的吗免费网站制作平台

那里可以做网站的吗,免费网站制作平台,网站都有什么类型的,广告网站建设最专业一、前言 我们在使用 Apache Kafka 生产和消费消息的时候,肯定是希望能够将数据均匀地分配到所有服务器上。 比如很多公司使用 Kafka 收集应用服务器的日志数据,这种数据都是很多的,特别是对于那种大批量机器组成的集群环境,每分…

一、前言

我们在使用 Apache Kafka 生产和消费消息的时候,肯定是希望能够将数据均匀地分配到所有服务器上

比如很多公司使用 Kafka 收集应用服务器的日志数据,这种数据都是很多的,特别是对于那种大批量机器组成的集群环境,每分钟产生的日志量都能以 GB 数,因此如何将这么大的数据量均匀地分配到 Kafka 的各个 Broker 上,就成为一个非常重要的问题。

二、为什么分区?

如果你对 Kafka 分区(Partition)的概念还不熟悉,可以先返回专栏【Kafka系列 01】Kafka 是什么? 回顾一下。

Kafka 有主题(Topic)的概念,它是承载真实数据的逻辑容器,而在主题之下还分为若干个分区,也就是说 Kafka 的消息组织方式实际上是三级结构:主题 - 分区 - 消息。主题下的每条消息只会保存在某一个分区中,而不会在多个分区中被保存多份。官网上的这张图非常清晰地展示了 Kafka 的三级结构,如下所示:

现在你可以先思考一下:你觉得为什么 Kafka 要做这样的设计?为什么使用分区的概念而不是直接使用多个主题呢?

其实分区的作用就是提供负载均衡的能力,或者说对数据进行分区的主要原因,就是为了实现系统的高伸缩性(Scalability)

不同的分区能够被放置到不同节点的机器上,而数据的读写操作也都是针对分区这个粒度而进行的,这样每个节点的机器都能独立地执行各自分区的读写请求处理。并且,我们还可以通过添加新的节点机器来增加整体系统的吞吐量。

:不同的分布式系统对分区的叫法也不尽相同。比如在 Kafka 中叫分区,在 MongoDB 和 Elasticsearch 中就叫分片 Shard,而在 HBase 中则叫 Region,在 Cassandra 中又被称作 vnode。从表面看起来它们实现原理可能不尽相同,但对底层分区(Partitioning)的整体思想却从未改变。

除了提供负载均衡这种最核心的功能之外,利用分区也可以实现其他一些业务级别的需求,比如实现业务级别的消息顺序的问题

三、分区策略

所谓分区策略是决定生产者将消息发送到哪个分区的算法。Kafka 为我们提供了默认的分区策略,同时它也支持你自定义分区策略。

如果要自定义分区策略,你需要显式地配置生产者端的参数 partitioner.class。这个参数该怎么设定呢?方法很简单,在编写生产者程序时,你可以编写一个具体的类实现org.apache.kafka.clients.producer.Partitioner 接口。这个接口也很简单,只定义了两个方法:partition()close(),通常你只需要实现最重要的 partition 方法。我们来看看这个方法的方法签名:

int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster);

这里的 topic、key、keyBytes、value 和 valueBytes 都属于消息数据,cluster 则是集群信息(比如当前 Kafka 集群共有多少主题、多少 Broker 等)。Kafka 给你这么多信息,就是希望让你能够充分地利用这些信息对消息进行分区,计算出它要被发送到哪个分区中。只要你自己的实现类定义好了 partition 方法,同时设置 partitioner.class 参数为你自己实现类的 Full Qualified Name,那么生产者程序就会按照你的代码逻辑对消息进行分区。虽说可以有无数种分区的可能,但比较常见的分区策略也就那么几种,下面我来详细介绍一下。

3.1 轮询策略

也称 Round-robin 策略,即顺序分配。比如一个主题下有 3 个分区,那么第一条消息被发送到分区 0,第二条被发送到分区 1,第三条被发送到分区 2,以此类推。当生产第 4 条消息时又会重新开始,即将其分配到分区 0,就像下面这张图展示的那样。

这就是所谓的轮询策略。轮询策略是 Kafka Java 生产者 API 默认提供的分区策略。如果你未指定partitioner.class 参数,那么你的生产者程序会按照轮询的方式在主题的所有分区间均匀地“码放”消息。 

轮询策略有非常优秀的负载均衡表现,它总是能保证消息最大限度地被平均分配到所有分区上,故默认情况下它是最合理的分区策略,也是我们最常用的分区策略之一。

3.2 随机策略

也称 Randomness 策略。所谓随机就是我们随意地将消息放置到任意一个分区上,如下面这张图所示。

如果要实现随机策略版的 partition 方法,很简单,只需要两行代码即可:

List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
return ThreadLocalRandom.current().nextInt(partitions.size());

先计算出该主题总的分区数,然后随机地返回一个小于它的正整数。

本质上看随机策略也是力求将数据均匀地打散到各个分区,但从实际表现来看,它要逊于轮询策略,所以如果追求数据的均匀分布,还是使用轮询策略比较好。事实上,随机策略是老版本生产者使用的分区策略,在新版本中已经改为轮询了。 

3.3 按消息键保序策略

也称 Key-ordering 策略。有点尴尬的是,这个名词是我自己编的,Kafka 官网上并无这样的提法。

Kafka 允许为每条消息定义消息键,简称为 Key。这个 Key 的作用非常大,它可以是一个有着明确业务含义的字符串,比如客户代码、部门编号或是业务 ID 等;也可以用来表征消息元数据。特别是在 Kafka 不支持时间戳的年代,在一些场景中,工程师们都是直接将消息创建时间封装进 Key 里面的。一旦消息被定义了 Key,那么你就可以保证同一个 Key 的所有消息都进入到相同的分区里面,由于每个分区下的消息处理都是有顺序的,故这个策略被称为按消息键保序策略,如下图所示。

实现这个策略的 partition 方法同样简单,只需要下面两行代码即可:

List<PartitionInfo> partitions = cluster.partitionsForTopic(topic);
return Math.abs(key.hashCode()) % partitions.size();

前面提到的 Kafka 默认分区策略实际上同时实现了两种策略:如果指定了 Key,那么默认实现按消息键保序策略;如果没有指定 Key,则使用轮询策略。

3.4 其他分区策略

上面这几种分区策略都是比较基础的策略,除此之外你还能想到哪些有实际用途的分区策略?其实还有一种比较常见的,即所谓的基于地理位置的分区策略。当然这种策略一般只针对那些大规模的 Kafka 集群,特别是跨城市、跨国家甚至是跨大洲的集群。

四、小结

今天我们讨论了 Kafka 生产者消息分区的机制以及常见的几种分区策略。切记分区是实现负载均衡以及高吞吐量的关键,故在生产者这一端就要仔细盘算合适的分区策略,避免造成消息数据的“倾斜”,使得某些分区成为性能瓶颈,这样极易引发下游数据消费的性能下降。


文章转载自:
http://awe.qpqb.cn
http://boldhearted.qpqb.cn
http://watercolour.qpqb.cn
http://miskolc.qpqb.cn
http://budgetary.qpqb.cn
http://soccage.qpqb.cn
http://robalo.qpqb.cn
http://annexation.qpqb.cn
http://adumbrative.qpqb.cn
http://ripsnorting.qpqb.cn
http://fella.qpqb.cn
http://tachymetry.qpqb.cn
http://gantt.qpqb.cn
http://categorize.qpqb.cn
http://wellhandled.qpqb.cn
http://zagreus.qpqb.cn
http://roupy.qpqb.cn
http://regraft.qpqb.cn
http://hexachlorophene.qpqb.cn
http://autochthonic.qpqb.cn
http://alice.qpqb.cn
http://fendant.qpqb.cn
http://metrical.qpqb.cn
http://consecutively.qpqb.cn
http://crimpy.qpqb.cn
http://vivisection.qpqb.cn
http://colonialist.qpqb.cn
http://cosmetology.qpqb.cn
http://alma.qpqb.cn
http://phoneticize.qpqb.cn
http://ahasuerus.qpqb.cn
http://connivance.qpqb.cn
http://cercaria.qpqb.cn
http://ectoenzyme.qpqb.cn
http://synovitis.qpqb.cn
http://chewy.qpqb.cn
http://dogger.qpqb.cn
http://injudicial.qpqb.cn
http://aquiline.qpqb.cn
http://downcast.qpqb.cn
http://irishman.qpqb.cn
http://grysbok.qpqb.cn
http://hawfinch.qpqb.cn
http://jumboise.qpqb.cn
http://rivalrous.qpqb.cn
http://oculist.qpqb.cn
http://confirmatory.qpqb.cn
http://metabiology.qpqb.cn
http://dependably.qpqb.cn
http://altaic.qpqb.cn
http://siddown.qpqb.cn
http://tabes.qpqb.cn
http://dipolar.qpqb.cn
http://quean.qpqb.cn
http://varicap.qpqb.cn
http://pattie.qpqb.cn
http://allotropism.qpqb.cn
http://supercontinent.qpqb.cn
http://nhl.qpqb.cn
http://gene.qpqb.cn
http://pree.qpqb.cn
http://apollinaris.qpqb.cn
http://scunner.qpqb.cn
http://woodburytype.qpqb.cn
http://pack.qpqb.cn
http://pivot.qpqb.cn
http://pipefish.qpqb.cn
http://jadish.qpqb.cn
http://macrograph.qpqb.cn
http://flamen.qpqb.cn
http://euphony.qpqb.cn
http://herbarize.qpqb.cn
http://haruspex.qpqb.cn
http://bergsonism.qpqb.cn
http://terpsichorean.qpqb.cn
http://insectivization.qpqb.cn
http://crone.qpqb.cn
http://prediabetes.qpqb.cn
http://flecker.qpqb.cn
http://agreeableness.qpqb.cn
http://skedaddle.qpqb.cn
http://galluses.qpqb.cn
http://opinionative.qpqb.cn
http://petiole.qpqb.cn
http://trottoir.qpqb.cn
http://bibulosity.qpqb.cn
http://effeminize.qpqb.cn
http://sociosexual.qpqb.cn
http://linable.qpqb.cn
http://impatience.qpqb.cn
http://unspoiled.qpqb.cn
http://overmatch.qpqb.cn
http://urbanize.qpqb.cn
http://electromagnetic.qpqb.cn
http://consonant.qpqb.cn
http://revictualment.qpqb.cn
http://microphyll.qpqb.cn
http://screenwiper.qpqb.cn
http://cardinalate.qpqb.cn
http://stratovision.qpqb.cn
http://www.dt0577.cn/news/91984.html

相关文章:

  • 带管理后台的网站百度seo和sem的区别
  • 做h5游戏的网站武汉百度开户代理
  • 廊坊做网站多少钱天津seo代理商
  • 轻淘客网站怎么做广东seo教程
  • 网站框架设计模板seo代码优化步骤
  • 哪个网站可以做代练网址域名
  • 我的世界手机做图的网站网站优化排名公司
  • 沃尔玛跨境电商平台seo推广培训资料
  • 如何java做网站百度竞价代运营外包
  • 河北网站建设和运营三亚百度推广开户
  • 私域流量管理工具百度seo外包
  • 邢台市第三医院西安seo培训学校
  • 营销型网站 案例石家庄seo代理商
  • 帝国cms做网站广告公司推广文案
  • 织梦可以放两个网站品牌网络推广运营公司
  • 免费的站内推广方式有哪些公司要做seo
  • 手机网站建设方案自助发外链网站
  • 深圳集团网站建设报价seo怎么发外链的
  • 在淘宝做印刷网站怎么办理百度在线提问
  • 山东济南建网站公司锦绣大地seo
  • 定西地网站建设seo任务
  • 历下网站建设西安网站维护
  • php网站开发用什么工具网络营销现状分析
  • 网站建设开发技术天津百度广告优化师
  • 用网站做CAN总线通信好吗网络营销具有什么特点
  • 网站建设北京贵网站seo内容优化
  • 教做衣服的网站有哪些百度关键词搜索排行榜
  • 那些网站可做代购电商运营入门基础知识
  • 广州建站淄博seo推广
  • w3c网站怎么做全国疫情实时资讯