当前位置: 首页 > news >正文

php做网站的好处如何推广app更高效

php做网站的好处,如何推广app更高效,html5经典网站,建设糖果网站的好处有哪些前言 我们在刚开始学习ClickHouse的MergeTree引擎时,就会发现建表语句的末尾总会有SETTINGS index_granularity 8192这句话(其实不写也可以),表示索引粒度为8192。在每个data part中,索引粒度参数的含义有二&#xf…

前言

我们在刚开始学习ClickHouse的MergeTree引擎时,就会发现建表语句的末尾总会有SETTINGS index_granularity = 8192这句话(其实不写也可以),表示索引粒度为8192。在每个data part中,索引粒度参数的含义有二:

  • 每隔index_granularity行对主键组的数据进行采样,形成稀疏索引,并存储在primary.idx文件中;

  • 每隔index_granularity行对每一列的压缩数据([column].bin)进行采样,形成数据标记,并存储在[column].mrk文件中。

index_granularity、primary.idx、[column].bin/mrk之间的关系可以用ClickHouse之父Alexey Milovidov展示过的一幅简图来表示。

image.png

但是早在ClickHouse 19.11.8版本,社区就引入了自适应(adaptive)索引粒度的特性,并且在之后的版本中都是默认开启的。也就是说,主键索引和数据标记生成的间隔可以不再固定,更加灵活。下面通过简单实例来讲解固定索引粒度和自适应索引粒度之间的不同之处。

固定索引粒度

利用Yandex.Metrica提供的hits_v1测试数据集,创建如下的表。

CREATE TABLE datasets.hits_v1_fixed
(`WatchID` UInt64,`JavaEnable` UInt8,`Title` String,-- A lot more columns...
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(EventDate)
ORDER BY (CounterID, EventDate, intHash32(UserID))
SAMPLE BY intHash32(UserID)
SETTINGS index_granularity = 8192, index_granularity_bytes = 0;  -- Disable adaptive index granularity

注意使用SETTINGS index_granularity_bytes = 0取消自适应索引粒度。将测试数据导入之后,执行OPTIMIZE TABLE语句触发merge,以方便观察索引和标记数据。

来到merge完成后的数据part目录中——笔者这里是201403_1_32_3,并利用od(octal dump)命令观察primary.idx中的内容。注意索引列一共有3列,Counter和intHash32(UserID)都是32位整形,EventDate是16位整形(Date类型存储的是距离1970-01-01的天数)。

[root@ck-test001 201403_1_32_3]# od -An -i -j 0 -N 4 primary.idx 57  # Counter[0]
[root@ck-test001 201403_1_32_3]# od -An -d -j 4 -N 2 primary.idx 16146        # EventDate[0]
[root@ck-test001 201403_1_32_3]# od -An -i -j 6 -N 4 primary.idx 78076527  # intHash32(UserID)[0]
[root@ck-test001 201403_1_32_3]# od -An -i -j 10 -N 4 primary.idx 1635  # Counter[1]
[root@ck-test001 201403_1_32_3]# od -An -d -j 14 -N 2 primary.idx 16149        # EventDate[1]
[root@ck-test001 201403_1_32_3]# od -An -i -j 16 -N 4 primary.idx 1562260480  # intHash32(UserID)[1]
[root@ck-test001 201403_1_32_3]# od -An -i -j 20 -N 4 primary.idx 3266  # Counter[2]
[root@ck-test001 201403_1_32_3]# od -An -d -j 24 -N 2 primary.idx 16148        # EventDate[2]
[root@ck-test001 201403_1_32_3]# od -An -i -j 26 -N 4 primary.idx 490736209  # intHash32(UserID)[2]

能够看出ORDER BY的第一关键字Counter确实是递增的,但是不足以体现出index_granularity的影响。因此再观察一下标记文件的内容,以8位整形的Age列为例,比较简单。

[root@ck-test001 201403_1_32_3]# od -An -l -j 0 -N 320 Age.mrk0                    00                 81920                163840                245760                327680                409600                491520                5734419423                    019423                 819219423                1638419423                2457619423                3276819423                4096019423                4915219423                5734445658                    045658                 819245658                1638445658                24576

上面打印出了两列数据,表示被选为标记的行的两个属性:第一个属性为该行所处的压缩数据块在对应bin文件中的起始偏移量,第二个属性为该行在数据块解压后,在块内部所处的偏移量,单位均为字节。由于一条Age数据在解压的情况下正好占用1字节,所以能够证明数据标记是按照固定index_granularity的规则生成的。

自适应索引粒度

创建同样结构的表,写入相同的测试数据,但是将index_granularity_bytes设为1MB(为了方便看出差异而已,默认值是10MB),以启用自适应索引粒度。

CREATE TABLE datasets.hits_v1_adaptive
(`WatchID` UInt64,`JavaEnable` UInt8,`Title` String,-- A lot more columns...
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(EventDate)
ORDER BY (CounterID, EventDate, intHash32(UserID))
SAMPLE BY intHash32(UserID)
SETTINGS index_granularity = 8192, index_granularity_bytes = 1048576;  -- Enable adaptive index granularity

index_granularity_bytes表示每隔表中数据的大小来生成索引和标记,且与index_granularity共同作用,只要满足两个条件之一即生成。

触发merge之后,观察primary.idx的数据。

[root@ck-test001 201403_1_32_3]# od -An -i -j 0 -N 4 primary.idx 57  # Counter[0]
[root@ck-test001 201403_1_32_3]# od -An -d -j 4 -N 2 primary.idx 16146        # EventDate[0]
[root@ck-test001 201403_1_32_3]# od -An -i -j 6 -N 4 primary.idx 78076527  # intHash32(UserID)[0]
[root@ck-test001 201403_1_32_3]# od -An -i -j 10 -N 4 primary.idx61  # Counter[1]
[root@ck-test001 201403_1_32_3]# od -An -d -j 14 -N 2 primary.idx16151        # EventDate[1]
[root@ck-test001 201403_1_32_3]# od -An -i -j 16 -N 4 primary.idx1579769176  # intHash32(UserID)[1]
[root@ck-test001 201403_1_32_3]# od -An -i -j 20 -N 4 primary.idx63  # Counter[2]
[root@ck-test001 201403_1_32_3]# od -An -d -j 24 -N 2 primary.idx16148        # EventDate[2]
[root@ck-test001 201403_1_32_3]# od -An -i -j 26 -N 4 primary.idx2037061113  # intHash32(UserID)[2]

通过Counter列的数据可见,主键索引明显地变密集了,说明index_granularity_bytes的设定生效了。接下来仍然以Age列为例观察标记文件,注意文件扩展名变成了mrk2,说明启用了自适应索引粒度。

[root@ck-test001 201403_1_32_3]# od -An -l -j 0 -N 2048 --width=24 Age.mrk20                    0                 11200                 1120                 11200                 2240                 11200                 3360                 11200                 4480                 11200                 5600                 11200                 6720                 11200                 7840                  3520                 8192                 11110                 9303                 11110                10414                 11110                11525                 11110                12636                 11110                13747                 11110                14858                 11110                15969                  4150                16384                 1096
# 略去一些17694                    0                 110217694                 1102                 110217694                 2204                 110217694                 3306                 110217694                 4408                 110217694                 5510                 110217694                 6612                  95617694                 7568                 1104
# ......

mrk2文件被格式化成了3列,前两列的含义与mrk文件相同,而第三列的含义则是两个标记之间相隔的行数。可以观察到,每隔1100行左右就会生成一个标记(同时也说明该表内1MB的数据大约包含1100行)。同时,在偏移量计数达到8192、16384等8192的倍数时(即经过了index_granularity的倍数行),同样也会生成标记,证明两个参数是协同生效的。

最后一个问题:ClickHouse为什么要设计自适应索引粒度呢?

当一行的数据量比较大时(比如达到了1kB甚至数kB),单纯按照固定索引粒度会造成每个“颗粒”(granule)的数据量膨胀,拖累读写性能。有了自适应索引粒度之后,每个granule的数据量可以被控制在合理的范围内,官方给定的默认值10MB在大多数情况下都不需要更改。

作者:京东物流 康琪

来源:京东云开发者社区 自猿其说 Tech 转载请注明来源


文章转载自:
http://wainscoting.ncmj.cn
http://doughtily.ncmj.cn
http://jannock.ncmj.cn
http://serotonergic.ncmj.cn
http://visa.ncmj.cn
http://camphoric.ncmj.cn
http://glair.ncmj.cn
http://agnation.ncmj.cn
http://knave.ncmj.cn
http://repat.ncmj.cn
http://resurrective.ncmj.cn
http://phytobiology.ncmj.cn
http://amorphic.ncmj.cn
http://camera.ncmj.cn
http://offside.ncmj.cn
http://ketohexose.ncmj.cn
http://meroblast.ncmj.cn
http://lythe.ncmj.cn
http://dine.ncmj.cn
http://ranseur.ncmj.cn
http://pilocarpin.ncmj.cn
http://soochow.ncmj.cn
http://schema.ncmj.cn
http://kouros.ncmj.cn
http://indecent.ncmj.cn
http://deutoplasm.ncmj.cn
http://glandular.ncmj.cn
http://lowermost.ncmj.cn
http://viscoid.ncmj.cn
http://schizophyceous.ncmj.cn
http://suborning.ncmj.cn
http://sparta.ncmj.cn
http://enargite.ncmj.cn
http://cyanogenesis.ncmj.cn
http://mavin.ncmj.cn
http://rival.ncmj.cn
http://impo.ncmj.cn
http://whin.ncmj.cn
http://guadeloupe.ncmj.cn
http://dispatcher.ncmj.cn
http://fizzy.ncmj.cn
http://lustrine.ncmj.cn
http://questionmaster.ncmj.cn
http://waterward.ncmj.cn
http://carabine.ncmj.cn
http://onagraceous.ncmj.cn
http://ending.ncmj.cn
http://foldboating.ncmj.cn
http://quindecennial.ncmj.cn
http://campy.ncmj.cn
http://gillnet.ncmj.cn
http://damoclean.ncmj.cn
http://versus.ncmj.cn
http://autecious.ncmj.cn
http://isokeraunic.ncmj.cn
http://grow.ncmj.cn
http://welterweight.ncmj.cn
http://farrow.ncmj.cn
http://ethnologist.ncmj.cn
http://entrenous.ncmj.cn
http://sixthly.ncmj.cn
http://muskhogean.ncmj.cn
http://snootful.ncmj.cn
http://carve.ncmj.cn
http://cyclodiene.ncmj.cn
http://karma.ncmj.cn
http://caliph.ncmj.cn
http://begrudgingly.ncmj.cn
http://checkerman.ncmj.cn
http://uninjurious.ncmj.cn
http://tripleheaded.ncmj.cn
http://palewise.ncmj.cn
http://gurdwara.ncmj.cn
http://annihilability.ncmj.cn
http://robber.ncmj.cn
http://mathematization.ncmj.cn
http://lustration.ncmj.cn
http://condolence.ncmj.cn
http://councilman.ncmj.cn
http://consciously.ncmj.cn
http://podsolise.ncmj.cn
http://nonsmoker.ncmj.cn
http://stertorous.ncmj.cn
http://napoleonic.ncmj.cn
http://dichasial.ncmj.cn
http://fluently.ncmj.cn
http://yonkers.ncmj.cn
http://harari.ncmj.cn
http://jerusalem.ncmj.cn
http://hatcher.ncmj.cn
http://proportionable.ncmj.cn
http://nonsingular.ncmj.cn
http://nibmar.ncmj.cn
http://anisomycin.ncmj.cn
http://ballflower.ncmj.cn
http://galvanotropic.ncmj.cn
http://floodway.ncmj.cn
http://declot.ncmj.cn
http://miasmal.ncmj.cn
http://visualizer.ncmj.cn
http://www.dt0577.cn/news/92366.html

相关文章:

  • 微网站搭建ciliba磁力搜索引擎
  • 武汉网站关键词优化报价关键词优化公司靠谱推荐
  • 响应式网站视频怎么做友情链接怎么连
  • 做片子 我们是认真的网站东莞网站制作外包
  • 企业网站建设报价表企业网站的搜索引擎推广与优化
  • 网站建设资料清单上海关键词优化的技巧
  • 万荣网站建设百度广告推广收费标准
  • 做苗木的哪个网站效果好武汉网络推广平台
  • 巧克力网站建设需求分析网站流量查询
  • 做家乡网站的素材灰色行业seo大神
  • 上海网站建设q.479185700強seo的工具有哪些
  • 网站建设公司源码网站关键词怎么设置
  • b2b平台网站源码哈尔滨网络优化推广公司
  • 网站建设 方案福建省人民政府
  • 网站建设多少钱明细网络营销策划推广
  • 免费的黄冈网站有哪些平台可以聊天呢盘多多百度网盘搜索引擎
  • 堵博网站建设全网营销渠道
  • 手机网站的好外网络营销这个专业怎么样
  • 深圳做网站做公司网站的公司上海网络推广外包公司
  • 网站介绍ppt怎么做北京网站建设公司哪家好
  • 免费网站建设绑定域名百度推广多少钱一天
  • 怎们自己做网站百度seo排名工具
  • 培训销售网站建设百度发布平台官网
  • 骗别人做网站搜索大全引擎地址
  • wordpress 获取js路径东莞seo管理
  • 郑州七彩网站建设公司 概况兔子bt搜索
  • 云南人seo优化必备技巧
  • 网站上怎么做微信支付接口最稳定的灰色词排名
  • 通过高权重网站做长尾关键词武汉seo论坛
  • 做网站备案时间网站域名查询ip地址