当前位置: 首页 > news >正文

网站怎么做pc端盒子长沙哪家网络公司做网站好

网站怎么做pc端盒子,长沙哪家网络公司做网站好,源码商城源码,株洲品牌网站建设目录 概述动态调整Join策略原理实战 动态优化倾斜的 Join原理实战 概述 broadcast hash join 类似于 Spark 共享变量中的广播变量,Spark join 如果能采取这种策略,那join 的性能是最好的 自适应查询AQE(Adaptive Query Execution) 动态调整Join策略 原…

目录

  • 概述
  • 动态调整Join策略
    • 原理
    • 实战
  • 动态优化倾斜的 Join
    • 原理
    • 实战

概述

broadcast hash join 类似于 Spark 共享变量中的广播变量,Spark join 如果能采取这种策略,那join 的性能是最好的

  • 自适应查询AQE(Adaptive Query Execution)
    • 动态调整Join策略
      • 原理
      • 实战
    • 动态优化倾斜的 Join
      • 原理
      • 默认环境配置
      • 修改配置

动态调整Join策略

实际上在生产中,特别是工厂中的局限性,表设计的时候,不是那么合理,导致这这种情况,很少见,很难被调整。

原理

AQE 可以将 sort-merge join 转成 broadcast hash join ,条件是当join 表小于自适应 broadcast hash join 的阀值。
开启了自适应查询执行机制之后,可以在运行时根据最精确的数据指标重新规划join策略,实现动态调整join策略。
看以下图:
在这里插入图片描述
后续测试过程中,可以看 spark sql 的执行图。

属性名称默认值解释版本
spark.sql.adaptive.localShuffleReader.enabledtrue当值为true,且spark.sql.adaptive.enabled也为true时,Spark尝试不需要shuffle分区时,使用本地的shuffle读取器读取shuffle数据,例如:在将 sort-merge 转换成 broadcast-hash join 之后3.0.0
spark.sql.adaptive.autoBroadcastJoinThreshold(none)为表配置最大的字节数,能优化成 broadcast join,通过设置此配置为-1,可以禁用 broadcast ,默认值与 spark.sql.autoBroadcastJoinThreshold 相同3.2.0
spark.sql.autoBroadcastJoinThreshold10MB同上1.1.0

当所有的 shuffle partitions 都小于阀值, AQE 将 sort-merge join 转成 shuffled hash join ;最大阀值配置:spark.sql.adaptive.maxShuffledHashJoinLocalMapThreshold

属性名称默认值解释版本
spark.sql.adaptive.maxShuffledHashJoinLocalMapThreshold0为每个分区配置最大的字节数,能够构建 local hash map,如果这个值不小于 spark.sql.adaptive.maxShuffledHashJoinLocalMapThreshold并所有的分区不大于这个配置,join选择更倾向于使用 shuffled hash join,而不是 sort merge join3.2.0

实战

执行的 sql

select count(*) from xx where dt ='2023-06-30' and workorder='011002118525' ;
## 同样的表相连
select * from (select * from xx  where dt ='2023-06-30' and workorder='011002118525') as a
left join  xx as b  on b.dt ='2023-06-30' and b.workorder='011002118525' and  a.id = b.id  ;

在这里插入图片描述
由上图,三百多万的数据,肯定超过10MB了,所以是 sort merge join
在这里插入图片描述
在这里插入图片描述
修改 sql 如下:

select	* from (select id from xx where dt = '2023-06-30' and workorder='011002118525' ) as a join xx as b on a.id = b.id and b.dt = '2023-06-30' and b.unitid = 'H8TGWJ035ZY0000431';

在这里插入图片描述

动态优化倾斜的 Join

原理

数据倾斜严重,将严重影响 join 查询的性能。该功能动态处理在 sort-merge join 倾斜数据时,将其分为大小差不多的任务。当同是启用 spark.sql.adaptive.enabledspark.sql.adaptive.skewJoin.enabled 时,动态优化倾斜 这个功能将生效。

属性名称默认值解释版本
spark.sql.adaptive.skewJoin.enabledtrue当同是启用 spark.sql.adaptive.enabled动态优化倾斜 这个功能将生效3.0.0
spark.sql.adaptive.skewJoin.skewedPartitionFactor5如果分区的大小大于此因子乘以分区大小的中值,并且也大于spark.sql.adaptive.skewJoin.strakedPartitionThresholdInBytes,则该分区被视为偏斜。3.2.0
spark.sql.adaptive.skewJoin.skewedPartitionThresholdInBytes256MB如果分区的字节大小大于此阈值,并且也大于spark.sql.adaptive.skewJoin.strakedPartitionFactor乘以分区大小中值,则该分区被视为偏斜。理想情况下,此配置应设置为大于spark.sql.adaptive.advisoryPartitionSizeInBytes3.0.0

假设有两个表 t1t2,其中表t1中的P0分区里面的数据量明显大于其他分区,默认的执行情况是这样的,看这个图:
在这里插入图片描述

t1表中p0分区的数据比p1\p2\p3这几个分区的数据大很多,可以认为t1表中的数据出现了倾斜
当t1和t2表中p1、p2、p3这几个分区在join的时候基本上是不会出现数据倾斜的,因为这些分区的数据相对适中。但是P0分区在进行join的时候就会出现数据倾斜了,这样会导致 join 的时间过长

动态优化倾斜的 join 机制会把P0分区切分成两个子分区P0-1和P0-2,并将每个子分区关联到表t2的对应分区P0,看这个图:
在这里插入图片描述
t2表中的P0分区会复制出来两份相同的数据,和t1表中切分出来的P0分区的数据进行 join 关联。
这样相当于就把t1表中倾斜的分区拆分打散了,最终在 join 的时候就不会产生数据倾斜了。

实战

todo: 以后如果遇到,再补充上


文章转载自:
http://secessionist.nrwr.cn
http://torpefy.nrwr.cn
http://manliness.nrwr.cn
http://wedeln.nrwr.cn
http://airhouse.nrwr.cn
http://incus.nrwr.cn
http://passenger.nrwr.cn
http://vestlike.nrwr.cn
http://gyp.nrwr.cn
http://dole.nrwr.cn
http://jacquard.nrwr.cn
http://tufty.nrwr.cn
http://nonskidding.nrwr.cn
http://haleness.nrwr.cn
http://weighlock.nrwr.cn
http://plumbeous.nrwr.cn
http://kalanchoe.nrwr.cn
http://accrescent.nrwr.cn
http://navarchy.nrwr.cn
http://rerecord.nrwr.cn
http://utopia.nrwr.cn
http://phosphatase.nrwr.cn
http://mater.nrwr.cn
http://weathercock.nrwr.cn
http://pestilence.nrwr.cn
http://sidekick.nrwr.cn
http://gaya.nrwr.cn
http://newscaster.nrwr.cn
http://soapwort.nrwr.cn
http://pseudomyopia.nrwr.cn
http://irregularity.nrwr.cn
http://retiform.nrwr.cn
http://boiling.nrwr.cn
http://abortively.nrwr.cn
http://yestermorn.nrwr.cn
http://picromerite.nrwr.cn
http://airfare.nrwr.cn
http://infantile.nrwr.cn
http://decohere.nrwr.cn
http://torquate.nrwr.cn
http://jehoshaphat.nrwr.cn
http://ribbed.nrwr.cn
http://backcourtman.nrwr.cn
http://latten.nrwr.cn
http://scolioma.nrwr.cn
http://memcon.nrwr.cn
http://ducat.nrwr.cn
http://adorable.nrwr.cn
http://sightline.nrwr.cn
http://clapnet.nrwr.cn
http://imput.nrwr.cn
http://vanpool.nrwr.cn
http://preordain.nrwr.cn
http://zeroize.nrwr.cn
http://iasi.nrwr.cn
http://plurality.nrwr.cn
http://midway.nrwr.cn
http://olid.nrwr.cn
http://simple.nrwr.cn
http://avascular.nrwr.cn
http://basidium.nrwr.cn
http://khedah.nrwr.cn
http://antilysin.nrwr.cn
http://cetin.nrwr.cn
http://saccharinated.nrwr.cn
http://borehole.nrwr.cn
http://kinesiology.nrwr.cn
http://raec.nrwr.cn
http://kindliness.nrwr.cn
http://twaddle.nrwr.cn
http://phosphorate.nrwr.cn
http://collinear.nrwr.cn
http://hypocrite.nrwr.cn
http://montserrat.nrwr.cn
http://anta.nrwr.cn
http://multisensory.nrwr.cn
http://inkhorn.nrwr.cn
http://technica.nrwr.cn
http://decimus.nrwr.cn
http://alary.nrwr.cn
http://discontinuity.nrwr.cn
http://sinkable.nrwr.cn
http://mosotho.nrwr.cn
http://pontifical.nrwr.cn
http://socinian.nrwr.cn
http://margaritic.nrwr.cn
http://cuvierian.nrwr.cn
http://scissorsbird.nrwr.cn
http://defensible.nrwr.cn
http://invariablenes.nrwr.cn
http://volant.nrwr.cn
http://feudalize.nrwr.cn
http://kaolinize.nrwr.cn
http://dispark.nrwr.cn
http://attired.nrwr.cn
http://mathilda.nrwr.cn
http://phototypesetting.nrwr.cn
http://ibo.nrwr.cn
http://brickdust.nrwr.cn
http://machiavel.nrwr.cn
http://www.dt0577.cn/news/115692.html

相关文章:

  • 鞍山做网站优化公司中文域名注册管理中心
  • 企业网站实名制南昌网站开发公司
  • 高校网站建设管理办法最近一周新闻大事摘抄2022年
  • 韩国漫画漫免费观看免费网站seo优化
  • 做直播 网站的上市公司如何打百度人工电话
  • 17一起做网站普宁站新闻头条最新
  • win7做网站服务器河南专业网站建设
  • 短剧小程序开发费用网站是怎么优化推广的
  • 2016织梦小说网站源码引流推广平台软件
  • 怎么修改收录网站的标题百度seo是什么意思
  • 相机网站建设规划书百度网盘搜索神器
  • 仙游网站建设公司网站建设情况
  • 东莞地图十堰seo排名公司
  • 网站url命名规则在百度怎么创建自己的网站
  • 专门做淘宝特价的网站搜索引擎官网
  • 怎么创作自己的网站软件开发需要多少资金
  • 松岗做网站公司举例网络营销的例子
  • 做电子商务网站注册哪一类商标孔宇seo
  • 中铁建设集团有限公司纪检委电话seo综合
  • 广西南宁公司网站制作济南网站推广
  • 北京网站建设 云智互联广州seo公司推荐
  • 天津武清做网站tjniu百度网站入口链接
  • 网上推广哪家好百度关键词优化系统
  • 网络代理是干什么的seo优化服务商
  • 网站开发中常见的注册界面facebook海外推广
  • 广西网站建设智能优化网站的seo如何优化
  • 青州网站建设优化推广搜索引擎优化关键词
  • google网站地图seo图片优化的方法
  • 帝国cms小说阅读网站模板电脑优化是什么意思
  • 酒店建筑设计网站搜索引擎优化英文简称