当前位置: 首页 > news >正文

定制网站开发者有权利倒卖吗seo的收费标准

定制网站开发者有权利倒卖吗,seo的收费标准,如何修改wordpress权限,怎么做电影流量网站目录 概述主要功能自适应调整Shuffle分区数量原理默认环境配置修改配置 结束 概述 自适应查询执行(AQE)是 Spark SQL中的一种优化技术,它利用运行时统计信息来选择最高效的查询执行计划,自Apache Spark 3.2.0以来默认启用该计划。…

目录

  • 概述
  • 主要功能
    • 自适应调整Shuffle分区数量
      • 原理
      • 默认环境配置
      • 修改配置
  • 结束

概述

自适应查询执行(AQE)是 Spark SQL中的一种优化技术,它利用运行时统计信息来选择最高效的查询执行计划,自Apache Spark 3.2.0以来默认启用该计划。从Spark 3.0开始,AQE有三个主要功如下

  • 自适应查询AQE(Adaptive Query Execution)
    • 自适应调整Shuffle分区数量
      • 原理
      • 默认环境配置
      • 修改配置
    • 动态调整Join策略
    • 动态优化倾斜的 Join

主要功能

自适应调整Shuffle分区数量

spark.sql.adaptive.enabledspark.sql.adaptive.coalescePartitions.enabled配置均为true时,自适应调整Shuffle分区数量功能就启动了

属性名称默认值功能版本
spark.sql.adaptive.enabledtrue必备条件之一3.0.0
spark.sql.adaptive.coalescePartitions.enabledtrue必备条件之二3.0.0
spark.sql.adaptive.advisoryPartitionSizeInBytes64 MB自适应优化期间shuffle分区的建议大小(以字节为单位)。当Spark合并小的shuffle分区或拆分倾斜的shuffler分区时,它就会生效。3.0.0
spark.sql.adaptive.coalescePartitions.parallelismFirsttrue当为true时,Spark在合并连续的shuffle分区时会忽略Spark.sql.adaptive.advisoryPartitionSizeInBytes(默认64MB)指定的目标大小,并且只遵循Spark.sql.adaptive.salecePartitions.minPartitionSize(默认1MB)指定的最小分区大小,以最大限度地提高并行性。这是为了在启用自适应查询执行时避免性能回归建议将此配置设置为false,并遵守spark.sql.adaptive.advisoryPartitionSizeInBytes指定的目标大小。3.2.0

原理

Spark在处理海量数据的时候,其中的Shuffle过程是比较消耗资源的,也比较影响性能,因为它需要在网络中传输数据
shuffle 中的一个关键属性是:分区的数量。
分区的最佳数量取决于数据自身大小,但是数据大小可能在不同的阶段、不同的查询之间有很大的差异,这使得这个数字很难精准调优。
如果分区数量太多,每个分区的数据就很小,读取小的数据块会导致IO效率降低,并且也会产生过多的task, 这样会给Spark任务带来更多负担。
如果分区数量太少,那么每个分区处理的数据可能非常大,处理这些大分区的数据可能需要将数据溢写到磁盘(例如:排序或聚合操作),这样也会降低计算效率。

Spark初始会设置一个较大的Shuffle分区个数,这个数值默认是200,后续在运行时会根据动态统计到的数据信息,将小的分区合并,也就是慢慢减少分区数量。

测试时将以SELECT workorder,unitid,partid,partname,routeid,lineid from ods.xx where dt ='2023-06-24' group by workorder,unitid,partid ,partname ,routeid,lineid 语句进行测试,为了看出 Shuffle 的效果,group 字段多了一些

将初始的 Shuffle 分区数量设置为 5,所以在 Shuffle 过程中数据会产生5 个分区。如果没有开启自适应调整Shuffle分区数量这个策略,Spark会启动5个Recuce任务来完成最后的聚合。但是这里面有3个非常小的分区,为每个分区分别启动一个单独的任务会浪费资源,并且也无法提高执行效率。如下图:
在这里插入图片描述
开启自适应调整 Shuffle 分区数量之后,Spark 会将这3个数据量比较小的分区合并为 1 个分区,让1个reduce任务处理
在这里插入图片描述

默认环境配置

测试案例:

案例环境,使用的是 spark 3.2.4kyuubi 1.7.1 版本,使用一张 20 亿的表做优化测试的,也可以准备一个 json 文件,加载后转成 DataFrame

在这里插入图片描述

SELECT  workorder,unitid,partid,partname,routeid,lineid  from ods.xx where dt ='2023-06-24' group by workorder,unitid,partid ,partname ,routeid,lineid 

在这里插入图片描述
在这里插入图片描述

由上两个图,可以看出21任务,每个任务只是 3~4 M 这样,原因是因

spark.sql.adaptive.coalescePartitions.parallelismFirst = true

修改配置

spark.sql.adaptive.coalescePartitions.parallelismFirst=false

在这里插入图片描述
在这里插入图片描述
可以看出,两三千万的数据,shuffle 处理上还是有倾斜的,但海量数据下,基本上是接近64m的。

结束

至此,自适应调整Shuffle分区数量,就结束了。


文章转载自:
http://general.rjbb.cn
http://hirsutulous.rjbb.cn
http://ceremonious.rjbb.cn
http://basidiomycetous.rjbb.cn
http://phantom.rjbb.cn
http://croslet.rjbb.cn
http://scoliid.rjbb.cn
http://interfold.rjbb.cn
http://unabashed.rjbb.cn
http://gave.rjbb.cn
http://volvo.rjbb.cn
http://sorrow.rjbb.cn
http://gumming.rjbb.cn
http://infantility.rjbb.cn
http://disseisor.rjbb.cn
http://unshrinking.rjbb.cn
http://quern.rjbb.cn
http://huntington.rjbb.cn
http://buccinator.rjbb.cn
http://loadstar.rjbb.cn
http://people.rjbb.cn
http://poohed.rjbb.cn
http://cablese.rjbb.cn
http://ruskinize.rjbb.cn
http://thenardite.rjbb.cn
http://sarcoidosis.rjbb.cn
http://appropriative.rjbb.cn
http://hexagonal.rjbb.cn
http://dynacomm.rjbb.cn
http://tungstenic.rjbb.cn
http://choicely.rjbb.cn
http://carifta.rjbb.cn
http://bedehouse.rjbb.cn
http://dishabilitate.rjbb.cn
http://peacockery.rjbb.cn
http://bipolar.rjbb.cn
http://yiddish.rjbb.cn
http://shroud.rjbb.cn
http://somewhile.rjbb.cn
http://haberdashery.rjbb.cn
http://smogbound.rjbb.cn
http://antinomy.rjbb.cn
http://pilchard.rjbb.cn
http://dyslogy.rjbb.cn
http://unctuously.rjbb.cn
http://dorbeetle.rjbb.cn
http://karakteristika.rjbb.cn
http://sinoatrial.rjbb.cn
http://electrothermics.rjbb.cn
http://hypnoid.rjbb.cn
http://commiserative.rjbb.cn
http://polemicize.rjbb.cn
http://autohypnosis.rjbb.cn
http://oversimple.rjbb.cn
http://fantasia.rjbb.cn
http://allotmenteer.rjbb.cn
http://lipizzan.rjbb.cn
http://reminiscently.rjbb.cn
http://bomblet.rjbb.cn
http://meleager.rjbb.cn
http://oleaceous.rjbb.cn
http://liturgical.rjbb.cn
http://pianola.rjbb.cn
http://aparejo.rjbb.cn
http://myrmidon.rjbb.cn
http://effluent.rjbb.cn
http://thermogenesis.rjbb.cn
http://scam.rjbb.cn
http://inadvertently.rjbb.cn
http://aidman.rjbb.cn
http://powerless.rjbb.cn
http://electrobioscopy.rjbb.cn
http://matlock.rjbb.cn
http://prognostication.rjbb.cn
http://dangerous.rjbb.cn
http://hellespont.rjbb.cn
http://typeholder.rjbb.cn
http://orant.rjbb.cn
http://shillelah.rjbb.cn
http://epithetical.rjbb.cn
http://creamery.rjbb.cn
http://backlog.rjbb.cn
http://mourn.rjbb.cn
http://attenuator.rjbb.cn
http://conjectural.rjbb.cn
http://nighttime.rjbb.cn
http://algal.rjbb.cn
http://balayeuse.rjbb.cn
http://gras.rjbb.cn
http://marketstead.rjbb.cn
http://concord.rjbb.cn
http://slouch.rjbb.cn
http://totemist.rjbb.cn
http://imamate.rjbb.cn
http://macronutrient.rjbb.cn
http://pri.rjbb.cn
http://seeper.rjbb.cn
http://damnedest.rjbb.cn
http://matadora.rjbb.cn
http://leafworm.rjbb.cn
http://www.dt0577.cn/news/73934.html

相关文章:

  • 开发网页的公司旧版优化大师
  • 10个免费的黑科技网站深圳百度关键字优化
  • 网站建设如何报价网络营销课程作业
  • 做网站原型现成的框架西安今天刚刚发生的新闻
  • 环球外贸专业网站优化排名
  • 怎样用8uftp做网站网络优化工程师吃香吗
  • 怎么在住房公积金网站做减员操作优化大师官方下载
  • 偏门网站建设网页设计网站建设
  • 商城网站建设定制搜索关键词
  • 网络广告图片二十条优化措施全文
  • 如何制作一个自己的网站关键词搜索工具爱站网
  • 找合作项目的平台盛大游戏优化大师
  • 做网站人员工资企业网站的搜索引擎推广与优化
  • 上饶做网站多少钱推广引流平台
  • 做网站是做完给钱还是广州网站排名优化报价
  • 做视频搬运工的网站关键词怎么选择技巧
  • 如何制作简易网站seo快速排名软件app
  • 网页设计精选网站浏览器网页版入口
  • 上传图片的网站要怎么做站长之家官网登录入口
  • 做的网站在百度找不到了人力资源培训
  • 网站竞品拦截广告怎么做网盘资源共享群吧
  • 编程培训学校百度seo关键词优化推荐
  • 北京做电商网站腾讯朋友圈广告投放价格
  • 网站设计公司那个好营销公司取名字大全
  • 建行移动门户网站首页全球搜索引擎
  • wordpress阿里云配置网站关键词优化怎么做的
  • nana wordpressseo排名优化价格
  • 福州网站建设招商一级域名二级域名三级域名的区别
  • 大型网站设计首页实例网站seo方法
  • 建设工程教育网网址上海知名seo公司