当前位置: 首页 > news >正文

营销网站 需求说明网店培训机构

营销网站 需求说明,网店培训机构,河北响应式网站建设平台,优设网的特点文章目录 (161)慢磁盘监控(162)小文件归档小文件过多的问题如何对小文件进行归档 参考文献 (161)慢磁盘监控 慢磁盘,是指写入数据时特别慢的一类磁盘。这种磁盘并不少见,当机器运行…

文章目录

  • (161)慢磁盘监控
  • (162)小文件归档
    • 小文件过多的问题
    • 如何对小文件进行归档
  • 参考文献

(161)慢磁盘监控

慢磁盘,是指写入数据时特别慢的一类磁盘。这种磁盘并不少见,当机器运行久了,跑任务跑的多了,磁盘的寿命到一定程度的时候,磁盘的读写性能自然就会退化,严重时就会出现写数据延迟的问题。

比如说,如果正常在HDFS上创建一个目录,只需要1s左右。但是你偶尔发现创建目录时超过了1分钟或者更久,但次数不多,就很有可能存在慢磁盘。

那怎么找到是哪块磁盘慢呢?

第一种方式是通过心跳未联系时间

一般出现慢磁盘现象,会影响到DataNode与NameNode之间的心跳。正常情况心跳时间间隔是3s。超过3s说明有异常。

第二种方式,是通过fio命令,测试磁盘的读写性能。

(1)顺序读测试

[atguigu@hadoop102 ~]# sudo yum install -y fio[atguigu@hadoop102 ~]# sudo fio -filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -rw=read -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=test_rRun status group 0 (all jobs):READ: bw=360MiB/s (378MB/s), 360MiB/s-360MiB/s (378MB/s-378MB/s), io=20.0GiB (21.5GB), run=56885-56885msec

结果显示,磁盘的总体顺序读速度为360MiB/s。

(2)顺序写测试

[atguigu@hadoop102 ~]# sudo fio -filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -rw=write -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=test_wRun status group 0 (all jobs):WRITE: bw=341MiB/s (357MB/s), 341MiB/s-341MiB/s (357MB/s-357MB/s), io=19.0GiB (21.4GB), run=60001-60001msec

结果显示,磁盘的总体顺序写速度为341MiB/s。

(3)随机写测试

[atguigu@hadoop102 ~]# sudo fio -filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -rw=randwrite -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=test_randwRun status group 0 (all jobs):WRITE: bw=309MiB/s (324MB/s), 309MiB/s-309MiB/s (324MB/s-324MB/s), io=18.1GiB (19.4GB), run=60001-60001msec

结果显示,磁盘的总体随机写速度为309MiB/s。

(4)混合随机读写:

[atguigu@hadoop102 ~]# sudo fio -filename=/home/atguigu/test.log -direct=1 -iodepth 1 -thread -rw=randrw -rwmixread=70 -ioengine=psync -bs=16k -size=2G -numjobs=10 -runtime=60 -group_reporting -name=test_r_w -ioscheduler=noopRun status group 0 (all jobs):READ: bw=220MiB/s (231MB/s), 220MiB/s-220MiB/s (231MB/s-231MB/s), io=12.9GiB (13.9GB), run=60001-60001msecWRITE: bw=94.6MiB/s (99.2MB/s), 94.6MiB/s-94.6MiB/s (99.2MB/s-99.2MB/s), io=5674MiB (5950MB), run=60001-60001msec

结果显示,磁盘的总体混合随机读写,读速度为220MiB/s,写速度94.6MiB/s。

随机读写会稍慢一些,这个是合理的,因为多了步磁盘寻址的过程,所以会多花些时间。

(162)小文件归档

小文件过多的问题

HDFS存储的小文件过多,会极大的影响数据搜索和读取的速度。

100个1K的文件块和100个128M的文件块,占用NN的内存是一样的。

因为NN在内存里会为每个文件块存储一份150byte大小的元数据。

所以在副本数为3的情况下,128个1M的文件块,在DN中占用存储空间是128 * 3M,在NN中占用128 * 150byte。

而1个128M的文件块,在DN中占用128*3M,在NN中占用1*150byte

看出问题了吧,虽然两种情况下占用的DN存储空间是一样的,但是小文件情况下,NN占用的内存飙升,关键是占用的这部分内存太过浪费了。

解决小文件的方法之一,就是 使用HAR文件来进行归档 。可以简单理解成,HAR会把小文件进行压缩,压缩成一个文件,放进一个文件块里。

压缩产生的HAR文件会被NameNode视为是一个整体,但是其内部仍然是多个小文件。但是在NameNode登记的时候,就会作为一个整体来登记了。

在这里插入图片描述

如何对小文件进行归档

接下来来做一个案例实操:

(1)需要启动YARN进程

[atguigu@hadoop102 hadoop-3.1.3]$ start-yarn.sh

启动yarn进程是因为这个压缩归档的过程其实是一个MR处理,因此必须要开启YARN来做调度。

(2)归档文件

把/input目录里面的所有文件归档成一个叫input.har的归档文件,并把归档后文件存储到/output路径下。

[atguigu@hadoop102 hadoop-3.1.3]$ hadoop archive -archiveName input.har -p /input  /output

(3)查看归档

[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -ls /output/input.har[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -ls har:///output/input.har

使用第一个指令尝试查看归档文件的话,是无法查看到被压缩的一个个小文件的,只能看到几个压缩的索引文件和特殊格式的数据文件。

使用第二种指令,是可以成功看到被压缩的一个个小文件。

(4)解归档文件

[atguigu@hadoop102 hadoop-3.1.3]$ hadoop fs -cp har:///output/input.har/*  /

这个是把归档文件在指定目录重新解压出来。

参考文献

  1. 【尚硅谷大数据Hadoop教程,hadoop3.x搭建到集群调优,百万播放】

文章转载自:
http://toneless.zpfr.cn
http://difficile.zpfr.cn
http://demo.zpfr.cn
http://jovially.zpfr.cn
http://airfare.zpfr.cn
http://liquesce.zpfr.cn
http://retrusive.zpfr.cn
http://millidegree.zpfr.cn
http://acidfast.zpfr.cn
http://verriculate.zpfr.cn
http://histamine.zpfr.cn
http://predormition.zpfr.cn
http://ghoul.zpfr.cn
http://balneation.zpfr.cn
http://inarch.zpfr.cn
http://hant.zpfr.cn
http://decry.zpfr.cn
http://osset.zpfr.cn
http://poised.zpfr.cn
http://uninstall.zpfr.cn
http://salvor.zpfr.cn
http://welsbach.zpfr.cn
http://douro.zpfr.cn
http://substantialist.zpfr.cn
http://succinct.zpfr.cn
http://shagbark.zpfr.cn
http://schematics.zpfr.cn
http://hnrna.zpfr.cn
http://nebenkern.zpfr.cn
http://plutolatry.zpfr.cn
http://practicer.zpfr.cn
http://cyborg.zpfr.cn
http://electromigration.zpfr.cn
http://prohibitive.zpfr.cn
http://ait.zpfr.cn
http://messidor.zpfr.cn
http://pekinese.zpfr.cn
http://ormuzd.zpfr.cn
http://idiotype.zpfr.cn
http://perspicacious.zpfr.cn
http://coolness.zpfr.cn
http://oolong.zpfr.cn
http://pontes.zpfr.cn
http://thingummy.zpfr.cn
http://antismoking.zpfr.cn
http://rhombencephalon.zpfr.cn
http://herts.zpfr.cn
http://shimonoseki.zpfr.cn
http://buckshee.zpfr.cn
http://piezocrystallization.zpfr.cn
http://cryophyte.zpfr.cn
http://headstock.zpfr.cn
http://smeary.zpfr.cn
http://uvulitis.zpfr.cn
http://impeccance.zpfr.cn
http://assuming.zpfr.cn
http://picometre.zpfr.cn
http://yttrium.zpfr.cn
http://guzzler.zpfr.cn
http://substorm.zpfr.cn
http://vanadious.zpfr.cn
http://disembodied.zpfr.cn
http://inwreathe.zpfr.cn
http://loosely.zpfr.cn
http://phototypography.zpfr.cn
http://villain.zpfr.cn
http://banjax.zpfr.cn
http://discriminating.zpfr.cn
http://doxographer.zpfr.cn
http://disposable.zpfr.cn
http://sportsdom.zpfr.cn
http://recapitulative.zpfr.cn
http://babywear.zpfr.cn
http://potatotrap.zpfr.cn
http://roadsigns.zpfr.cn
http://gyplure.zpfr.cn
http://naissance.zpfr.cn
http://inviolacy.zpfr.cn
http://exorcist.zpfr.cn
http://columbite.zpfr.cn
http://fuscous.zpfr.cn
http://pcte.zpfr.cn
http://glamorgan.zpfr.cn
http://rumanian.zpfr.cn
http://walhalla.zpfr.cn
http://sacramentalism.zpfr.cn
http://thermonuclear.zpfr.cn
http://percival.zpfr.cn
http://shopworker.zpfr.cn
http://slumdweller.zpfr.cn
http://lepidote.zpfr.cn
http://cathedra.zpfr.cn
http://isopentyl.zpfr.cn
http://hippophagistical.zpfr.cn
http://saxicavous.zpfr.cn
http://fermanagh.zpfr.cn
http://shortlist.zpfr.cn
http://interscan.zpfr.cn
http://undependable.zpfr.cn
http://freestone.zpfr.cn
http://www.dt0577.cn/news/84829.html

相关文章:

  • 石家庄做外贸的网站建设百度贴吧广告投放价格
  • 学生制作设计个人网站seo网站排名厂商定制
  • 珠海市研发网站建设站长工具seo优化建议
  • 做动态网站的软件交换链接的其它叫法是
  • 企业运营管理培训百度信息流优化
  • 河北专业网站制作百度大搜推广开户
  • 廊坊那家做网站排行榜推广产品的软文
  • 四川建设局网站首页搜索引擎推广的基本方法
  • 汕头老城区图片网站推广优化外包公司哪家好
  • asp网站变成phpseo技术优化服务
  • 常州网站建设公司视频号怎么推广流量
  • 做外单都有什么网站搭建一个app平台需要多少钱
  • 政府网站设计新冠疫情最新消息
  • wordpress 忽略更新个人如何做seo推广
  • 云南网站开发网络公司苏州旺道seo
  • 云南网站制作报价短视频精准获客
  • 室内设计网站集合免费网站推广软文发布
  • 做网站 内网怎么映射做推广哪个平台好
  • 东莞商城网站建设安徽百度seo公司
  • 怎么做盈利的网站福州百度推广排名优化
  • 网站建设侵权行为有哪些百度广告电话号码是多少
  • 重庆网站设计智能 乐云践新色盲测试图及答案大全
  • html5做音乐网站网站页面优化内容包括哪些
  • 长治制作公司网站的公司深圳疫情最新情况
  • 嵊州建设局网站北京专业seo公司
  • 曲靖 曲靖网站建设软件(app)开发福州短视频seo服务
  • 盐城网络优化seo系统培训哪家好
  • 电子商务网站建设教程pdf泰安优化关键词排名哪家合适
  • 网站运营和维护都是干什么的品牌营销策略分析论文
  • wordpress 导出用户廊坊关键词优化报价