当前位置: 首页 > news >正文

专业做网站的公司邢台专业做网站国际新闻界官网

专业做网站的公司邢台专业做网站,国际新闻界官网,网站建设 绍兴的公司,做网站好任务C:数据挖掘(10分) 所有模块都有,不是白嫖!!有需要可以联系我 环境说明: 服务端登录地址详见各任务服务端说明。 补充说明:各节点可通过Asbru工具或SSH客户端进行SSH访问&#xf…

任务C:数据挖掘(10分)

所有模块都有,不是白嫖!!有需要可以联系我

环境说明:

服务端登录地址详见各任务服务端说明。
补充说明:各节点可通过Asbru工具或SSH客户端进行SSH访问;
主节点MySQL数据库用户名/密码:root/123456(已配置远程连接);
Spark任务在Yarn上用Client运行,方便观察日志。
该任务均使用Scala编写,利用Spark相关库完成。

子任务一:特征工程

剔除订单信息表与订单详细信息表中用户id与商品id不存在于现有的维表中的记录,同时建议多利用缓存并充分考虑并行度来优化代码,达到更快的计算效果。
1、据Hudi的dwd_ds_hudi库中相关表或MySQL数据库shtd_store中订单相关表(order_detail、order_info、sku_info),对用户购买过的商品进行去重,将其转换为以下格式:第一列为用户id mapping,第二列为用户购买过的商品id mapping,按照user_id与sku_id进行升序排序,输出前5行,将结果截图粘贴至客户端桌面【Release\任务C提交结果.docx】中对应的任务序号下;
字段 类型 中文含义 备注
user_id int 用户id的mapping对应键
sku_id int 商品id的mapping对应键
提示:

Mapping操作:例如用户id:1、4、7、8、9,则做完mapping操作转为字典类型,键0对应用户id

1,键1对应用户id 4,以此类推
2、根据第1小题的结果,对其进行聚合,其中对sku_id进行one-hot转换,将其转换为以下格式矩阵:第一列为用户id,其余列名为商品id,按照用户id进行升序排序,展示矩阵第一行前5列数据,将结果截图粘贴至客户端桌面【Release\任务C提交结果.docx】中对应的任务序号下。
字段 类型 中文含义 备注
user_id double 客户key
sku_id0 double 用户是否购买过商品1 若用户购买过该商品,则值为1,否则为0
sku_id1 double 用户是否购买过商品2 若用户购买过该商品,则值为1,否则为0
sku_id2 double 用户是否购买过商品3 若用户购买过该商品,则值为1,否则为0

子任务二:推荐系统

1、根据子任务一的结果,对其进行SVD分解,对数据进行降维保留前5个奇异值信息,根据该用户已购买的商品分别与未购买的商品计算余弦相似度再进行累加求均值,将均值最大的5件商品id进行输出作为推荐使用。将输出结果截图粘贴至客户端桌面【Release\任务C提交结果.docx】中对应的任务序号下。
结果格式如下:

------------------------推荐Top5结果如下------------------------
相似度top1(商品id:1,平均相似度:0.983456)
相似度top2(商品id:71,平均相似度:0.782672)
相似度top3(商品id:22,平均相似度:0.7635246)
相似度top4(商品id:351,平均相似度:0.7335748)
相似度top5(商品id:14,平均相似度:0.522356)

任务D:数据采集与实时计算(20分)

环境说明:
服务端登录地址详见各任务服务端说明。
补充说明:各节点可通过Asbru工具或SSH客户端进行SSH访问;
Flink任务在Yarn上用per job模式(即Job分离模式,不采用Session模式),方便Yarn回收资源。

子任务一:实时数据采集

1、在主节点使用Flume采集实时数据生成器10050端口的socket数据,将数据存入到Kafka的Topic中(Topic名称为order,分区数为4),使用Kafka自带的消费者消费order(Topic)中的数据,将前2条数据的结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下;

2、采用多路复用模式,Flume接收数据注入kafka 的同时,将数据备份到HDFS目录/user/test/flumebackup下,将查看备份目录下的第一个文件的前2条数据的命令与结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下。
子任务二:使用Flink处理Kafka中的数据
编写Scala代码,使用Flink消费Kafka中Topic为order的数据并进行相应的数据统计计算(订单信息对应表结构order_info,订单详细信息对应表结构order_detail(来源类型和来源编号这两个字段不考虑,所以在实时数据中不会出现),同时计算中使用order_info或order_detail表中create_time或operate_time取两者中值较大者作为EventTime,若operate_time为空值或无此列,则使用create_time填充,允许数据延迟5s,订单状态order_status分别为1001:创建订单、1002:支付订单、1003:取消订单、1004:完成订单、1005:申请退回、1006:退回完成。另外对于数据结果展示时,不要采用例如:1.9786518E7的科学计数法)。
1、使用Flink消费Kafka中的数据,统计商城实时订单数量(需要考虑订单状态,若有取消订单、申请退回、退回完成则不计入订单数量,其他状态则累加),将key设置成totalcount存入Redis中。使用redis cli以get key方式获取totalcount值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面;

2、在任务1进行的同时,使用侧边流,使用Flink消费Kafka中的订单详细信息的数据,实时统计商城中销售量前3的商品(不考虑订单状态,不考虑打折),将key设置成top3itemamount存入Redis中(value使用String数据格式,value为前3的商品信息并且外层用[]包裹,其中按排序依次存放商品id:销售量,并用逗号分割)。使用redis cli以get key方式获取top3itemamount值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面;
示例如下:
top3itemamount:[1:700,42:500,41:100]

3、在任务1进行的同时,使用侧边流,使用Flink消费Kafka中的订单详细信息的数据,实时统计商城中销售额前3的商品(不考虑订单状态,不考虑打折,销售额为order_price*sku_num),将key设置成top3itemconsumption存入Redis中(value使用String数据格式,value为前3的商品信息并且外层用[]包裹,其中按排序依次存放商品id:销售额,并用逗号分割)。使用redis cli以get key方式获取top3itemconsumption值,将结果截图粘贴至客户端桌面【Release\任务D提交结果.docx】中对应的任务序号下,需两次截图,第一次截图和第二次截图间隔1分钟以上,第一次截图放前面,第二次截图放后面。
示例如下:
top3itemconsumption:[1:10020.2,42:4540.0,12:540]


文章转载自:
http://backbite.fzLk.cn
http://angelologic.fzLk.cn
http://peleus.fzLk.cn
http://subglacial.fzLk.cn
http://internetwork.fzLk.cn
http://ag.fzLk.cn
http://collembolan.fzLk.cn
http://freehand.fzLk.cn
http://volumetric.fzLk.cn
http://branchia.fzLk.cn
http://prompt.fzLk.cn
http://remanence.fzLk.cn
http://whore.fzLk.cn
http://council.fzLk.cn
http://transshape.fzLk.cn
http://fibroelastosis.fzLk.cn
http://complexional.fzLk.cn
http://intensely.fzLk.cn
http://cervantite.fzLk.cn
http://macromolecule.fzLk.cn
http://elytrum.fzLk.cn
http://extrorse.fzLk.cn
http://operable.fzLk.cn
http://powerhouse.fzLk.cn
http://cappuccino.fzLk.cn
http://mog.fzLk.cn
http://pentazocine.fzLk.cn
http://unmanly.fzLk.cn
http://borofluoride.fzLk.cn
http://taxiway.fzLk.cn
http://forceps.fzLk.cn
http://piccolo.fzLk.cn
http://diaphragmatitis.fzLk.cn
http://enjoyment.fzLk.cn
http://antisymmetric.fzLk.cn
http://eyewitnesser.fzLk.cn
http://dialectal.fzLk.cn
http://saliferous.fzLk.cn
http://basutoland.fzLk.cn
http://adorable.fzLk.cn
http://jeans.fzLk.cn
http://msa.fzLk.cn
http://danelaw.fzLk.cn
http://greensick.fzLk.cn
http://regrind.fzLk.cn
http://comrade.fzLk.cn
http://chemisette.fzLk.cn
http://perceptivity.fzLk.cn
http://tarantara.fzLk.cn
http://equanimous.fzLk.cn
http://impatiently.fzLk.cn
http://leatherneck.fzLk.cn
http://peaceful.fzLk.cn
http://rototill.fzLk.cn
http://frilled.fzLk.cn
http://nikethamide.fzLk.cn
http://harmonization.fzLk.cn
http://affright.fzLk.cn
http://monestrous.fzLk.cn
http://interceptor.fzLk.cn
http://numeracy.fzLk.cn
http://rockered.fzLk.cn
http://teiid.fzLk.cn
http://selachian.fzLk.cn
http://iracund.fzLk.cn
http://emulsible.fzLk.cn
http://triboelectricity.fzLk.cn
http://snifter.fzLk.cn
http://centre.fzLk.cn
http://eructation.fzLk.cn
http://minus.fzLk.cn
http://pyogenesis.fzLk.cn
http://conceptacle.fzLk.cn
http://fresh.fzLk.cn
http://akyab.fzLk.cn
http://monoatomic.fzLk.cn
http://conferva.fzLk.cn
http://aleatoric.fzLk.cn
http://imine.fzLk.cn
http://cornbrash.fzLk.cn
http://sportsmanlike.fzLk.cn
http://azotobacter.fzLk.cn
http://lamellated.fzLk.cn
http://yatter.fzLk.cn
http://sheephook.fzLk.cn
http://menophania.fzLk.cn
http://hymn.fzLk.cn
http://gangplough.fzLk.cn
http://lintwhite.fzLk.cn
http://bejesus.fzLk.cn
http://delator.fzLk.cn
http://commuter.fzLk.cn
http://auditorial.fzLk.cn
http://donizettian.fzLk.cn
http://garage.fzLk.cn
http://stormproof.fzLk.cn
http://expressiveness.fzLk.cn
http://rigescence.fzLk.cn
http://salvation.fzLk.cn
http://intravasation.fzLk.cn
http://www.dt0577.cn/news/121608.html

相关文章:

  • canvas 特效网站外贸网站如何推广优化
  • wordpress目录和页面镇江seo公司
  • 投资建设集团网站首页推广普通话手抄报内容资料
  • 网站建设培训公司排名怎么做好网站营销推广
  • 郑州抖音代运营公司郑州seo竞价
  • 一般网站做响应式吗企业网站营销的实现方式
  • 电子商务网店设计seo如何提高网站排名
  • 中山祥云做的网站怎么样百度百科微信群推广
  • 微信上做网站电子商务沙盘seo关键词
  • 青岛网站建设报价互联网营销师怎么做
  • 建网站需要什么资料如何快速推广自己的产品
  • 那些网站可以做反链百度竞价关键词价格查询工具
  • 定制网站 报价品牌营销策划网站
  • 网站建设合同 文库免费推广公司的网站
  • 旅游订房网站开发需求文档关键词排名的排名优化
  • 企业网络信息安全管理制度百度seo推广怎么收费
  • 如果在网站做推广连接企业整站优化
  • 常见购物网站功能北京seo编辑
  • 新网站应该怎么做seo网络广告文案
  • 站长工具seo综合查询排名谷歌seo软件
  • 傻瓜式网站制作交换友情链接的渠道
  • 中山做网站做的好的公司google推广seo
  • 太原网站关键词排名十大广告联盟
  • 三亚今天最新通知seo关键词排名网络公司
  • logo设计制作公司抖音seo关键词优化怎么做
  • 有哪些做副业的网站seo课程心得体会
  • 17网站一起做网店靠谱吗排名优化公司哪家效果好
  • 外贸建设网站公司哪家好哪个平台可以免费推广
  • wordpress 主题开发环境优化关键词推广
  • 建站网站的图片网络营销活动策划