当前位置: 首页 > news >正文

五莲县财源建设网站无货源电商怎么做

五莲县财源建设网站,无货源电商怎么做,买购网官方网站,2023年没必要学php了层级 全拼 职责划分 ODS(源数据层) Operational DataStore ODS层存储最原始的数据, 对数据不做任何加工处理; 源数据主要来自业务数据库和日志,这些数据是用户操作业务系统产生,所以叫操作型数据(Operational Data) 。 DWD(…

 

层级

全拼

职责划分

ODS(源数据层)

Operational DataStore

ODS层存储最原始的数据, 对数据不做任何加工处理;

源数据主要来自业务数据库和日志,这些数据是用户操作业务系统产生,所以叫操作型数据(Operational Data) 。

DWD(明细层)

Data Warehouse Detail

DWD层的数据表是对ODS层数据表的关联、字段重命名、清洗、类型转换;

一般不做汇总操作和指标计算。

DWM(汇总层)

Data Warehouse Model

DWM数据层的表是对ODS层或DWV的数据表进行汇总和指标计算;

一般按业务主题组织轻度汇总数据,产出通用、稳定的预处理数据,尽可能多的满足数据需求,避免后期重复计算。

DM(集市层)

Data Mart

DM层数据表按业务主题组织高度汇总数据,产出统计报表;

该层面向最终的业务数据需求,复杂业务场景下可使用维度建模对该层做细化设计。

DIM(维度层)

Dimension

DIM层数据表主要存放维度数据;

维度数据是一些基础配置数据,比如城市表、类目表;

维度是对具体分析对象的分析角度,维度要具备丰富的属性,历史信息的可追溯性,对通用的维度要保持一致性,避免产生二义性。

数仓中的数据分层

数据加载层:ETL extract transform load 贯穿整个数仓

数据运营层 ODS operational data store

数据仓库层 DW data warehouse

数据明细层 DWD data warehouse detail

数据中间层 DWM data warehouse middle

数据服务层 DWS data warehouse server

数据应用层 APP Application

维表层 DIM dimension

 

一、数据运营层:ODS(Operational Data Store)

“面向主题的”数据运营层,也叫ODS层,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就ETL 之后,装入本层。本层的数据,总体上大多是按照源头业务系统的分类方式而分类的。

一般来讲,为了考虑后续可能需要追溯数据问题,因此对于这一层就不建议做过多的数据清洗工作,原封不动地接入原始数据即可,至于数据的去噪、去重、异常值处理等过程可以放在后面的DWD层来做。

二、数据仓库层:DW(Data Warehouse)

数据仓库层是我们在做数据仓库时要核心设计的一层,在这里,从 ODS 层中获得的数据按照主题建立各种数据模型。DW层又细分为 DWD(Data Warehouse Detail)层、DWM(Data WareHouse Middle)层和DWS(Data WareHouse Servce)层。

1. 数据明细层:DWD(Data Warehouse Detail)

该层一般保持和ODS层一样的数据粒度,并且提供一定的数据质量保证。同时,为了提高数据明细层的易用性,该层会采用一些维度退化手法,将维度退化至事实表中,减少事实表和维表的关联。

另外,在该层也会做一部分的数据聚合,将相同主题的数据汇集到一张表中,提高数据的可用性。

2. 数据中间层:DWM(Data WareHouse Middle)

该层会在DWD层的数据基础上,对数据做轻度的聚合操作,生成一系列的中间表,提升公共指标的复用性,减少重复加工。

直观来讲,就是对通用的核心维度进行聚合操作,算出相应的统计指标。

3. 数据服务层:DWS(Data WareHouse Servce)

又称数据集市或宽表。按照业务划分,如流量、订单、用户等,生成字段比较多的宽表,用于提供后续的业务查询,OLAP分析,数据分发等。

一般来讲,该层的数据表会相对比较少,一张表会涵盖比较多的业务内容,由于其字段较多,因此一般也会称该层的表为宽表。

在实际计算中,如果直接从DWD或者ODS计算出宽表的统计指标,会存在计算量太大并且维度太少的问题,因此一般的做法是,在DWM层先计算出多个小的中间表,然后再拼接成一张DWS的宽表。由于宽和窄的界限不易界定,也可以去掉DWM这一层,只留DWS层,将所有的数据在放在DWS亦可。

三、数据应用层:APP(Application

在这里,主要是提供给数据产品和数据分析使用的数据,一般会存放在 ES、PostgreSql、Redis等系统中供线上系统使用,也可能会存在 Hive 或者 Druid 中供数据分析和数据挖掘使用。比如我们经常说的报表数据,一般就放在这里。

四、维表层(Dimension)

最后补充一个维表层,维表层主要包含两部分数据:

高基数维度数据:一般是用户资料表、商品资料表类似的资料表。数据量可能是千万级或者上亿级别。

低基数维度数据:一般是配置表,比如枚举值对应的中文含义,或者日期维表。数据量可能是个位数或者几千几万。

 

http://www.dt0577.cn/news/53111.html

相关文章:

  • 绿茵足球网站建设seo全网营销
  • 资源网站很难做引擎搜索
  • 2018网站开发最流行的语言中小企业网站优化
  • 如何架设内部网站网上国网app推广方案
  • 高端网站哪个比较好百度关键词收录
  • 做美国市场哪个网站好seo优化需要多少钱
  • 自己做网站是否要买云主机微营销系统
  • 深圳市南山区做网站的小公司站长工具站长
  • 毕设做网站什么主题比较好外贸营销网站建设介绍
  • 网站建设策划师百度信息流推广技巧
  • 网站是生成静态好还是动态好营销渠道
  • 做设计需要素材的常用网站有哪些市场营销案例分析
  • 怎么做微信网站吗浙江网络科技有限公司
  • 智能硬件开发流程seo标题优化导师咨询
  • 网站怎样做淘宝客百度域名查询
  • 商品展示网站源码现在做百度推广有用吗
  • 国外服务器租用网站网站统计哪个好用
  • php网站开发 薪资 东莞百度网盘链接
  • 影楼做网站兰州网络推广新手
  • 做英文网站多少钱网站建设报价方案
  • 网站平台设计团队seo管理系统培训运营
  • 论坛做视频网站有哪些直接下载app
  • 桂林旅游网官方网站免费网站申请注册
  • 网站模板哪个好山东济南seo整站优化公司
  • 购物网站案例新闻联播俄罗斯与乌克兰
  • 南宁网站设计图台州关键词优化平台
  • 河南旅游网站建设百度指数的各项功能
  • 设计网站得多少钱网络媒体
  • 百度站长工具大全百度收录api怎么提交
  • 做动漫图片的网站无锡百度