[ 数据湖/数据仓库 ] (133)
    开发框架
    Hudi、Iceberg、Delta ...
    建模步骤
        概念建模
        构建实体关系图(ER图):确定目标系统 ...
        逻辑建模
        根据ER图确定实体属性:完善系统实体、 ...
        物理建模
        根据ER图以及实体属性,确定如何构建表 ...
    建模方法
        范式理论
        关系模型建模
        关系建模(ER模型)常用于OLTP数据 ...
        维度模型建模
        维度建模是面向分析场景而生,针对分析场 ...
            建模过程
                业务过程
                声明粒度
                确认维度
                确认事实
            事实
                事实表
                    事务事实表
                    周期快照事实表
                    无事实事实表
                    累积快照事实表
            维度
                维度表
                    退化维度
                    因为过于简单没有必要创建一个维表,直接 ...
                    杂项维度
                    支架维度
                    多值维度与桥接表
                    一致性维度
                    缓慢变化维
                    缓慢变化维的处理方式:直接覆盖原值,增 ...
            粒度
            数据汇总范围的度量。 ...
            建模模式
                星形模型
                雪花模式
                星座模式
    数仓分层
        DIM (Dimension) 维度层
            DWD 数据明细层
            主要是对ODS层进行数据清洗、转换、标 ...
            DWB 数据基础层
            DWM 数据中间层
            DWS 数据服务层
            按业务主题对数据进行抽象、归类,提供业 ...
            DWT 数据主题层
        ADS (Application Data Store) 数据应用层
        用来存储查询结果,数据应用层也称为数据 ...
    数仓分类
        离线数仓
        实时数仓
    ETL (Extract-Transform-Load)
    用来描述将数据从来源端经过抽取(ext ...
        抽取 Extract
        转换 Transform
        加载 Load
    数仓架构
        传统架构
        传统离线数仓,使用Hive离线计算构建 ...
        Lambda架构
        在原来的离线数仓基础之上增加了一个实时 ...
        Kappa架构
        完全使用实时链路计算实时数据,使得离线 ...