大数据之实时数仓分层项目实战 收藏

34人加入学习
价格
¥64
教学计划
学习有效期
永久有效

基于HBase和Kafka作数仓分层;数据原始层ODS,通Canal或MaxWell监听数据库binlog,打入Kafka;通过Flink流式处理清洗数据,并拆分出事实表数据和维度表数据,维度表数据写入HBase,事实表写入Kafka;Flink流式处理对接第二层Kafka,进行流与流Join得到聚合数据;流数据聚合后再使用Flink Async IO功能关联HBase维度表数据,获得宽表数据;通过Flink将宽表数据写入HBase中;HBase宽表rowkey设计

主讲老师

汪老师

课程数: 3门
学生数: 130人
长期致力于大数据技术的研究和培训工作。曾就职于思华科技,金风科技等知名企业,曾参与开发混合可再生能源预测、 智能学习行为分析系统等项目。对Hadoop、Hive、Flume、Kafka、HBase、Spark等主流大数据框架有深入研究。授课认真细致,对技术的讲解清晰易懂。
最新成员

xh4528

rlagh7758

rosendal

whunicorn

moran

ypengju

yukee

munan

806977556

bawnagling

baldur

andytang

haogg

alin_php

懒惰的大叔

Barry

为你推荐 换一批