菜单 学习猿地 - LMONKEY

VIP

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练!告别无效练习

接私单赚外块

VIP优先接,累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

入驻

大数据之实时数仓分层项目实战 收藏

38人加入学习
更新时间
2024-04-26
课程价格
¥512 ¥64会员免费
课程任务
9 个
课程节数
140 个
课程时长
35课时

基于HBase和Kafka作数仓分层;数据原始层ODS,通Canal或MaxWell监听数据库binlog,打入Kafka;通过Flink流式处理清洗数据,并拆分出事实表数据和维度表数据,维度表数据写入HBase,事实表写入Kafka;Flink流式处理对接第二层Kafka,进行流与流Join得到聚合数据;流数据聚合后再使用Flink Async IO功能关联HBase维度表数据,获得宽表数据;通过Flink将宽表数据写入HBase中;HBase宽表rowkey设计

主讲老师

汪老师

课程数: 3门
学生数: 139人
长期致力于大数据技术的研究和培训工作。曾就职于思华科技,金风科技等知名企业,曾参与开发混合可再生能源预测、 智能学习行为分析系统等项目。对Hadoop、Hive、Flume、Kafka、HBase、Spark等主流大数据框架有深入研究。授课认真细致,对技术的讲解清晰易懂。
最新成员

publichj

子午线

lyy_yy01

伟仔

xh4528

rlagh7758

rosendal

whunicorn

moran

ypengju

yukee

munan

806977556

bawnagling

baldur

andytang

为你推荐 换一批