在互联网时代,数据量不断增多,数据仓库已成为互联网企业的标准配置。已经非常成熟的传统数据仓库,已经逐渐承受不住压力,迫切需要转型,这个转型方向就是大数据架构的数据仓库。在各大招聘网站上,一些大型企业,已经抛出高薪酬的橄榄枝,来吸引大数据数据仓库人才。
掌握数据仓库技术,是进入互联网大厂的另一种方式。不同于代码编写的工作,数据仓库更看重架构的规划、模型的设计,并能够使用 SQL 完成数据处理、分析工作。
但市面上关于数据仓库材料比较少,而且不够全面、不成体系,并没有讲解清楚数据仓库的基本核心,没有理清从传统数据仓库到大数据的数据仓库的变化过程。
本专栏将带你更深入地了解数据仓库,让你知晓它的整体建设和规划流程。通过 2 个真实数据仓库项目,亲历数据仓库从无到有的诞生,并体会真实的项目流程。我们将随专栏【附赠】一键完成集群搭建的自动化脚本,全面解决环境搭建的后顾之忧。
专栏亮点
- 系统全面的数据仓库原理与实战,用最简洁的语言和例子攻克知识点。
- 详细讲解真实企业级数据仓库实战,从集群搭建、数仓构建到真实案例开发。
- 附赠一键完成集群搭建的自动化脚本,快速完成环境搭建。

专栏结构
专栏主要技术路线以大数据数据仓库为导向,总体结构:简介 -> 架构 -> 建模 -> 最佳实践 -> 项目开发。其中前 3 部分为通用数据仓库知识,同样适用于传统数据仓库,可以选择性翻阅。最后项目实战为大数据数据仓库的完整项目,包含集群搭建、企业级完整流程实操。
- 第 1 部分:简介(01-06)
- 01-专栏介绍&学习指南
- 02-数据仓库诞生背景
- 03-数据仓库概述
- 04-MPP&分布式架构
- 05-数据仓库技术实现
- 06-常见数据仓库产品
- 第 2 部分:架构(07-10)
- 07-数据仓库架构设计
- 08-ETL流程
- 09-数据积存功能之ODS层
- 10-数据分析功能之DWD、DWS、ADS层
- 第 3 部分:建模(11-14)
- 11-不同系统的建模方法
- 12-ROLAP维度模型
- 13-MOLAP建模方法
- 14-多维分析
- 第 4 部分:最佳实践(15-17)
- 15-表的分类
- 16-ETL同步策略
- 17-任务调度
- 第 5 部分:项目实战(18-28)
- 18-项目&数据概述
- 19-架构设计&环境规划
- 20-环境搭建
- 21-项目流程&数据生成
- 22-ETL数据导入
- 23-ODS层创建&数据接入
- 24-DWD层创建&数据接入
- 25-DWS层创建&数据接入
- 26-ADS层复购率统计
- 27-ADS层数据导出
- 28-Azkaban自动化调度
- 第 6 部分:课后作业(29-32)
- 29-GMV成交总额计算
- 30-ADS层创建&数据接入
- 31-ADS层数据导出
- 32-Azkaban自动化调度
你将获得什么?
- 拥有快速搭建大数据数据仓库集群的能力
- 能够胜任大数据&传统数据仓库的设计与构建
- 掌握数据仓库的演变、架构、理论知识
- 可以独立完成数据仓库的开发工作
适宜人群
- 数据仓库的初学者
- 向大数据数据仓库转型的企业开发者
- 想全面了解数据仓库理论的架构师
作者简介

订阅须知
- 本专栏为图文内容,共计 32 篇。
- 本专栏为虚拟产品,一经付费概不退款,敬请谅解。
- 本专栏可在 GitChat 服务号、App 及网页端 gitbook.cn 上购买,一端购买,多端阅读。
订阅福利
- 订购本专栏可获得专属海报(在 GitChat 服务号领取),分享专属海报每成功邀请一位好友购买,即可获得 25% 的返现奖励,多邀多得,上不封顶,立即提现。
- 提现流程:在 GitChat 服务号中点击「我-我的邀请-提现」。
- 订阅本专栏后,即可加入 专属交流群,服务号会自动弹出入群二维码和暗号。如果你没有收到那就先关注微信服务号「GitChat」,或者加我们的小助手「Linmicc」咨询。(入群方式可查看 第 2 篇 文末说明)。
购买须知
- 本课程内容版权归北京码字科技发展有限公司独家所有,未经授权,不得转载。
- 本课程为虚拟产品,一经付费概不退款,敬请谅解。
- 添加 GitChat 助教俏俏(微信 ID: gitchat2025),加入免费技术交流群。