课程介绍
教程涵盖Apache生态系统的所有主流技术:Hadoop、Hive、Spark、Flume、Kafka、Azkaban、Zookeeper、Sqoop、Atlas、Kylin、Presto、Kerberos、Ranger、Zabbix等,均采用了最新稳定版。数据治理内容更加全面,搭建Kerberos+Ranger的一体化权限管理系统,使用Python+Shell脚本实现自动化数据质量监控,使用Zabbix+Grafana实现集群性能监控,采用目前企业主流的元数据管理应用Atlas实现了数据血缘管理,保障了数仓的安全性、一致性和可靠性。