1. 余老师带你学习大数据框架全栈
  2. 1. 第一章 课程总体介绍(需首先阅读)
    1. 1.1. 第一节 课程总体介绍(需首先阅读)
    2. 1.2. 第二节 创建并初始化环境(需首先操作)
    3. 1.3. 第三节 保证当前shell的用户为hadoop(课程中大部分操作是在hadoop用户下进行的)
  3. 2. 第二章 Zookeeper
    1. 2.1. 第一节 总体介绍
    2. 2.2. 第二节 Zookeeper环境搭建
    3. 2.3. 第三节 Zookeeper客户端基本操作
    4. 2.4. 第四节 Zookeeper分布式锁
    5. 2.5. 第五节 Zookeeper主从应用
  4. 3. 第三章 Hadoop
    1. 3.1. 第一节 Hadoop技术概要
    2. 3.2. 第二节 Hadoop环境搭建
    3. 3.3. 第三节 HDFS基本操作
    4. 3.4. 第四节 Federation操作
    5. 3.5. 第五节 MR基本用例WordCount-java
    6. 3.6. 第六节 MR基本用例WordCount-Python
    7. 3.7. 第七节 MR内部机制调优
    8. 3.8. 第八节 YARN的背景和框架
    9. 3.9. 第九节 YARN基本操作
    10. 3.10. 第十节 RM HA配置文件
    11. 3.11. 第十一节 YARN调度器配置及编写实战
    12. 3.12. 第十二节 作业
  5. 4. 第四章 Tez
    1. 4.1. 第一节 Tez总体介绍
    2. 4.2. 第二节 Tez环境搭建
    3. 4.3. 第三节 Tez编写实战
  6. 5. 第五章 Hive
    1. 5.1. 第一节 Hive总体介绍
    2. 5.2. 第二节 Hive环境搭建
    3. 5.3. 第三节 Hive基本操作
    4. 5.4. 第四节 HiveQL数据定义
    5. 5.5. 第五节 Hive锁
    6. 5.6. 第六节 深入理解Hive
  7. 6. 第六章 Spark
    1. 6.1. 第一节 Spark总体介绍
    2. 6.2. 第二节 Spark编程模型与基本框架
    3. 6.3. 第三节 Spark环境搭建
    4. 6.4. 第四节 Spark例子-pyspark
  8. 7. 第七章 Oozie
    1. 7.1. 第一节 Oozie总体介绍
    2. 7.2. 第二节 Oozie环境搭建
    3. 7.3. 第三节 Oozie案例分析
  9. 8. 第八章 Spark案例分析
    1. 8.1. 第一节 淘宝案例数据源分析
    2. 8.2. 第二节 淘宝案例操作和分析
    3. 8.3. 第三节 youtube视频网站数据案例分析
  10. 9. 第九章 HBase
    1. 9.1. 第一节 深刻了解HBase
    2. 9.2. 第二节 HBase环境搭建
    3. 9.3. 第三节 HBase表操作
  11. 10. 第十章 Kafka
    1. 10.1. 第一节 了解Kafka
    2. 10.2. 第二节 安装Kafka
    3. 10.3. 第三节 Kafka基本命令
    4. 10.4. 第四节 Kafka-Admin
    5. 10.5. 第五节 Kafka-Producer
    6. 10.6. 第六节 Kafka-Consumer
    7. 10.7. 第七节 Kafka-Stream
    8. 10.8. 第八节 Kafka-Connect
  12. 11. 第十一章 Flink
    1. 11.1. 第一节 Flink基本概念
    2. 11.2. 第二节 批处理和流处理
    3. 11.3. 第三节 Standalone模式的安装
    4. 11.4. 第四节 Standalone模式下的job提交
    5. 11.5. 第五节 提交job到YARN集群
    6. 11.6. 第六节 深入理解Flink理论
    7. 11.7. 第七节 社交网络数据分析案例
  13. 12. 第十二章 Flume
    1. 12.1. 第一节 Flumeg概述
    2. 12.2. 第二节 Flume安装部署
    3. 12.3. 第三节 简单案例之官方案例
    4. 12.4. 第四节 简单案例之Flume实时监控单个追加文件
    5. 12.5. 第五节 简单案例之Flume实时监控目录下多个新文件
    6. 12.6. 第六节 简单案例之Flume实时监控目录下的多个追加文件
    7. 12.7. 第七节 简单案例之Flume进阶--Flume 事务
    8. 12.8. 第八节 简单案例之Flume进阶--Flume Agent 内部原理
    9. 12.9. 第九节 简单案例之Flume进阶--拓扑结构
    10. 12.10. 第十节 企业开发案例之复制
    11. 12.11. 第十一节 企业开发案例之负载均衡和故障转移
    12. 12.12. 第十二节 企业开发案例之聚合
  14. 13. 第十三章 Hudi
    1. 13.1. 第一节 Hudi核心技术
    2. 13.2. 第二节 Spark-shell操作Hudi
  15. 14. 第十四章 数据可视化分析
    1. 14.1. 第一节 为什么选择superset作为可视化工具
    2. 14.2. 第二节 数据可视化环境操作简介
    3. 14.3. 第三节 创建数据连接与数据集
    4. 14.4. 第四节 数据集简介与表的透视
    5. 14.5. 第五节 数字饼图柱状图的设计
    6. 14.6. 第六节 设计看板
    7. 14.7. 第七节 过滤器
    8. 14.8. 第八节 高级分析主题-滚动平均-时间对比-重采样
    9. 14.9. 第九节 案例研究-新冠疫苗研发可视化-上
    10. 14.10. 第十节 案例研究-新冠疫苗研发可视化-中
    11. 14.11. 第十一节 案例研究-新冠疫苗研发可视化-下
    12. 14.12. 第十二节 连接Apache Hive数据仓库
    13. 14.13. 第十三节 作业
  16. 15. 第十五章 数据治理
    1. 15.1. 第一节 Atlas数据治理
      1. 15.1.1. 为什么学习Atlas
      2. 15.1.2. Atlas概述
      3. 15.1.3. Atlas架构讲解
      4. 15.1.4. 安装Solr
      5. 15.1.5. 编译Atlas
      6. 15.1.6. 安装与配置Atlas
      7. 15.1.7. 数据初次导入
      8. 15.1.8. 数据血缘关系管理
      9. 15.1.9. 作业
    2. 15.2. 第二节 DCMM数据管理能力成熟度评估
      1. 15.2.1. DCMM数据管理能力成熟度评估
  17. Linux操作系统和Python语言快速入门
  18. 学苑网课中心首页
  19. 关于松鼠学苑

余老师带你学习大数据框架全栈