余老师带你学习大数据框架全栈
1.
第一章 课程总体介绍(需首先阅读)
1.1.
第一节 课程总体介绍(需首先阅读)
1.2.
第二节 创建并初始化环境(需首先操作)
1.3.
第三节 保证当前shell的用户为hadoop(课程中大部分操作是在hadoop用户下进行的)
2.
第二章 Zookeeper
2.1.
第一节 总体介绍
2.2.
第二节 Zookeeper环境搭建
2.3.
第三节 Zookeeper客户端基本操作
2.4.
第四节 Zookeeper分布式锁
2.5.
第五节 Zookeeper主从应用
3.
第三章 Hadoop
3.1.
第一节 Hadoop技术概要
3.2.
第二节 Hadoop环境搭建
3.3.
第三节 HDFS基本操作
3.4.
第四节 Federation操作
3.5.
第五节 MR基本用例WordCount-java
3.6.
第六节 MR基本用例WordCount-Python
3.7.
第七节 MR内部机制调优
3.8.
第八节 YARN的背景和框架
3.9.
第九节 YARN基本操作
3.10.
第十节 RM HA配置文件
3.11.
第十一节 YARN调度器配置及编写实战
3.12.
第十二节 作业
4.
第四章 Tez
4.1.
第一节 Tez总体介绍
4.2.
第二节 Tez环境搭建
4.3.
第三节 Tez编写实战
5.
第五章 Hive
5.1.
第一节 Hive总体介绍
5.2.
第二节 Hive环境搭建
5.3.
第三节 Hive基本操作
5.4.
第四节 HiveQL数据定义
5.5.
第五节 Hive锁
5.6.
第六节 深入理解Hive
6.
第六章 Spark
6.1.
第一节 Spark总体介绍
6.2.
第二节 Spark编程模型与基本框架
6.3.
第三节 Spark环境搭建
6.4.
第四节 Spark例子-pyspark
7.
第七章 Oozie
7.1.
第一节 Oozie总体介绍
7.2.
第二节 Oozie环境搭建
7.3.
第三节 Oozie案例分析
8.
第八章 Spark案例分析
8.1.
第一节 淘宝案例数据源分析
8.2.
第二节 淘宝案例操作和分析
8.3.
第三节 youtube视频网站数据案例分析
9.
第九章 HBase
9.1.
第一节 深刻了解HBase
9.2.
第二节 HBase环境搭建
9.3.
第三节 HBase表操作
10.
第十章 Kafka
10.1.
第一节 了解Kafka
10.2.
第二节 安装Kafka
10.3.
第三节 Kafka基本命令
10.4.
第四节 Kafka-Admin
10.5.
第五节 Kafka-Producer
10.6.
第六节 Kafka-Consumer
10.7.
第七节 Kafka-Stream
10.8.
第八节 Kafka-Connect
11.
第十一章 Flink
11.1.
第一节 Flink基本概念
11.2.
第二节 批处理和流处理
11.3.
第三节 Standalone模式的安装
11.4.
第四节 Standalone模式下的job提交
11.5.
第五节 提交job到YARN集群
11.6.
第六节 深入理解Flink理论
11.7.
第七节 社交网络数据分析案例
12.
第十二章 Flume
12.1.
第一节 Flumeg概述
12.2.
第二节 Flume安装部署
12.3.
第三节 简单案例之官方案例
12.4.
第四节 简单案例之Flume实时监控单个追加文件
12.5.
第五节 简单案例之Flume实时监控目录下多个新文件
12.6.
第六节 简单案例之Flume实时监控目录下的多个追加文件
12.7.
第七节 简单案例之Flume进阶--Flume 事务
12.8.
第八节 简单案例之Flume进阶--Flume Agent 内部原理
12.9.
第九节 简单案例之Flume进阶--拓扑结构
12.10.
第十节 企业开发案例之复制
12.11.
第十一节 企业开发案例之负载均衡和故障转移
12.12.
第十二节 企业开发案例之聚合
13.
第十三章 Hudi
13.1.
第一节 Hudi核心技术
13.2.
第二节 Spark-shell操作Hudi
14.
第十四章 数据可视化分析
14.1.
第一节 为什么选择superset作为可视化工具
14.2.
第二节 数据可视化环境操作简介
14.3.
第三节 创建数据连接与数据集
14.4.
第四节 数据集简介与表的透视
14.5.
第五节 数字饼图柱状图的设计
14.6.
第六节 设计看板
14.7.
第七节 过滤器
14.8.
第八节 高级分析主题-滚动平均-时间对比-重采样
14.9.
第九节 案例研究-新冠疫苗研发可视化-上
14.10.
第十节 案例研究-新冠疫苗研发可视化-中
14.11.
第十一节 案例研究-新冠疫苗研发可视化-下
14.12.
第十二节 连接Apache Hive数据仓库
14.13.
第十三节 作业
15.
第十五章 数据治理
15.1.
第一节 Atlas数据治理
15.1.1.
为什么学习Atlas
15.1.2.
Atlas概述
15.1.3.
Atlas架构讲解
15.1.4.
安装Solr
15.1.5.
编译Atlas
15.1.6.
安装与配置Atlas
15.1.7.
数据初次导入
15.1.8.
数据血缘关系管理
15.1.9.
作业
15.2.
第二节 DCMM数据管理能力成熟度评估
15.2.1.
DCMM数据管理能力成熟度评估
Linux操作系统和Python语言快速入门
学苑网课中心首页
关于松鼠学苑
Light
Rust
Coal (default)
Navy
Ayu
余老师带你学习大数据框架全栈
安装视频教程
相关资源
1、solr下载地址:https://archive.apache.org/dist/lucene/solr/7.7.3/solr-7.7.3.tgz