全部课程> 华为HCIA-Big Data零基础大数据技术培训

华为HCIA-Big Data零基础大数据技术培训
- 24课时(建议每周学习0小时)
- 录播
-
会新星会员免费观看新9.9元体验新星会员周卡
已有4151人报名学习
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
该课程适用于华为HCIA-Big Data V3.5,本课程主要介绍了大数据行业的发展趋势,鲲鹏大数据、常用且重要的大数据组件基础技术原理及华为大数据解决方案、功能特性和华为在大数据行业的成功案例。
课程概览
华为HCIA-Big Data 是培养和认证具备使用华为 MRS 大数据开发平台能力的大数据工程师。
一、培训目标
1.掌握大数据行业的发展趋势,大数据特点以及华为鲲鹏大数据等。
2.掌握常用且重要的大数据组件技术原理与架构(包括 HDFS、HBase、Hive、ClickHouse、MapReduce、YARN、Spark、Flink、Flume、Kafka、ElasticSearch、ZooKeeper)。
3.熟悉华为大数据平台 MRS、了解华为数据治理中心 DataArts Studio 及华为在大数据行业的成功案例。
4.具备大数据售前、大数据项目管理、大数据开发等岗位所必备的知识和技能。 三、适用人群
5.希望成为大数据工程师的人员;
6.希望获得 HCIA-Big Data V3.5 认证的人员;
7.希望进一步提升技术的人员;
二、认证收益
通过 HCIA-Big Data 认证,将证明您掌握常用且重要的大数据组件技术原理与架构,包括 HDFS、Hive、HBase、ClickHouse、MapReduce、Flume、Spark、Flink、ElasticSearch等组件,掌握华为大数据平台 MRS 的使用方法;具备基于华为 MRS 服务的操作和开发的能力;能够胜任大数据开发工程师等岗位;
三、适合职位:大数据开发工程师、数据治理工程师、售前工程师等。
授课讲师

项目开发经验: 10年项目开发经验,曾领导团队成功研发CRM大型项目,展现项目管理和技术领导力。 教学经验: 10年教学经验,作为总监级讲师,专注于培养技术人才。 专业技能: 精通华为大数据平台和数据挖掘,具备扎实的大数据专业知识。 熟练Java软件开发,能够进行高效软件设计和开发。 认证资格: 持有HCIE-Big Data认证,华为认证体系中的最高级别,证明大数据领域的专业水平。 技术专长: 大数据技术与应用 Java软件开发 华为技术认证与教学
课程大纲
- 第1章大数据发展趋势与鲲鹏大数据
-
    第1节 大数据时代
-
    第2节 大数据的应用领域
-
    第3节 企业所面临的挑战和机遇
-
    第4节 华为鲲鹏解决方案
- 第2章HDFS分布式文件系统和ZooKeeper
-
    第1节 第二章前言
-
    第2节 HDFS概述
-
    第3节 HDFS相关概念
-
    第4节 HDFS体系架构
-
    第5节 HDFS关键特性
-
    第6节 HDFS数据读写流程
-
    第7节 ZooKeeper概述
-
    第8节 ZooKeeper体系架构
- 第3章HBase分布式数据库和Hive分布式数据仓库
-
    第1节 第三章前言
-
    第2节 HBase概述
-
    第3节 HBase数据模型
-
    第4节 HBase体系架构
-
    第5节 HBase性能优化
-
    第6节 HBase常用Shell命令
-
    第7节 Hive概述
-
    第8节 Hive功能与架构
-
    第9节 Hive基本操作
-
    第10节 第三章小结
- 第4章ClickHouse联机分析数据库管理系统
-
    第1节 第四章前言
-
    第2节 ClickHouse概述
-
    第3节 ClickHouse系统架构及基本特性
-
    第4节 ClickHouse增强特性
-
    第5节 第四章小结
- 第5章MapReduce和Yarn技术原理
-
    第1节 MapReduce和Yarn基本介绍
-
    第2节 MapReduce和Yarn功能与架构
-
    第3节 Yarn的资源管理和任务调度
-
    第4节 Yarn的增强特性
- 第6章Spark基于内存的分布式计算和Flink流批一体分布式实时处理引擎
-
    第1节 Spark概述
-
    第2节 Spark数据结构
-
    第3节 Spark原理与架构
-
    第4节 Flink原理与架构
-
    第5节 Flink的Time与Window
-
    第6节 Flink的Watermark
-
    第7节 Flink的容错机制
-
    第8节 第六章小结
- 第7章Flume海量日志聚合和Kafka分布式消息订阅系统
-
    第1节 第七章前言
-
    第2节 Flume简介及架构
-
    第3节 Flume关键特性介绍
-
    第4节 Flume应用举例
-
    第5节 Kafka简介
-
    第6节 Kafka架构与功能
-
    第7节 Kafka数据管理
-
    第8节 第七章小结
- 第8章ElasticSearch分布式全文检索服务
-
    第1节 ElasticSearch简介
-
    第2节 ElasticSearch系统架构
-
    第3节 ElasticSearch关键特性
-
    第4节 第八章小结
- 第9章华为大数据平台MRS
-
    第1节 华为大数据平台MRS概述
-
    第2节 组件介绍
-
    第3节 MRS云原生数据湖基线方案
- 第10章华为数据治理中心DataArts Studio
-
    第1节 数据治理概述
-
    第2节 华为数据治理中心DataArts Studio概述
实验列表
- 实验名称HDFS常用操作
- 实验描述在本练习中,您将练习使用HDFS、Hadoop分布式文件系统。您将使用HDFS命令行工具来操纵HDFS中的文件
- 实验名称Zookeeper基础命令
- 实验描述在本练习中,您将练习使用Zookeeper基础命令
- 实验名称Hbase的命令操作
- 实验描述在本练习中,您将练习使用Hbase命令行操作Hbase
- 实验名称Hive创建表
- 实验描述Hive是重要的数据仓库工具,在数据挖掘、数据汇总、统计分析等领域有重要作用。特别是在电信业务中,Hive扮演相当重要的角色,可以利用Hive统计用户的流量、话费、资费等信息,也可挖掘出用户的消费模型以帮助运营商更好的规划套餐内容。
- 实验名称Hive数据库操作
- 实验描述在本练习中,您将练习使用Hive操作数据库
- 实验名称Hive表操作
- 实验描述在本练习中,您将练习使用Hive操作Hive表
- 实验名称ClickHouse联机分析数据库实战
- 实验描述ClickHouse是一款开源的面向联机分析处理的列式数据库,其独立于Hadoop大数据体系,最核心的特点是极致压缩率和极速查询性能。同时,ClickHouse支持SQL查询,且查询性能好,特别是基于大宽表的聚合分析查询性能非常优异,比其他分析型数据库速度快一个数量级。
- 实验名称MapReduce词频统计
- 实验描述在本练习中,您将练习使用MapReduce执行单词统计。
- 实验名称Spark运行环境搭建
- 实验描述Hadoop、Spark伪分布式环境的安装和配置。
- 实验名称Spark RDD常用操作
- 实验描述在本练习中,您将练习Spark RDD常用操作
- 实验名称Flink操作
- 实验描述在本练习中,您将练习使用flink
- 实验名称Flume采集目录数据
- 实验描述在本练习中,您将练习使用Flume采集目录数据,数据保存到hdfs
- 实验名称Kafka命令操作
- 实验描述在本练习中,您将练习使用Kafka命令
- 实验名称实验14 14_从Flume发送消息给Kafka
- 实验描述在本练习中,您将在网关节点上运行Flume代理,它将从本地spool目录中获取web日志,并将每一行作为消息发送给Kafka主题。 Flume代理被配置为向前面创建的weblog主题发送消息。
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
pdf
第一章第一节-大数据时代
大小:979.28KB
2023-08-04
-
pdf
第一章第二节-大数据的应用领域
大小:1.15MB
2023-08-04
-
pptx
第一章第三节-企业所面临的挑战和机遇
大小:80.92KB
2023-08-04
-
pptx
第一章第四节-华为鲲鹏解决方案
大小:3.75MB
2023-08-04
-
pptx
第02章 HDFS分布式文件系统和ZooKeeper
大小:13.88MB
2023-08-04
-
pptx
第03章 HBase分布式数据库和Hive分布式数据仓库
大小:2.66MB
2023-08-04