二维码已过期

请重新获取

使用微信扫一扫

登录博睿谷

Hadoop大数据开发实战
Hadoop大数据开发实战
¥139.00
¥199.00
新星会员免费观看
9.9元体验新星会员周卡
总课时
30课时
先修知识
授课模式
录播
学习人数
2474人
介绍
讲师
大纲
课件
实验
推荐

在今天的数字时代,数据已成为企业和组织中最宝贵的资产之一。为了有效地管理和分析这些海量数据,分布式计算和存储系统已经变得至关重要。本课程将带领同学深入探讨 Hadoop 及其生态圈,这一强大的开源工具集,旨在处理大规模数据处理和分析的挑战。

课程概览

第一部分:Hadoop 基础

首先,我们将介绍 Hadoop 分布式文件系统(HDFS)。HDFS 允许您在大规模集群上存储数据,确保高可用性和容错性。您将了解如何配置、管理和操作 HDFS,以便为大规模数据存储提供坚实的基础。

接着,我们将深入研究 MapReduce 分布式计算框架。MapReduce 是一种用于处理分布式数据的编程模型,它使我们能够轻松地处理大规模数据集,进行复杂的数据转换和分析。

第二部分:分布式协调与辅助系统

在本课程的下一部分,我们将介绍 ZooKeeper 分布式协调服务。ZooKeeper 提供了一种可靠的方式来协调分布式系统中的各个组件,确保它们能够协同工作。您将学会如何配置和使用 ZooKeeper 来管理分布式应用程序的状态和配置信息。

接下来,我们将研究 Hadoop 的生态圈中的一些关键辅助系统,包括:

  • Hive: Hive 是一个数据仓库工具,它允许您使用 SQL 类似的语言来查询和分析存储在 Hadoop 中的数据。您将学会如何创建表、编写查询,并将 Hive 与其他 Hadoop 组件集成。

  • HBase: HBase 是一个分布式、高性能的 NoSQL 数据库,专为处理大规模数据集设计。您将了解如何在 HBase 中存储和检索数据,并了解其在实时数据处理中的应用。

  • Flume 和 Sqoop: Flume 用于可靠地收集、汇总和移动大规模数据,而 Sqoop 则用于将数据传输到和从关系型数据库中。这两个工具对于将外部数据引入 Hadoop 生态系统或将数据导出到其他系统都非常有用。

通过本课程,您将获得深入了解 Hadoop 及其生态圈的能力,掌握分布式存储、计算和协调的关键概念,以及如何应用这些技能来解决实际的大数据挑战。无论您是数据工程师、数据科学家还是 IT 专业人士,都将受益于这门课程,因为它将为您提供处理和分析大规模数据的强大工具和技术。希望您享受学习的过程!


伍老师有10年的Java开发、大数据开发工作经验,精通Java、Scala、js、Python、sql等编程语言。熟练运用Java,运用各级框架的组合开发。并能熟悉基于Oracle、MySQL等多种数据库编程,有千万级的电信大数据处理经验;曾带领团队主导研发CRM大型项目。熟悉linux/unix平台;熟悉redis、solr、nginx、apache集群、负载均衡等等技术解决系统多并发的问题。精通Hadoop、hive、Spark等大数据组件,及华为大数据平台与数据挖掘知识体系。 项目经验: 1、广东电信营业厅效能评估子系统 2、广东电信渠道绩效业务支撑系统 3、某银行定期存款业务预测项目 4、某电商日志数据消费行为分析项目 5、AFC地铁售票机管理系统 6、广东移动销售绩效评估系统
  • 第1章 初识Hadoop
  •     第1节 大数据简介 试听
    视频名称:第1节大数据简介.wmv
  •     第2节 大数据技术核心需求 试听
    视频名称:第2节大数据技术核心需求.wmv
  •     第3节 Hadoop简介
  •     第4节 离线数据分析流程介绍
  •     第5节 大数据学习流程
  • 第2章搭建Hadoop集群
  •     第1节 安装准备
  •     第2节 Linux基本命令
  •     第3节 Hadoop集群搭建
  •     第4节 Hadoop集群测试
  • 第3章HDFS分布式文件系统
  •     第1节 HDFS的简介
  •     第2节 HDFS的架构和原理
  •     第3节 HDFS的Shell命令
  •     第4节 Java程序操作HDFS
  • 第4章MapReduce分布式计算框架
  •     第1节 认识MapReduce
  •     第2节 MapReduce作业解析
  •     第3节 MapReduce工作原理
  •     第4节 Shuffle阶段
  • 第5章Zookeeper分布式协调服务
  •     第1节 认识Zookeeper
  •     第2节 Zookeeper的安装和常用命令
  •     第3节 Zookeeper客户端编程
  •     第4节 Zookeeper典型应用场景
  • 第6章Hadoop2.0新特性
  •     第1节 Hadoop2.0新特性
  •     第2节 Yarn资源管理框架
  •     第3节 Hadoop的HA模式
  • 第7章Hive
  •     第1节 数据仓库简介
  •     第2节 认识Hive
  •     第3节 Hive安装
  •     第4节 Hive数据类型
  •     第5节 Hive数据库操作
  •     第6节 Hive表
  •     第7节 Hive表的查询
  •     第8节 Hive函数
  •     第9节 Hive 案例分析
  • 第8章HBase分布式存储系统
  •     第1节 认识HBase
  •     第2节 HBase表设计
  •     第3节 HBase安装
  •     第4节 HBase Shell常用操作
  • 第9章 Flume
  •     第1节 认识Flume
  •     第2节 Flume基本组件
  •     第3节 Flume安装
  •     第4节 Flume数据流模型
  •     第5节 采集案例
  • 第10章Sqoop
  •     第1节 认识Sqoop
  •     第2节 Sqoop安装
  •     第3节 Sqoop命令
  •     第4节 Sqoop数据导入
  •     第5节 Sqoop数据导出
  •     第6节 Sqoop job
  • pdf

    Linux

    大小:1.84MB

    2023-04-25

  • pdf

    Hadoop

    大小:680.26KB

    2023-04-25

  • pdf

    MapReduce

    大小:902.25KB

    2023-04-25

  • pdf

    Zookeeper

    大小:339.16KB

    2023-04-25

  • pdf

    Hive

    大小:1000.39KB

    2023-04-25

  • pdf

    Hbase

    大小:390.2KB

    2023-04-25

    • 实验名称
      Linux基本命令
    • 实验描述
      在本练习中,您将练习使用Linux的基本命令
    • 实验名称
      HDFS基本命令
    • 实验描述
      在本练习中,您将练习使用HDFS、Hadoop分布式文件系统。您将使用HDFS命令行工具来操纵HDFS中的文件
    • 实验名称
      MapReduce执行单词统计
    • 实验描述
      在本练习中,您将练习使用MapReduce执行单词统计。
    • 实验名称
      Zookeeper基础命令
    • 实验描述
      在本练习中,您将练习使用Zookeeper基础命令
    • 实验名称
      Hive数据库操作
    • 实验描述
      在本练习中,您将练习使用Hive操作数据库
    • 实验名称
      Hive表操作
    • 实验描述
      在本练习中,您将练习使用Hive操作Hive表
    • 实验名称
      Hbase的命令操作
    • 实验描述
      在本练习中,您将练习使用Hbase命令行操作Hbase
    • 实验名称
      Sqoop数据导入
    • 实验描述
      在本练习中,您将练习使用选择mysql中数据库的表,导入相对应的hdfs的表中
    • 实验名称
      Sqoop数据导出
    • 实验描述
      在本练习中,您将练习使用Sqoop的hdfs数据导出 mysql
    • 实验名称
      Sqoop命令
    • 实验描述
      在本练习中,您将练习使用Sqoop命令
    • 实验名称
      Java程序操作HDFS
    • 实验描述
      在本练习中,您将练习使用Java程序操作HDFS
    • 实验名称
      Zookeeper客户端编程
    • 实验描述
      在本练习中,您将练习使用idea操作zookeeper
    • 实验名称
      Hive案例
    • 实验描述
      在本练习中,您将练习使用idea操作hive
    • 实验名称
      Hive表查询
    • 实验描述
      在本练习中,您将练习使用Hive操作Hive表查询
    • 实验名称
      Hive函数
    • 实验描述
      在本练习中,您将练习使用Hive操作Hive函数
    • 实验名称
      Sqoop Job操作
    • 实验描述
      在本练习中,您将练习使用Sqoop Job
    • 实验名称
      Flume采集目录数据
    • 实验描述
      在本练习中,您将练习使用Flume采集目录数据,数据保存到hdfs
    课程名称:
    Hadoop大数据开发实战
    课程原价:
    19900
    课程现价:
    139
    支付方式:
    支付宝支付
    微信支付
    确认支付
    支付剩余时间: 15:00
    视频试听
    购买课程
    当前课程仅限高级会员学习!
    成为会员
    取消