主要学习一些Java语言的概念,如字符、bai流程控制、面向对象、进程线程、枚举反射等,学习MySQL数据库的安装卸载及相关操作,学习JDBC的实现原理以及Linux基础知识,是大数据刚入门阶段。
主要讲解CAP理论、数据分布方式、一致性、2PC和3PC、大数据集成架构。涉及的知识点有Consistency一致性、Availability可用性、Partition
tolerance分区容忍性、数据量分布、2PC流程、3PC流程、哈希方式、一致性哈希等。
主要讲解协调服务ZK(1T)、数据存储hdfs(2T)、数据存储alluxio(1T)、数据采集flume、数据采集logstash、数据同步Sqoop(0.5T)、数据同步datax(0.5T)、数据同步mysql-binlog(1T)、计算模型MR与DAG(1T)、hive(5T)、Impala(1T)、任务调度Azkaban、任务调度airflow等。
主要讲解数仓仓库的历史背景、离线数仓项目-伴我汽车(5T)架构技术解析、多维数据模型处理kylin(3.5T)部署安装、离线数仓项目-伴我汽车升级后加入kylin进行多维分析等;
主要讲解计算引擎、scala语言、spark、数据存储hbase、redis、kudu,并通过某p2p平台项目实现spark多数据源读写。
主要讲解数据通道Kafka、实时数仓druid、流式数据处理flink、SparkStreaming,并通过讲解某交通大数让你可以将知识点融会贯通。
主要讲解elasticsearch,包括全文搜索技术、ES安装操作、index、创建索引、增删改查、索引、映射、过滤等。
主要讲解数据标准、数据分类、数据建模、图存储与查询、元数据、血缘与数据质量、Hive Hook、Spark Listener等。
主要讲解Superset、Graphna两大技术,包括基本简介、安装、数据源创建、表操作以及数据探索分析。
主要讲解机器学习中的数学体系、Spark Mlib机器学习算法库、Python scikit-learn机器学习算法库、机器学习结合大数据项目。
因为大数据行业的技术总在更新,学员学到目前主流的大数据技术才好找工作,所以好的培训机构的课程也要做到经常更新才好。反之,如果培训机构的课程内容是过时的,那么学员即使学会了找工作时也很容易被拒绝。所以提前了解授课内容是比较重要的,可以拿着和企业需求做对比。
第一阶段Java基础,主要知识点有:Java基础语法、面向对象编程、常用类和工具类、集合框架体系、异常处理机制、文件和IO流、移动开户管理系统、多线程、枚举和垃圾回收、反射、JDK新特性、通讯录系统。
第二阶段JavaEE核心,主要知识点有:前端技术、数据库、JDBC技术、服务器端技术、Maven、Spring、SpringBoot、Git。
第三阶段Hadoop生态体系,主要知识点有:Linux、Hadoop、ZooKeeper、Hive
HBase、Phoenix、Impala、Kylin、Flume、Sqoop&DataX、Kafka、Oozie&Azkaban
Hue、智慧农业数仓分析平台。
第四阶段Spark生态体系,主要知识点有:Scala、Spark、交通领域汽车流量监控项目、Flink。
第五阶段项目实战+机器学习,主要知识点有:高铁智能检测系统、电信充值、中国天气网、机器学习。
第六阶段为就业指导,主要有企业面试前期准备与技巧、专业指导、企业面试复盘,帮助学员快速就业。
以上就是优就业大数据学习路线。