4006061723微信:shanghai3347
「深圳CDA数据分析师」-深耕数据人才教育15年,致力于打造数据人才全方位学习平台,汇聚优质学习资源,助力数据人才找到好工作。开设的课程有:数据分析培训,业务数据赋能,商业策略分析,精益数据挖掘,python机器学习等。CDA秉承着总结凝练先进的商业数据分析实践为使命,明晰各类数据分析从业者的知识体系为职责,旨在加强范围内化、科学化、专业化的大数据及数据分析人才队伍建设,进一步提升数据分析师的职业素养与能力水平,促进数据分析行业的高质量持续发展。
适合初学者的大数据学习路线
第 一阶段:大数据学习必备Java技术
目前大部分企业大数据技术实现都是在Java编程语言基础之上,因此对于基础差的同学首先要掌握Java开发技术,此阶段需要掌握的知识内容有Java编程基础、面向对象入门、JavaWeb核心知识、Java开发主流框架(Spring组件、SpringMVC、Mybatis组件等)、Java常用流行框架(Lucene组件、Spring Data JPA、SpringBoot等)。学习完成本阶段大家已经具备企业级JavaWeb项目的开发,并且能够掌握微服务框架的使用,完成项目环境部署。
第二阶段:大数据基础增强
在掌握了Java核心技术之后,还需要进一步学习Linux操作基础,主要学习Linux操作系统的理论基础和服务器配置时间知识,掌握Linux操作系统的网络配置、DNS/DHCP/HTTP/FTP/SMTP和POP3服务的配置与管理,为更深一步学习其他网络操作系统和软件系统开发奠定坚实的基础。
第三阶段:大数据技术学习
掌握以上两个阶段的内容后,就要开始大数据技术的学习了。在大数据学习中核心需要掌握的技术点包括Hadoop、NoSQL、Kafka、ELK、Spark、Flink、Druid等知识点。
1、Hadoop,在Hadoop离线分布式系统学习中,需要重点掌握HDFS组件详解以及实战、mapreduce 组件详解以及性能优化、Yarn组件详解以及多租户的实现、hive组件实战以及性能优化、impala组件实战以及性能优化sqoop常见问题详解。
2、NoSQL介绍、Redis的原理和架构、 Redis的集群搭建、Hbase的应用场景、Hbase架构和原理以及RowKey设计和优化策略、HBase+Redis微博实战案例、Elasticsearch的功能、架构和原理以及ELK案例实战
3、Spark,在Spark内存计算系统需要重点学习的内容包括:Scala语言基础、Spark入门以及集群搭建、SparkRDD、Spark SQL、SparkSrteaming、Structured Streaming、Kudu等。
4、Flink,Flink的运行机制、Flink组件和逻辑计划、Flink执行计划生成、JobManager中的基本组件、TaskManager、算子、网络、水印WaterMark、任务调度,flink的状态管理、CheckPoint、flinksql及flinkTableApi。