數據來源:拉勾網
數據來源:拉勾網
涵蓋了大數據體系中的
絕大多數的重要技術
以案例驅動教學
將真實的案例貫穿到知識點中
項目源于企業中的真實項目
學完即可直接勝任企業崗位需求
第一階段JAVA基礎階段 |
JAVA就大數據開發的基礎,大數據標準Hadoop就是用JAVA實現的。打好堅實的JAVA基礎有利于大數據程序開發工作。同時,關系型數據庫及SQL語句也是大數據的重要基礎,還要掌握JAVA與數據庫交互的技術JDBC。
第二階段WEB框架階段 |
Web是大數據的重要數據來源,同時,大數據分析的結果通常也要借助Web來進行展示,本階段課程要求掌握Web前端開發技術、JAVA WEB技術和流行的SSM框架,為大數據項目奠定基礎。
第三階段構建離線數據分析平臺階段 |
Hadoop是大數據技術的核心和標準,而HDFS和MapReduce又是Hadoop的核心和標準,包括Hadoop的五個核心進程,也必須掌握。此外,我們還要學習Hadoop集群及搭建集群的協調工具ZooKeeper,數據倉庫分析工具Hive,和初步接觸內存計算框架Spark。
第四階段構建實時數據分析平臺階段 |
實時流式數據分析也是大數據的重要應用領域,本課程以Spark Streaming和Storm兩種流式計算框架為核心,還包括機器學習MLlib、圖數據庫Graphx、消息中間件Kafka、日志收集工具Flume等,搭建一個成熟商用的實時大數據分析平臺。
第五階段python與openstack云計算框架 |
大數據與云計算密不可分。本課程研究虛擬化容器Docker和云計算標準技術openStack,分析openstack的各種重要組件及其使用,包括使用Dashboard可視化使用和使用Python語言編程控制,以及云計算遷移,公有云、私有云、混合云的搭建策略