2017年大數(shù)據(jù)平臺搭建與高性能計算最佳實戰(zhàn)

2017年大數(shù)據(jù)平臺搭建與高性能計算最佳實戰(zhàn)課程
[課程簡介]：根據(jù)黨中央和國務院“互聯(lián)網(wǎng)+”行動計劃戰(zhàn)略布局，落實國務院促進大數(shù)據(jù)發(fā)展行動綱要，響應工業(yè)和信息化部培養(yǎng)大數(shù)據(jù)技術高端人才的號召,中國信息化培訓中心特推出了大數(shù)據(jù)平臺搭建與高性能計算實戰(zhàn)課程培訓班。 ...

【時間地點】	2017年12月15-18日北京
【培訓講師】	多名講師
【參加對象】	不限
【參加費用】	￥5800元/人（含場地費、考試證書費、教材費、學習期間的午餐費）食宿統(tǒng)一安排，費用自理。請學員帶二寸彩照1張（背面注明姓名），身份證復印件一張。本課程學習考核通過后由中國信息化培訓中心頒發(fā)《大數(shù)據(jù)開發(fā)高級架構師》證書; 證書可作為專業(yè)技術人員職業(yè)能力考核的證明，以及專業(yè)技術人員崗位聘用、任職、定級和晉升職務的重要依據(jù)。
【會務組織】	森濤培訓網(wǎng)（www.gzlkec.com）．廣州三策企業(yè)管理咨詢有限公司
【咨詢電話】	020-34071250；020-34071978（提前報名可享受更多優(yōu)惠）
【聯(lián) 系人】	龐先生，鄧小姐；13378458028、18924110388（均可加微信）
【在線 QQ 】	568499978	課綱下載
【溫馨提示】	本課程可引進到企業(yè)內(nèi)部培訓，歡迎來電預約！

培訓關鍵詞：大數(shù)據(jù)平臺培訓,大數(shù)據(jù)管理培訓

2017年大數(shù)據(jù)平臺搭建與高性能計算最佳實戰(zhàn)(多名講師)課程介紹：

根據(jù)黨中央和國務院“互聯(lián)網(wǎng)+”行動計劃戰(zhàn)略布局，落實國務院促進大數(shù)據(jù)發(fā)展行動綱要，響應工業(yè)和信息化部培養(yǎng)大數(shù)據(jù)技術高端人才的號召,中國信息化培訓中心特推出了大數(shù)據(jù)平臺搭建與高性能計算實戰(zhàn)課程培訓班。通過專業(yè)的大數(shù)據(jù)技術架構體系與業(yè)界真實案例來全面提升大數(shù)據(jù)項目高管、大數(shù)據(jù)平臺架構師，以及大數(shù)據(jù)開發(fā)工程師與大數(shù)據(jù)應用設計人員的專業(yè)水平，旨在培養(yǎng)專業(yè)的大數(shù)據(jù)技術架構專家，培養(yǎng)大數(shù)據(jù)技術和應用創(chuàng)新型人才，促進大數(shù)據(jù)技術在各行業(yè)內(nèi)部及跨行業(yè)進行實施應用，以及企事業(yè)單位的大數(shù)據(jù)項目開發(fā)和落地，并利用大數(shù)據(jù)提升競爭力優(yōu)勢。

一、培訓特色
1. 課程培訓業(yè)界最流行、應用最廣泛的Hadoop與Spark大數(shù)據(jù)技術體系。
強化大數(shù)據(jù)平臺的分布式集群架構和核心關鍵技術實現(xiàn)、大數(shù)據(jù)應用項目開發(fā)和大數(shù)據(jù)集群運維實踐、以及Hadoop與Spark大數(shù)據(jù)項目應用開發(fā)與調(diào)優(yōu)的全過程沙盤模擬實戰(zhàn)。
2. 通過一個完整的大數(shù)據(jù)開發(fā)項目及一組實際項目訓練案例，完全覆蓋Hadoop與Spark生態(tài)系統(tǒng)平臺的應用開發(fā)與運維實踐。課堂實踐項目以項目小組的形式進行沙盤實操練習，重點強化理解Hadoop與Spark大數(shù)據(jù)項目各個階段的工作重點，同時掌握作為大數(shù)據(jù)項目管理者的基本技術與業(yè)務素養(yǎng)。
3. 本課程的授課師資都是有著多年在一線從事Hadoop與Spark大數(shù)據(jù)項目的資深講師，采用原理技術剖析和實戰(zhàn)案例相結合的方式開展互動教學、強化以建立大數(shù)據(jù)項目解決方案為主體的應用開發(fā)、技術討論與交流咨詢，在學習的同時促進講師學員之間的交流，讓每個學員都能在課程培訓過程中學到實實在在的大數(shù)據(jù)技術知識體系，以及大數(shù)據(jù)技術應用實戰(zhàn)技能，具備實際大數(shù)據(jù)應用項目的動手開發(fā)實踐與運維管理部署能力。授課過程中，根據(jù)學員需求，增設交流環(huán)節(jié)，可將具體工作中遇到的實際問題展開討論，講師會根據(jù)學員的實際情況微調(diào)授課內(nèi)容，由講師帶著全部學員積極討論，并給出一定的時間讓學員上臺發(fā)言，現(xiàn)場剖析問題的癥結，規(guī)劃出可行的解決方案。

二、培訓目標
1.深刻理解在“互聯(lián)網(wǎng)+”時代下大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程和演化趨勢；
2.了解業(yè)界市場需求和國內(nèi)外最新的大數(shù)據(jù)技術潮流，洞察大數(shù)據(jù)的潛在價值；
3.理解大數(shù)據(jù)項目解決方案及業(yè)界大數(shù)據(jù)應用案例，從而為企業(yè)在大數(shù)據(jù)項目
中的技術選型及技術架構設計提供決策參考；
4.掌握業(yè)界最流行的Hadoop與Spark大數(shù)據(jù)技術體系；
5.掌握大數(shù)據(jù)采集技術；
6.掌握大數(shù)據(jù)分布式存儲技術；
7.掌握NoSQL與NewSQL分布式數(shù)據(jù)庫技術；
8.掌握大數(shù)據(jù)倉庫與統(tǒng)計機器學習技術；
9.掌握大數(shù)據(jù)分析挖掘與商業(yè)智能（BI）技術；
10.掌握大數(shù)據(jù)離線處理技術；
11.掌握Storm流式大數(shù)據(jù)處理技術；
12.掌握基于內(nèi)存計算的大數(shù)據(jù)實時處理技術；
13.掌握大數(shù)據(jù)管理技術的原理知識和應用實戰(zhàn)；
14.深入理解大數(shù)據(jù)平臺技術架構和使用場景；
15.嫻熟運用Hadoop與Spark大數(shù)據(jù)技術體系規(guī)劃解決方案滿足實際項目需求；
16.熟練地掌握基于Hadoop與Spark大數(shù)據(jù)平臺進行應用程序開發(fā)、集群運維管理和性能調(diào)優(yōu)技巧。

三、課程大綱

第一天上午
大數(shù)據(jù)技術基礎
1. 大數(shù)據(jù)的產(chǎn)生背景與發(fā)展歷程
2. 大數(shù)據(jù)的4V特征，以及與云計算的關系
3. 大數(shù)據(jù)應用需求以及潛在價值分析
4. 業(yè)界最新的大數(shù)據(jù)技術發(fā)展態(tài)勢與應用趨勢
5. 大數(shù)據(jù)項目的系統(tǒng)與技術選型，及落地實施的挑戰(zhàn)
6. “互聯(lián)網(wǎng)+”時代下的電子商務、制造業(yè)、零售批發(fā)、電信運營商、互聯(lián)網(wǎng)金融業(yè)、電子政務、移動互聯(lián)網(wǎng)、教育信息化等行業(yè)應用實踐與應用案例介紹

業(yè)界主流的大數(shù)據(jù)技術方案 1. 大數(shù)據(jù)軟硬件系統(tǒng)全棧與關鍵技術介紹
2. 主流的大數(shù)據(jù)解決方案介紹
3. Apache大數(shù)據(jù)平臺方案剖析
4. CDH大數(shù)據(jù)平臺方案剖析
5. HDP大數(shù)據(jù)平臺方案剖析
6. 大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫方案比較

大數(shù)據(jù)計算模型（一）——批處理MapReduce
1. MapReduce產(chǎn)生背景與適用場景
2. MapReduce計算模型的基本原理
3. MapReduce作業(yè)執(zhí)行流程
4. MapReduce基本組件，JobTracker和TaskTracker
5. MapReduce高級編程應用，Combiner和Partitioner
6. MapReduce性能優(yōu)化技巧
7. MapReduce案例分析與開發(fā)實踐操作

第一天下午
大數(shù)據(jù)存儲系統(tǒng)與應用實踐
1. 分布式文件系統(tǒng)HDFS產(chǎn)生背景與適用場景
2. HDFS master-slave系統(tǒng)架構與工作原理
3. HDFS核心組件技術講解
4. HDFS高可用保證機制
5. HDFS集群的安裝、部署與配置，熟練HDFS shell命令操作
6. 分布式小文件存儲系統(tǒng)的平臺架構、核心技術與應用場景
7. 分布式對象存儲系統(tǒng)的平臺架構、核心技術與應用場景

Hadoop框架與生態(tài)發(fā)展，以及應用實踐操作 1. Hadoop的發(fā)展歷程
2. Hadoop大數(shù)據(jù)生態(tài)圈系統(tǒng)與工具全貌介紹
3. Hadoop 1.0的核心組件與適用范圍
4. Hadoop 2.0的核心組件YARN工作原理，以及與Hadoop 1.0的區(qū)別
5. Hadoop資源管理與作業(yè)調(diào)度機制
6. Hadoop 常用性能優(yōu)化技術
7. Hadoop集群安裝與部署實踐，以及MapReduce程序在YARN上執(zhí)行

第二天上午
大數(shù)據(jù)計算模型（二）——實時處理/內(nèi)存計算 Spark
1. MapReduce計算模型的瓶頸
2. Spark產(chǎn)生動機、基本概念與適用場景
3. Spark編程模型與RDD彈性分布式數(shù)據(jù)集的工作原理與機制
4. Spark實時處理平臺運行架構與核心組件
5. Spark容錯機制
6. Spark作業(yè)調(diào)度機制
7. Scala開發(fā)介紹與實踐
8. Spark集群部署與配置實踐，Spark開發(fā)環(huán)境構建，Spark案例程序分析，Spark程序開發(fā)與運行，Spark與Hadoop集群集成實踐

第二天下午
大數(shù)據(jù)倉庫查詢技術Hive、SparkSQL、Impala，以及應用實踐
1. 基于MapReduce的大型分布式數(shù)據(jù)倉庫Hive基礎知識與應用場景
2. Hive數(shù)據(jù)倉庫的平臺架構與核心技術剖析
3. Hive metastore的工作機制與應用
4. Hive數(shù)據(jù)倉庫實踐：Hive集群安裝部署，數(shù)據(jù)倉庫表導入導出與分區(qū)操作，Hive SQL操作，Hive客戶端操作
5. 基于Spark的大型分布式數(shù)據(jù)倉庫SparkSQL基礎知識與應用場景
6. Spark SQL實時數(shù)據(jù)倉庫的實現(xiàn)原理與工作機制
7. SparkSQL應用分析與操作實踐
8. 基于MPP的大型分布式數(shù)據(jù)倉庫Impala基礎知識與應用場景
9. Impala實時查詢系統(tǒng)平臺架構、關鍵技術剖析

Hadoop集群運維監(jiān)控工具
1. Hadoop大數(shù)據(jù)運維監(jiān)控管理系統(tǒng)HUE平臺介紹
2. Hadoop運維管理監(jiān)控系統(tǒng)Ambari工具介紹
3. 第三方運維系統(tǒng)與工具Ganglia, Nagios

第三天上午

大數(shù)據(jù)計算模型（三）——流處理Storm, SparkStreaming
1. 流數(shù)據(jù)處理應用場景與流數(shù)據(jù)處理的特點
2. 流數(shù)據(jù)處理工具Storm的平臺架構與集群工作原理
3. Storm關鍵技術與并發(fā)機制
4. Storm編程模型與基本開發(fā)模式
5. Storm數(shù)據(jù)流分組
6. Storm可靠性保證與Acker機制
7. Storm應用案例分析與實踐：Storm集群安裝部署，Storm程序開發(fā)運行操作實踐，Storm與Hadoop集群的集成
8. 流數(shù)據(jù)處理工具Spark Streaming基本概念與數(shù)據(jù)模型
9. Spark Streaming工作機制

大數(shù)據(jù)ETL操作工具，與大數(shù)據(jù)分布式采集系統(tǒng)
1. Hadoop與DBMS之間數(shù)據(jù)交互工具的應用
2. Sqoop導入導出數(shù)據(jù)的工作原理，以及Sqoop工具的安裝部署與實踐操作，利用Sqoop實現(xiàn)MySQL與Hadoop集群之間的數(shù)據(jù)導入導出交互
3. Flume-NG數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)流模型與系統(tǒng)架構
4. Kafka分布式消息訂閱系統(tǒng)的應用介紹與平臺架構，及其使用模式

第三天下午
面向OLTP型應用的NoSQL數(shù)據(jù)庫及應用實踐
1. 關系型數(shù)據(jù)庫瓶頸，以及NoSQL數(shù)據(jù)庫的發(fā)展，概念，分類，及其在半結構化和非結構化數(shù)據(jù)場景下的適用范圍
2. 列存儲NoSQL數(shù)據(jù)庫HBase簡介與數(shù)據(jù)模型剖析
3. HBase分布式集群系統(tǒng)架構與讀寫機制，ZooKeeper分布式協(xié)調(diào)服務系統(tǒng)的工作原理與應用
4. HBase表設計模式與primary key設計規(guī)范
5. HBase分布式集群安裝、部署與操作實踐
6. 文檔NoSQL數(shù)據(jù)庫MongoDB簡介與數(shù)據(jù)模型剖析
7. MongoDB集群模式、讀寫機制與常用API操作
8. Cassandra分布式數(shù)據(jù)庫的平臺架構以及關鍵技術
9. Cassandra一致性哈希算法與數(shù)據(jù)分布策略，以及NWR策略
10.鍵值型NoSQL數(shù)據(jù)庫Redis簡介與數(shù)據(jù)模型剖析
11.Redis多實例集群架構與關鍵技術
12.NewSQL數(shù)據(jù)庫技術簡介及其適用場景
大數(shù)據(jù)項目選型、實施、優(yōu)化等問題交流討論大數(shù)據(jù)項目的需求分析、應用實施、系統(tǒng)優(yōu)化，以及解決方案等咨詢與交流討論

第四天學習考核與業(yè)內(nèi)經(jīng)驗交流

四、授課師資
鐘老師現(xiàn)任職于中科院某研究所，高級工程師，副高職稱，博士畢業(yè)于中國科學院計算技術研究所，獲工學博士學位（計算機系統(tǒng)結構方向）。中培教育的大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)系列課程建設與教學專家。近六年來帶領團隊主要從事大數(shù)據(jù)與云計算技術項目的研發(fā)與IT項目管理工作。鐘老師有著多年的企業(yè)內(nèi)訓和公開課培訓講師經(jīng)歷，主要講授大數(shù)據(jù)平臺技術、云計算、移動互聯(lián)網(wǎng)、電子商務、IT信息軟件項目管理、企業(yè)信息化規(guī)劃與管理、IT戰(zhàn)略規(guī)劃與企業(yè)架構、數(shù)據(jù)中心主機規(guī)劃與IDC系統(tǒng)運營等企業(yè)實戰(zhàn)類培訓課程。鐘老師將原理技術剖析和應用實戰(zhàn)相結合的授課風格受到廣大公開課學員和企業(yè)內(nèi)訓學員的歡迎。

蔣老師清華大學博士，云計算專家熟悉主流的云計算平臺，并有商業(yè)與開源云計算平臺的實踐經(jīng)驗,對云計算關鍵技術有深刻了解和實踐經(jīng)驗，如分布式系統(tǒng)、虛擬化、分布式文件系統(tǒng)、云存儲等，參與并領導多個大型云計算項目。對大數(shù)據(jù)關鍵技術有深刻了解和實踐經(jīng)驗，如NoSQL數(shù)據(jù)庫、大數(shù)據(jù)處理、Hadoop、Hive、HBase、Spark等。

課綱下載

2017年大數(shù)據(jù)平臺搭建與高性能計算最佳實戰(zhàn)

2017年大數(shù)據(jù)平臺搭建與高性能計算最佳實戰(zhàn)(多名講師)課程介紹：

更多2017年大數(shù)據(jù)平臺搭建與高性能計算最佳實戰(zhàn)相關課程：