曙海教育集團
全國報名免費熱線:4008699035 微信:shuhaipeixun
或15921673576(微信同號) QQ:1299983702
首頁 課程表 在線聊 報名 講師 品牌 QQ聊 活動 就業(yè)
 
Spark大數據平臺應用實戰(zhàn)課程

 
  班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號)
      每個班級的人數限3到5人,互動授課, 保障效果,小班授課。
  上間和地點
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區(qū)1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈
最近開間(周末班/連續(xù)班/晚班):2020年3月16日
  實驗設備
    ◆小班教學,教學效果好
       
       ☆注重質量☆邊講邊練

       ☆合格學員免費推薦工作
       ★實驗設備請點擊這兒查看★
  質量保障

       1、培訓過程中,如有部分內容理解不透或消化不好,可免費在以后培訓班中重聽;
       2、培訓結束后,授課老師留給學員聯系方式,保障培訓效果,免費提供課后技術支持。
       3、培訓合格學員可享受免費推薦就業(yè)機會。☆合格學員免費頒發(fā)相關工程師等資格證書,提升職業(yè)資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。

部份程大綱
 

第一部份. Spark背景介紹與安裝部署
1.1 Spark在大數據生態(tài)中的定位
1.2 Spark主要模塊介紹
1.3 Spark部署模型介紹
1.4 Spark基于Ambari的安裝
1.5 Spark Standalone下的HA

第二部份. 基于Java的Spark編程入門
2.1 Spark應用中的術語介紹
2.2 交互式工具spark-shell
2.3 從Word Count看Spark編程
2.4 spark-submit的幾種用法

第三部份 Spark常用算子介紹
3.1 transform與action
3.2 廣播變量與累加器
3.3 persist與checkpoint
3.4 數據本地性(Data locality)

第四部份. 一個Spark應用的一生
4.1 Spark應用的Stage劃分
4.2 窄依賴 vs. Shuffle依賴
4.3 Job邏輯執(zhí)行計劃
4.4 Job物理執(zhí)行計劃

第五部份. Shuffle機制變遷
5.1 Hadoop Shuffle方案
5.2 Spark Hash Shuffle
5.3 Spark Sort Shuffle
5.4 Spark Tungsten Sort Shuffle

第六部份. Spark SQL實戰(zhàn)
6.1 Spark SQL前世今生
6.2 RDD vs. Dataframe vs. Dataset
6.3 使用外部數據源
6.4 連接metastore
6.5 自定義函數
6.6 spark-sql與Spark thrift server

第七部份. Spark SQL原理
7.1 Spark SQL執(zhí)行過程解析
7.2 Catalyst原理
7.3 SQL引擎原理
7.4 Spark SQL優(yōu)化

第八部份. 例講數據傾斜解決方案
8.1 為何需要處理數據傾斜
8.2 調整并行度,分散同一Task的不同Key
8.3 自定義Partitioner,分散同一Task的不同Key
8.4 Map Join代替Reduce Join消除數據傾斜
8.5 為傾斜key增加隨機前綴
8.6 大表增加隨機前綴,小表擴容

第九部份. Spark Streaming上
9.1 Spark Streaming示例
9.2 流式系統關鍵問題分析
9.3 Window操作
9.4 如何在流數據上做Join
9.5 Checkpoint機制

第十部份. Spark Streaming下
10.1 如何處理數據亂序問題
10.2 Spark Streaming容錯機制
10.3 Spark與Kafka實現Exactly once
10.4 Spark Streaming vs. Storm vs. Kafka Stream
10.5 Spark Streaming性能優(yōu)化
10.6 Structured Streaming

第十一部份. Spark MLlib
11.1 Pipeline
11.2 特征工程
11.3 模型選擇
11.4 調優(yōu)

第十二部份. Spark優(yōu)化
12.1 應用代碼優(yōu)化
12.2 Spark統一內存模型
12.3 基于YARN的參數優(yōu)化
12.4 其它優(yōu)化項

 

-

 

  備案號:備案號:滬ICP備08026168號-1 .(2024年07月24日)....................
友情鏈接:Cadence培訓 ICEPAK培訓 EMC培訓 電磁兼容培訓 sas容培訓 羅克韋爾PLC培訓 歐姆龍PLC培訓 PLC培訓 三菱PLC培訓 西門子PLC培訓 dcs培訓 橫河dcs培訓 艾默生培訓 robot CAD培訓 eplan培訓 dcs培訓 電路板設計培訓 浙大dcs培訓 PCB設計培訓 adams培訓 fluent培訓系列課程 培訓機構課程短期培訓系列課程培訓機構 長期課程列表實踐課程高級課程學校培訓機構周末班培訓 南京 NS3培訓 OpenGL培訓 FPGA培訓 PCIE培訓 MTK培訓 Cortex訓 Arduino培訓 單片機培訓 EMC培訓 信號完整性培訓 電源設計培訓 電機控制培訓 LabVIEW培訓 OPENCV培訓 集成電路培訓 UVM驗證培訓 VxWorks培訓 CST培訓 PLC培訓 Python培訓 ANSYS培訓 VB語言培訓 HFSS培訓 SAS培訓 Ansys培訓 短期培訓系列課程培訓機構 長期課程列表實踐課程高級課程學校培訓機構周末班 端海 教育 企業(yè) 學院 培訓課程 系列班 長期課程列表實踐課程高級課程學校培訓機構周末班 短期培訓系列課程培訓機構 端海教育企業(yè)學院培訓課程 系列班
主站蜘蛛池模板: 久久―日本道色综合久久| 综合欧美亚洲日本一区| 亚洲色偷偷综合亚洲AVYP| 99久久精品国产综合一区| 一本一道久久a久久精品综合| 婷婷久久香蕉五月综合加勒比| 国产精品综合久久第一页| 免费精品99久久国产综合精品| 亚洲国产综合无码一区二区二三区| 亚洲色图综合网| 日韩欧美综合在线| 激情综合五月天| 亚洲狠狠久久综合一区77777| 久久久久综合中文字幕| 久久综合九色综合精品| 99久久综合国产精品免费| 国产成人亚洲综合一区| 亚洲色欲久久久久综合网| 五月综合激情婷婷六月色窝| 狠狠色丁香婷婷综合久久来来去| 一个色综合久久| 色综合久久久久无码专区| 色婷婷综合久久久中文字幕| 99久久综合狠狠综合久久| 伊人久久大香线蕉综合影院首页| 久久综合综合久久综合| 久久综合噜噜激激的五月天| 亚洲综合AV在线在线播放| 亚洲欧美日韩国产综合| 久久93精品国产91久久综合| 婷婷成人丁香五月综合激情| 99久久婷婷国产综合精品草原| 亚洲第一综合天堂另类专| 五月天激情综合| 欧美综合在线观看| 久久综合精品国产一区二区三区| 久久本道综合久久伊人| 久久久久综合国产欧美一区二区| 天天做天天爱天天爽综合网| 色欲香天天综合网站| 亚洲综合另类小说色区|