課程目錄:用Spark和Python通過PySpark處理大數據培訓
4401 人關注
(78637/99817)
課程大綱:

       用Spark和Python通過PySpark處理大數據培訓

 

 

 

介紹

了解大數據

Spark概述

Python概述

PySpark概述

使用彈性分布式數據集框架分發數據
使用Spark API運算符分布計算
設置Python和Spark

設置PySpark

針對Spark使用Amazon Web Services(AWS)EC2實例

設置數據塊

設置AWS EMR集群

學習Python編程的基礎知識

Python入門
使用Jupyter Notebook
使用變量和簡單的數據類型
使用列表
使用 if 語句
使用用戶輸入
處理while循環
實現函數
使用類
處理文件和異常
處理項目、數據、API
學習Spark DataFrame的基礎知識

Spark DataFrames入門
用Spark實現基本操作
使用Groupby和聚合操作
使用時間戳和日期
進行Spark DataFrame項目練習

了解用MLlib進行機器學習

使用MLlib、Spark和Python進行機器學習

了解回歸

學習線性回歸理論
實現回歸評估代碼
進行線性回歸示例練習
學習Logistic回歸理論
實現一個Logistic回歸代碼
進行Logistic回歸示例練習
了解隨機森林(Random Forests)和決策樹(Decision Trees)

學習樹方法論(Tree Methods Theory)
實現決策樹和隨機森林代碼
進行隨機森林分類示例練習
使用K均值聚類

了解K均值聚類理論
實現K均值聚類代碼
進行群集示例練習
使用推薦系統

實現自然語言處理

理解自然語言處理(NLP)
NLP工具概述
進行NLP示例練習
在Python中用Spark進行流式處理

用Spark進行流式處理概述
Spark流數據處理(Spark Streaming)示例練習

主站蜘蛛池模板: 国产精品国色综合久久| 伊人久久大香线蕉综合影院首页| 亚洲 欧美 日韩 综合aⅴ视频| 欧美婷婷六月丁香综合色| 色偷偷91久久综合噜噜噜噜| 亚洲综合色视频在线观看| 色综合久久久久| 大香网伊人久久综合网2020| 综合国产在线观看无码| 狠狠综合久久AV一区二区三区| 91超碰碰碰碰久久久久久综合 | 国产综合精品女在线观看| 欧美久久天天综合香蕉伊| 91精品国产综合久久香蕉| 久久综合精品国产一区二区三区| 色与欲影视天天看综合网| 亚洲国产综合91精品麻豆| 国产欧美日韩综合精品一区二区| 久久影院综合精品| 无翼乌无遮挡全彩老师挤奶爱爱帝国综合社区精品 | 亚洲综合无码精品一区二区三区| 日韩无码系列综合区| 狠狠色噜噜狠狠狠狠色综合久AV| 综合久久一区二区三区| 色婷婷狠狠久久综合五月| 亚洲国产综合专区在线电影| 国产成人综合美国十次| 色婷婷综合久久久久中文一区二区| 色婷婷久久综合中文久久一本| 99久久婷婷国产综合精品草原| 国产综合久久久久久鬼色| 亚洲精品欧美综合| 人妻 日韩 欧美 综合 制服| 综合自拍亚洲综合图不卡区| 精品国产综合区久久久久久| 青青综合在线| 亚洲国产综合91精品麻豆| 无码专区久久综合久中文字幕| 欧美自拍另类欧美综合图片区| 国产成人亚洲综合无码| 自拍 偷拍 另类 综合图片|