400-886-8010/027-87158220

全國免費服務熱線

華為大數據HCIE-Big Data認證培訓

HCIE-Big Data
(Huawei Certified internetwork Expert Big Data)
華為認證互聯網專家-大數據
大數據是當下 IT 領域最熱門,最高大上,也是最被看好的行業,人才的稀缺程度從各公司,各大招聘網站開出的薪水便能感知,高薪就業無憂, 但大數據對于很多人來說不知道該如何學習,需要哪些基礎,學習一些什么內容,譽天將為零基礎學員量身定做,成為一名合格的大數據工程師,我們專注實戰和就業。
01
HCIE-Big Data認證
定位于大數據分析領域中大型分布式并行處理數據倉庫平臺的架構原理、優化設計、應用開發和大數據挖掘領域的基礎理論、常用挖掘算法、應用設計以及開發,旨在推動業界大數據行業的專家型人才培養。
02
HCIE-Big Data認證
包括但不僅限于:(1)華為企業級的大型并行處理分布式數據倉庫平臺FusionInsight LibrA的架構、功能特性、數據庫設計、數據庫數據導入導出、數據庫調優及數據庫開發等;(2)數據挖掘的理論(包括數據預處理、數據倉庫、分類、聚類、關聯規則等)以及使用華為企業級大數據挖掘平臺FusionInsight Miner和基于華為云的企業智能平臺EI (Enterprise Intelligence)的基礎服務 - MLS (Machine Learning Service,機器學習服務)進行數據深度分析和挖掘。
03
通過HCIE-Big Data認證
將證明您系統理解并掌握大型并行處理數據倉庫平臺的架構原理、分布式關系型數據庫的設計和優化及應用開發;掌握大數據挖掘的基本原理,常用算法、常用挖掘方法、對華為大數據挖掘解決方案FusionInsight Miner和華為云機器學習服務MLS的熟練使用,勝任數據倉庫開發、大數據分析、大數據數據挖掘和人工智能的相關崗位。
04
企業擁有HCIE-Big Data認證的工程師
意味著企業掌握了運用大數據技術進行大數據分析應用、大數據挖掘應用的能力。

課時:132課時


考試代碼 考試名稱 地點
H13-731 HCIE-Big Data(筆試) Prometric
H13-732 HCIE-Big Data(機試) 華為
H13-733 HCIE-Big Data(面試) 華為
N/A 面試補考 華為
N/A LAB分數復查 華為
譽天大數據項目優勢

01

擁有3名HCNA大數據講師,他們同時也是存儲和云計算HCIE

02

有IT及Linux相關的工作經驗和行業積累能給客戶提供一流的培訓體驗和價值

03

2017年6月3日,國內第一個HCNA-Big Data 班在譽天開班

04

2017年7月9日,國內首個HCNA-Big Data 企業定制班在譽天開班

05

2017年9月,華為耕云計劃國內首期 HCNA-Big Data沙龍在譽天北京校區打響第一槍

所需掌握的內容

學習大綱 具體內容
模塊一: Linux (贈送 24 課時視頻)
將利用我們多年的 Linux 經驗,讓您從零基礎迅速掌握 Linux 基本技能,滿足后續搭建原生態的 Hadoop 和學習 python 做好準備,這個基礎非常重要。

1. Linux 系統安裝

2. Linux 基礎使用
3. Linux 幫助系統和文件系統管理
4. 用戶,組及權限管理
5. IO 及管道,循環語句,環境變量, shell 基礎,腳本基礎
(精華)
6. 文本處理工具, grep,awk,sed 正則表達式等(精華)
7. 進程管理,遠程管理工具
8. Linux 下文件查找與壓縮
9. Linux 下文件系統的深入理解
(精華)
10.Linux 下軟件包的安裝和管理
11.Shell 腳本實戰
(精華)
模塊二:Hadoop 技術(36 小時)
Hadoop 是大數據最重要的運行平臺,華為 FusionInsight HD 就是基于開源的Hadoop 開發,但 Hadoop 組件眾多,原理復雜,我們將從原理及流程開始講解每個組件,然后使用命令行搭建一套開源的 Hadoop 系統,這樣才能更透徹的理解
這些組件,最后搭建出華為 FusionInsight 進行商業化應用,重點講解 Spark和 Hbase。
1. Hadoop 基礎
2. MapReduce 和 YARN 分布式計算引擎技術
3. 搭建開源的 Hadoop HA 的平臺
4. LDAP 及 Kerberos 工作原理及應用
5. Hadoop 分布式文件系統
6. Spark 基于內存的分布式計算技術
7. Hive 數據倉庫
8. HBase 分布式數據庫
9. Zookeeper 集群分布式鎖設施
10.Streaming 實時計算技術及應用
11.Kafka 訂閱消息系統
12.Flume 海量日志聚合
13.華為 FusionInsight HD 產品部署及使用
模塊三:數據庫(贈送 12 課時視頻)
這個是學習分布式數據庫的基礎,為后續分析平臺做好準備,學習數據庫的安裝,SQL 語句,數據庫的基本操作,數據庫視圖,索引等。
1. 搭建實驗環境、 虛擬機/操作系統/數據庫安裝/數據庫應用安裝、 數據庫基
礎知識
2. SELECT 基本語法、 過濾和排序數據、 單行函數、 高級子查詢 (精華)
3. 多表查詢、 分組函數、 子查詢、 操縱數據、 使用集合運算 (精華)
4. 創建和管理表、 內置約束、 創建視圖、 索引及其他數據庫對象 (精華)
5. 控制用戶訪問,數據字典
模塊四:大數據挖掘技術與實現(36 小時)
數據挖掘又稱數據庫中的知識發現(Knowledge Discover in Database, KDD),是目前人工智能和數據庫領域研究的熱點問題,所謂數據挖掘是指從數據庫的大量數據中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。
1. 分類和回歸
2. 決策樹分類算法
3. 組合分類
4. 隨機森林
5. 支持向量機分類算法
6. 樸素貝葉斯分類算法
7. 聚類算法
8. K-均值算法、中心點算法
9. 關聯規則 Apriori
10. 離群點檢測
11. 預處理

12. FusionInsight Miner 和華為云機器學習服務 MLS

大數據挖掘項目實戰(以下項目均有數據源)
1.銀行定期存款業務預測
2.鮑魚生長年齡
3.詞頻
4.逆文檔頻率
5.抽樣排序
6.用六種算法進行銀行存款分析
7.防止欺詐
8.電影推薦
9.幸福指數
10.客戶分群
11.CRM 用戶精準營銷


模塊五: 通過 python 實現算法(30 小時)

Python 是目前丕界上最流行的開發語言,也是云計算、大數據、人工智能時代最好的開發語言,也是最容易上手的開發語言,沒有開發,就沒有大數據,譽天將零基礎帶你進入 python 的大門,通過 Python 是實現算法,讓他更深入的理解算法,并且用 Python 寫出算法。
Python 簡介、環境安裝 Python. Anaconda + Pycharm
1.第一個 Python 程序 使用文本編輯器, 輸入和輸出
2.Python 基礎 基礎語法、變量類型
3.運算符、條件語句
4.循環語句、 While 循環語句、 for 循環語句、循環嵌套
5.break 語句、 continue 語句、 pass 語句
6.列表(List)、元組、字典(Dictionary)
7.Number(數字)、字符串、日期和時間
8.函數、模塊
9.面向對象編程-類和實例
10.面向對象編程-訪問限制
11.面向對象編程-繼承和多態
12.文件 I/O、 File 方法
13.IO 編程-文件讀寫、操作文件和目錄
14.訪問數據庫
15.預處理 Numpy
16.預處理 Pandas
17."決策樹分類算法 Python 實現
18.隨機森林 Python 實現
19.支持向量機分類算法 Python 實現
20.樸素貝葉斯分類算法 Python 實現"
21."K-均值算法、中心點算法 Python 實現
22.關聯規則 Apriori、離群點檢測 python 實現

模塊六: 爬蟲技術與實戰(18 課時)
1.網絡爬蟲概述
2. 網絡爬蟲工作原理第
3.網絡爬蟲基礎使用第
3. 網絡爬蟲中的異常處理

4. GET 請求爬取數據實戰
5.POST 請求爬取數據實戰
6.網絡爬蟲案例實戰
7.App 信息爬取實戰
8.爬取天氣預報數據
9.檢驗滑動驗證碼的識別

模塊七: ETL 及可視化工具 (12 課時)
一. 數據的抽取(Extract)
二.數據的清洗轉換(Cleaning、 Transform)
三.數據的加載(Load)
1.空值處理
2.規范化數據格式
3.拆分數據:
4.驗證數據正確性:
5.數據替換
6.Lookup
四、開源可視化工具的使用
1. FineReport
2. Tableau Public




宝乐有限公司