Enterprise Big Data Analyst 企業大數據分析師
企業大數據分析師(Enterprise Big Data Analyst)課程將向學員講授完整的大數據分析流程,並帶領學員建立可重複使用的數據分析模型。您將學習如何利用統計和機器學習技術,並從數據中獲取價值,以及建立自己的工具箱,利用可重複的方式解決各項業務上的問題。分析師必須要有能力掌握分析流程,這也是分析師需要被驗證的能力。
本課程概述了探索型數據分析、統計推論、預測建模和機器學習技術(分類和聚類)的最常用之演算法。課程參與者將學習不同演算法的基礎理論,以及利用程式語言建立自身的工具箱,在未來,可以將每種演算法應用到實踐案例中。候選人可以不必擔心寫程式的困擾,課程將會提供各式各樣的原始程式碼。
不喜歡寫程式?我們說:工具只是工具,身為一位優秀的 Business Analyst 或是 Data Analyst 需要用哪種工具才會有效與高效的達成你的商業目標?無論是數據分析師,或是資料科學家,工具的使用是必須的,但這只是其中的一項能力。我們國際認證要驗證你的全部的能力。
0.0
(0)
28 時
關於課程
| 課程日期 | 定價 | 早鳥優惠價 |
|---|---|---|
| 平日班 2025/12/16, 17, 23, 24(預定 12/26 原場地考試) | NT$ 42,000(含考試) | NT$ 36,000(含考試) |
時數與費用
時數:5 天 (09:00~17:00;每天 7 小時,前四天上課,最後一天考試)
費用:$42,000 (含考試)
早鳥優惠價:NT$36,000 (含考試)
點數: 11
講師: 吳傑 / 具APMG講師證照之講師
課程介紹
企業大數據分析師(Enterprise Big Data Analyst)課程將向學員講授完整的大數據分析流程,並帶領學員建立可重複使用的數據分析模型。您將學習如何利用統計和機器學習技術,並從數據中獲取價值,以及建立自己的工具箱,利用可重複的方式解決各項業務上的問題。分析師必須要有能力掌握分析流程,這也是分析師需要被驗證的能力。
本課程概述了探索型數據分析、統計推論、預測建模和機器學習技術(分類和聚類)的最常用之演算法。課程參與者將學習不同演算法的基礎理論,以及利用程式語言建立自身的工具箱,在未來,可以將每種演算法應用到實踐案例中。候選人可以不必擔心寫程式的困擾,課程將會提供各式各樣的原始程式碼。
不喜歡寫程式?我們說:工具只是工具,身為一位優秀的 Business Analyst 或是 Data Analyst 需要用哪種工具才會有效與高效的達成你的商業目標?無論是數據分析師,或是資料科學家,工具的使用是必須的,但這只是其中的一項能力。我們國際認證要驗證你的全部的能力。
課程特色
- 全世界第一套根據職務角色所設計的大數據國際認證。並不是依賴軟體工具技能的使用,而是全方位的數據職務角色設計的國際認證課程。
- 認證考試通過發給英國APMG國際認證。全世界192個國家認可。80%的FTSE 100企業和33%的S&P 500企業直接認可APMG International 的認證,是外商工作必備證書。在台灣,只有我們授權提供此項認證服務。
- 課程內容由歐洲企業大數據框架聯盟 (Enterprise Big Data Framework Alliance)所設計開發的知識體系。講師是該聯盟的官方大使,多次獲得頒獎殊榮,同時也是英國APMG審核通過的講師,具備APMG講師證照。
- 課程教材來自英國,繁體中文的教材,繁體中文的考試,頒發英文版的國際證書。不必擔心語言上的隔閡,證書全世界通用,終身受用。
- 不必擔心寫程式等技術問題。因為數據能力的建立是全方位的,工具只是其中的一部分。課程中有十五個實習,強烈建議學員自帶電腦,透過課程建立自己的分析環境,然後再透過實習與講師提供的程式碼,可以直接轉作未來的實戰工具箱。
- 於課程最後進行模擬考試與講解,確保學員對於考試有足夠的瞭解與準備。
- 考試時間:2.5個小時,80題案例選擇題,65%過關。教室紙本考試。
學習路徑

Enterprise Big Data Analyst 企業大數據分析師會讓您經歷整個分析流程。這其中,將會經歷至少十套演算法,讓您理解機器學習的目標:預測。大數據是人工智慧的基礎,您可以考慮利用歐洲設計的職務角色能力設計的課程,逐級的練就自己的實力,並且利用英國 APMG 的證照,來向全世界證明您的能力與持續學習的精神。
考試與認證資訊
| 認證名稱 | Enterprise Big Data Analyst |
| 考試代號 | EBDA |
| 考試費用 | 課程費用已含 |
| 考試時間 | 150 分鐘 |
| 支援語言 | 繁體中文、英文 |
| 考試形式 | 80 題,案例引導式複雜形式選擇題。 |
| 通過標準 | 65% (答對 52 題) |
| 考試地點 | 課程結束後,以紙本方式於教室考試。 |
| 適合對象 | 必須要參加課程之後,才可以參加考試。 |
| 有效期限 | 終身有效。 |
| 官方備考資源 | 課程結束之後,講師會提供模擬考試練習與講解。 |
我將會學到?
- 理解並解釋數據分析流程,包括企業大數據分析中包含的所有相關步驟。
- 理解常見數據來源 (本地、線上和資料庫連接) 的區別和結構,以及這些來源應該如何導入後,可以進行數據分析。
- 應用和利用基本的數據清洗 (data cleaning) 操作以及不同數據清洗技術之間的差異。
- 應用和利用基本的數據整理 (data wrangling) 操作以及不同數據整理技術之間的差異。
- 理解並應用探索型數據分析 (exploratory data analysis) 的技術,這是模型構建、模型驗證和初期視覺化,所需要的技巧。
- 理解並應用統計推論 (statistical inference) 的核心概念,包括假設檢定 (hypothesis testing) 所需要的技術。
- 制定和解釋有關於:統計關聯和回歸 (correlation and regression) 函數的預測模型,包括簡單線性回歸。
- 制定和解釋有關於:分類 (classification) 的機器學習模型,包括 k-NN、單純貝氏、羅吉斯回歸和分類樹 (Naïve Bayes, Logistic Regression and Classification Trees)。
- 制定和解釋有關於:聚類 (clustering) 的機器學習模型,包括層次聚類和k 均值聚類 (Hierarchical clustering and k-means clustering)。
- 制定和解釋有關於:異常值檢測 (outlier detection) 模型,包括 Grubbs 異常值檢測和 k-NN 異常值檢測 (Grubbs Outlier Detection and k-NN Outlier Detection)。
- 理解並應用有關於:核心數據呈現技巧,包含編碼本和視覺化 (codebooks and visualizations) 在內的技術,用於呈現相關的分析結果。
教材包含有
- APMG 的原廠教材:我們的老師經過 APMG 授權翻譯為繁體中文。不用擔心語言隔閡。
- APMG 的正式考試:我們的老師經過 APMG 授權翻譯為繁體中文。考試不用心煩。
- 具有APMG講師證照的老師,利用國語授課。近四十年工作經驗,超過十年以上授課經驗。
- 不用擔心程式語言的能力,課程將會提供各式的程式碼,幫助大家建立自己的工具箱。
- 十五個實習,來自許多國際知名案例,你不必擔心學不會,而是太多學不完。
- 人工智慧的時代,講師也將要展示如何利用大型語言模型產生可用的程式碼。
需具備條件
- 無
目標對象
- 數據分析師 (Data Analysts)
- 商業分析師 (Business Analysts)
- 商業數據分析師 (Business Data Analysts)
- 系統分析師 (Systems Analysts)
- 數據管理分析師 (Data Management Analysts)
- 業務分析顧問 (Business Analytics Consultants)
- 資料科學家 (Data Scientists)
- 數據模型師 (Data Modelers)
- 對於生物統計需要掌握實驗數據的專業人士
- 來自不同背景、希望在新興的資料分析領域中探索機會的個人。
課程內容
第一單元:大數據分析的介紹
-
數據分析流程五步驟的目標:業務目標、數據提取、數據準備、數據分析、數據呈現
第二單元:業務目標
-
理解每種類型的業務問題,與其相關的分析模型和技術。
-
如何確定問題涉及的業務目標類型:描述型、探索型、推理型、預測型、因果型及機理型。
-
一個問題所涉及的業務目標類型,並提出在解決問題時,需要使用那些合適的統計和機器學習技術。
-
業務目標的類型以及統計和機器學習技術適用於解決該項業務問題。
第三單元:數據提取 – 導入和讀取數據
-
本地數據集:它們的結構和語法。如何使用命令和套件將本地數據集導入 R。導入數據時如何處理數據集中的標題。
-
線上數據集:它們的結構和語法,以及它們的通常是在哪種場合使用。如何應用 download.file 方法從 Internet 下載檔案。如何使用命令和套件,將線上數據集導入到系統,以及這些套件返回的資訊。API 在控制數據存取方面的作用。
-
數據集內的數據類型(本地、線上和資料庫)以及數據分析師在導入和讀取該數據時的主要考慮因素。
-
觀察數據集的結構和語法,以及導入和讀取該數據正確的含義。
第四單元:數據準備 – 清理和整理數據
-
「乾淨數據」的三個原則。
-
審查數據的三項步驟的目的,以及在每項步驟中可以進行的關鍵觀察:①審查結構②查看數據的頂部和底部③看數據的匯總統計。
-
數據清洗的關鍵目標和數據清洗時通常使用的操作目標:Select、Filter、Arrange、Rename、Summarize、Mutate。
-
數據整理的關鍵目標和數據整理時通常使用的操作目標:Spread and Key-Value Pairs、Gather、Drop, Replace and Fill missing values。
-
三種不同的處理缺失數據的方式,其中的含義,以及每種操作對某些類型數據集的適用性
-
審查下載的數據集並解釋使用常見數據檢查技術的輸出的方法。
-
對數據集進行適當的數據清理和數據整理操作,並確定所選操作的影響。
-
基於數據集的結構,審查下載的數據集和解釋數據檢查結果的方法是正確的。
-
為數據集確定的數據清理和數據整理操作是適當的,並對所選操作的影響進行了適當的評估。
第五單元:探索型數據分析技術
-
探索型數據分析 (EDA) 的目標,以及如何在該項分析中使用 EDA 技術,包含:直方圖、箱形圖、散點圖。
-
使用探索型數據分析 (EDA) 技術,初步理解數據集裡的變量,同時也需要構建的模型和演算法之間的關係。
-
所使用的探索型數據分析 (EDA) 的技術和關於數據集裡的變量之間關係之初步想法,可否適用於業務問題和案例數據集。
第六單元:統計推論
-
統計推論的理論和概念,以及如何建立零假設和對立假設。
-
隨機檢定的不同步驟以及如何確定是否可以拒絕原假設:①計算觀察到的差異②查看計算的差異③比較觀察到的差異和計算出的差異。
-
適當的零假設和對立假設,並解釋隨機化測試中不同步驟的輸出,以確定是否可以拒絕零假設。
-
確定了適當的零假設和對立假設,並正確解釋了隨機化測試中不同步驟的輸出。
第七單元:關聯與線性回歸
-
當關聯技術與數據集一起使用時,以及皮爾遜關聯係數的值表示什麼。
-
簡單線性回歸的理論框架:①關鍵屬性和注意事項 (構成模型的變量)②關於使用和結果的主要特徵 (線性回歸線和最小平方法、y 軸截距和斜率值與預測建模的相關性)③如何檢查和提高模型的準確性。
-
使用皮爾遜關聯係數的兩個變量之間關係的性質
-
如何使用線性回歸,透過分析案例數據,進行預測並解釋模型的結果。
-
正確解釋使用皮爾遜關聯係數的兩個變量之間關係的性質。
-
使用線性回歸模型,從案例數據集的分析中獲得商業價值時,被適當地應用和解釋。
第八單元:分類 – K-NN 和單純貝葉斯
-
k-NN的理論框架:①核心屬性和注意事項:非參數演算法 、不同的維度、需要常規化②關於使用和結果的主要特徵:數據點分類(歐幾里得距離)、使用兩個數據集(訓練和測試)、選擇 k 的最佳值、函數的公共參數 ③如何檢查和提高模型的準確性
-
k-NN從案例數據集中,預測數據點的目標類別並解釋模型的結果。
-
使用k-NN ,從案例數據集的分析中,獲得商業價值時,被適當地應用和解釋。
-
單純貝葉斯分類器的理論框架:①核心屬性和注意事項:概率、常見應用、聯合概率和條件概率的使用、處理多個變量與假設變量之間是獨立的②關於使用和結果的主要特徵:概率表及其使用方式、拉普拉斯平滑的需求與效果、函數的公共參數③如何檢查模型的準確性
-
單純貝葉斯根據對象落入某個類別的概率,對案例數據集裡的對象進行分類並解釋模型的結果。
-
使用單純貝葉斯,從案例數據集的分析中,獲得商業價值時,被適當地應用和解釋。
第九單元:分類 – 邏輯回歸和分類樹
-
邏輯回歸的理論框架:①關鍵屬性和注意事項:適用於二元分類、基於邏輯函數的 “S”形最佳擬合線②關於使用和結果的主要特徵:輸出預測、設置分類門檻值、函數的公共參數③如何檢查模型的準確性
-
對案例數據集裡的數據點,進行二元分類的邏輯回歸,並解釋模型的結果。
-
使用邏輯回歸,從案例數據集裡分析中,獲得商業價值時,被適當地應用和解釋。
-
分類樹的理論框架:①關鍵屬性和注意事項:根節點、決策節點和葉節點、常見應用②關於使用和結果的主要特徵:拆分標準和同性質的子組、使用兩個數據集(訓練數據與測試數據)、預剪枝和剪枝後選項、函數的公共參數③過度擬合以及如何檢查模型的準確性
-
分類樹從案例數據集中預測數據點的目標類別,並解釋模型的結果。
-
使用分類樹,從案例數據集的分析中,獲得商業價值時,被適當地應用和解釋。
第十單元:聚類演算法和技術
-
層次聚類的理論框架:①關鍵屬性和注意事項:將聚類與最相似(最近)的聚類相結合、多變量分析和常見應用②關於使用和結果的主要特徵:使用歐幾里得距離和雅卡德指數測量數據點之間的距離以及對輸入變量的影響、鏈接方法的意義、在之前或之後指定 k 的值、使用樹狀圖來視覺化步驟、繪製聚類結果、缺失值、標準化數據和常規化的意義、函數的公共參數③如何檢查模型的準確性
-
分層聚類將案例數據集中的數據點分組到聚類中並解釋模型的結果。
-
使用分層聚類,從案例數據集的分析中,獲得商業價值時,被適當地應用和解釋。
-
k-means聚類的理論框架:①關鍵屬性和注意事項:分配到最近均值聚類的觀測值、集群之間的差異②常見應用:關於其使用和結果的主要特徵、基於 k 值的假想質心、歐幾里得距離的使用、手動設定 k 並確定其最佳值 (手肘法)、繪製聚類結果、函數的公共參數③如何檢查模型的準確性
-
k-means 聚類將案例數據集中的數據點分組到集群中並解釋模型的結果。
-
使用k-means聚類,從案例數據集的分析中,獲得商業價值時,被適當地應用和解釋。
第十一單元:異常值檢測
-
使用Grubbs檢驗進行異常值檢測的理論框架:①關鍵屬性和注意事項:以假設檢定理論為基礎、假設來自常態分佈的單變量數據集②關於使用和結果的主要特徵:p 值的重要性、使用探索型數據分析(直方圖)檢查分佈、函數的公共參數
-
用KNN進行異常值檢測的理論框架:①關鍵屬性和注意事項:基於 k-NN 理論、與多個變量和標準化一起使用、常見應用②關於使用和結果的主要特徵:使用歐幾里得距離、使用到鄰居的平均距離確定最重要的異常值、使用散點圖來視覺化觀察、k 值對結果的影響、函數的公共參數
-
用於檢測案例數據集裡的異常值並解釋測試結果的 Grubbs 測試或 k-NN。
-
用於檢測案例數據集裡的異常值時,適當地應用和解釋異常值檢驗結果。
第十二單元:數據呈現
-
大數據分析中維護編碼本的重要性及其關鍵要素。
-
進行數據視覺化的方法,以及視覺化三個關鍵重要因素:①數據②美學③幾何圖形。
-
ggplot 如何用於數據視覺化,以及使用不同視覺化技術時經常對美學和幾何學進行的一些常見更改:①更改美學以顯示變量中的尺度,例如性別的男性與女性維度②更改直方圖的幾何形狀以更改直條的寬度③利用增加另一個可變維度來改變箱型圖中的美學④更改幾何以在散點圖中增加回歸線。
-
案例場景情況中的數據呈現技巧。
-
數據呈現的方法是適當地使用數據呈現技術,以滿足案例場景情況的需要。
還沒有評論
你好,歡迎回來!




