跳去內容

降維

出自維基百科,自由嘅百科全書
主成分分析嘅圖解;幅圖每一點代表一個個案,兩個箭咀代表兩個成份,長啲嗰個箭咀係比較重要嗰個成份。

降維英文dimension reduction)喺統計學機械學習上係指減少手上考慮嘅隨機變數嘅數量嘅過程。常見嘅方法有主成份分析

基本諗頭[編輯]

睇埋:Dataset

降維係指減低手上拃 datadei1 taa4)入面隨機變數嘅數量,簡單例子可以想像而家要分析 1,000 隻蝴蝶,手上嘅 data 描述

蝴蝶 0001 翼係咩形狀、色水係點、有乜花紋...
蝴蝶 0002 翼係咩形狀、色水係點、有乜花紋...
蝴蝶 0003 翼係咩形狀、色水係點、有乜花紋...

要做降維嘅話,就可能係按呢啲 data 將啲蝴蝶分做唔同嘅物種,噉就變成

蝴蝶 0001 屬於物種 A / 蝴蝶 0002 屬於物種 B / 蝴蝶 0003 屬於物種 C...

—令到啲 data 嘅維度下降咗,用日常用語講即係令啲 data 易睇咗。做研究嗰陣,降維好多時都能夠令到啲 data 更易處理。

因素分析[編輯]

内文:因素分析

因素分析(factor analysis)將大量嘅變數轉化做少量因素,當中「因素」通常係一啲數值冇得直接量度嘅嘢,所以就要由量度到嗰啲變數嚟「反映」佢哋。例如智商測驗(講緊正式心理學上會用嗰啲)就係因素分析嘅一個應用例子:智商測驗旨在量度智能,但係智能(因素)呢家嘢冇得話攞把尺去量度,一個個體嘅智能值只可以靠住由測驗題目攞到嘅分數(量度得到嘅變數)嚟反映[1]

主成份分析[編輯]

主成份分析(principal component analysis,PCA)係一種常用嚟判斷「邊個變數重要啲」嘅統計分析方法。

聚類分析[編輯]

内文:聚類分析

線性判別[編輯]

睇埋[編輯]

引咗[編輯]

  1. Child, Dennis (2006), The Essentials of Factor Analysis (3rd ed.), Continuum International.