五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

數(shù)據(jù)降維,不得不說的經(jīng)典機(jī)器學(xué)習(xí)方法——PCA

2023-08-01 16:34 作者:爾云間  | 我要投稿

信息過度復(fù)雜是多變量數(shù)據(jù)最大的挑戰(zhàn)之一。許多小伙伴經(jīng)常會遇到這種問題,于是我們會考慮用降維來解決,這時(shí)候很多人都會想到PCA降維,那么PCA到底是什么呢?今天小云來帶大家探索PCA算法的原理。

PCA(Principal Component Analysis)全稱為主成分分析,是一種無監(jiān)督的數(shù)據(jù)降維方法,通過主成分分析可以盡可能保留下具備區(qū)分性的低維數(shù)據(jù)特征。主成分分析圖能幫助我們直觀地感受樣本在降維后空間中的分簇和聚合情況,這在一定程度上亦能體現(xiàn)樣本在原始空間中的分布情況。

相信大家看到這里應(yīng)該大致能知道PCA究竟能干嘛了,那么該怎么實(shí)現(xiàn)呢?別著急,小果下面通過一個(gè)分析過程來帶大家學(xué)習(xí)具體流程。

1、載入數(shù)據(jù)及相關(guān)R包

2.PCA分析

3.主成分選取

說明:結(jié)果中的PC1、PC2、PC3、和PC4是計(jì)算出來的主成分,圖中的Standard deviation代表每個(gè)主成分的標(biāo)準(zhǔn)差,Proportion of Variance代表每個(gè)主成分的貢獻(xiàn)率,Cumulative Proportion代表各個(gè)主成分的累積貢獻(xiàn)率。每個(gè)主成分都不屬于X1、X2、X3和X4中的任何一個(gè)。第一主成分、第二主成分、第三主成分和第四主成分都是X1、X2、X3和X4的線性組合,也就是說最原始數(shù)據(jù)的成分經(jīng)過線性變換得到了各個(gè)主成分。一般地,選擇累積貢獻(xiàn)率達(dá)到八成的前幾個(gè)主成分即可(這個(gè)實(shí)例中我們選擇前兩個(gè),畢竟第二主成分的貢獻(xiàn)率也比較大)。

4.PCA可視化

結(jié)果展示

分析最后我們會得到一個(gè)PCA分析圖,如下圖1所示,圖中的橫縱坐標(biāo)分別對應(yīng)主成分PC1和PC2,整體表現(xiàn)了所有樣本在這兩個(gè)主成分上的分布。同時(shí)小伙伴們還可以保存樣本在主成分上的表達(dá)水平來開展其他分析,具體樣例如圖2所示,每行為一個(gè)樣本,列為不同的主成分。

大功告成!分析到這里就結(jié)束了,相信大家已經(jīng)掌握了,感興趣的小伙伴快去試試吧!

這里推薦一下小云新開發(fā)的零代碼云生信分析工具平臺包含超多零代碼小工具,上傳數(shù)據(jù)一鍵出圖,感興趣的小伙伴歡迎了解~

網(wǎng)址:http://www.biocloudservice.com/home.html

今天小果的分享就到這里,歡迎大家和小云一起討論學(xué)習(xí),下期再見哦!





數(shù)據(jù)降維,不得不說的經(jīng)典機(jī)器學(xué)習(xí)方法——PCA的評論 (共 條)

分享到微博請遵守國家法律
盈江县| 湖北省| 渭源县| 汾阳市| 西乌珠穆沁旗| 繁峙县| 无锡市| 忻州市| 台北市| 彭山县| 高唐县| 辽中县| 赣州市| 馆陶县| 共和县| 鸡泽县| 德惠市| 靖边县| 漳州市| 定边县| 磴口县| 都江堰市| 太湖县| 肥乡县| 尚义县| 开阳县| 丘北县| 娄烦县| 临朐县| 柞水县| 阆中市| 红桥区| 霍山县| 武冈市| 林芝县| 德格县| 观塘区| 玉田县| 额尔古纳市| 荔波县| 方城县|