五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

拓端tecdat|R語言主成分分析(PCA)葡萄酒可視化:主成分得分散點圖和載荷圖

2021-07-25 22:38 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=22492?

原文出處:拓端數(shù)據(jù)部落公眾號

我們將使用葡萄酒數(shù)據(jù)集進行主成分分析。

數(shù)據(jù)

數(shù)據(jù)包含177個樣本和13個變量的數(shù)據(jù)框;vintages包含類標簽。這些數(shù)據(jù)是對生長在意大利同一地區(qū)但來自三個不同栽培品種的葡萄酒進行化學(xué)分析的結(jié)果:內(nèi)比奧羅、巴貝拉和格里格諾葡萄。來自內(nèi)比奧羅葡萄的葡萄酒被稱為巴羅洛。

這些數(shù)據(jù)包含在三種類型的葡萄酒中各自發(fā)現(xiàn)的幾種成分的數(shù)量。

  1. # 看一下數(shù)據(jù)

  2. head(no)

輸出

轉(zhuǎn)換和標準化數(shù)據(jù)

對數(shù)轉(zhuǎn)換和標準化,將所有變量設(shè)置在同一尺度上。

  1. # 對數(shù)轉(zhuǎn)換

  2. no_log <- log(no)

  3. # 標準化

  4. log_scale <- scale(no_log)

  5. head(log_scale)

主成分分析(PCA)

使用奇異值分解算法進行主成分分析

  1. prcomp(log_scale, center=FALSE)

  2. summary(PCA)

基本圖形(默認設(shè)置)

帶有基礎(chǔ)圖形的主成分得分和載荷圖


  1. plot(scores[,1:2], # x和y數(shù)據(jù)

  2. pch=21, # 點形狀

  3. cex=1.5, # 點的大小


  4. legend("topright", # legend的位置

  5. legend=levels(vint), # 圖例顯示


  6. plot(loadings[,1:2], # x和y數(shù)據(jù)

  7. pch=21, # 點的形狀


  8. text(loadings[,1:2], # 設(shè)置標簽的位置

此外,我們還可以在分數(shù)圖中的組別上添加95%的置信度橢圓。

置信度橢圓圖函數(shù)

  1. ## 橢圓曲線圖

  2. elev=0.95, # 橢圓概率水平

  3. pcol=NULL, # 手工添加顏色,必須滿足長度的因素

  4. cexsize=1, # 點大小

  5. ppch=21, # 點類型,必須滿足因素的長度

  6. legcexsize=2, # 圖例字體大小

  7. legptsize=2, # 圖例點尺寸


  8. ## 設(shè)定因子水平

  9. if(is.factor(factr) {

  10. f <- factr

  11. } else {

  12. f <- factor(factr, levels=unique(as.character(factr)))

  13. }

  14. intfactr <- as.integer(f) # 設(shè)置與因子水平相匹配的整數(shù)向量


  15. ## 獲取橢圓的數(shù)據(jù)

  16. edf <- data.frame(LV1 = x, LV2=y, factr = f) # 用數(shù)據(jù)和因子創(chuàng)建數(shù)據(jù)框

  17. ellipses <- dlply(edf, .(factr), function(x) {


  18. Ellipse(LV1, LV2, levels=elev, robust=TRUE, draw=FALSE) #從dataEllipse()函數(shù)中按因子水平獲取置信度橢圓點

  19. })

  20. ## 獲取X和Y數(shù)據(jù)的范圍

  21. xrange <- plotat(range(c(as.vector(sapply(ellipses, function(x) x[,1])), min(x), max(x))))

  22. ## 為圖塊設(shè)置顏色

  23. if(is.null(pcol) != TRUE) { # 如果顏色是由用戶提供的

  24. pgcol <- paste(pcol, "7e", sep="") # 增加不透明度


  25. # 繪圖圖形

  26. plot(x,y, type="n", xlab="", ylab="", main=""

  27. abline(h=0, v=0, col="gray", lty=2) #在0添加線條

  28. legpch <- c() # 收集圖例數(shù)據(jù)的矢量

  29. legcol <- c() # 收集圖例col數(shù)據(jù)的向量

  30. ## 添加點、橢圓,并確定圖例的顏色

  31. ## 圖例

  32. legend(x=legpos, legend=levels(f), pch=legpch,

  33. ## 使用prcomp()函數(shù)的PCA輸出的軸圖示

  34. pcavar <- round((sdev^2)/sum((sdev^2))

基礎(chǔ)圖形

繪制主成分得分圖,使用基本默認值繪制載荷圖

  1. plot(scores[,1], # X軸的數(shù)據(jù)

  2. scores[,2], # Y軸的數(shù)據(jù)

  3. vint, # 有類的因素

  4. pcol=c(), # 用于繪圖的顏色(必須與因素的數(shù)量相匹配)

  5. pbgcol=FALSE, #點的邊框是黑色的?

  6. cexsize=1.5, # 點的大小

  7. ppch=c(21:23), # 點的形狀(必須與因子的數(shù)量相匹配)

  8. legpos="bottom right", # 圖例的位置

  9. legcexsize=1.5, # 圖例文字大小

  10. legptsize=1.5, # 圖例點的大小

  11. axissize=1.5, # 設(shè)置軸的文字大小

  12. linewidth=1.5 # 設(shè)置軸線尺寸

  13. )

  14. title(xlab=explain[["PC1"]], # PC1上解釋的方差百分比

  15. ylab=explain[["PC2"]], # PC2解釋的方差百分比

  16. main="Scores", # 標題

  17. cex.lab=1.5, # 標簽文字的大小

  18. cex.main=1.5 # 標題文字的大小


  19. plot(loadings[,1:2], # x和y數(shù)據(jù)

  20. pch=21, # 點的形狀

  21. cex=1.5, # 點的大小

  22. # type="n", # 不繪制點數(shù)

  23. axes=FALSE, # 不打印坐標軸

  24. xlab="", # 刪除x標簽

  25. ylab="" ? ? ? ? ? ? ?# 刪除y標簽

  26. )

  27. pointLabel(loadings[,1:2], #設(shè)置標簽的位置

  28. labels=rownames(PCAloadings), # 輸出標簽

  29. cex=1.5 # 設(shè)置標簽的大小

  30. ) # pointLabel將嘗試將文本放在點的周圍

  31. axis(1, # 顯示x軸

  32. cex.axis=1.5, # 設(shè)置文本的大小

  33. lwd=1.5 # 設(shè)置軸線的大小

  34. )

  35. axis(2, # 顯示y軸

  36. las=2, # 參數(shù)設(shè)置文本的方向,2是垂直的

  37. cex.axis=1.5, # 設(shè)置文本的大小

  38. lwd=1.5 # 設(shè)置軸線的大小

  39. )

  40. title(xlab=explain[["PC1"]], # PC1所解釋的方差百分比

  41. ylab=explain[["PC2"]], # PC2解釋的方差百分比


  42. cex.lab=1.5, # 標簽文字的大小

  43. cex.main=1.5 # 標題文字的大小

  44. )

最受歡迎的見解

1.matlab偏最小二乘回歸(PLSR)和主成分回歸(PCR)

2.R語言高維數(shù)據(jù)的主成分pca、 t-SNE算法降維與可視化分析

3.主成分分析(PCA)基本原理及分析實例

4.基于R語言實現(xiàn)LASSO回歸分析

5.使用LASSO回歸預(yù)測股票收益數(shù)據(jù)分析

6.r語言中對lasso回歸,ridge嶺回歸和elastic-net模型

7.r語言中的偏最小二乘回歸pls-da數(shù)據(jù)分析

8.r語言中的偏最小二乘pls回歸算法

9.R語言線性判別分析(LDA),二次判別分析(QDA)和正則判別分析(RDA)


拓端tecdat|R語言主成分分析(PCA)葡萄酒可視化:主成分得分散點圖和載荷圖的評論 (共 條)

分享到微博請遵守國家法律
玉山县| 格尔木市| 广汉市| 洛扎县| 石台县| 高青县| 大名县| 涞源县| 英吉沙县| 宜君县| 涟水县| 广灵县| 航空| 湄潭县| 兰考县| 门源| 永春县| 延吉市| 宝坻区| 措勤县| 黔西县| 微山县| 交口县| 元谋县| 宁化县| 渭源县| 揭西县| 万荣县| 罗江县| 剑川县| 新沂市| 洱源县| 阜新市| 承德县| 仪陇县| 东兴市| 淮安市| 扎兰屯市| 深州市| 江永县| 罗甸县|