五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

拓端tecdat|R語言中使用非凸懲罰函數(shù)回歸(SCAD、MCP)分析前列腺數(shù)據(jù)

2021-07-15 11:01 作者:拓端tecdat  | 我要投稿

原文鏈接:http://tecdat.cn/?p=20828?

原文出處:拓端數(shù)據(jù)部落公眾號

本文使用lasso或非凸懲罰擬合線性回歸,GLM和Cox回歸模型的正則化,特別是最小最大凹度懲罰函數(shù)(MCP)和光滑切片絕對偏差懲罰(SCAD),以及其他L2懲罰的選項( “彈性網(wǎng)絡(luò)”)。還提供了用于執(zhí)行交叉驗證以及擬合后可視化,摘要,推斷和預(yù)測的實用程序。

我們研究?前列腺數(shù)據(jù),它具有8個變量和一個連續(xù)因變量,即將進行根治性前列腺切除術(shù)的男性的PSA水平(按對數(shù)尺度):


  1. X <- data$X

  2. y <- data$y

要將懲罰回歸模型擬合到此數(shù)據(jù),執(zhí)行以下操作:

reg(X, y)

此處的默認懲罰是最小最大凹度懲罰函數(shù)(MCP),但也可以使用SCAD和lasso懲罰。這將產(chǎn)生一個系數(shù)路徑,我們可以繪制


  1. plot(fit)

注意,變量一次輸入一個模型,并且在λ的任何給定值下,幾個系數(shù)均為零。要查看系數(shù)是多少,我們可以使用以下?coef?函數(shù):


  1. coef(fit, lambda=0.05)

  2. # (Intercept) ? ? ?lcavol ? ? lweight ? ? ? ? age ? ? ? ?lbph ? ? ? ? svi

  3. # ?0.35121089 ?0.53178994 ?0.60389694 -0.01530917 ?0.08874563 ?0.67256096

  4. # ? ? ? ? lcp ? ? gleason ? ? ? pgg45

  5. # ?0.00000000 ?0.00000000 ?0.00168038

該?summary?方法可用于后選擇推斷:


  1. summary(fit

  2. # MCP-penalized linear regression with n=97, p=8

  3. # At lambda=0.0500:

  4. # -------------------------------------------------

  5. # ? Nonzero coefficients ? ? ? ? : ? 6

  6. # ? Expected nonzero coefficients: ? 2.54

  7. # ? Average mfdr (6 features) ? ?: ? 0.424

  8. #

  9. # ? ? ? ? Estimate ? ? ?z ? ? mfdr Selected

  10. # lcavol ? 0.53179 ?8.880 ?< 1e-04 ? ? ? ?*

  11. # svi ? ? ?0.67256 ?3.945 0.010189 ? ? ? ?*

  12. # lweight ?0.60390 ?3.666 0.027894 ? ? ? ?*

  13. # lbph ? ? 0.08875 ?1.928 0.773014 ? ? ? ?*

  14. # age ? ? -0.01531 -1.788 0.815269 ? ? ? ?*

  15. # pgg45 ? ?0.00168 ?1.160 0.917570 ? ? ? ?*

在這種情況下,?即使調(diào)整了模型中的其他變量之后,lcavol,?svi以及?lweight?顯然與因變量關(guān)聯(lián),同時?lbph,?age和?pgg45?可能只是偶然包括。通常,為了評估模型在λ的各種值下的預(yù)測準確性,將執(zhí)行交叉驗證:


  1. plot(cvfit)

使交叉驗證誤差最小的λ的值由?cvfit$lambda.min給出,在這種情況下為0.017。將coef?在return的輸出?應(yīng)用于?cv.ncvreg?λ的值的系數(shù):


  1. coef

  2. # ?(Intercept) ? ? ? lcavol ? ? ?lweight ? ? ? ? ?age ? ? ? ? lbph ? ? ? ? ?svi

  3. # ?0.494154801 ?0.569546027 ?0.614419811 -0.020913467 ?0.097352536 ?0.752397339

  4. # ? ? ? ? ?lcp ? ? ?gleason ? ? ? ?pgg45

  5. # -0.104959403 ?0.000000000 ?0.005324465

可以通過predict來獲得預(yù)測值?,該選項有多種選擇:


  1. predict(cvfit

  2. # 預(yù)測新觀測結(jié)果的響應(yīng)

  3. # ? ? ? ? 1 ? ? ? ? 2 ? ? ? ? 3 ? ? ? ? 4 ? ? ? ? 5 ? ? ? ? 6

  4. # 0.8304040 0.7650906 0.4262072 0.6230117 1.7449492 0.8449595


  5. # 非零系數(shù)的數(shù)量

  6. # 0.01695

  7. # ? ? ? 7


  8. # 非零系數(shù)的特性

  9. # ?lcavol lweight ? ? age ? ?lbph ? ? svi ? ? lcp ? pgg45

  10. # ? ? ? 1 ? ? ? 2 ? ? ? 3 ? ? ? 4 ? ? ? 5 ? ? ? 6 ? ? ? 8

請注意,原始擬合(至完整數(shù)據(jù)集)的結(jié)果為?cvfit$fit;不必同時調(diào)用兩者?ncvreg?和?cv.ncvreg?分析數(shù)據(jù)集。

如,?plot(cvfit$fit)?將產(chǎn)生與上述相同的系數(shù)路徑圖?plot(fit)?。

最受歡迎的見解

1.R語言多元Logistic邏輯回歸 應(yīng)用案例

2.面板平滑轉(zhuǎn)移回歸(PSTR)分析案例實現(xiàn)

3.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)

4.R語言泊松Poisson回歸模型分析案例

5.R語言回歸中的Hosmer-Lemeshow擬合優(yōu)度檢驗

6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)

7.在R語言中實現(xiàn)Logistic邏輯回歸

8.python用線性回歸預(yù)測股票價格

9.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標


拓端tecdat|R語言中使用非凸懲罰函數(shù)回歸(SCAD、MCP)分析前列腺數(shù)據(jù)的評論 (共 條)

分享到微博請遵守國家法律
和硕县| 西吉县| 衡山县| 黄山市| 高邮市| 榆中县| 海兴县| 山阳县| 关岭| 博爱县| 常德市| 田阳县| 澄迈县| 蓝山县| 林西县| 宽城| 滕州市| 福鼎市| 绥滨县| 翁牛特旗| 巴马| 惠水县| 监利县| 屏边| 大田县| 白朗县| 沁源县| 建始县| 朝阳县| 宁南县| 长葛市| 抚宁县| 思南县| 澎湖县| 葫芦岛市| 鄯善县| 宁都县| 东乌| 井陉县| 郯城县| 曲麻莱县|