從Ecology letters上一篇technical comment 看當(dāng)前meta分析中需要注意的幾個技術(shù)
最近,看到Ecology letters 2020年發(fā)表的一篇technical comment (Sánchez-Tójar et al. 2020), 針對該雜志此前發(fā)表的一篇國內(nèi)同行的Meta分析論文(Yin et al. 2019)中的技術(shù)問題做出的評論。拋開具體的專業(yè)領(lǐng)域科學(xué)問題不做討論,這篇評論中提及的meta分析中的技術(shù)問題,非常具有普遍意義,也代表了當(dāng)前高質(zhì)量期刊在技術(shù)層面對Meta分析論文的較高要求。這里列舉下這些技術(shù)問題及其應(yīng)對方案。
?
1. “residual variance (i.e. unit-level effect), which needs to be modelled explicitly in meta-analyses, was not.”
???? 這個是一個非常專業(yè)的統(tǒng)計問題。由于Meta分析是基于不同的研究案例進(jìn)行的整合分析,每個案例都有自己的案例內(nèi)方差vi, 不同案例之間vi的差異造成的效應(yīng)值的方差,必須考慮在模型之內(nèi),即方差來源部分的計算必須抵達(dá)單個案例這個水平上。那么在原文的模型中,我們可以看到,其分析采用了當(dāng)前廣泛流行的嵌套meta分析模型,隨機(jī)效應(yīng)部分設(shè)置了兩層嵌套(study嵌套于物種之下),這里study指的是參考文獻(xiàn)。
M1<-rma.mv(yi, vi, mods=~environmental_context,random=~1|species/factor(study),method="ML",data=data)
從純統(tǒng)計角度來講,這確實(shí)是有問題的,因?yàn)橥黄獏⒖嘉墨I(xiàn)可能具有多個研究案例,每個案例對應(yīng)一個vi, 所以,這個模型的設(shè)置,確實(shí)沒有把unit level effect 納入進(jìn)來。那么納入進(jìn)來的做法其實(shí)也很簡單,即在原數(shù)據(jù)中,給每個案例,即每一行數(shù)據(jù),都給一個識別碼,如obsID,然后將其嵌套在study之下,就完美解決了這一問題,即將模型代碼修改為:
M2<-rma.mv(yi, vi, mods=~environmental_context,random=~1|species/factor(study)/ obsID, method="ML",data=data)
?
2. “Second, a nested data structure was assumed for the random effects, despite the data structure corresponding to a (partial) crossed design”
這個問題,就涉及到模型隨機(jī)效的嵌套型結(jié)構(gòu)和交叉型結(jié)構(gòu)問題。比如科、屬、種這種關(guān)系,就屬于完全的嵌套型結(jié)構(gòu),隨機(jī)效應(yīng)寫成family/genus/species沒有任何問題。但類似物種和地點(diǎn)這種結(jié)構(gòu),因?yàn)橐粋€物種可以在多個地點(diǎn)出現(xiàn),而一個地點(diǎn)又往往具有多個物種,這就屬于典型的交叉型隨機(jī)結(jié)構(gòu)了,這時候就不能寫成species/site, 或者site/species了,因?yàn)槲锓N和地點(diǎn)之間,并沒有嵌套關(guān)系,而是應(yīng)該寫成,(~ 1 | site, ~ 1 | species)這種形式。所以很顯然,就本案例來說,確實(shí)是一個物種可以在多個參考文獻(xiàn)中出現(xiàn),而一個參考文獻(xiàn)又可能包括多個物種,所以二者確實(shí)是交叉關(guān)系。
所以,可以繼續(xù)改進(jìn)上述模型:
?M3<- rma.mv(yi, vi, mods=~ environmental_context,
??????????????????????????????? random=list(~ 1 | obsID, ~ 1 | study, ~ 1 | species),
????????????????????????????????????? method="REML",data=data)
?
3. “shared control and phylogenetic non-independence (Chamberlain et al., 2012) were not accounted for”
?? 這里,首先涉及多個處理共用一個對照問題,這個鄙人于在本公眾號去年發(fā)的博文“Meta分析中多個處理共用一個對照的解決方案”一文中已有詳細(xì)論述,這里不在贅述。另一個問題是系統(tǒng)發(fā)育關(guān)系的納入。這就需要我們依據(jù)數(shù)據(jù)中的物種信息,構(gòu)建一個系統(tǒng)發(fā)育樹,然后把這個發(fā)育樹轉(zhuǎn)化為VCV或者相關(guān)矩陣,納入到模型中來,就可以了。假如現(xiàn)在你的矩陣已準(zhǔn)備好,名稱為phylo_cor,就可以把該矩陣納入到模型當(dāng)中即可:
M4<- rma.mv(yi, vi, mods=~ environmental_context,
????????????????? random=list(~ 1 | obsID, ~ 1 | study, ~ 1 | species),
R = list(species= phylo_cor)
????????????????????????????????????? method="REML",data=data)
?
更進(jìn)一步,如果你想知道除了系統(tǒng)發(fā)育之外,物種的隨機(jī)效應(yīng)本身對效應(yīng)值造成的方差是多少,那么可以在模型中加入一個名為species2的變量,其實(shí)該變量跟species一模一樣,只不過他代表的是獨(dú)立的隨機(jī)效應(yīng),跟方差毫無關(guān)系。那么模型可以繼續(xù)改進(jìn)
?
M5<- rma.mv(yi, vi, mods=~ environmental_context,
????????????????? random=list(~ 1 | obsID, ~ 1 | study, ~ 1 | species, ~ 1 | species2,),
R = list(species= phylo_cor)
????????????????????????????????????? method="REML",data=data)
M5是這篇technical comment論文所用的最終模型??梢妼哟蝝eta分析模型,給我們提供了足夠的彈性結(jié)構(gòu),可以讓我們根據(jù)自身數(shù)據(jù)結(jié)構(gòu),去改變模型結(jié)構(gòu),這樣我們的結(jié)果就更為可靠。
這里需要指出的是,有同行對一篇論文做出評論,其原作者當(dāng)然可以做出回應(yīng)。這篇論文的作者(曾與本人在東靈山有數(shù)面之緣,才華橫溢,令鄙人倍感仰慕的原大老板)就針對這篇評論發(fā)表了回應(yīng)文章,從專業(yè)和技術(shù)角度做出了精彩的回應(yīng),證明了其結(jié)論依然可靠(Zhang et al. 2020)。其實(shí)我的論文以前也收到過針對具體方法的評論,也做出了相應(yīng)的回應(yīng)(Zhang et al. 2016, Kozlov and Klemola 2017, Zhang et al. 2017)。正所謂理不辨不明,應(yīng)該感謝數(shù)據(jù)和代碼的開源共享,讓我們能更加透明的進(jìn)行學(xué)術(shù)交流,加深對科學(xué)問題的認(rèn)知。
最后,做一個小廣告,對于Meta分析方法感興趣的朋友,可以關(guān)注本人將于本月25-26號舉行的最新一期Meta分析培訓(xùn)班,將會就最新,最實(shí)用的Meta分析方法與學(xué)術(shù)道友進(jìn)行系統(tǒng)、滲入的交流,鏈接如下,歡迎關(guān)注?。?!
?http://www.bjupclouddata.com/newsinfo/5435939.html
?
參考文獻(xiàn):
Kozlov, M. V., and T. Klemola. 2017. Hemispheric asymmetries in herbivory: do they exist? Journal of Ecology 105:1571-1574.
Sánchez-Tójar, A., M. Lagisz, N. P. Moran, S. Nakagawa, D. W. A. Noble, and K. Reinhold. 2020. The jury is still out regarding the generality of adaptive ‘transgenerational’ effects. Ecology Letters 23:1715-1718.
Yin, J., M. Zhou, Z. Lin, Q. Q. Li, and Y.-Y. Zhang. 2019. Transgenerational effects benefit offspring across diverse environments: a meta-analysis in plants and animals. Ecology Letters 22:1976-1986.
Zhang, S., Y. Zhang, and K. Ma. 2016. Latitudinal variation in herbivory: hemispheric asymmetries and the role of climatic drivers. Journal of Ecology 104:1089-1095.
Zhang, S., Y. Zhang, and K. Ma. 2017. A re-evaluation of hemispheric asymmetries in herbivory: a response to Kozlov & Klemola 2017. Journal of Ecology 105:1575-1579.
Zhang, Y.-Y., J. Yin, M. Zhou, Z. Lin, and Q. Q. Li. 2020. Adaptive transgenerational effects remain significant. Ecology Letters 23:1719-1720.
?