R語(yǔ)言生態(tài)學(xué)進(jìn)化樹(shù)推斷物種分化歷史:分類(lèi)單元數(shù)與時(shí)間關(guān)系、支系圖可視化|附代碼數(shù)據(jù)
全文鏈接:http://tecdat.cn/?p=31434
最近我們被客戶(hù)要求撰寫(xiě)關(guān)于生態(tài)學(xué)進(jìn)化樹(shù)的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。
我們圍繞進(jìn)化樹(shù)技術(shù)進(jìn)行一些咨詢(xún),分析生物類(lèi)群在時(shí)間上的多樣性是如何變化的
我們將用到分類(lèi)單元數(shù)-時(shí)間圖(Lineages-through-time plot),該圖可以用來(lái)描述物種多樣化的總體趨勢(shì)。
數(shù)據(jù)
3500trees.nexus是nexus格式的文件,里面有3500棵樹(shù)。

besttree.nexus也是nexus格式的文件,里面有1顆樹(shù),是從3500顆樹(shù)中篩選出來(lái)的一致樹(shù)。
各支系圖示

這棵樹(shù)總共有4大支系(Lineage),現(xiàn)在我需要做的分析都是需要分別做總的,以及4個(gè)支系的,也就是說(shuō)同樣的分析要做5次,針對(duì)5組不同的對(duì)象。
分析方法
方法主要是物種多樣化速率(diversification?rate) 相關(guān)的內(nèi)容。
trees=read.nexus("3500trees.nexus") ?besttree=read.nexus("besttree.nexus")

點(diǎn)擊標(biāo)題查閱往期內(nèi)容

生態(tài)學(xué)建模:增強(qiáng)回歸樹(shù)(BRT)預(yù)測(cè)短鰭鰻生存分布和影響因素

左右滑動(dòng)查看更多

01

02

03

04

1.mltt plot (multiple lineage through time)
分類(lèi)單元數(shù)-時(shí)間圖
lingeage的數(shù)值取log的,95%置信區(qū)間的ltt plot,中間黑色線的是besttree的,要顯示出來(lái)。分別做總的,以及4個(gè)支系的,共5個(gè)圖。
plot(trees)

,log='y')

besttree

# 95% ltt置信區(qū)間
ltt.ci<-function(tree.all){ ?
? ntip=length(tree.all[[1]]$tip.label) ?
? ntree=length(tree.all)

2.gamma statistic
檢驗(yàn)分化速率的變化趨勢(shì),看γ的值是正的還是負(fù)的。結(jié)果需要得到每組的γ值及P值。
mmaStat(besttree)
## [1] -3.693285
3. Monte Carlo constant rates test
檢驗(yàn)樣品不全是否對(duì)分化速率的結(jié)果有顯著的影響,應(yīng)該也是每組都要做的。
mc.out <- mcmc.popline(tree.hiv) ?plot(sk, l

4.對(duì)每個(gè)組做幾個(gè)模型的檢驗(yàn),主要包括Pure-birth, birth-death, Yule 2-rate,density-dependent logistic,density-dependent exponential模型。
tdAICr## --------------Model Summary---------------- ?## ?## MODEL pureBirth ?## ?## Parameters:? r1 ?## ?## LH 535.1086 ?## ?## AIC -1068.217 ?## ?## r1 0.1817879 ?## ?## a -1068.217 ?## ?## ?## -------------------------- ?## MODEL bd ?## ?## Parameters:? r1, a ?## ?## LH 535.1086 ?## ?## AIC -1066.217 ?## ?## r1 0.1817879 ?## ?## a 0 ?## ?## ?## -------------------------- ?## MODEL DDL ?## ?## Parameters:? r1, k ?## ?## LH 542.2213 ?## ?## AIC -1080.443 ?## ?## r1 0.2537928 ?## ?## a -1080.443 ?## ?## k 554 ?## ?## ?## -------------------------- ?## MODEL DDX ?## ?## Parameters:? r1, X ?## ?## LH 536.991 ?## ?## AIC -1069.982 ?## ?## r1 0.3098342 ?## ?## a -1069.982 ?## ?## x 0.1131752 ?## ?## ?## -------------------------- ?## ?## Best Constant Rate Model = pureBirth? AIC? -1068.217 ?## ?## Best Rate Variable Model = DDL? AIC? -1080.443 ?## ?## delta AICrc =? 12.2254##?????? model params np mtype?????? LH??????? r1 r2???????? a??????? xp?? k ?## 1 pureBirth???? r1? 1??? RC 535.1086 0.1817879 NA -1068.217??????? NA? NA ?## 2??????? bd? r1, a? 2??? RC 535.1086 0.1817879 NA???? 0.000??????? NA? NA ?## 3?????? DDL? r1, k? 2??? RV 542.2213 0.2537928 NA -1080.443??????? NA 554 ?## 4?????? DDX? r1, X? 2??? RV 536.9910 0.3098342 NA -1069.982 0.113175

點(diǎn)擊文末?“閱讀原文”
獲取全文完整代碼數(shù)據(jù)資料。
本文選自《R語(yǔ)言生態(tài)學(xué):進(jìn)化樹(shù)推斷物種分化歷史:分類(lèi)單元數(shù)與時(shí)間關(guān)系、支系圖可視化》。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
Python決策樹(shù)、隨機(jī)森林、樸素貝葉斯、KNN(K-最近鄰居)分類(lèi)分析銀行拉新活動(dòng)挖掘潛在貸款客戶(hù)
R語(yǔ)言邏輯回歸(Logistic Regression)、回歸決策樹(shù)、隨機(jī)森林信用卡違約分析信貸數(shù)據(jù)集R語(yǔ)言基于Bagging分類(lèi)的邏輯回歸(Logistic Regression)、決策樹(shù)、森林分析心臟病患者
R語(yǔ)言樣條曲線、決策樹(shù)、Adaboost、梯度提升(GBM)算法進(jìn)行回歸、分類(lèi)和動(dòng)態(tài)可視化
R語(yǔ)言用主成分PCA、?邏輯回歸、決策樹(shù)、隨機(jī)森林分析心臟病數(shù)據(jù)并高維可視化
matlab使用分位數(shù)隨機(jī)森林(QRF)回歸樹(shù)檢測(cè)異常值
R語(yǔ)言用邏輯回歸、決策樹(shù)和隨機(jī)森林對(duì)信貸數(shù)據(jù)集進(jìn)行分類(lèi)預(yù)測(cè)
R語(yǔ)言中使用線性模型、回歸決策樹(shù)自動(dòng)組合特征因子水平
R語(yǔ)言中自編基尼系數(shù)的CART回歸決策樹(shù)的實(shí)現(xiàn)
Python對(duì)商店數(shù)據(jù)進(jìn)行l(wèi)stm和xgboost銷(xiāo)售量時(shí)間序列建模預(yù)測(cè)分析
R語(yǔ)言基于樹(shù)的方法:決策樹(shù),隨機(jī)森林,Bagging,增強(qiáng)樹(shù)
R語(yǔ)言實(shí)現(xiàn)偏最小二乘回歸法 partial least squares (PLS)回歸
R語(yǔ)言多項(xiàng)式回歸擬合非線性關(guān)系
R語(yǔ)言邏輯回歸(Logistic回歸)模型分類(lèi)預(yù)測(cè)病人冠心病風(fēng)險(xiǎn)
R語(yǔ)言用局部加權(quán)回歸(Lowess)對(duì)logistic邏輯回歸診斷和殘差分析
R語(yǔ)言混合效應(yīng)邏輯回歸(mixed effects logistic)模型分析肺癌數(shù)據(jù)