五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

R語言ConsensusClusterPlus包無監(jiān)督聚類

2023-02-09 09:22 作者:小云愛生信  | 我要投稿

爾云間? 一個專門做科研的團(tuán)隊

原創(chuàng)?小果?生信果


一致法無監(jiān)督聚類廣泛應(yīng)用于癌癥分子亞型分型中,我們在查看文獻(xiàn)這部分分析中經(jīng)常看到以下幾個圖


Tracking plot ,可以看到不同K之下各個樣本的亞型分組情況,如果該樣本在不同的k值下亞型分組不變,就說明該樣本比較穩(wěn)定,反之則不穩(wěn)定,如果一種亞型含有很多不穩(wěn)定樣本,則說明該亞型不穩(wěn)定。



小果之前給大家分享過多篇雙疾病的研究思路文章


Delta area,根據(jù)此圖我們可以依據(jù)拐點法判斷最佳分組,拐點后隨著聚類數(shù)的增加,損失函數(shù)的收益越來越小,因此通常選擇拐點作為最佳K值,這種方法也被形象的稱為手肘法。



CDF圖,展示各個K值下的曲線下面積



一致性矩陣熱圖,聚類效果好的話,下圖中的藍(lán)色和白色也就是矩陣對應(yīng)的0和1會分割的很清楚,看起來比較干凈。



下面小果就把對應(yīng)的代碼貼出來


rm(list=ls());gc();
BiocManager::install("ConsensusClusterPlus")
#準(zhǔn)備輸入數(shù)據(jù)
library(data.table)

express<-fread("express.CSV")
express<-as.data.frame(express)
rownames(express)<-express[,1]
express<-express[,-1]
class(express)
colname<-colnames(express)#保存行名
rowname<-rownames(express)#保存列名
express<-as.data.frame(lapply(express,as.numeric))#數(shù)據(jù)框轉(zhuǎn)換為數(shù)值型
colnames(express)<-colname
rownames(express)<-rowname
#歸一化
express = sweep(express,1, apply(express,1,median,na.rm=T))
express<-as.matrix(express)

#運行ConsensusClusterPlus


library(ConsensusClusterPlus)
title="untitled_consensus_cluster"
results = ConsensusClusterPlus(express,maxK=10,reps=1000,pItem=0.8,pFeature=1,
?????????????????????????????? title=title,clusterAlg="hc",distance="pearson",
?????????????????????????????? seed=1262118388.71279,plot="pdf", writeTable = TRUE)

#1. pItem, 選擇80%的樣本進(jìn)行重復(fù)抽樣

#2. pfeature, 選擇80%的基因進(jìn)行重復(fù)抽樣

#3. maxK, 最大的K值,形成一系列梯度

#4. reps, 重復(fù)抽樣的數(shù)目

#5. clusterAlg, 層次聚類的算法

#6. distanc, 距離矩陣的算法

#7. title, 輸出結(jié)果的文件夾名字,包含了輸出的圖片

#8. seed, 隨機(jī)種子,用于重復(fù)結(jié)果




str(results[[2]])

# 一致性矩陣,樣本的鄰接矩陣
dim(d)


dim(results[[2]][["consensusMatrix"]])


results[[2]][["consensusMatrix"]][1:5,1:5]





# 樣本的聚類樹
results[[2]][["consensusTree"]]

# ml, 就是consensusMatrix
results[[2]][["ml"]][1:5,1:5]


results[[2]][["consensusMatrix"]][1:5,1:5]



# clrs, 顏色
results[[2]][["clrs"]]


#收集cluster-consensus和item-consensus 矩陣


icl = calcICL(results,title=title,plot="pdf",writeTable=TRUE)
icl[["clusterConsensus"]]

dim(icl[["itemConsensus"]])


icl[["itemConsensus"]][1:5,]


關(guān)注小果,小果將會持續(xù)為你帶來更多生信干貨哦。


R語言ConsensusClusterPlus包無監(jiān)督聚類的評論 (共 條)

分享到微博請遵守國家法律
沙洋县| 青川县| 涡阳县| 黑河市| 文安县| 上虞市| 和顺县| 县级市| 威宁| 石河子市| 通许县| 勐海县| 成安县| 泌阳县| 溆浦县| 阳山县| 凤翔县| 普安县| 永新县| 淮安市| 乐安县| 吉木乃县| 金平| 鞍山市| 大足县| 卢湾区| 大邑县| 历史| 郧西县| 绥滨县| 农安县| 巴林左旗| 九龙城区| 长岭县| 南康市| 江安县| 买车| 阿城市| 新干县| 蚌埠市| 汶上县|