視頻】復(fù)雜網(wǎng)絡(luò)分析CNA簡(jiǎn)介與R語(yǔ)言對(duì)婚禮數(shù)據(jù)聚類社區(qū)檢測(cè)和可視化|數(shù)據(jù)分享|附代碼數(shù)
全文鏈接:http://tecdat.cn/?p=18770?
最近我們被客戶要求撰寫關(guān)于復(fù)雜網(wǎng)絡(luò)分析的研究報(bào)告,包括一些圖形和統(tǒng)計(jì)輸出。
復(fù)雜網(wǎng)絡(luò)分析研究如何識(shí)別、描述、可視化和分析復(fù)雜網(wǎng)絡(luò)。
為了用R來處理網(wǎng)絡(luò)數(shù)據(jù),我們使用婚禮數(shù)據(jù)集
CNA 研究和應(yīng)用爆炸式增長(zhǎng)的突出原因是兩個(gè)因素 - 一個(gè)是廉價(jià)而強(qiáng)大的計(jì)算機(jī)的可用性,使在數(shù)學(xué)、物理和社會(huì)科學(xué)方面接受過高級(jí)培訓(xùn)的研究人員和科學(xué)家能夠進(jìn)行一流的研究;另一個(gè)因素是是人類社會(huì)、行為、生物、金融和技術(shù)方面不斷增加的復(fù)雜性。
網(wǎng)絡(luò)是離散數(shù)據(jù)的組織和表示的關(guān)系形式。關(guān)于網(wǎng)絡(luò)的兩個(gè)最重要的概念是實(shí)體和它們之間的關(guān)系。實(shí)體稱為節(jié)點(diǎn),關(guān)系稱為邊。網(wǎng)絡(luò)節(jié)點(diǎn)和邊是高級(jí)抽象,對(duì)于大多數(shù)網(wǎng)絡(luò)來說,它們的真實(shí)性質(zhì)并不重要。當(dāng)必要時(shí),我們通過添加屬性來表示節(jié)點(diǎn)和邊。關(guān)系或邊通常涉及兩個(gè)離散的實(shí)體或節(jié)點(diǎn),盡管實(shí)體可以與自身存在關(guān)系,這種關(guān)系稱為自反關(guān)系。
在討論復(fù)雜網(wǎng)絡(luò)的真正樣子之前,讓我們先談?wù)動(dòng)袝r(shí)稱為經(jīng)典網(wǎng)絡(luò)的基本簡(jiǎn)單網(wǎng)絡(luò)。?經(jīng)典網(wǎng)絡(luò)的一個(gè)例子是線性網(wǎng)絡(luò)——我們生命的時(shí)間線,每個(gè)生命事件(例如“出生”、“第一次走路”、“學(xué)校畢業(yè)”、“婚姻”和最終的“死亡”)都是一個(gè)實(shí)體至少一個(gè)屬性是時(shí)間?!鞍l(fā)生在之后”是這種情況下的關(guān)系,因?yàn)橐粭l邊將兩個(gè)事件連接在一起,一個(gè)事件緊接著另一個(gè)事件發(fā)生。這個(gè)網(wǎng)絡(luò)之所以被認(rèn)為是簡(jiǎn)單的,是因?yàn)樗哂幸?guī)則的結(jié)構(gòu),而不是因?yàn)樗苄 ?/p>
線性時(shí)間線
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
航空公司復(fù)雜網(wǎng)絡(luò)對(duì)疫情進(jìn)行建模
左右滑動(dòng)查看更多
01
02
03
04
**
**
復(fù)雜的網(wǎng)絡(luò)具有非平凡的結(jié)構(gòu),它既不是網(wǎng)格也不是樹。
?
由于沒有全局控制的分散過程,這些復(fù)雜的網(wǎng)絡(luò)發(fā)生在自然界和人造世界中。此類網(wǎng)絡(luò)的一些代表包括:
社交網(wǎng)絡(luò):家人和朋友、Twitter 和 instagram 追隨者等。
文化網(wǎng)絡(luò):?宗教網(wǎng)絡(luò)、語(yǔ)言家族等。
技術(shù)網(wǎng)絡(luò):?交通和通訊系統(tǒng)等……
金融網(wǎng)絡(luò):?華爾街市場(chǎng)、國(guó)際貿(mào)易等。
生物網(wǎng)絡(luò):?基因/蛋白質(zhì)相互作用、疾病流行等。
R語(yǔ)言復(fù)雜網(wǎng)絡(luò)分析:聚類(社區(qū)檢測(cè))和可視化
為了用R來處理網(wǎng)絡(luò)數(shù)據(jù),我們使用婚禮數(shù)據(jù)集?(?查看文末了解數(shù)據(jù)獲取方式?)?。
?nflo=network(flo,directed=FALSE)
?plot(nflo,?displaylabels?=?TRUE,+?boxed.labels?=+?FALSE)
下一步是igraph。由于我們有鄰接矩陣,因此可以使用它
graph_from_adjacency_matrix(flo,
+?mode?=?"undirected")
我們可以在兩個(gè)特定節(jié)點(diǎn)之間獲得最短路徑。我們給節(jié)點(diǎn)賦予適當(dāng)?shù)念伾?/p>
?all_shortest_paths(iflo,
?)
?
?
>?plot(iflo)
我們還可以可視化邊,需要從輸出中提取邊緣
>?lins=c(paste(as.character(L)[1:4],
+?"--"?
+?as.character(L)[2:5]??sep=""?,
+?paste(as.character(L)?2:5],
+?"--",
?
>?E(ifl?)$color=c("grey","black")[1+EU]>?plot(iflo)
也可以使用D3js可視化
>?library(?networkD3?)
>?simpleNetwork?(df)
下一個(gè)問題是向網(wǎng)絡(luò)添加一個(gè)頂點(diǎn)。最簡(jiǎn)單的方法是通過鄰接矩陣實(shí)現(xiàn)概率
>?flo2["f","v"]=1>?flo2["v","f"]=1
然后,我們進(jìn)行集中度測(cè)量。
目的是了解它們之間的關(guān)系。
?betweenness(ilo)
?
>?cor(base)
betw?close?deg?eig
betw?1.0000000?0.5763487?0.8333763?0.6737162close?0.5763487?1.0000000?0.7572778?0.7989789deg?0.8333763?0.7572778?1.0000000?0.9404647eig?0.6737162?0.7989789?0.9404647?1.0000000
可以使用層次聚類圖來可視化集中度度量
hclust(dist(?ase??,
+?method="ward")
相關(guān)視頻
**
拓端
,贊20
查看集中度度量的值,查看排名
?>?for(i?in?1:4)?rbase[,i]=rank(base[,i])
在此,特征向量測(cè)度非常接近頂點(diǎn)的度數(shù)。
最后,尋找聚類(以防這些家庭之間爆發(fā)戰(zhàn)爭(zhēng))
>?kc?<-?fastgreedy.community?(?iflo?)
在這里,我們有3類
點(diǎn)擊文末?“閱讀原文”
獲取全文完整資料。
本文選自《復(fù)雜網(wǎng)絡(luò)分析CNA簡(jiǎn)介與R語(yǔ)言對(duì)婚禮數(shù)據(jù)聚類(社區(qū)檢測(cè))和可視化》。
點(diǎn)擊標(biāo)題查閱往期內(nèi)容
R語(yǔ)言公交地鐵路線進(jìn)出站數(shù)據(jù)挖掘網(wǎng)絡(luò)圖可視化
混合圖形模型MGM的網(wǎng)絡(luò)可預(yù)測(cè)性分析
網(wǎng)絡(luò)社區(qū)檢測(cè)(社群發(fā)現(xiàn))分析女性參加社交活動(dòng)和社區(qū)節(jié)點(diǎn)著色可視化
用航空公司復(fù)雜網(wǎng)絡(luò)對(duì)疫情進(jìn)行建模
R語(yǔ)言社區(qū)發(fā)現(xiàn)算法檢測(cè)心理學(xué)復(fù)雜網(wǎng)絡(luò):spinglass、探索性圖分析walktrap算法與可視化
R語(yǔ)言復(fù)雜網(wǎng)絡(luò)分析:聚類(社區(qū)檢測(cè))和可視化
使用Python和SAS Viya分析社交網(wǎng)絡(luò)
R語(yǔ)言用igraph繪制網(wǎng)絡(luò)圖可視化
在R語(yǔ)言中使用航空公司復(fù)雜網(wǎng)絡(luò)對(duì)疫情進(jìn)行建模
R語(yǔ)言用相關(guān)網(wǎng)絡(luò)圖可視化分析汽車配置和飲酒習(xí)慣
R語(yǔ)言公交地鐵路線進(jìn)出站數(shù)據(jù)挖掘網(wǎng)絡(luò)圖可視化
python對(duì)網(wǎng)絡(luò)圖networkx進(jìn)行社區(qū)檢測(cè)和彩色繪圖R語(yǔ)言推特twitter網(wǎng)絡(luò)轉(zhuǎn)發(fā)可視化分析
R語(yǔ)言復(fù)雜網(wǎng)絡(luò)分析:聚類(社區(qū)檢測(cè))和可視化
R語(yǔ)言混合圖形模型MGM的網(wǎng)絡(luò)可預(yù)測(cè)性分析
R語(yǔ)言使用自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)進(jìn)行客戶細(xì)分
R語(yǔ)言網(wǎng)絡(luò)分析友誼悖論案例
R語(yǔ)言網(wǎng)絡(luò)和網(wǎng)絡(luò)流的可視化實(shí)踐:通勤者流動(dòng)網(wǎng)絡(luò)
R語(yǔ)言最大流最小割定理和最短路徑算法分析交通網(wǎng)絡(luò)流量擁堵問題
R語(yǔ)言公交地鐵路線網(wǎng)絡(luò)圖實(shí)現(xiàn)數(shù)據(jù)挖掘?qū)崙?zhàn)
R軟件SIR模型網(wǎng)絡(luò)結(jié)構(gòu)擴(kuò)散過程模擬
通過SAS網(wǎng)絡(luò)分析對(duì)人口遷移進(jìn)行可視化分析
python隸屬關(guān)系圖模型:基于模型的網(wǎng)絡(luò)中密集重疊社區(qū)檢測(cè)方法
使用Python和SAS Viya分析社交網(wǎng)絡(luò)
用R語(yǔ)言和python進(jìn)行社交網(wǎng)絡(luò)中的社區(qū)檢測(cè)
python圖工具中基于隨機(jī)塊模型動(dòng)態(tài)網(wǎng)絡(luò)社團(tuán)檢測(cè)
在R語(yǔ)言中使用航空公司復(fù)雜網(wǎng)絡(luò)對(duì)疫情進(jìn)行建模
采用SPSS Modeler的Web復(fù)雜網(wǎng)絡(luò)對(duì)所有腧穴進(jìn)行分析