基因富集分析,GSEA軟件使用想學(xué)的趕緊進(jìn)來!
GSEA
基因富集分析是在一組基因中找到具有一定基因功能特征和生物過程的基因集,在研究差異表達(dá)基因、篩選基因的后續(xù)分析中經(jīng)常使用。常規(guī)富集分析必須先做差異篩選,用篩選的基因(無論多少)進(jìn)行功能富集,這種方式可能由于篩選參數(shù)的不合理導(dǎo)致漏掉一些關(guān)鍵信息。
而GSEA無需做差異分析,直接拿所有基因的表達(dá)量即可找到實(shí)驗(yàn)組和對(duì)照組有一致性差異的感興趣的通路。好處就是,不經(jīng)篩差異可以保留了這些關(guān)鍵信息,進(jìn)而找到那些差異不很明顯但是基因差異趨勢(shì)很一致的功能基因集。科研技能實(shí)操單元課最近上新了一節(jié)GSEA使用教程課程,今天小編給大家介紹一下GSEA軟件使用,文末可以直接領(lǐng)取課件,無需任務(wù)。
一、MSigDB與GSEA簡(jiǎn)介
GSEA與傳統(tǒng)GO、KEGG富集分析的區(qū)別在于以下3點(diǎn)1.輸入文件:GSEA是表達(dá)矩陣,傳統(tǒng)的富集分析是基因名列表;2.差異分析:GSEA不需要進(jìn)行差異分;3.目的:傳統(tǒng)的富集分析主要關(guān)注的差異顯著基因的功能,GSEA關(guān)注的是某個(gè)生物狀態(tài)下功能基因集的變化。而MSigDB數(shù)據(jù)庫(kù)作為專門為GSEA分析收集整理的功能基因集,全部?jī)?chǔ)存在gmt格式的文件中,它可以直接用于GSEA分析。
二、GSEA輸入文件的制作
GSEA軟件需通過其官網(wǎng)進(jìn)行下載安裝,這里不再贅述。GSEA官網(wǎng):https://www.gsea-msigdb.org/gsea/index.jsp
我們來看看GSEA輸入文件是如何制作的,GSEA分析需要輸入預(yù)定義基因集文件(.gmt)、表達(dá)矩陣文件(.gct)、表型信息文件(.cls)。預(yù)定義基因文件可以在官網(wǎng)下載,我們也可以制作自定義的gmt格式基因集,按照格式在Excel中按要求制作好后,將后綴改成.gmt即可。

表達(dá)矩陣文件制作,我們可以按照要求在excel制作后,保存文制表符分隔文件,再將后綴改為.gct。

表型信息文件的制作,cls格式文件定義了表型標(biāo)簽(分類、分組等信息),為gmt文件中的每一個(gè)樣本設(shè)定了一個(gè)標(biāo)簽,使用空格或tab分隔??墒褂胑xcel制作該文件,保存為制表符分隔的文本文件,然后修改后綴名為.cls即可。cls內(nèi)容的主要區(qū)別在于分類和連續(xù)型標(biāo)簽定義的不同。
三、GSEA分析結(jié)果解讀
在制作好文件后,下一步需要將數(shù)據(jù)導(dǎo)入到GSEA進(jìn)行分析,具體操作按照課程流程進(jìn)行,我們將注意力集中在GSEA分析結(jié)果解讀上。在GSEA分析完成后,結(jié)果會(huì)保存在先前設(shè)置到的文件夾中,打開index.html就可以查看網(wǎng)頁版結(jié)果。

通過網(wǎng)頁展示的結(jié)果,我們就可以具體分析數(shù)據(jù),而且可以看到詳細(xì)的富集分析結(jié)果,包括網(wǎng)頁形式以及Excel形式。更多具體分析結(jié)果解讀請(qǐng)?jiān)谫Y源內(nèi)查看。
資源領(lǐng)取方式
①轉(zhuǎn)發(fā)本條動(dòng)態(tài)到朋友圈? ?
②報(bào)名 免 費(fèi) 訓(xùn)練營(yíng)內(nèi)學(xué)習(xí)領(lǐng)取? ? 報(bào)名戳:
https://m.helixlife.cn/trainings/cfdcd438-8d7f-4992-8f52-4ef2505b0a33?c=78982131-3307-4cba-a82b-50460b87676a?