五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

從小白到空轉(zhuǎn)達(dá)人:小云教你用Scanpy包玩轉(zhuǎn)前沿?zé)狳c(diǎn)空間轉(zhuǎn)錄組分析!

2023-09-12 11:22 作者:爾云間  | 我要投稿

大家好呀,我們又見面啦,今天和大家聊聊單細(xì)胞和空轉(zhuǎn)分析中一個(gè)很基礎(chǔ)的包——Scanpy,Scanpy 是一個(gè)Python包,用于分析與 AnnData(一種數(shù)據(jù)結(jié)構(gòu))聯(lián)合構(gòu)建的單細(xì)胞分析數(shù)據(jù),當(dāng)然目前隨著技術(shù)的發(fā)展,它的開發(fā)者也在跟隨時(shí)代熱點(diǎn)變化不斷改進(jìn)它,現(xiàn)在除了單細(xì)胞分析,它也實(shí)現(xiàn)了空間轉(zhuǎn)錄組數(shù)據(jù)分析流程。之前小伙伴在后臺(tái)問小云Scanpy和Seurat包的區(qū)別,說自己不是很懂各種分析流程的步驟和原理,云云今天就給大家詳細(xì)講講python的scanpy包,其實(shí)scanpy和seurat的功能基本是可以替代的,不同的是一個(gè)用在python,一個(gè)用在R。 我們知道單細(xì)胞和空轉(zhuǎn)分析流程包括很多步驟,比如質(zhì)控(QC),標(biāo)準(zhǔn)化(Normalization),降維聚類(Dimensional reduction and clustering),Cluster marker genes, Spatially variable genes等,小云今天并不想直接給大家介紹網(wǎng)上都有的流程,而是想給大家看看Scanpy讀取的數(shù)據(jù)結(jié)構(gòu),以及如何可視化,教大家一步入門Scanpy! 1.?首先肯定是要輸入文件!先來教教大家h5ad文件的讀取

h5ad文件全稱是h5anndata,是anndata的h5格式,anndata也是python中的數(shù)據(jù)格式,如果你想用seurat讀,可以發(fā)現(xiàn)最后讀取的文件格式會(huì)變?yōu)閔5seurat,簡(jiǎn)單的說python中適配h5ad格式讀取,R適配h5seurat格式讀取。 adata =anndata.read_h5ad('F:/university/research/空間轉(zhuǎn)錄組/canvas/GSM6177599_10xVisium_processed.h5ad') 2.?讀入文件后,讓我們看一下adata中有什么

Obsm:對(duì)于觀測(cè)的多維注釋,它是可變的ndarray,就是說維度是可變的!小云偷偷告訴你,這里的維度一般是2至多維哦。而Obsm這里的m指的就是multi-dim多個(gè)維度的,obs_m對(duì)應(yīng)于obs,但obs的每個(gè)成員都是一維的觀測(cè)注釋,obs_m的每個(gè)成員(X_pac和X_umap)都是多維的觀測(cè)注釋。哦對(duì)了,忘了告訴你,obs就是矩陣的行,也就是樣本!

Varm:與obsm對(duì)應(yīng),是基因的多維觀測(cè)~

uns:非結(jié)構(gòu)化數(shù)據(jù),也就是字典。

rank_genes_groups 識(shí)別差異表達(dá)的基因(潛在的marker),這個(gè)函數(shù)將獲取每組細(xì)胞,并將每組中每個(gè)基因的分布與不在該組中的所有其他細(xì)胞中的分布進(jìn)行比較最后進(jìn)行識(shí)別。

pca:主成分分析降低數(shù)據(jù)維度。

umap降維:umap比tsne保留全局結(jié)構(gòu),允許大數(shù)據(jù)輸入,運(yùn)行時(shí)間短,這是umap和tsne的區(qū)別,一定要牢記喔!

obsp(pair):表示細(xì)胞和細(xì)胞之間的距離和連通性。

順便給大家提提obs中的mito表示線粒體基因,一般mito都表示的是線粒體。

n_genes_by_counts`:每個(gè)細(xì)胞中,有表達(dá)的基因的個(gè)數(shù);

total_counts:每個(gè)細(xì)胞的基因總計(jì)數(shù)(總表達(dá)量)

pct_counts_mt:每個(gè)細(xì)胞中,線粒體基因表達(dá)量占該細(xì)胞所有基因表達(dá)量的百分比

先給大家介紹這么多了,具體的還是需要后續(xù)自己查一下哦~

1.?可視化一下

import matplotlib.pyplot as plt from matplotlib import rc_context # rc_context用于指定figure大小 with rc_context({'figure.figsize': (4, 4)}): #????vmax改變顏色最大值,frameon為去掉邊框 sc.pl.umap(Myadata, color=['Rp1','clusters','pct_counts_mito','total_counts'],s=50,ncols=4,frameon=False,vmax='p99')

上圖中我們使用umap繪制了對(duì)應(yīng)的cluster,metadata的值,metadata就是每個(gè)細(xì)胞的信息喔,還繪制了Rp1,這么多圖只需要簡(jiǎn)單的兩行代碼就可以繪制!是不是覺得寫這個(gè)包的人很牛! 但是其實(shí)小云還是想知道這個(gè)坐標(biāo)是哪里來的,所以就去試了一下adata中的obsm中的umap的值,想看看究竟在這個(gè)包中是不是X_umap的坐標(biāo)繪制了上面這樣的圖,于是就進(jìn)行了下述操作: #測(cè)試一下umap?符合預(yù)期,確實(shí)是數(shù)據(jù)為細(xì)胞的坐標(biāo) import matplotlib.pyplot as plt # 將二維數(shù)組轉(zhuǎn)換為兩個(gè)一維數(shù)組x和y data=Myadata.obsm['X_umap'] x = [d[0] for d in data] y = [d[1] for d in data] # 繪制散點(diǎn)圖 plt.scatter(x, y)

我們可以看到,確實(shí)是這樣的!所以大家之后要是不懂包內(nèi)部的原理的話一定要多嘗試,多試試總歸是騙不了人的! with rc_context({'figure.figsize': (4.5, 3)}): ????'''stripplot=False用于刪除internal dots, inner='box'用于在小提琴內(nèi)部加方框圖''' ????sc.pl.violin(Myadata, ['pct_counts_in_top_50_genes', 'total_counts_mito'], groupby='clusters', stripplot=False, inner='box') ????'''mino表示線粒體基因''' 可以再來試試小提琴圖!

這是11個(gè)cluster中每個(gè)cluster對(duì)應(yīng)的不同類的基因的小提琴圖。 總結(jié)一下叭,pl.umap可以畫umap降維圖,pl.violin可以畫小提琴圖,那你知道熱圖怎么畫嗎,還有堆疊小提琴圖,比如下面這種圖所示,是不是很好看哈哈哈,小伙伴們可以之后試試哦,如果有需要的話,小云也會(huì)專門給大家出一期繼續(xù)講一下我們這次所用數(shù)據(jù)的后續(xù)分析的,就看大家的贊的個(gè)數(shù)了哦

從小白到空轉(zhuǎn)達(dá)人:小云教你用Scanpy包玩轉(zhuǎn)前沿?zé)狳c(diǎn)空間轉(zhuǎn)錄組分析!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
花垣县| 开阳县| 布尔津县| 游戏| 和顺县| 辽阳县| 金坛市| 天台县| 虎林市| 镇赉县| 安新县| 中卫市| 龙州县| 项城市| 修水县| 海安县| 天津市| 隆子县| 遵义县| 登封市| 灯塔市| 开封市| 富顺县| 临江市| 商南县| 郁南县| 华阴市| 得荣县| 汤原县| 西乌珠穆沁旗| 于都县| 雷州市| 长兴县| 沐川县| 东海县| 通城县| 峨眉山市| 陆良县| 湘潭市| 板桥市| 威远县|