「青蓮客戶文獻(xiàn)」PSL-LCCL:人肝癌細(xì)胞系SK_HEP1蛋白的亞細(xì)胞定位數(shù)據(jù)庫
癌細(xì)胞系百科全書匯編了25種人肝癌細(xì)胞系(hLCCLs)的基因突變和mRNA表達(dá)。TCGA中的肝細(xì)胞肝癌(LIHC)隊(duì)列描述了基因組畸變、表觀遺傳學(xué)和基因表達(dá)譜特征。此外,一項(xiàng)關(guān)于肝癌發(fā)生的蛋白質(zhì)組學(xué)的研究對(duì)生物標(biāo)志物的篩選和治療具有重要意義。然而目前hLCCLs的細(xì)胞器圖譜尚未被描繪出來。
今天北京蛋白質(zhì)組學(xué)跟大家分享的是一篇青蓮客戶文獻(xiàn)來自河南省醫(yī)學(xué)遺傳研究所及國家蛋白質(zhì)機(jī)構(gòu)合作完成,于2022年1月20日發(fā)表在Database上“PSL-LCCL: a resource for subcellular protein localization in liver cancer cell line SK_HEP1”。蛋白亞細(xì)胞定位的表征為進(jìn)一步了解細(xì)胞行為提供了基礎(chǔ)。人肝癌細(xì)胞系(hLCCLs)中蛋白質(zhì)在膜結(jié)合細(xì)胞器上的亞細(xì)胞定位還有待進(jìn)一步研究,因此作者通過質(zhì)譜法對(duì)分離并富集了六個(gè)膜結(jié)合細(xì)胞器的蛋白質(zhì)進(jìn)行了定量分析,利用marker蛋白和基于機(jī)器學(xué)習(xí)的算法實(shí)現(xiàn)了在聚類和鄰域水平上定位蛋白質(zhì)(青蓮百奧提供技術(shù)支持)。

圖1:用MS定量分析SK_HEP1分離六種細(xì)胞器(n=3)中的蛋白質(zhì)
研究結(jié)果
六種膜結(jié)合細(xì)胞器中蛋白質(zhì)的定量結(jié)果分析
六個(gè)細(xì)胞器中共鑒定到4464個(gè)蛋白質(zhì),其重疊率為 百分之92 (n = 4097)。作者將來自六個(gè)細(xì)胞器鑒定的蛋白質(zhì)結(jié)果組合在一起并實(shí)施機(jī)器學(xué)習(xí)算法來預(yù)測蛋白質(zhì)亞細(xì)胞定位?;跈C(jī)器學(xué)習(xí)算法的分類在很大程度上依賴于可用的marker蛋白,而特異性定位于細(xì)胞器的marker蛋白要求具有高度的可復(fù)制性。選定了1481個(gè)marker蛋白分為18個(gè)簇(圖2A)并進(jìn)一步注釋為不同的亞細(xì)胞區(qū)室。

圖 2:選定的1481個(gè)marker蛋白的注釋
蛋白在 t-SNE 空間的分布,如相鄰的幾個(gè)簇(簇 1-3、簇 4-8、 簇9-11 和簇 12-17)表明了簇之間的內(nèi)在聯(lián)系?;谝阎膩喖?xì)胞區(qū)室的關(guān)系,作者使用“鄰域”的定義來合并相鄰的簇,如“分泌”(簇 1-3)、“線粒體”(簇 4-8)、“細(xì)胞核”(簇 9-11)和“胞質(zhì)溶膠”(簇 12-17)。不同細(xì)胞器中marker蛋白的表達(dá)譜(圖2B)也表明選擇的marker蛋白的可靠性。
基于聚類的、鄰域的蛋白質(zhì)亞細(xì)胞定位
基于監(jiān)督的機(jī)器學(xué)習(xí)的方法將所有鑒定到蛋白嚴(yán)格地分配到簇中進(jìn)行分類,成功地將 2510 個(gè)(百分之56)蛋白分類為簇。然后,作者將預(yù)測的單定位蛋白(n = 2510)與 UniProt (n = 7147)和GO (n = 6664)中的單定位蛋白進(jìn)行比較,發(fā)現(xiàn) 百分之44 的蛋白(n = 1105)與單定位蛋白一致。富集分析證實(shí)亞細(xì)胞定位在簇水平上被正確分配。

圖3:鑒定的蛋白質(zhì)(n = 4464)在鄰域水平的亞細(xì)胞定位
由于聚類相關(guān)性和蛋白質(zhì)覆蓋深度有限,僅一半(百分之56)被歸類為cluster。因此遵循“鄰域”的定義,根據(jù)已知的亞細(xì)胞區(qū)室關(guān)系在較高水平上對(duì)蛋白質(zhì)進(jìn)行分類(圖3A)。蛋白分類比例增加到百分之85 的蛋白質(zhì)(n = 3803),并與公共數(shù)據(jù)庫中注釋的單定位蛋白質(zhì)進(jìn)行比較進(jìn)一步驗(yàn)證蛋白亞細(xì)胞定位分類。
蛋白質(zhì)結(jié)構(gòu)域和復(fù)合物的亞細(xì)胞分布
蛋白質(zhì)結(jié)構(gòu)域可能在蛋白亞細(xì)胞定位中發(fā)揮作用,例如帶有轉(zhuǎn)運(yùn)肽的蛋白質(zhì)可以被運(yùn)輸?shù)骄€粒體,而一個(gè)信號(hào)肽可以將蛋白質(zhì)靶向“分泌”鄰域。將具有不同結(jié)構(gòu)域(如跨膜、信號(hào)和轉(zhuǎn)運(yùn))的蛋白質(zhì)定位到網(wǎng)絡(luò)中顯示具有不同結(jié)構(gòu)域的蛋白在預(yù)期的鄰域中富集。pfam中注釋的36個(gè)結(jié)構(gòu)域家族在特定的簇或鄰域中顯著富集表明了蛋白質(zhì)結(jié)構(gòu)域與其亞細(xì)胞定位之間的關(guān)聯(lián)。

圖4:蛋白質(zhì)復(fù)合物的亞細(xì)胞定位
作者創(chuàng)建了一個(gè) PSL-LCCL 數(shù)據(jù)庫,提供了用于SK _ hep1的“ PSL-LCCL”的用戶友好的蛋白質(zhì)亞細(xì)胞定位數(shù)據(jù)庫??梢酝ㄟ^關(guān)鍵字查詢給定蛋白質(zhì)的定位進(jìn)行可視化,還可以查看細(xì)胞器中感興趣的蛋白質(zhì)。
PSL-LCCL:一種人肝癌細(xì)胞系SK_HEP1中蛋白的亞細(xì)胞定位資源庫
期刊名稱:Database
影響因子:2.593
樣本選擇:SK_HEP1細(xì)胞器包括質(zhì)膜、內(nèi)質(zhì)網(wǎng)、核內(nèi)體、溶酶體、高爾基體和線粒體
技術(shù)策略:非標(biāo)蛋白質(zhì)組學(xué)