你可能根本不知道的GEO數(shù)據(jù)查詢技巧

01?常規(guī)篩選
在GEO數(shù)據(jù)庫搜索所需數(shù)據(jù)集的時候,條目太多,一個個點進去篩選耗時耗力,效率不高。
通常我們可以通過geo界面左右兩側(cè)給的一些選項進行篩選
數(shù)據(jù)記錄類型:atasets、series、samples和platforms

選擇來源物種

測序平臺:DNA、mRNA、SNP、甲基化等等

限定作者

限定樣本類型

限定數(shù)據(jù)上傳時間

02?檢索式搜索
上述是網(wǎng)上經(jīng)常提到的篩選方法,但今天我發(fā)現(xiàn)一個有意思的地方,感覺可以探索一下
當我以“undifferentiated carcinoma”為關(guān)鍵詞進行搜索時

它右側(cè)輸入框顯示"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]

當我們點擊See more出現(xiàn)以下界面

Query Translation這里提示我也可以在GEO使用檢索式進行檢索
針對"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]這一命令進行解讀
它是在關(guān)鍵詞MeSH Terms中對carcinoma進行精確搜索,OR 或 ,在所有字段[All Fields]中搜索undifferentiated carcinoma。
而我們在搜索框中輸入的undifferentiated carcinoma,我是想對undifferentiated carcinoma進行一個精確的搜索,通常使用雙引號””便可進行精確搜索


我們可以看到在進行精確搜索前我們得到了238298條數(shù)據(jù),而精確搜索后就只有64條數(shù)據(jù),有量級的差別
這也說明了我們是可以在GEO數(shù)據(jù)庫使用檢索式進行搜索
而我們也可以使用All Fields,Title,MeSH Terms,Description這些限定檢索字段

上圖顯示[Description]是被正常識別的
當然一些常規(guī)的符號也是能識別的,比如:
“|”或——并行搜索、
“-”非——消除無關(guān)性、
“+”加號 —— 強制包含關(guān)鍵詞

這里|就被識別為了OR,當然你也可以直接輸入OR。
