17分的Nucleic Acids Research生物信息學(xué)數(shù)據(jù)挖掘的文章是怎樣煉成的?
?上午十點(diǎn)左右和胖師兄一起聊天,發(fā)現(xiàn)他當(dāng)年竟然發(fā)過一篇17分SCI論文,不愧是大神。下邊是我們的聊天記錄:
小? 云:師兄啊,Nucleic Acids Research十七分了。
胖師兄:嗯,我知道,咱們也做啊。我自己還發(fā)過1篇呢。
小? 云:哇塞,真的嗎?你能不能給我好好講講,我后續(xù)推給咱們的粉絲們?
?胖師兄:其實(shí)很好做的。搞一點(diǎn)文本挖掘,輔助人工閱讀,然后開發(fā)一些在線展示工具。
小? 云:師兄眼中都很容易的。?
胖師兄:也不是,做個(gè)數(shù)據(jù)庫,開發(fā)個(gè)在線工具其實(shí)很花時(shí)間的,例如數(shù)據(jù)庫中各種數(shù)據(jù)要去收集,可能一個(gè)數(shù)據(jù)庫中想要的數(shù)據(jù)都分散在接近2萬篇文獻(xiàn)中,如何從2萬篇文獻(xiàn)中查詢到自己感興趣的數(shù)據(jù)很費(fèi)時(shí)間,可能要計(jì)算機(jī)文本挖掘,例如學(xué)習(xí)下perl這種處理文本比較方便的語言,外加人工輔助閱讀要讀幾個(gè)月才能做完一個(gè)項(xiàng)目,而且主導(dǎo)這個(gè)項(xiàng)目的要懂自己研究的方向,能夠知道做這個(gè)方向是不是熱點(diǎn),一些很偏的點(diǎn)雖然創(chuàng)新性夠了,但是因?yàn)檠芯康娜颂?,核酸研究也不收的。但是好的熱點(diǎn),雖然圈子外邊的不好把握。圈子內(nèi)的人都曉得,根本機(jī)會(huì)就不多了。
另外,說到低,這個(gè)事情靠努力和專家知識(shí)選一個(gè)好方向就好了。但是我想說的不是如此。
小? 云:師兄你咋不說了呢?師兄想啥?趕緊的啊
胖師兄:小? 云吶,那邊新開了個(gè)店,據(jù)說肉夾饃挺好吃。
小? 云:師兄,中午我請(qǐng)客,趕緊告訴我吧!
胖師兄:呵呵,小云吶,別著急。發(fā)到核酸研究上不難,難就難在好用,而且很多人用。若是能夠和臨床結(jié)合的數(shù)據(jù)庫才更有價(jià)值!我們幫很多朋友做過許多的,但是我特別佩服一個(gè)臨床主任,很有想法,他把自己關(guān)注的臨床數(shù)據(jù)收集了很多,搭配上公共數(shù)據(jù),找我們挖掘,后續(xù)科室里邊做科研的創(chuàng)新點(diǎn)都從這里出來,后來他還基于這個(gè)數(shù)據(jù)庫還申請(qǐng)了一個(gè)小幾百萬的國(guó)家課題。
小? 云:咱們也可以幫忙做啊
胖師兄:是啊,每年都做好幾個(gè)呢。負(fù)責(zé)這塊的我有一個(gè)專業(yè)的技術(shù)團(tuán)隊(duì),可能你不知道。
小? 云:那咱們這個(gè)技術(shù)團(tuán)隊(duì)的亮點(diǎn)是什么啊?
胖師兄:扎扎實(shí)實(shí)硬實(shí)力啊,
小? 云:具體怎么個(gè)流程呢?
胖師兄:比如你要找我?guī)兔?,就是?/span>準(zhǔn)備方向,然后我們做查新,我們幫你挖掘公共數(shù)據(jù)。交付結(jié)果。Over。
小? 云:但是我還是不知道是啥, 17分對(duì)于做科研的人好有吸引力啊。發(fā)不了長(zhǎng)長(zhǎng)見識(shí)也好啊。
胖師兄:我把今年的核酸研究收錄的數(shù)據(jù)庫的中文版本pdf發(fā)你一份吧。
小? 云:后續(xù)我發(fā)給公號(hào)粉絲們,粉絲們也可能有想做的!
胖師兄:好似剛才說的那家店不僅僅是肉夾饃好吃啊,豬頭肉也不錯(cuò)吶
小? 云:被你說的我也想吃了呢?師兄,走起,我請(qǐng)客。
