腦科學(xué)新領(lǐng)域:神經(jīng)科學(xué)+大數(shù)據(jù)
神經(jīng)科學(xué)研究,俗稱“腦研究”,在“大數(shù)據(jù)”概念出來(lái)的多年前就已經(jīng)用上了一些大數(shù)據(jù)研究的方法了,所以,作為神經(jīng)科學(xué)家,我們對(duì)“大數(shù)據(jù)”早就非常熟悉了。這里談一下我個(gè)人對(duì)于神經(jīng)科學(xué)領(lǐng)域大數(shù)據(jù)的一些想法。
大家要問(wèn),神經(jīng)科學(xué)領(lǐng)域都有哪些大數(shù)據(jù)呢?這里,最明顯不過(guò)的如“成像”數(shù)據(jù),像功能性核磁共振(fMRI)、彌散張量成像(DTI)、電壓敏感染料成像(VSDI)等實(shí)驗(yàn)的數(shù)據(jù);還有使用多通道技術(shù)獲得的的長(zhǎng)時(shí)間的電生理數(shù)據(jù),如多道EEG、胞外多通微電極記錄、微電極陣列(MEA)記錄等實(shí)驗(yàn)的數(shù)據(jù)。
這些數(shù)據(jù)的特點(diǎn)一是數(shù)據(jù)文件體積龐大,在2003年的時(shí)候就可以輕易超過(guò)1G(腦電生理數(shù)據(jù)),或者是在計(jì)算機(jī)內(nèi)存中進(jìn)行計(jì)算的時(shí)候會(huì)超過(guò)4G,以至于必需使用64位操作系統(tǒng)。第二個(gè)特點(diǎn)是使用單個(gè)CPU計(jì)算時(shí)需要很長(zhǎng)時(shí)間,像2003年即使200M大小的腦電生理數(shù)據(jù),使用當(dāng)時(shí)的單核計(jì)算機(jī)做時(shí)頻譜分析,一個(gè)數(shù)據(jù)文件的計(jì)算時(shí)間通常都要超過(guò)2個(gè)小時(shí)。
在目前多核計(jì)算機(jī)平臺(tái)下進(jìn)行計(jì)算,對(duì)于需要進(jìn)行復(fù)雜計(jì)算的數(shù)據(jù),大多數(shù)專用的神經(jīng)科學(xué)分析軟件暫時(shí)還不支持并行計(jì)算,有些通用的軟件如Matlab已經(jīng)可以支持OpenMP和CUDA兩種模式的并行計(jì)算,但前提要求是使用者必須懂得計(jì)算機(jī)編程,尤其像CUDA模式更是如此。
目前國(guó)內(nèi)的神經(jīng)科學(xué)計(jì)算還很少有人用到超級(jí)計(jì)算機(jī)(以下簡(jiǎn)稱“超算”),使用超算多少有些麻煩,主要原因是還沒有比較成熟的軟件(無(wú)論商業(yè)還是開源軟件)可以讓一般的神經(jīng)科學(xué)家像使用Excel一樣方便地使用那樣的并行軟件。即使在桌面領(lǐng)域,支持OpenMP和CUDA的神經(jīng)科學(xué)專用計(jì)算軟件也很稀少。但是這樣的局面不會(huì)保持太久,估計(jì)在2020年之前這樣的軟件就會(huì)比較普及。
并行計(jì)算軟件的普及對(duì)于研究者來(lái)說(shuō)是很重要的,因?yàn)闆]有金剛鉆就攬不了瓷器活。但除了軟件之外,更重要的怕是對(duì)于神經(jīng)科學(xué)數(shù)據(jù)的理解、分析能力了。這一點(diǎn)可不是一個(gè)人或是某個(gè)領(lǐng)域的人就可以干得下來(lái)的活,要完成這種研究,必須有數(shù)學(xué)、信息學(xué)、神經(jīng)生物學(xué)等多個(gè)領(lǐng)域的專家聯(lián)合起來(lái)對(duì)某個(gè)專門的問(wèn)題進(jìn)行集中、深入的研究方可。這種多學(xué)科聯(lián)合不是那種“要錢”的松散聯(lián)合,而是為了解決一個(gè)實(shí)際問(wèn)題必須要進(jìn)行的實(shí)質(zhì)性聯(lián)合,也許現(xiàn)有的國(guó)家科研體制暫時(shí)還不支持這種聯(lián)合,但只要不是“為了發(fā)文章而合作”,相關(guān)領(lǐng)域的科學(xué)家應(yīng)該還是可以聯(lián)合在一起潛心進(jìn)行研究的,目前自然科學(xué)基金也支持這種研究。
大數(shù)據(jù)的核心問(wèn)題在于如何挖掘與相關(guān)領(lǐng)域有關(guān)的科學(xué)規(guī)律,所以這種挖掘不能僅靠所謂的“數(shù)據(jù)科學(xué)家”,因?yàn)榇髷?shù)據(jù)通常都是和某個(gè)具體科學(xué)領(lǐng)域有關(guān),或者和某個(gè)具體的科學(xué)問(wèn)題有關(guān),因此,除了數(shù)據(jù)科學(xué)家之外,實(shí)驗(yàn)學(xué)家和理論學(xué)家都需要參與數(shù)據(jù)的挖掘工作,這是一個(gè)綜合性很高的系統(tǒng)工程。
大數(shù)據(jù)概念誕生到現(xiàn)在還不到5年,但是神經(jīng)科學(xué)家為了揭開腦功能的奧秘,和大數(shù)據(jù)打交道已經(jīng)10年以上了,像2005年歐洲發(fā)起的“藍(lán)腦計(jì)劃(Blue Brain Project)”使用顯微鏡和膜片鉗技術(shù)以及超算從一小片腦片研究開始,直到最近幾年IBM用超算和專門芯片來(lái)模擬大腦為止,神經(jīng)科學(xué)領(lǐng)域?qū)τ诖髷?shù)據(jù)的理解和其他領(lǐng)域相比要更加深入。
對(duì)于神經(jīng)科學(xué)領(lǐng)域的研究人員來(lái)說(shuō),無(wú)論是小到分子水平還是大到行為水平方面的研究,遲早都要和大數(shù)據(jù)打交道,所以,掌握一些必要的數(shù)學(xué)、計(jì)算機(jī)編程的知識(shí)對(duì)于今后事業(yè)的發(fā)展是會(huì)有所幫助的。