大數(shù)據(jù)及大數(shù)據(jù)技術(shù)的出現(xiàn),使得各行各業(yè)面臨著新的變革,這些變革或者大大推進(jìn)了行業(yè)的發(fā)展,或者逐漸顛覆傳統(tǒng)的運(yùn)行和發(fā)展模式。例如,互聯(lián)網(wǎng)和信息行業(yè)的快速發(fā)展使其具備了新的內(nèi)涵:通過深度的數(shù)據(jù)管理、數(shù)據(jù)挖掘、數(shù)據(jù)分析等展現(xiàn)大數(shù)據(jù),可以對(duì)行業(yè)發(fā)展起到預(yù)測、預(yù)警、指引等作用,大數(shù)據(jù)將其精準(zhǔn)、客觀、科學(xué)的價(jià)值轉(zhuǎn)化為一種生產(chǎn)元素,滲透到傳統(tǒng)行業(yè)的各個(gè)環(huán)節(jié)中去,從而帶來某些、甚至是本質(zhì)上的變革。
醫(yī)學(xué)大數(shù)據(jù)顛覆傳統(tǒng)醫(yī)療
傳統(tǒng)的物質(zhì)世界,因?yàn)闀r(shí)空限制,信息是嚴(yán)重不對(duì)稱的。我們以往很多的商業(yè)模式都是基于信息不對(duì)稱的物質(zhì)世界而建立的,很多商業(yè)模式都是因?yàn)橘嵢⌒畔⒉粚?duì)稱的利潤而生存,如電視臺(tái)、報(bào)紙、網(wǎng)絡(luò)等廣告模式。當(dāng)世界上的人、事、物都因?yàn)楫a(chǎn)生大量數(shù)據(jù)而構(gòu)建起關(guān)聯(lián)關(guān)系,讓人類獲得了無限的信息對(duì)稱,一切基于信息不對(duì)稱的物質(zhì)世界而建立的商業(yè)模式勢必獲得變革。未來主流的商業(yè)模式之一,將是以大數(shù)據(jù)為基礎(chǔ)的產(chǎn)業(yè)互聯(lián)網(wǎng)。
醫(yī)療行業(yè)也是一樣,醫(yī)學(xué)大數(shù)據(jù)廣泛涉及人類健康相關(guān)的各個(gè)領(lǐng)域,如臨床醫(yī)療、公共衛(wèi)生、醫(yī)藥研發(fā)、醫(yī)療市場、健康管理、氣候與環(huán)境、精神與心理學(xué)、人類遺傳學(xué)與組學(xué)、社會(huì)人口學(xué)等等。
一般地講,大數(shù)據(jù)具有“4V”特征:
1.數(shù)據(jù)容量-Volume大,常常在PB(1PB=250B)級(jí)以上;
2.數(shù)據(jù)種類-Variety多,常常具有不同的數(shù)據(jù)類型(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化)和數(shù)據(jù)來源;
3.產(chǎn)生和更新速度-Velocity快(如實(shí)時(shí)數(shù)據(jù)流),時(shí)效性要求高;
4.科學(xué)價(jià)值或商業(yè)價(jià)值-Value大,常常蘊(yùn)藏著新知識(shí)或具有重要預(yù)測價(jià)值。
人類已進(jìn)人大數(shù)據(jù)時(shí)代,國際數(shù)據(jù)公司的研究結(jié)果表明,近幾年全球產(chǎn)生的數(shù)據(jù)量高達(dá)數(shù)個(gè)ZB?;谶@樣一個(gè)大數(shù)據(jù)的概念,我們會(huì)在各行各業(yè),比如醫(yī)療行業(yè),將迎來深度的行業(yè)變革,甚至顛覆性的變革。且看下面一個(gè)有關(guān)醫(yī)療行業(yè)大數(shù)據(jù)應(yīng)用的例子。
“和你一樣的病人”:Lloyd 的大數(shù)據(jù)故事
我們看到了這樣一個(gè)故事。
如果一位醫(yī)生還在抱怨病人得了“搜索病”-指看病前習(xí)慣先上網(wǎng)查查自己可能得了什么病,那么這個(gè)醫(yī)生大概已經(jīng)落伍了?;诖髷?shù)據(jù)在醫(yī)療領(lǐng)域的深度應(yīng)用,美國斯坦福大學(xué)醫(yī)學(xué)院一群富有創(chuàng)新精神的醫(yī)學(xué)專家正和硅谷的醫(yī)療產(chǎn)業(yè)專家合作,推進(jìn)一個(gè)最新的科研項(xiàng)目—“和你一樣的病人”,通過這個(gè)智能系統(tǒng),病人有望自查疾病,這也減少了醫(yī)生因經(jīng)驗(yàn)累積有限而導(dǎo)致的誤診或漏診的案例。這個(gè)系統(tǒng)有望成為醫(yī)生的好幫手,也可能顛覆現(xiàn)有的醫(yī)療模式。
反思傳統(tǒng)“一對(duì)一”就醫(yī)療模式。那是在1998年,斯坦福大學(xué)醫(yī)學(xué)院院長Lloyd Minor和同事在全世界首次報(bào)道了一種罕見病—“上半規(guī)管裂損癥候群”。這種疾病的患者會(huì)出現(xiàn)眩暈、對(duì)聲音異常敏感等癥狀。這本是一次很普通的學(xué)術(shù)發(fā)現(xiàn),但令Lloyd Minor意外的是,當(dāng)他們發(fā)表了論文后,世界上許多國家的人開始上網(wǎng)搜索這個(gè)病的信息,并輸入自己的信息,一批多年來找不到病因、或在其他科室苦苦試驗(yàn)治療方案的病人終于確診。例如,英國就報(bào)道過一名女子罹患這種疾病,不僅能聽見自己的心跳聲、大腦攪動(dòng)聲,連吃顆蘋果對(duì)她來說都是不可能的任務(wù),因?yàn)樗p輕一咬,就是一陣震耳欲聾。通過互聯(lián)網(wǎng)找到“和你一樣的病人”,這個(gè)啟示讓Lloyd Minor和斯坦福醫(yī)學(xué)院的同仁們開始開發(fā)這款全新的系統(tǒng)。事實(shí)上,促成Lloyd Minor和伙伴們開發(fā)這個(gè)系統(tǒng)的機(jī)緣,正是對(duì)傳統(tǒng)就醫(yī)模式的反思。
在斯坦福大學(xué)醫(yī)學(xué)院,已有令人“腦洞大開”的科研進(jìn)展。醫(yī)生們開發(fā)的這個(gè)名為“和你一樣的病人”的系統(tǒng)里,積累了上百萬條藥物、治療方案、病例信息等數(shù)據(jù),登錄者鍵入身體狀況、年齡、不適部位等,系統(tǒng)就會(huì)給出一個(gè)完全個(gè)性化的診斷結(jié)果以及理想的治療方案。這種系統(tǒng)篩選出的治療方案,可能比醫(yī)生的方案效果更好,能讓更多病人獲得真正屬于他們的最優(yōu)治療。因?yàn)槲覀兌贾?,醫(yī)生的治療水平很大部分來自于醫(yī)學(xué)積累,也就是經(jīng)驗(yàn),但這種積累不論是30年還是50年,依然是有限的,它一定沒有擁有全體病人就醫(yī)數(shù)據(jù)的電腦系統(tǒng)見多識(shí)廣。
基于大數(shù)據(jù)應(yīng)用,未來的看病模式很可能不再是現(xiàn)在這樣與醫(yī)生“一對(duì)一”。在哈佛大學(xué)醫(yī)學(xué)院,已有醫(yī)生嘗試給乳腺癌患者這樣看?。和ㄟ^系統(tǒng)篩查全美乳腺癌患者病歷,并挑出和具體患者相同或相似的年齡、生活環(huán)境、突變基因等,最終挑選出一個(gè)生存期、生活質(zhì)量最高的治療方案提供給患者。這是目前醫(yī)生尋求“外腦”幫助的有效途徑??梢詴诚氲氖?,醫(yī)療大數(shù)據(jù)帶給人們的將不僅僅是更優(yōu)的診斷與治療計(jì)劃,而是更優(yōu)的生活方式。Lloyd Minor說,通過醫(yī)療大數(shù)據(jù)的挖掘和篩選,還能前移到發(fā)現(xiàn)何種生活方式可能是更有利的,從而給政府、醫(yī)保政策制定者、醫(yī)院以及大眾更好的生活方式指導(dǎo)。
Lloyd Minor表示,我們正處于科技和大數(shù)據(jù)急速推動(dòng)創(chuàng)新的時(shí)代,有機(jī)會(huì)利用現(xiàn)有優(yōu)勢提升社區(qū)甚至全球健康水準(zhǔn)。目前大數(shù)據(jù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用主要包括危重、罕見疾病診療決策輔助、腫瘤精準(zhǔn)醫(yī)療的開展、慢病的調(diào)研防治等。大數(shù)據(jù)技術(shù)幫助人們存儲(chǔ)管理好醫(yī)療大數(shù)據(jù),并從大體量、高復(fù)雜的數(shù)據(jù)中提取價(jià)值。Lloyd Minor介紹,該??蒲腥藛T從不同資源中獲取了大量數(shù)據(jù),包括電子醫(yī)療記錄,全基因組序列、保險(xiǎn)和醫(yī)藥記錄、可穿戴式傳感器和社會(huì)環(huán)境數(shù)據(jù)。通過分析這些數(shù)據(jù),醫(yī)生和研究人員可更好地預(yù)測個(gè)人患特定疾病的概率,有針對(duì)性地制定對(duì)早期檢查和預(yù)防的方案。這些分析材料也將為臨床醫(yī)生提供實(shí)時(shí)治療決策時(shí)所需的信息。
醫(yī)學(xué)大數(shù)據(jù)顛覆傳統(tǒng)醫(yī)療的幾個(gè)場景
場景之一:組學(xué)大數(shù)據(jù)精準(zhǔn)醫(yī)療
人類通過開展組學(xué)研究及不同組學(xué)間的關(guān)聯(lián)研究,從環(huán)境、生活方式和行為等暴露組學(xué),至個(gè)體細(xì)胞分子水平上的基因組學(xué)、表觀組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、代謝組學(xué)、宏基因組學(xué),再到個(gè)體健康和疾病狀態(tài)的表型組學(xué)等。利用大數(shù)據(jù)將各種組學(xué)進(jìn)行綜合及整合,既能為疾病發(fā)生、預(yù)防和治療提供全面、全新的認(rèn)識(shí),也有利于開展個(gè)體化醫(yī)學(xué),即通過系統(tǒng)整合生物醫(yī)學(xué)與臨床數(shù)據(jù),可以更準(zhǔn)確地預(yù)測個(gè)體患病風(fēng)險(xiǎn)和預(yù)后,有針對(duì)性地實(shí)施預(yù)防和治療。
場景之二:大數(shù)據(jù)虛擬藥物研發(fā)
快速識(shí)別生物標(biāo)志物和研發(fā)藥物。利用某種疾病患者人群的臨床數(shù)據(jù)和組學(xué)數(shù)據(jù),可以快速識(shí)別有關(guān)疾病發(fā)生、預(yù)后或治療效果的生物標(biāo)志物。在藥物研發(fā)方面,醫(yī)學(xué)大數(shù)據(jù)使得人們對(duì)病因和疾病發(fā)生機(jī)制的理解更加深入,從而有助于識(shí)別生物靶點(diǎn)和研發(fā)藥物。同時(shí),充分利用海量臨床數(shù)據(jù)和組學(xué)數(shù)據(jù)、已有藥物的研究數(shù)據(jù)和高通量藥物篩選,能加速藥物篩選過程。
場景之三:生物大數(shù)據(jù)流行病防治
快速篩檢未知病原和發(fā)現(xiàn)可疑致病微生物。通過采集未知病原樣本數(shù)據(jù),對(duì)病原進(jìn)行測序,并將未知病原與已知病原的基因序列進(jìn)行比對(duì),從而判斷其為已知病原或與其最接近的病原類型,據(jù)此推測其來源和傳播路線、開展藥物篩選和相應(yīng)的流行疾病防治。
場景之四:互聯(lián)網(wǎng)大數(shù)據(jù)公衛(wèi)監(jiān)測
利用互聯(lián)網(wǎng)大數(shù)據(jù)以及有關(guān)專業(yè)數(shù)據(jù)實(shí)時(shí)開展公共衛(wèi)生監(jiān)測。公共衛(wèi)生監(jiān)測包括傳染病監(jiān)測、慢性非傳染性疾病及相關(guān)危險(xiǎn)因素監(jiān)測、健康相關(guān)監(jiān)測,如出生缺陷監(jiān)測、食品安全風(fēng)險(xiǎn)監(jiān)測等。此外,還可以通過覆蓋全國的患者電子病歷數(shù)據(jù)庫進(jìn)行疫情監(jiān)測,通過監(jiān)測社交媒體或頻繁檢索的詞條來預(yù)測某些傳染病的流行。
場景之五:大數(shù)據(jù)健康管理
實(shí)時(shí)開展大數(shù)據(jù)健康管理,通過可穿戴設(shè)備對(duì)個(gè)體體征數(shù)據(jù),如心率、脈率、呼吸頻率、體溫、熱消耗量、血壓、血糖、血氧、體脂含量等數(shù)據(jù)的實(shí)時(shí)、連續(xù)監(jiān)測和流數(shù)據(jù)挖掘、分析,提供實(shí)時(shí)健康指導(dǎo)與建議,更科學(xué)地實(shí)施個(gè)性化健康管理。
大數(shù)據(jù)醫(yī)學(xué)研究
上面列舉了價(jià)格醫(yī)學(xué)大數(shù)據(jù)變革醫(yī)療行業(yè)的幾個(gè)場景,但這些遠(yuǎn)不是醫(yī)學(xué)大數(shù)據(jù)應(yīng)用的全部。大數(shù)據(jù)還在醫(yī)學(xué)研究領(lǐng)域發(fā)揮變革性的作用,本人在先前的博客中已有相關(guān)討論,這里再舉兩個(gè)例子。
1. 大數(shù)據(jù)疾病譜研究
了解人群疾病譜的改變,這有助于制定新的疾病防治策略。全球疾病負(fù)擔(dān)研究是一個(gè)應(yīng)用大數(shù)據(jù)的實(shí)例,該研究應(yīng)用的數(shù)據(jù)范圍廣、數(shù)據(jù)量巨大,近4700臺(tái)并行臺(tái)式計(jì)算機(jī)完成了數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)倉庫建立和數(shù)據(jù)挖掘分析的自動(dòng)化和規(guī)范化計(jì)算,應(yīng)用大數(shù)據(jù)研究人群疾病譜。
2. 大數(shù)據(jù)人群隊(duì)列研究
以大數(shù)據(jù)為導(dǎo)向的人群隊(duì)列研究逐漸成為醫(yī)學(xué)研究的熱點(diǎn)。超大規(guī)模隊(duì)列研究具有大樣本-如數(shù)十萬人群,前瞻性-如數(shù)十年長期隨訪,多學(xué)科-如基礎(chǔ)、臨床、預(yù)防、信息等多學(xué)科合作,多病種-如對(duì)多種疾病進(jìn)行研究,多因素-如探討多種危險(xiǎn)因素,整合性-如監(jiān)測系統(tǒng)、信息系統(tǒng)、醫(yī)保系統(tǒng)的整合,共享性-如生物標(biāo)本和數(shù)據(jù)資源的共享,等特點(diǎn),經(jīng)過長期隨訪能夠產(chǎn)出大量人群數(shù)據(jù),基于大數(shù)據(jù)的人群隊(duì)列研究更具有科學(xué)性、可靠性和權(quán)威性。
醫(yī)學(xué)大數(shù)據(jù)顛覆傳統(tǒng)醫(yī)療,不是命題問題,只是時(shí)間問題。正如本人對(duì)流行的“顛覆”一詞的觀點(diǎn),“顛覆”是可能的,但不是瞬間的,而是逐漸的。“顛覆”不是否定,“顛覆”是變革,“顛覆”是發(fā)展。醫(yī)學(xué)大數(shù)據(jù)“顛覆”傳統(tǒng)醫(yī)療也是這樣,醫(yī)學(xué)大數(shù)據(jù)是變革傳統(tǒng)醫(yī)療,醫(yī)學(xué)大數(shù)據(jù)是發(fā)展傳統(tǒng)醫(yī)療。