兩會 | 全國人大代表、廣州國家實驗室研究員蔣太交:布局建設(shè)國家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點
【字體:大、中、小】
【顏色:】
瀏覽量:
生命健康科學研究已進入數(shù)據(jù)密集型大模型時代,而生物數(shù)據(jù)庫主要由美國國家生物技術(shù)信息中心(NCBI)和歐洲生物信息學研究所(EBI)兩個中心領(lǐng)導,中國在這個方面缺乏國際影響力。EBI負責人Rolf Apweiler指出兩個問題:中國缺少一個明確的代表性科學中心可以代表中國接軌國際;中國科學家使用了歐洲生物信息學研究所超過三分之一的資源,但在數(shù)據(jù)和數(shù)據(jù)庫維護上缺乏貢獻。黨中央高度重視生物大數(shù)據(jù)資源發(fā)展,提出了國家生物數(shù)據(jù)中心“1+N”體系建設(shè)思路。國家發(fā)改委先期聚焦組學數(shù)據(jù)立項了“1”國家生物信息中心,“N”僅聚焦文獻數(shù)據(jù)立項了國家生物醫(yī)學文獻信息中心,尚缺乏以疾病為核心的系統(tǒng)全面的數(shù)據(jù)資源。
粵港澳大灣區(qū)建設(shè),是習近平總書記親自謀劃、親自部署、親自推動的重大國家戰(zhàn)略,也是我國經(jīng)濟發(fā)展重要區(qū)域與對外經(jīng)貿(mào)交流的南大門,GDP超全國總量12%,其中,大健康產(chǎn)業(yè)是粵港澳大灣區(qū)核心支柱產(chǎn)業(yè)之一。通過大數(shù)據(jù)的匯聚和關(guān)聯(lián)分析能夠更快、更直接地發(fā)現(xiàn)新知識、新機制、新規(guī)律,驅(qū)動新技術(shù)、新成果的快速誕生與產(chǎn)業(yè)應用。據(jù)文獻報道,以“臨床+多組學”為主的生物醫(yī)學數(shù)據(jù)基礎(chǔ)設(shè)施支持了2/3以上FDA獲批的原研藥研發(fā)工作,每年獲得巨額產(chǎn)業(yè)回報。因此,建設(shè)支撐生命健康科學研究與生物醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的生物醫(yī)學數(shù)據(jù)節(jié)點,既是粵港澳大灣區(qū)經(jīng)濟持續(xù)繁榮的必然要求,也是落實粵港澳大灣區(qū)國家戰(zhàn)略的重要支撐。
近百年來,對人類生命健康產(chǎn)生深遠影響的重大突發(fā)公共衛(wèi)生事件無一不是由呼吸系統(tǒng)傳染病導致的?;浉郯拇鬄硡^(qū)地處亞熱帶,氣候溫和適合病毒傳播,同時還是我國對外經(jīng)貿(mào)交流的南大門,入境人數(shù)占全國90%以上,常住人口超8000萬人,是傳染病“外防輸入、內(nèi)防傳播”的重點區(qū)域。在粵港澳大灣區(qū)建立支撐呼吸系統(tǒng)傳染病監(jiān)測預警與快速主動應對的生物醫(yī)學數(shù)據(jù)節(jié)點,是及時了解疫情動態(tài)、制定科學有效防控策略的必要手段。通過收集并加以整理分析區(qū)域內(nèi)生物醫(yī)學數(shù)據(jù)與境內(nèi)外呼吸道傳染病的病例數(shù)據(jù)、病毒基因序列、人體多組學數(shù)據(jù)、流行病學信息等重要數(shù)據(jù),可及時了解全球范圍內(nèi)呼吸道傳染病疫情的頻發(fā)和傳播速度、疫情動態(tài)與防控策略,發(fā)現(xiàn)疫情的時空分布規(guī)律、預測疫情的爆發(fā)趨勢,為公共衛(wèi)生防控決策提供決策支持和科學依據(jù),最大程度地保護我國人民群眾的健康安全。
因此,廣州國家實驗室作為國家戰(zhàn)略科技力量,以解決新發(fā)突發(fā)病原重大疫情預測預警、呼吸系統(tǒng)疾病及其防控領(lǐng)域關(guān)鍵核心為己任,有意愿、有能力承建與長期運行國家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點,助力我國生命健康科學研究與生物醫(yī)藥產(chǎn)業(yè)高質(zhì)量發(fā)展。
在廣東省廣州市的支持下,廣州國家實驗室開展了前期工作,在軟硬件、數(shù)據(jù)資源和管理模式上已形成完善的小試到中試的技術(shù)能力,獲得了一系列初步成果,并具備清晰可落地的技術(shù)和市場轉(zhuǎn)化服務路徑。比如自主研發(fā)了支撐大規(guī)模算力資源管理、智能工具開發(fā)與集成、大模型驅(qū)動到跨平臺資源共享的市場化工業(yè)軟件系統(tǒng)—“生物醫(yī)學大數(shù)據(jù)操作系統(tǒng)(Bio-OS)”;接入了50萬余全球人類基因組數(shù)據(jù)集、10000余算子鏡像;匯聚了15PB數(shù)據(jù);建成了27億參數(shù)垂直領(lǐng)域大模型;啟動了百萬呼吸健康人群隊列研究,以及生物醫(yī)學科研與數(shù)據(jù)治理大模型建設(shè);與全國近1000家醫(yī)院達成戰(zhàn)略合作協(xié)議,與多所港澳科研機構(gòu)建立戰(zhàn)略合作關(guān)系;建設(shè)了5年可產(chǎn)出約400PB高質(zhì)量多組學數(shù)據(jù)與基礎(chǔ)實驗數(shù)據(jù)的全鏈條科研平臺。
建議充分發(fā)揮國家實驗室“總平臺總鏈長”作用,以及廣州國家實驗室在生物醫(yī)藥領(lǐng)域深厚積淀,建設(shè)面向呼吸系統(tǒng)疾病領(lǐng)域的“國家生物數(shù)據(jù)中心體系粵港澳大灣區(qū)節(jié)點”。