基因網絡繪制需要大量轉錄組數據用于建立基因之間的聯系,這也阻礙了一些數據有限場景(如罕見?。┑妊芯俊W罱?,利用遷移學習的機器學習技術在自然語言和計算機視覺等領域帶來了變革性進展,其通過在大規模通用數據集上進行大模型預訓練,而后遷移到數據量有限的特定任務進行微調。美國博德研究所等研究團隊提出了一個深度學習模型Geneformer可實現特定生物學任務與背景中的預測。該研究成果于近日發表在《Nature》雜志上,題為:Transfer learning enables predictions in network biology。
研究人員開發的深度學習模型Geneformer,在大約3000萬個單細胞轉錄組的大規模數據集上進行了預訓練,以便在網絡生物學有限數據的情況下進行特異性預測。在預訓練期間,Geneformer獲得了對網絡動態的基本理解,以完全自我監督的方式在模型的注意力權重中編碼網絡層次。研究人員利用Geneformer基于下游有限數據進行了預測任務,包括“疾病候選靶點預測”“解釋拷貝數變異”“關鍵基因網絡調控因子”“基因網絡層次編碼”“染色質動力學預測”等,并通過實驗支持了其預測的結果。
綜上,Geneformer代表了一種預訓練的深度學習模型,可以對其進行微調,以實現廣泛的下游應用,加速發現網絡調節關鍵環節和候選治療目標。
注:此研究成果摘自《Nature》雜志,文章內容不代表本網站觀點和立場,僅供參考。
知前沿,問智研。智研咨詢是中國一流產業咨詢機構,十數年持續深耕產業研究領域,提供深度產業研究報告、商業計劃書、可行性研究報告及定制服務等一站式產業咨詢服務。專業的角度、品質化的服務、敏銳的市場洞察力,專注于提供完善的產業解決方案,為您的投資決策賦能。



