美國紐約大學科研人員利用深度學習架構和神經外科監測數據,揭示了人類語音生成過程中前饋和反饋機制的交互作用。該研究成果發表在《美國科學院院報》(PNAS)上。
人類語音生成過程是一個復雜的神經生物學現象,涉及運動命令的前饋控制以及自身產生語音的反饋處理,并需要大腦中多個神經網絡協同參與。科研團隊通過結合深度學習架構和人類神經外科監測數據,采用了一種基于規則的可微分語音合成器,以解碼大腦皮層信號中的語音參數。通過實現區分因果(當前和過去的神經信號)、反因果(當前和未來的神經信號)或兩者(非因果)時間卷積組合的神經網絡架構,科研人員可深入分析前饋和反饋機制在語音生成中的貢獻和交互作用。
該研究不僅揭示了人類語音生成過程的深層神經機制,還啟發了一種新型的語音假肢技術,在神經工程和語音重建領域具有突破性意義。
本文摘自國外相關研究報道,文章內容不代表本網站觀點和立場,僅供參考。
知前沿,問智研。智研咨詢是中國一流產業咨詢機構,十數年持續深耕產業研究領域,提供深度產業研究報告、商業計劃書、可行性研究報告及定制服務等一站式產業咨詢服務。專業的角度、品質化的服務、敏銳的市場洞察力,專注于提供完善的產業解決方案,為您的投資決策賦能。



