摘要:當前,“ChatGPT”“文心一言”“盤古Chat”等大模型的爆火推動了新一輪人工智能技術發展熱潮,AI大模型相關研究、產品不斷涌現,中國大模型產業規模快速增長。據統計,中國AI大模型行業市場規模從2020年的15億元增長至2022年的70億元,年均復合增長率達116.02%,2023年市場規模為147億元。預計2024年中國AI大模型行業市場規模將達216億元,行業發展前景廣闊。
一、定義及分類
大模型是大規模語言模型(Large Language Model)的簡稱,是指模型具有龐大的參數規模和復雜程度的機器學習模型。這些模型通常在訓練過程中需要大量的數據和計算能力,并且具有數百萬到數十億個參數。大模型的設計目的是為了提高模型的表示能力和性能,在處理復雜任務時能夠更好地捕捉數據中的模式和規律。根據其應用場景和功能,大模型可分為自然語言處理大模型、計算機視覺大模型、語音識別大模型、推薦系統大模型、強化學習大模型、生成對抗網絡大模型、對話系統大模型等。
二、行業政策
1、主管部門和監管體制
大模型行業主管部門主要是指工業和信息化部,其主要負責擬訂實施行業規劃、產業政策和標準;監測工業行業日常運行;推動重大技術裝備發展和自主創新;管理通信業;指導推進信息化建設;協調維護國家信息安全等。
中國人工智能產業發展聯盟是行業的自律性組織,其宗旨是將認真貫徹落實黨中央、國務院有關決策部署,以國家產業政策為導向,以市場為驅動,以企業為主體,搭建產學研用合作平臺,促進聯盟成員的研發、設計、生產、集成、服務等水平,構建我國人工智能產業生態,提升我國人工智能產業的競爭力,強化人工智能與經濟社會各領域深度融合,促進技術進步、提高生產效率,推動傳統行業數字化轉型,支持新技術、新產業、新業態、新模式加快發展。
2、行業相關政策
近年來,大模型已逐漸得到國家政府的高度重視,出臺了一系列政策和措施來推動行業發展。如2023年7月發布的《人工智能氣象應用工作方案(2023—2030年)》中,提出啟動氣象預報大模型等新興技術研發,開展人工智能新興技術與監測預警、預報預測、數值預報和專業服務“四大領域”融合。2023年11月發布的《人形機器人創新發展指導意見》中,提出建設大模型訓練數據庫,創新數據自動化標注、清洗、使用等方法,擴充高質量的多模態數據。科學布局人形機器人算力,加速大模型訓練迭代和產品應用。隨著這些政策的順利實施,我國大模型產業將得到快速發展。
三、發展歷程
隨著人工智能的快速發展,大模型成為當前研究的熱點之一。國內在大模型的發展上也取得了顯著的進展。從發展歷程來看,我國大模型主要分為三個階段:起步階段、應用拓展階段、產業化階段。2001年,中國科學院計算技術研究所成立了機器學習與數據挖掘實驗室,開始了對大模型的研究工作。2011年,百度推出基于大數據和大模型的搜索算法“海量深度學習技術”,取得了重大突破。此后,國內的互聯網公司紛紛加大在大模型領域的研發投入,推動了大模型的應用拓展。2016年阿里巴巴成立“達摩院”,并在大模型研究方面取得了一系列的突破。同年,騰訊成立了“騰訊研究院”,推動了大模型在智能推薦、自然語言處理等領域的應用。2019年國內的大模型研究取得了重大突破,其中最為重要的是在自然語言處理領域。2020年國內的大模型開始向其他領域拓展,如計算機視覺、語言識別等。
四、行業壁壘
1、技術壁壘
技術壁壘是大模型行業面臨的主要挑戰之一。大模型技術的研發需要大量的專業知識和技術積累,包括深度學習、自然語言處理、計算機視覺等多個領域。這使得一些技術實力較弱的企業難以進入該領域或難以在競爭中取得優勢。同時,大模型技術的更新換代速度非常快,企業需要不斷投入研發資源進行技術創新,否則很容易被市場淘汰。
2、資金壁壘
大模型的研發需要投入大量的資金用于算法研究、模型訓練、數據收集和處理等方面。如在模型訓練方面,行業內企業通常需要高性能的計算機和大量的計算資源,這意味著企業需要投入大量的資金購買和維護這些設備。對于一些規模較小的企業來說,這是一筆不小的開支,難以承受。因此,大模型行業的資金壁壘較高,新進入者需要充分考慮自身的資金實力和融資能力。
3、人才壁壘
大模型行業是一個多學科交叉的領域,涵蓋了深度學習、自然語言處理、計算機視覺等多個專業領域。這意味著從業人員不僅需要具備扎實的專業知識,還需要具備跨學科的視野和綜合能力。然而,目前這種復合型的人才需求使得該領域的人才供給相對緊張,導致企業難以招聘到合適的人才。對于新進入者來說,大模型行業具有較高的人才壁壘。
五、產業鏈
1、行業產業鏈分析
從大模型行業產業鏈來看,上游主要包括硬件和軟件,硬件又包括芯片、服務器、通信網絡等;軟件又包括云計算、數據庫、中間件等。中游是指大模型行業;下游是指大模型的應用領域,包括游戲、辦公、傳媒影視、醫療、金融、電商、工業等,這些領域的多樣化需求將推動大模型不斷進行技術創新和優化,提升模型的準確性和效率。



















2、行業領先企業分析
(1)深圳市騰訊計算機系統有限公司
深圳市騰訊計算機系統有限公司于1998年成立,并于2004年在港交所成功上市。經過20年的發展,騰訊由一家聊天軟件開發商逐步成長為全球最大的互聯網企業之一。通過廣告、游戲、社交、支付等多個業務板塊相互交織,形成了一個龐大的產品和服務生態系統,公司規模及企業影響力持續擴大。近年來,隨著新一代信息技術的崛起,騰訊持續加大在人工智能、物聯網、云計算投資布局及技術研發,已取得較大成果。公司擁有超10億用戶的連接能力,旗下多個版塊業務發展至今已積累了大量的數據和技術經驗,使其在發展大模型方面具有天然優勢。騰訊正圍繞大模型產業鏈核心節點展開技術布局,夯實算法、算力和數據“底座”,并于2023年9月正式發布混元大模型,參數規模超千億,已在多個內部產品測試。從企業經營業績來看,2023年前三季度公司實現收入4538.2億元,同比增長11%;歸母凈利潤達到881.91億元,同比增長7.58%。
(2)百度在線網絡技術(北京)有限公司
百度在線網絡技術(北京)有限公司成立于2000年,是國內領先的AI公司,同時也是全球為數不多的集AI芯片、軟件構架和應用程序等全棧AI技術研發及生產為一體的公司之一。目前,公司的核心業務包括搜索服務、交易服務、移動生態、智能云和智能駕駛等。2023年,公司各項業務均呈現穩中向好的發展態勢,其中,AI成為百度的增長新動力,這主要得益于公司在迭代文心大模型與文心一言、重構產品和服務、以及商業化方面取得重大進展。公司全面推進旗下產品及服務的AI原生化重構,推出百度新搜索、百度新文庫、文心一言App等AI原生應用,以及輕舸、品牌智能體等AI營銷工具。從企業經營業績來看,2023年公司實現營業收入1345.98億元,同比上漲8.83%,歸母凈利潤達到203.15億元,同比上漲191.55%。
六、行業現狀
當前,“ChatGPT”“文心一言”“盤古Chat”等大模型的爆火推動了新一輪人工智能技術發展熱潮,AI大模型相關研究、產品不斷涌現,中國大模型產業規模快速增長。據統計,中國AI大模型行業市場規模從2020年的15億元增長至2022年的70億元,年均復合增長率達116.02%,2023年市場規模為147億元。預計2024年中國AI大模型行業市場規模將達216億元,行業發展前景廣闊。
七、發展因素
1、機遇
(1)國家政策的大力支持
國家和地方政府對于大模型的發展給予高度重視,制定并出臺了一系列法律法規和政策支持。如2023年12月,國家數據局等17部門發布《“數據要素×”三年行動計劃(2024—2026年)》,其中提出以科學數據支持大模型開發,深入挖掘各類科學數據和科技文獻,通過細粒度知識抽取和多來源知識融合,構建科學知識資源底座,建設高質量語料庫和基礎科學數據集,支持開展人工智能大模型開發和訓練。這將有利于推動大模型的開發和應用,為人工智能技術的發展注入新的活力。
(2)下游應用場景廣闊
越來越多的行業開始意識到大模型在提高效率、降低成本、創新業務模式等方面的潛力,紛紛加大投入,推動大模型在各自領域的應用。在醫療領域,大模型可以幫助醫生更快速地診斷疾病,通過分析大量的醫療數據,提高診斷的準確性和效率。在金融領域,大模型可以應用于風險評估和欺詐檢測,快速識別潛在風險,提高金融機構的運營效率。在制造業中,大模型可以優化生產流程,提高生產效率,降低生產成本。大模型的應用場景正在不斷拓展。
(3)技術水平不斷提升
隨著技術水平的不斷提升,大模型的能力越來越強大,能夠處理更為復雜、精細的任務。如在算法方面,深度學習算法的不斷成熟和演進使得大模型的性能和精度得到了顯著提升。研究者們通過持續探索和優化算法,使得大模型在各個領域的應用效果得到了進一步提升。這包括改進模型的架構、優化訓練過程、提升模型的泛化能力等,從而使得大模型能夠更好地適應各種復雜場景和任務。
2、挑戰
(1)泛化能力和魯棒性不足
大模型雖然具有強大的學習能力和特征提取能力,但往往存在過擬合和泛化能力不足的問題。這通常是因為模型過于依賴訓練數據的特定特征,而未能學習到更一般化的規律。同時,大模型也容易受到一些攻擊和干擾,其性能可能會受到嚴重影響。例如,在醫學圖像診斷中,模型可能會因為圖像的微小變化或噪聲而產生錯誤的診斷結果。
(2)數據質量和多樣性問題
大模型需要大量的數據進行訓練,但數據的質量和多樣性往往存在很多問題。這不僅會影響模型的訓練效果,也會增加模型的風險和不可預測性。如數據不一致問題的出現有可能導致模型在訓練過程中學習到錯誤的模式,從而影響其在真實場景中的表現;數據泄露問題的出現可能會對個人隱私和企業安全造成威脅;數據偏斜問題的出現可能導致模型會過于依賴這些偏斜的特征,導致在真實場景中的性能下降。
(3)技術更新迭代風險
技術發展的快速性意味著新的模型架構、算法和訓練方法不斷涌現。大模型作為技術的前沿領域,其相關的技術更新換代速度尤為迅速。新的技術可能在性能、效率或適用性方面相較于舊技術有顯著的提升。如果大模型不能及時跟進最新的技術更新,其性能可能會逐漸落后,甚至被新的模型完全取代。此外,隨著技術的不斷進步,舊版本的模型可能逐漸失去與新技術的兼容性,導致維護和升級變得困難。
八、競爭格局
隨著人工智能領域的飛速發展,各大科技公司紛紛布局大模型市場,以推動科技創新和產業變革。在這波瀾壯闊的時代背景下,華為、阿里巴巴、騰訊、百度等中國科技巨頭競相推出了自家的大模型,各自擁有獨特的特點和重要的合作伙伴。可見,我國在大模型市場的競爭格局日益激烈,各家公司都在尋找創新的應用場景,并與各個行業的龍頭企業建立合作關系。
九、發展趨勢
大模型產品百花齊放的當下,模型實現了計算機能力從“搜索”到“認知與學習”,再以進一步發展為“行動與解決方案”層面。除常見的智能客服、智能推薦、情感分析等應用領域以外,大模型逐步于教育、醫療、金融等垂直領域得到了廣泛應用,行業應用場景日趨多樣化。同時,隨著大模型相關技術不斷創新,將推動大模型實現模型規模縮小、模型性能提升,進一步促進大模型發展。此外,伴隨計算機視覺、語音識別等技術的不斷發展,跨模態大模型也逐漸成為研究熱點,未來相關企業將不斷加強投入推動跨模態大模型的發展。
智研咨詢倡導尊重與保護知識產權,對有明確來源的內容注明出處。如發現本站文章存在版權、稿酬或其它問題,煩請聯系我們,我們將及時與您溝通處理。聯系方式:gaojian@chyxx.com、010-60343812。
![趨勢研判!2024年中國大模型行業產業鏈、市場規模、重點企業及發展趨勢分析:大模型技術不斷進步,市場規模持續增長[圖]](http://img.chyxx.com/images/2022/0330/d1363a7ee3953fc25ed09e0b79158acce9dc7c22.png?x-oss-process=style/w320)
趨勢研判!2024年中國大模型行業產業鏈、市場規模、重點企業及發展趨勢分析:大模型技術不斷進步,市場規模持續增長[圖]
大模型是大規模語言模型(Large Language Model)的簡稱,是指模型具有龐大的參數規模和復雜程度的機器學習模型。這些模型通常在訓練過程中需要大量的數據和計算能力,并且具有數百萬到數十億個參數。大模型的設計目的是為了提高模型的表示能力和性能,在處理復雜任務時能夠更好地捕捉數據中的模式和規律。根據其應用場景和功能,大模型可分為自然語言處理大模型、計算機視覺大模型、語音識別大模型、推薦系統大模型、強化學習大模型、生成對抗網絡大模型、對話系統大模型等。