行業(yè)主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 騰訊 ( 00700.HK, TCEHY ) ;科大訊飛 ( 002230.SZ ) ;萬(wàn)興科技 ( 300624.SZ ) ;三六零 ( 601360.SH ) ;昆侖萬(wàn)維 ( 300418.SZ ) ; 云從科技 ( 688327.SH ) ;拓爾思 ( 300229.SZ ) 等
本文核心數(shù)據(jù):備案數(shù)量 ; 收費(fèi)模式 ; 市場(chǎng)規(guī)模 ; 區(qū)域占比等
產(chǎn)業(yè)概況
1、定義及特征
多模態(tài) ( Multimodality ) 是指集成和處理兩種或兩種以上不同類型的信息或數(shù)據(jù)的方法和技術(shù)。在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域,多模態(tài)涉及的數(shù)據(jù)類型通常包括但不限于文本、圖像、視頻、音頻和傳感器數(shù)據(jù)。多模態(tài)系統(tǒng)的目的是利用來(lái)自多種模態(tài)的信息來(lái)提高任務(wù)的性能,提供更豐富的用戶體驗(yàn),或者獲得更全面的數(shù)據(jù)分析結(jié)果。多模態(tài)大型語(yǔ)言模型 ( Multimodal Large Language Models,簡(jiǎn)稱 MLLMs ) 是一類結(jié)合了大型語(yǔ)言模型 ( Large Language Models,簡(jiǎn)稱 LLMs ) 的自然語(yǔ)言處理能力與對(duì)其他模態(tài) ( 如視覺(jué)、音頻等 ) 數(shù)據(jù)的理解與生成能力的模型。這些模型通過(guò)整合文本、圖像、聲音等多種類型的輸入和輸出,提供更加豐富和自然的交互體驗(yàn)。
2、產(chǎn)業(yè)鏈剖析:產(chǎn)業(yè)鏈?zhǔn)驱嫶蠖鴱?fù)雜的系統(tǒng)
多模態(tài)大模型產(chǎn)業(yè)鏈?zhǔn)且粋€(gè)龐大而復(fù)雜的系統(tǒng),涵蓋了從硬件設(shè)施到軟件開(kāi)發(fā)的各個(gè)環(huán)節(jié),主要包括基礎(chǔ)層、模型層和應(yīng)用層。其中,基礎(chǔ)層主要包括硬件和基礎(chǔ)軟件,模型層主要是多模態(tài)大模型的種類,包括 CLIP、BLIP、BLIP-2、dreamLLM、LLaMA、LLaVA、flamingo、mini-GPT4 等,應(yīng)用層則是指大模型結(jié)合行業(yè)的進(jìn)一步升級(jí)應(yīng)用形成的行業(yè)大模型,主要包括生產(chǎn)制造領(lǐng)域、生活?yuàn)蕵?lè)領(lǐng)域和公共服務(wù)領(lǐng)域等。
中國(guó)大模型產(chǎn)業(yè)鏈上游基礎(chǔ)層硬件環(huán)節(jié)參與者有英特爾、英偉達(dá)等,基礎(chǔ)軟件環(huán)節(jié)參與者有華為、騰訊、紫光同創(chuàng) ; 中游模型層參與者有 OpenAI、Meta、Google、阿里、華為、百度、360、科大訊飛等 ; 下游應(yīng)用層參與企業(yè)有用友網(wǎng)絡(luò)、京東、阿里巴巴、金山辦公和科大訊飛等。
行業(yè)發(fā)展歷程:多模態(tài)大模型進(jìn)入商業(yè)化階段
中國(guó)的多模態(tài)大模型行業(yè)在國(guó)際研究的基礎(chǔ)上迅速起步,依托政府支持、企業(yè)投入和學(xué)術(shù)力量,逐步形成自主創(chuàng)新能力,推動(dòng)多模態(tài)大模型從基礎(chǔ)研究到產(chǎn)業(yè)應(yīng)用的全面發(fā)展。未來(lái),中國(guó)在這一領(lǐng)域有望進(jìn)一步引領(lǐng)全球技術(shù)發(fā)展,實(shí)現(xiàn)從 " 追趕 " 到 " 引領(lǐng) " 的跨越。
行業(yè)政策背景:政策鼓勵(lì)多模態(tài)大模型提升自主研發(fā)能力
多模態(tài)大模型政策上,從加大資金支持、加大大型多模態(tài)大模型等向企業(yè)開(kāi)放力度、簡(jiǎn)化預(yù)算編制、簡(jiǎn)化緊急多模態(tài)大模型調(diào)用流程、建立多模態(tài)大模型共享資源數(shù)據(jù)庫(kù)等方面進(jìn)行了政策上的支持。這些政策有利于提高科技成果區(qū)域轉(zhuǎn)化效率,提升多模態(tài)大模型的自主研發(fā)能力。國(guó)家層面多模態(tài)大模型行業(yè)政策匯總?cè)缦拢?/p>
行業(yè)發(fā)展現(xiàn)狀
1、中國(guó)大模型監(jiān)管備案要求
2022 年 12 月和 2023 年 7 月,國(guó)家互聯(lián)網(wǎng)信息辦公室先后發(fā)布并實(shí)施了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》和《生成式人工智能服務(wù)管理暫行辦法》,兩項(xiàng)法規(guī)分別針對(duì)信息服務(wù)深度合成和生成式人工智能服務(wù)提出了監(jiān)管規(guī)范,要求相關(guān)國(guó)內(nèi)企業(yè)在國(guó)內(nèi)實(shí)施相應(yīng)服務(wù)時(shí)需要進(jìn)行備案。
從二者概念的法律界定上看,深度合成技術(shù)是基于算法,而生成式人工智能技術(shù)則是更加強(qiáng)調(diào)模型。每個(gè)模型里都包含算法,算法是設(shè)計(jì)出來(lái)的,自由度低,可解釋性強(qiáng) ; 模型更加復(fù)雜,是訓(xùn)練出來(lái)的結(jié)果。算法是指針對(duì)特定問(wèn)題的一種方法,通常由程序代碼實(shí)現(xiàn),比如手寫(xiě)識(shí)別算法,排序算法等 ; 模型則是多個(gè)算法根據(jù)一定架構(gòu)組成的集合,其是指數(shù)據(jù)通過(guò)算法進(jìn)行訓(xùn)練后得到的一個(gè)可以解決特定問(wèn)題的模塊,例如手寫(xiě)識(shí)別模型,當(dāng)向模型輸入一張手寫(xiě)圖片后,其就可以輸出圖片中的文字。
上述規(guī)定對(duì)相關(guān)技術(shù)的概念界定較為模糊,一定程度上擴(kuò)大了二者原有的范圍,尤其是深度合成技術(shù)。故目前主流觀點(diǎn)認(rèn)為,在現(xiàn)有法律體系下,生成式人工智能技術(shù)乃深度合成技術(shù)的子集,可以通過(guò)一定的解釋來(lái)使生成式人工智能技術(shù) ( 預(yù)訓(xùn)練大模型技術(shù) ) 同時(shí)受《深度合成管理規(guī)定》的規(guī)制。因此可知國(guó)內(nèi)大模型企業(yè)必須獲得《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》或《生成式人工智能服務(wù)管理暫行辦法》的備案。
2、中國(guó)大模型已有 327 個(gè)備案
自 2022 年末起,ChatGPT 以其突破性技術(shù)在全球舞臺(tái)掀起了一場(chǎng)人工智能的革命。隨之而來(lái)的,是無(wú)數(shù)大型預(yù)訓(xùn)練模型 ( Large Pre-trained Models, LPTMs ) 的涌現(xiàn),它們?nèi)缤喝绽锏闹窆S般迅速生長(zhǎng),遍布學(xué)術(shù)界與工業(yè)界。這些模型的誕生標(biāo)志著生成式人工智能技術(shù)的蓬勃發(fā)展,開(kāi)啟了一場(chǎng)被稱為 " 大模型之爭(zhēng) " 的新時(shí)代序幕。
截至 2024 年 4 月底,國(guó)內(nèi)共推出了約 305 個(gè)大模型,其中 10 億參數(shù)規(guī)模以上的大模型數(shù)量達(dá)到了 254 家。然而,截至 2024 年 8 月,在超過(guò) 300 個(gè)大模型中,只有約 180 個(gè)大模型完成了生成式人工智能服務(wù)備案,占比約為 59%。根據(jù)各地最新通告,截至 2025 年 4 月,我國(guó)已有 327 個(gè)生成式 AI 大模型通過(guò)備案、227 個(gè)生成式 AI 大模型完成登記。
3、多模態(tài)大模型商業(yè)模式演進(jìn)
早期大模型的商業(yè)模式主要為 SaaS 模式和 PaaS 模式,但隨著大模型行業(yè)的快速發(fā)展以及再各行各業(yè)的快速拓展應(yīng)用,以大模型為核心的 MaaS 模式 ( 模型即服務(wù) ) 出現(xiàn),MaaS 模式允許大模型服務(wù)提供商將大模型的特定功能或整個(gè)模型封裝為 API ( 應(yīng)用程序接口 ) ,并將其作為一種服務(wù),提供給其他開(kāi)發(fā)者或業(yè)務(wù)合作伙伴使用,是目前大模型行業(yè)一種主流的商業(yè)模式。
4、多模態(tài)大模型產(chǎn)品收費(fèi)模式
根據(jù)對(duì)已披露的部分國(guó)內(nèi)外主要多模態(tài)大模型產(chǎn)品的收費(fèi)模式的對(duì)比,目前按照 token 計(jì)價(jià)和訂閱模式是行業(yè)最主流的收費(fèi)模式,而從收費(fèi)價(jià)格來(lái)看,由于整體多模態(tài)大模型行業(yè)仍處于探索階段,而且各家多模態(tài)大模型產(chǎn)品的服務(wù)質(zhì)量的差異,因此不同多模態(tài)大模型產(chǎn)品的收費(fèi)價(jià)格也有較大的差異。
5、多模態(tài)大模型市場(chǎng)規(guī)模穩(wěn)步增長(zhǎng)
根據(jù)工業(yè)和信息化部賽迪研究院公布的數(shù)據(jù)顯示,2023 年,我國(guó)人工智能核心產(chǎn)業(yè)規(guī)模已達(dá) 5000 億元,大模型市場(chǎng)規(guī)模達(dá)到 132.3 億元,同比增長(zhǎng)率為 110% 左右。初步測(cè)算,2024 年中國(guó)大模型行業(yè)市場(chǎng)規(guī)模將達(dá)到 205 億元。其中,多模態(tài)占據(jù)大模型比重為 22%,根據(jù)大模型市場(chǎng)規(guī)模和多模態(tài)的占比進(jìn)行初步測(cè)算,2024 年,中國(guó)多模態(tài)大模型市場(chǎng)規(guī)模為 45.1 億元。
注:中國(guó)多模態(tài)大模型市場(chǎng)規(guī)模 = 中國(guó)大模型行業(yè)市場(chǎng)規(guī)模 ( 205 億元 ) * 多模態(tài)技術(shù)占比情況 ( 22% )
行業(yè)競(jìng)爭(zhēng)格局
1、區(qū)域競(jìng)爭(zhēng):京滬粵浙蘇占比近八成
全國(guó) 327 個(gè)大模型已通過(guò)備案,京滬粵浙蘇占比近八成。根據(jù)各地最新通告,截至 2025 年 3 月,我國(guó)已有 327 個(gè)生成式 AI 大模型通過(guò)備案。從地域布局來(lái)看,全國(guó)共有 23 個(gè)省份已經(jīng)在備案上有所布局,其中北京、上海和廣東分別通過(guò) 105、66、39 個(gè)大模型備案。和登記相比,生成式人工智能大模型的備案流程更為嚴(yán)格。京滬粵浙蘇五省份占榜 TOP5,比重接近全國(guó)總量的 80%。
2、企業(yè)競(jìng)爭(zhēng):百度處于領(lǐng)先地位
賽迪四川依據(jù)智算中心建設(shè)、萬(wàn)卡集群布局、知名 GPU 廠商合作披露情況等研究得出,算力能級(jí)和上榜企業(yè)排名呈正相關(guān)關(guān)系,第一梯隊(duì)企業(yè)算力能級(jí)為第四梯隊(duì)企業(yè)算力能級(jí)的兩倍,彰顯出算力作為多模態(tài)大模型發(fā)展核心底座支撐的重要地位。具體來(lái)看,中國(guó)人工智能多模態(tài)大模型企業(yè)綜合競(jìng)爭(zhēng)力 20 強(qiáng)可劃分為 4 個(gè)競(jìng)爭(zhēng)梯隊(duì)。
產(chǎn)業(yè)發(fā)展前景及趨勢(shì)預(yù)測(cè):到 2030 年我國(guó)多模態(tài)大模型突破千億元
未來(lái)多模態(tài)大模型行業(yè)發(fā)展前景廣闊,作為大模型產(chǎn)業(yè)的重要技術(shù)方向,將成為未來(lái)發(fā)展的重點(diǎn)。多模態(tài)技術(shù)因其能夠融合文本、圖像、音頻、視頻等多種數(shù)據(jù)形式,具備更強(qiáng)的泛用性和跨場(chǎng)景能力,滿足了智慧城市、醫(yī)療、教育、元宇宙等多個(gè)領(lǐng)域的核心需求。隨著應(yīng)用場(chǎng)景不斷拓展和技術(shù)性能提升,多模態(tài)大模型在大模型產(chǎn)業(yè)中的技術(shù)滲透率將持續(xù)提高,逐步從邊緣應(yīng)用走向主流。尤其在政策支持和市場(chǎng)需求雙驅(qū)動(dòng)下,多模態(tài)大模型有望成為推動(dòng)產(chǎn)業(yè)升級(jí)和創(chuàng)新的重要引擎,其行業(yè)地位和影響力將進(jìn)一步鞏固。預(yù)計(jì)到 2030 年我國(guó)多模態(tài)大模型行業(yè)的市場(chǎng)規(guī)模將達(dá)到 969 億元,行業(yè)復(fù)合增速將超過(guò) 65%,行業(yè)前景巨大。
來(lái)源:前瞻網(wǎng)