產業觀察家們注意到生成式AI的革命性意義,并做出了豐富解讀。
英偉達創始人兼首席執行官黃仁勛稱生成式AI的推出為AI產業的i-Phone時刻,意指其顛覆性的技術突破和產品形態或引發了Al產業的全面變革。
投資公司a16z的合伙人馬丁middot;卡薩多稱其為第三個計算時代,意指繼微芯片將計算的邊際成本降到零、互聯網將分發的邊際成本降到零之后,大模型將創作內容的邊際成本降到零的第三次飛躍。
麥肯錫技術合伙人萊瑞拉middot;余則將其類比為計算產業所經歷過的大型機到個人電腦(PC)的劇變,意指生成式AI將技術使用權從精英轉向大眾,實現了AI技術的民主化。
但以上解讀局限于AI產業自身,沒有考慮生成式AI如何重塑更廣泛的經濟。在筆者看來,生成式AI和大模型有潛力成為整個國民經濟智能基礎設施,進而奠定所謂的大智能時代。
展望未來:時代躍遷
不同于專注于解釋現有數據的分析式AI或根據給定輸入推斷輸出的預測式AI,生成式AI專注于生成新內容,或稱合成數據。ChatGPT(美國AI公司OpenAI旗下的對話大模型產品)僅是大模型的一種。準確地說,它僅是文本大模型的一種。文本大模型之外,還有音頻大模型和視覺大模型。
不同于預設規則或試圖尋找結構化規則的傳統AI,生成式AI直接從海量未經標簽化的非結構化數據中提取基礎模型,由于基礎模型的參數巨大,常被稱為大模型。大模型的訓練極其昂貴,但具備一系列傳統AI模型不具備的優勢。一是其采取的非監督訓練的方式極大降低了人工標注的需要;二是模型具有更好的通用性,可靈活應付多種任務;三是大模型可以理解并使用人類語言,交互體驗非常自然。
歸根到底,大模型是人類全量知識的壓縮。傳統AI利用有限的知識從豐富的場景數據中提取結果,而大模型利用近乎完備的知識去解讀場景數據(盡管它不一定豐富)。大數據時代和大智能時代,分別建立在這兩種不同的模式上。
與此同時,時代生產力的進步還通常體現為某種新型基礎設施的建立。工業時代出現電力基礎設施,網絡化時代出現網絡基礎設施,而智能時代將出現何種基礎設施呢?在筆者看來,大模型具備成為智能基礎設施的潛力,因其具備基礎設施的三個基本特征。
一是通用性。傳統AI需要針對特定任務設計,表現出更多的專用性與垂直性。相比之下,經過高強度預訓練的大模型具備靈活應對多種非預設任務的能力,可通過微調及提示詞工程實現應用情景的高擴展,進而在通用性上大大提升。
二是規模經濟。大模型的規模經濟與兩個概念有關。一是智能涌現。只有模型參數規模超越臨界點之后,智能才開始涌現。工業經濟情景下,低于最小有效生產規模的廠商無法有效參與市場競爭。類似地,廠商必須投入高昂的前期訓練成本,才能參與大模型市場競爭。二是智能摩爾定律。傳統摩爾定律預測硅片上的晶體管密度隨時間推移指數級增長,而成本保持不變。智能摩爾定律則預測大模型智能所能覆蓋的場景數具有類似的規律。這意味著,隨著大模型參數的增長,其覆蓋智能場景的單位成本呈指數級降低。
三是外部性。修好的路上不跑車,價值等于零。盡管大模型語境下的車是什么尚未完全確定,但確定的是大模型的出現將促進各類車型的創新。因此,大模型對經濟的推動作用要遠遠大于生成式AI產業產值本身。聊天類應用僅僅是大模型應用的初級形態,而創意和想象力與未知場景進行結合所迸發出產業能量,才是大模型作為基礎設施最具想象空間之處。
通用性、規模經濟和外部性是基礎設施所具備的一般性特征。大模型作為基礎設施的特殊性何在呢?筆者認為,這是人類歷史上第一次實現智能的大規模集中供給,故而稱其為智能基礎設施。
數字化時代難道不是已經見證林林總總的智能化基礎設施了嗎?此處需澄清,智能的基礎設施化不同于基礎設施的智能化。智能手機的核心是手機,智能電網的核心是電網,智能交通的核心是交通,而賦予其各種智能內涵的過程是基礎設施的智能化。
不同的是,智能基礎設施的核心是相對通用的智能本身,能對接千行百業。過去幾十年,數字化基礎設施圍繞信息的采集、處理、傳輸、存儲、計算等環節得到了充分的發展,而智能基礎設施的發展才剛剛開始。
大智能時代
每輪基礎設施的躍遷都會引發一輪新商業機遇的爆發。這是因為,基礎設施將此前需要分散承擔的可變成本轉化為集中承擔的固定成本,推動新要素普及、降低創新門檻。
智能基礎設施帶來的新要素就是智能:大模型壓縮了人類所有知識,當場景數據輸入大模型,大模型就能根據其知識反饋出相應結果。當這種智能產生模式廣泛應用,我們或將見證前所未有的大智能時代。
大智能時代區別于大數據時代的核心特征是數據與智能的解耦。谷歌常因所謂數據網絡效應的原因被反壟斷機構約談:搜索引擎的市場份額越大,用戶數據就越多,而數據訓練出來的機器算法就越來越智能,進而進一步提升其用戶體驗,導致更大的市場份額。曾鳴教授更是基于阿里巴巴的類似經驗,提煉出以數據智能為基石的智能商業方法論。這種思維強調企業構建的數據飛輪是智能商業的前提:無數據,不智能。
在大智能時代,這一圭臬盡管在產業層面仍然成立,但在企業層面的應用卻值得推敲:智能不再完全來自于企業自身構建的數據飛輪。數據作為智能原料的地位無可撼動。然而,大模型使用這種原料上的效率遠超此前分散部署的小模型,以至于有志于智能商業的企業構建自身數據飛輪喪失經濟性。國家電網能穩定輸出電力時,為何要在工廠旁邊自建小發電廠?
智能基礎設施化的后果之一是數據與智能的解耦。數據與智能的解耦并不意味著數據不重要,而是意味著小數據也可以撬動大智能。當前,大模型的進一步發展面臨高質量數據源不足的障礙,可見數據的重要性。
但這不意味著任何企業都需要花心思囤積數據。過去,企業要精心構建并維護一個數據供應鏈,才有可能實現所謂的數據智能。而今,大模型使得智能不需要在低水平重復開發。企業只需要用小數據去微調這個模型,便有可能開展智能商業。由此,企業可節省精力、聚焦業務創新,釋放出所謂智能紅利。
產業生態
立足當下,本部分從三個視角來把握高度動態復雜的生成式AI產業生態。一是供給側視角的技術生態,有助于理解生成式AI技術實現所需的生產要素;二是需求側視角的應用生態,有助于了解生成式AI的應用方向;三是中美競爭背景下的區域生態,有助于理解需求側和供給側在不同條件下的互動模式。
1、生成式AI技術生態
大模型技術生態符合典型的IT垂直分工架構。最底層是基礎設施,負責提供大模型訓練以及推理所需的算力。產業初期,算力主要用于模型預訓練。隨著各大模型紛紛商用,用于響應用戶請求所需的推理算力占比快速增加。
眾所周知,大模型的算力需求主要由GPU來滿足。但NPU(神經網絡處理器)和TPU(張量處理器)等專為大模型推理運算設計的芯片也逐步成熟。NPU主要用于手機、無人機等終端產品的計算單元,而TPU是谷歌設計的云計算芯片。值得注意的是,硬件集群僅僅只是基礎設施的一部分,其上負責硬件資源調度的云平臺也非常重要。
基礎設施之上是大模型。大模型有開源和閉源之分。OpenAI的GPT是一個閉源模型,而2023年7月,Meta的Llama2(一款大模型)宣布支持開源和商用,引爆了大模型領域的開源運動。選擇開源模型還是閉源模型,似乎和應用有關。ChatGPT、Mid-journey(美國AI公司Midjourney旗下的文生圖模型產品)等廣受歡迎的ToC(面向消費者)應用都構建在私有大模型之上。但ToB(面向企業)領域的應用通常構建在開源大模型之上,因為開源大模型支持私有化部署,并在微調方面提供了更大的靈活度。
值得指出的是,大模型層與應用層之間存在一個中間層,旨在幫助應用開發者解決兩方面問題。一方面,基于大模型做二次開發需要一系列工具或模板;另一方面,由于市面上存在多種大模型,應用開發者可能希望一站式接入和管理。所謂模型即服務(MaaS)集成了這些工具和功能。
2、大模型應用生態
技術生態主要是巨頭和工程師的場域,而應用生態則是創業者和產品經理的沃土。在技術生態部分,應用層在技術堆棧中的位置得到了強調。本部分談及的應用生態則從需求側視角展開,根本上是要回答:大模型如何對接應用場景、創造用戶價值?這個問題可以沿著兩個維度思考:客戶屬性和產品策略。
一方面,ToC和ToB的大模型應用在價值創造方面具有顯著差異。首先,消費類應用的價值創造幾乎都在應用內完成,而企業級應用需要與企業內部價值鏈和IT系統整合。其次,消費類應用幾乎都基于公有云,而企業客戶因隱私顧慮偏好私有云或混合云部署。最后,消費類應用通常以一對多的方式提供服務進而迅速規模化,而企業級應用服務通常需要一對一定制。
以上ToC和ToB客戶市場的一般性差異,并不因大模型技術的開創性而改變??梢?,ToC應用的價值創造具備獨立性,而ToB應用的價值創造高度依賴其他互補性資源。進而,ToC應用有望構建出一個以自身為中心的生態,而ToB應用通常嵌入在在位玩家的生態中。
另一方面,無論是ToB還是ToC,大模型應用可考慮增強、替代或整合三種策略。
增強策略為現有產品或服務加入大模型性能,進一步提升產品體驗。比如,Office產品中嵌入了基于大模型輔助工具或者視頻游戲中引入大模型生成個性化劇情。
替代策略則把大模型應用作為生產力工具替代原有的低效流程。比如,在客服行業,替代正在大規模發生,而一部分營銷設計工作也有望在大模型的支撐下實現自動化。
相較于增強現有產品和替代低效流程,整合策略則跳出現有產品或流程,重新定義客戶體驗。筆者避免使用顛覆一詞,因為這種重新定義很大程度上是通過重組現有要素發生的。大模型并不創造要素,但提供了高超的整合能力。
3、生成式AI的區域生態
產業不可避免地嵌入在區域中??v觀全球,生成式AI的產業競爭主要是在中美之間開展。對于中美AI產業的一般性對比分析不是本文的重點。接下來,主要分析兩國區域條件的差異如何影響技術生態、應用生態以及兩者之間的良性反饋。
靜態對比,中美兩國在技術生態方面的差距并不致命。誠然,美國在聚集、培育生成式AI技術人才方面具有顯著優勢。并且,GPU出口管制在很大程度上也增加了中國企業的成本。
但同時我們要看到三方面的有利因素。第一,得益于開源運動的知識溢出效應,中美技術差距并沒有大到足以阻礙中國的產業進步;第二,中國企業對開源的貢獻也在日益壯大,中國也吸引了一些頂級科學家回國創業;第三,盲目的科技軍備競賽并不可取,大模型產業競爭的焦點已轉向工程化和商業化。
反倒是中美應用生態的差距令人擔憂。高科技產業的發展,短期內可以靠資本維系,長期來看要靠市場支付發展所需的成本,包括消費者側和企業側的支付。然而,中國消費者的付費能力遠不如美國消費者。中國移動通信用戶的月均支出約為50元,而美國約為50美元,但中國企業購買GPU的成本要高于美國企業。
在ToB市場,支付能力且不談,最大的問題是中國企業數字化水平低,尤其體現在SaaS的滲透率上。大模型應用更容易部署到SaaS化程度較高的企業,因其底層數據治理較規范、流程標準化程度較高。反之,SaaS化程度不高的企業需要花費大量時間和精力去做前期準備,耗散掉精力、耐心和資源,這會導致大部分企業淺嘗輒止或望而卻步。
值得強調的是,中國在移動互聯網時代的場景優勢,在生成式AI產業不成立。場景優勢建立在迭代之上,而迭代的前提是發展用戶??v觀所有國內大模型企業,沒有一家像推廣移動互聯網APP那樣去不遺余力地發展用戶。關鍵原因在于,移動互聯網APP服務一個新用戶的邊際成本幾乎為零,而大模型應用發展一個用戶的邊際成本恒不為零。在商業模式清晰之前,地主家也沒這么多余糧。
如果說中國移動互聯網的成功經驗之一在于前端場景優勢與后端技術進步的正反饋,筆者擔心中國生成式AI產業正在經歷一個截然相反的過程。從這個動態視角再去看待中美之間技術生態的差距,恐怕會得到與靜態對比不同的結論。
幾點思考與建議
據說,人們容易高估一件事的短期影響但低估其長期潛力。事關生成式AI產業,本文恰好提供了一劑對癥解藥:筆者長期看好其作為智能基礎設施的前途,但短期內對其結構性障礙持悲觀態度。
本文沒有論述中美生成式AI產業發展面臨的共性挑戰,而聚焦中國相對于美國的比較劣勢。那么,中國有沒有比較優勢呢?筆者相信,發揮以下三方面的比較優勢或有助于彌補劣勢:移動互聯網生態、產業協同治理和商業模式創新。
二是推動智能產業群協同發展。智能基礎設施的建設端需要整合算法、算力和數據等要素,是數字基礎設施和數字資源體系的有機融合和升級。支持數字基礎設施運營企業向智能基礎設施運營企業升級,實施算力、數據、算法的一體化運營。在需求側,通過降低各行業使用生成式AI的成本,拉動應用、工程、運營等配套服務的發展。
三是堅定鼓勵商業模式創新。生成式AI產業面臨的問題歸根到底是價值創造和價值分配的問題,即商業模式。無論打通移動互聯網生態還是推動產業協同發展,都旨在為生成式AI生態的發展創造一個更廣闊的環境和更堅實的基礎。這些比較優勢是否能夠精準轉化為可彌補比較劣勢的方面,商業模式設計起決定性作用。
免責聲明:該文章系本站轉載,旨在為讀者提供更多信息資訊。所涉內容不構成投資、消費建議,僅供讀者參考。
2023-06-24
2023-06-24
2023-06-20
2023-06-20