2023-10-26 13:01:41聖天使

開源不是活雷鋒,但搭便車的機會出現了


「是的。谷歌在人工智能方面並沒有護城河,OpenAI也沒有。在我們彼此競爭的時候,第三派一直在悄悄地吃我們的午餐。」

「第三派,我是說那些開源模型,開源能讓它們『更快、更可定製、更私密,能力更強』。」

——谷歌研究員報告備忘錄

「Llama 2為初創企業提供了一條生命線,像我這樣的人希望開源模式存在,因為我不喜歡把我所有的錢都給OpenAI。」

——人工智能助理初創公司Lindy創始人

越是前沿的領域,越是充滿變數。

對公眾來說,大模型領域可能只是出了幾個玩具般的App,很厲害,但沒什麼用。真正的商用似乎還有一段距離。

但商業端,大小公司之間的爭鬥已經進入了貼身白刃戰,戰況瞬息萬變,反轉頻出,感覺都有點燃起來了。

太多的細節,對於小白來說多少有些繁雜,要想吃明白這個瓜,可以去提綱挈領一個主線,在我們看來,這也是今年以來大模型領域的鬥爭核心:

開源VS閉源。

開源:後發者的驅虎吞狼

就軟件來說,屬於它的科技史並不算長,但我們依然可以總結出一些規律。

比如,每一次全新時代來臨之際,其核心產品都會出現兩條路線,先發者閉源,後來者開源。

PC時代的操作系統,Windows VS Linux;

移動互聯網時代的操作系統,iOS VS Android;

以及當下即將來臨的AI時代,GPT VS ??;

第一次,Linux的出現比Windows整整晚了六年。Linux的江湖地位不必多說,但商業價值相比後者的一家獨大,可以說是忽略不計。

第二次,Android的出現僅僅比iOS 晚了十個月。

結果是,Android拿下了80%以上的市場份額,而蘋果拿走了手機市場90%以上的利潤。

這個數據為長期以來的平均概數。最新數據,Android市場份額跌到了70%,蘋果的利潤占比則跌到了85%。這與中國廠商的崛起有不小關係。

開源系統的影響力大幅提高,但在商業價值上依然被閉源系統吊打。

第三次,也就是這一次,商業化落地的進程還沒正式開啟,開源系統就已經來勢洶洶了。

產生這一路線分歧,有其必然的商業邏輯。

在前沿科技領域,每一次技術突破的背後都需要極大的研發成本。這其中對於企業自身的資本、精力、人員投入乃至運氣,都有着極高的要求。

比如此次的引領者OpenAI,有報告顯示,OpenAI每天僅維持其人工智能服務ChatGPT的運行就需要花費約70萬美元。

如果不是OpenAI光啟動資金就有10億美元,是個典型的富二代,怕是經不住這樣「燒錢」。

其次,在巨額投入的先發優勢下,這類企業的產品質量也往往是市面上所能看到的最優選項,儘管這種優勢在中後期會隨着技術進步的放慢而被抹平,但這也是支撐其做到直接收費的市場原因。

這是非常傳統的商業邏輯,典型例子如製藥領域,早期高投入研製特效藥,前期專利保護高價售賣進行回本,後期逐步放開惠及市場。

但與藥品市場不同的是,軟件領域有着極大網格效應,時間在這一行業中格外重要,先發者往往能做到贏家通吃。

藥品市場中,假設我新藥比你研發得慢一點,但只要我比你便宜一塊錢,或者有其他差異化特性,我依然可以拿到屬於自己的市場份額,那大家自然都願意慢慢地搞專利保護,也就是閉源模式。

但在軟件領域中,市場的發展瞬息萬變,新入場的創業者、開發人員以及應用生態都在不斷湧現,而他們也需要付出學習成本以及維護成本,那麼越往後期,其更換成本就越高。

就像你手中的微信,也許你並不喜歡這款軟件,也許市面上有更加優秀的通訊產品,但你已經將自己的互聯網社交圈子安置在這個軟件上了,某種程度上就是別無選擇。這也就是所謂的贏家通吃。

而當初一同出現的米聊、易信、飛信等軟件,這些企業早期投入的成本,也就隨着微信生態的建立打了水漂。

但Android的成功,意味着這類後發者還有一線生機:開源。

開源的本質,是驅虎吞狼。

拉開架勢1V1單挑確實打不過了,那就把我的入場券免費送出去,請所有人一起入場。

個人的失敗固然痛心,但同行的成功更令人無法忍受。

既然贏家最後的核心優勢是生態建立,那我就不讓你這麼順利地壟斷生態,通過免費的行為,把這一環節的水徹底攪渾。

攻防戰的背後,競合大於競爭

梳理過往經驗,有這樣幾個規律和趨勢是可以清晰看到的:

1、商業價值上,開源系統的優勢在於影響力的迅速擴散,閉源系統的優勢則是利潤更有保障;

2、與Linux相比,安卓獲得了極大的商業成功,這與後發者的反應速度有着極大關係;

3、結合上一點,考慮到這一次大模型領域中,後發者的開源進程已經進入了提前搶跑式的布局。

那麼我們有理由相信,在又一個新的時代中,開源大模型很有可能取得比Android更加優異的成績。

這對包括GPT在內的所有閉源大模型來說,都不是一個好消息。文章開頭所引用的谷歌研究員匿名報告,他所擔心的便是這一趨勢。

毫無疑問,當下是開源模型的強勢期。後發者下定決心拿出「免費開源」這一必殺器時,必將強有力地攪動行業現狀。

但另一邊,這也意味着OpenAI的先發優勢已經十分穩固,在閉源系統這一端,可以說已經拿下了這一城。

不要相信那些開源社區所說的「透明化、分享精神、更高效的組織形式balabala」。

商業領域,尤其是要對股東負責的上市公司,是不可能純做活雷鋒的。真有信心硬剛OpenAI,能賺錢為什麼不賺?

回顧過去一年,雙方攻防數輪,精彩非常:

ChatGPT月活剛突破1億,Meta就立馬推出LLaMA(「羊駝」);

羊駝被「非故意開源」之後,基於開源模型產生的GPT平替大爆發, OpenAI立馬反手打一個GPT-4;

Dolly 2.0首創開源、遵循指令、提供可商業化數據集的大模型,ChatGPT APP就再次掀起風暴;

Meta推出新一代開源大模型Llama 2,這是大型科技公司首個開源的商用大模型,被稱為GPT-4的「最強平替」,後來首席人工智能科學家楊立昆就被叫到參議院接受眾議員質詢

......

總體來說,雙方的主線依然是競速賽。

請輸入圖

雖然也出現了「媒體輿論」和「政策監管」這些盤外招,但長期來看,未來的商業格局,還是取決於三點,也就是人工智能三要素:算法、算力、算據(數據)。

算法方面,我們不能否認當下的開源模型在過去的GPT-3中汲取了大量養分。而隨着GPT-4更加封閉,其能否持續保持競爭力,仍然有待進一步觀察。

清華大學電子工程系長聘教授周伯文說:「我們目前只知道它(GPT-4)是一個多模態大語言模型,但它如何理解圖片,如何用 RLHF 微調,以及參數量規模、訓練數據和成本等技術細節,OpenAI 全部選擇隱藏。」

這一點上,對OpenAI來說,大模型賽道的技術長度,或者說依然暫未開發的未來進化空間是其優勢。

也就是說,如果GPT-5乃至GPT-6持續推出,考慮到AI進化的荷塘效應,這一可能性幾乎是必然的,開源模型能否繼續保持相對競爭力尚未可知。

算力方面,就是堆錢,雙方均實力雄厚,不展開。

算據方面,我們認為,存量數據的價值意義遠不如基於AI產品所產生的原生數據。

如果說存量數據是「AI小寶寶」看電視被動學說話,那麼原生數據便是「AI小寶寶」在與人直接交流。更即時的反饋,更快速地糾錯,以及更貼合實際應用的數據價值,自然更有利於AI的進一步進化迭代。

基於此,ChatGPT APP的戰略價值進一步被放大。

而開源生態方面,則需要觀察垂類原生應用的進展情況。

正如,羊駝被泄露後,一眾GPT的平替爆發,知識蒸餾(通過將大型模型的知識轉移到小型模型中,從而快速達到想要的模型質量)的出現大幅降低了計算成本,某種程度上直接削低了加入開源生態的門檻。

那麼這一進展也將間接促進開源生態的進一步繁榮。

總體來說,雙方各有優勢。

閉源大模型不斷向上拓寬行業的天花板,隨着不可避免的技術外溢,必然將引領着開源大模型的持續發展。

另一邊,開源大模型則在迅速橫向拓展着AI生態的繁榮,這一繁榮所帶來的新增市場,也將被閉源大模型所共同分享。

目前仍處於市場越做越大的階段。

「在競爭中共同成長」,極有可能是未來的主題。

基座之爭收尾,下一階段爭什麼?

隨着開源模型的出現,這也意味着大模型時代的基座鬥爭已經進入了尾聲。

閉源方面,OpenAI坐穩了江山,接下來它的對手只有自己和技術本身。

短期來看,開源上手成本低,使用靈活,同時給予了中小型企業極大的自主性和安全感,短期內必將形成強烈的衝擊。

但中長期來看,隨着開源項目組建的系統進展,依然會需要大量人力和資源來維護,其綜合成本同樣會持續上升,屆時OpenAI的市場可能又會迎來回升。

基於此,未來的形勢或許會反覆,但巨大的反轉不太可能會出現。

開源生態方面,Meta的Llama目前具有着明顯的優勢。

開源之後,Meta將擁有更多的可訓練數據,開發人員能夠幫助Llama 2去發現和解決漏洞,並且能夠很快打開市場,為未來的商業化鋪路。

扎克伯格在四月份與股票分析師的電話會議上表示,隨着開發者採用和改進這些模型或修補他們的安全漏洞,Meta將能夠將這些改進納入其自己的消費者和廣告產品的AI模型中。

當然,考慮到當前仍處於AI時代的極早期階段,應用級生態的建立仍需要時間去觀察。同時考慮到中國市場的這一變量,開源大模型或許在未來仍需要參加半決賽乃至附加賽。

隨着開源這一最終殺器的祭出,這也意味着通用大模型基座維度的競爭中,最大的變數已經落地。

此外,隨着開源模式的出現,一個新的階段也將被徹底開啟。即,應用層產品的湧現。

在此之前,人們往往會質疑其商業壁壘的問題,比較知名的如投資人朱嘯虎所說:「如果90%的能力是ChatGPT提供,那麼AIGC應用就沒有什麼投資價值。」

其潛台詞是,無論你成長得多麼大,你的利潤都可以輕易被OpenAI拿走。

但開源模型的出現徹底打消了這一顧慮。

隨着開源社區的爆發式增長,具備基礎能力的大模型正在迅速普及。

供給側的繁榮使得大模型趨於白菜價。

此外,應用級企業自主研發的門檻也被降到了最低,企業的自主性將得到極大保障。

應用級企業被巨頭釜底抽薪的可能性消失了,寒武紀式的物種爆發近在眼前。

可以預見的是,接下來應用級層面的Killer App(殺手級應用)將成為行業中的下一個核心賽點。

而整個市場的競爭重心,也將從100%的技術驅動,向着代表着用戶體驗的產品驅動傾斜。-[文:市值榜*作者:劉奇*編輯:何玥陽/鈦媒體]