生成式AI的用云難題,其實才剛開始 | ToB産業觀察
大模型軍備賽中,雲計算企業仍在持續行動。
生成式AI初創公司Anthropic日前獲得了新一輪融資,亞馬遜、谷歌等科技巨頭已在其投資名單。此舉背後的重要原因在于,生成式AI企業訓練大模型,或者提供給最終用戶使用的AI産品方案,都需要算力資源,而調用算力的主要來源可以是買卡、自建私有機房,也可以是分布式雲的、容器、Serverless等雲上資源。後者的好處顯而易見:對于AI初創公司,需要將更多精力投入在業務效率上,從長遠來看,還有業務規模化後的穩定性和彈性收益等等。
不只是這些備受關注的AI企業。钛媒體App注意到,在中國用戶市場,在GPU算力緊缺以及基礎大模型尚未得到足夠提升的背景下,過去一年,還有一些新業務團隊,在嘗試通過雲上資源構建生成式AI的場景應用。
2023年2月,西門子中國大禹團隊(負責IT數據分析與人工智能)認識到,長期以來企業內部資源的檢索和調用都存在結構散亂、檢索速度慢、交互不便等問題。出于企業戰略考慮和具體業務需求,能不能從根本上提升知識庫的可用性,構建一個基于大數據庫和生成式AI的全新“智能知識庫”?
三個月後,基于新架構設計的智能會話機器人“小禹”正式在全公司發布。實測結果顯示,“小禹”的回答內容不僅生成速度更快,對搜索關鍵詞的命中率更高,整體使用體驗也得到提升。同時,還解決了各業務部門之間需求相似、重複開發問題,對系統在運維和擴展的投入成本實現了集約化。
這一成果的背後是來自于亞馬遜雲科技的支撐,除了采用當下流行的檢索增強生成RAG架構、向量數據庫等生成式AI技術外,還有Amazon OpenSearch Service分析服務和Amazon SageMaker機器學習服務等産品。投人、投技術、投專家夥伴,大禹團隊還期待與亞馬遜雲科技進行更多共創。
大模型需要在雲上找答案
本月初,亞馬遜雲科技宣布了幾項新功能,其中包括:全托管生成式AI服務Amazon Bedrock正式可用,並新增接入Amazon Titan Embeddings模型和Meta Llama 2模型,AI編程助手Amazon CodeWhisperer發布定制新功能預覽, Amazon QuickSight發布生成式BI新功能預覽。
值得一提的是,Amazon Bedrock提供了企業構建生成式AI應用程序所需的一系列功能,能夠在實現簡化開發的同時確保隱私性和安全性。目前Amazon Bedrock提供給開發者可供選擇的基礎模型庫正在擴大。目前已接入的AI公司大模型包括Anthropic C laude2,Stability AI Stable Diffusion XL,AI21 Labs Jurassic- 2,Cohere Command,加上最新接入的Meta Llama 2,以及亞馬遜自研的Amazon Titan,共六種大模型。通過Amazon Bedrock,企業無需進行底層資源部署和管理,可直接調用這些基礎模型,使用自身專有數據實現模型定制。
例如,沐瞳科技正在試用Amazon Bedrock,用于優化遊戲開發領域的業務流程。在工業領域,海爾創新設計中心利用生成式AI能夠實現文生圖、圖生圖、定量圖和全場景圖四個方面的提效,上線後,自動化設計系統應用讓相關業務的操作周期縮短了20%
金山辦公在面向海外業務拓展過程中,計劃將Amazon Bedrock服務集成到WPS海外版本進行生産測試,期待不同大模型組合在各類辦公場景中帶來實效。“現在沒有一個模型能夠解決所有問題,”金山辦公AI研發總監劉強強調。
可以發現,面向中國市場,亞馬遜雲科技生成式A堆棧各個層面的能力正加速同步給B端企業用戶。
10月24日,亞馬遜雲科技提出將爲用戶構建完整端到端生成式AI的技術堆棧,從五個層面展開:
選擇合適的應用場景,從典型場景入手創新業務模式
借助專門構建的生成式AI工具和基礎設施,快速構建高性價比的生成式AI應用
夯實數據基座,使用私有化數據,打造差異化競爭優勢
雲原生服務,加速AI原生應用構建,助力業務敏捷創新
使用開箱即用的生成式AI服務,消除重複性工作並專注創新本身
選擇合適的應用場景,從典型場景入手創新業務模式
借助專門構建的生成式AI工具和基礎設施,快速構建高性價比的生成式AI應用
夯實數據基座,使用私有化數據,打造差異化競爭優勢
雲原生服務,加速AI原生應用構建,助力業務敏捷創新
使用開箱即用的生成式AI服務,消除重複性工作並專注創新本身
“生成式AI本身就是雲原生的技術,只有雲技術能讓生成式AI落地生根。雲計算本身是企業去運用生成式AI最好的方式。作爲一家雲基礎設施提供商,亞馬遜雲科技定位于技術普惠化,我們希望通過技術解決大部分客戶痛點,並快速降低客戶使用門檻,幫助客戶取得業務成功。”亞馬遜雲科技大中華區産品部總經理陳曉建對钛媒體App等指出。
在陳曉建看來,生成式AI不僅僅是大模型,同樣需要加速芯片、數據庫、數據分析、數據安全服務等服務作支撐。從底層的加速層如加速芯片、存儲優化,到中間層模型構建工具和服務,再到最上層的生成式AI相關應用,每一層技術棧的創新都在解決客戶需求。
深入中國市場的挑戰
不過,據钛媒體App觀察,在下半年以來百度等企業同行的戰略描述中,開始將更多落腳點放在與具體行業、垂類場景結合方面。而在高調宣布或對客戶的承諾中,包括底層基礎設施、平台、工具鏈、數據集等AI技術棧的“全面性”,誰也沒有比誰的更差。
相反,從實際公開的企業案例和應用成果方面,比如走在AI應用前列的金融、電力等行業客戶,已經將大模型作爲探索自身業務高效發展的重要方向。
如何不讓生成式AI的企業實踐變成空中樓閣?如何塑造有價值的未來?
陳曉建提到一點:“在這個階段去評價現在我們做得好還是不好,並不是非常重要,而更重要的是能夠快速地去了解這個行業、了解客戶的訴求,包括我們自身能力的具備。”
至于誰能夠最先獲得客戶市場的信賴?結合當下市場環境來看,AIGC産業化仍然處于非常早期的階段,價值和挑戰同樣並存。而更多的挑戰在于,算力緊缺、成本制約、商業變現,這或許也是幾乎所有企業所面臨的問題。
對于亞馬遜雲科技而言,面向中國市場,無論是基于出海企業和跨國公司提供服務,還是拓展新的業務版圖,面臨的市場環境會更爲複雜,尤其是在安全合規方面,立場和所需采取的措施也會更加嚴苛。
整體來看,亞馬遜雲科技以往90%以上的産品都是從客戶需求推導而來。在AIGC領域的競賽,亞馬遜雲科技也在大力夯實基礎,端到端地爲客戶提供構建生成式AI應用所需的各種技術堆棧,除了上述的全托管生成式AI服務Amazon Bedrock,還在持續升級Amazon Trainium和Amazon Inferentia等AI芯片,布局某些具有潛力的應用如AI編程助手Amazon CodeWhisperer。
可能將這些投入轉變爲所謂的業務收入或客戶數量,還需時日,亞馬遜雲科技也在伴隨客戶和夥伴不斷成長。正如媒體溝通中提及一個有意思的話題:Amazon Bedrock未來會不會接入基于中文語料庫的大模型?
亞馬遜雲科技大中華區技術專家團隊總監王曉野的回答是:“目前公開信息是沒有的。但我們看到很多中國初創企業在做中文大模型,從産品努力的方向上,我們一定是幫全球使用中文模型的客戶來降低門檻,提供更好的便利。”-(钛媒體/作者:楊麗)