打完“價(jià)格戰”,大模型還要比什么?
摘要:大模型的1996。
?
來(lái)源 | 伯虎財經(jīng)(bohuFN)?
作者 | 楷楷?
在近日舉辦的2024年云棲大會(huì )上,阿里再次成為了焦點(diǎn)。
今年5月,阿里云宣布旗下通義千問(wèn)的多款商業(yè)化及開(kāi)源模型進(jìn)行大幅降價(jià),最高降價(jià)幅度高達97%;云棲大會(huì )上,通義千問(wèn)三款主力模型再次大幅降價(jià),最高降幅達85%。
自阿里在5月率先“開(kāi)卷”之后,字節跳動(dòng)旗下云服務(wù)火山引擎、百度智能云、騰訊云、科大訊飛等均官宣旗下大模型大幅下調價(jià)格,行業(yè)降價(jià)幅度達到了90%左右。
不僅國內大模型廠(chǎng)商跟進(jìn)價(jià)格戰,行業(yè)風(fēng)向標 OpenAI 也在今年7月推出了GPT-4o mini ,商用價(jià)格較GPT-3.5 Turbo 便宜了60% 以上。
可以預見(jiàn),在阿里再掀“價(jià)格戰”之后,大模型價(jià)格還將繼續下調,甚至可能走向“負毛利”。在互聯(lián)網(wǎng)行業(yè)的發(fā)展史中,“虧本換規?!辈⒉皇悄硞€(gè)企業(yè)的孤例,要改變整個(gè)行業(yè)的商業(yè)模式,必然需要投入更高的成本。
但在這個(gè)過(guò)程中,如何平衡價(jià)格、質(zhì)量與服務(wù)也成為了大模型企業(yè)必須思考的問(wèn)題,企業(yè)想要“活下來(lái)”,就不能只吃“低垂的果實(shí)”。
01 規模比利潤更重要
國內大模型已從“以分計價(jià)”的定價(jià)模式走向“以厘計價(jià)”的新時(shí)代。今年5月,阿里通義千問(wèn)大模型的API調用輸出價(jià)格,從0.02元/千Tokens降至0.0005元/千Tokens。
在9月再次降價(jià)之后,阿里云Qwen-Turbo(128k)、Qwen-Plus(128k)、Qwen-Max 三款模型每千 tokens的最低調用價(jià)格再次刷新下限,分別降至0.0003元、0.0008元、0.02元。
對于再次降價(jià),阿里云CTO周靖人表示,每一次降價(jià)都是一個(gè)非常嚴肅的過(guò)程,要從整個(gè)產(chǎn)業(yè)發(fā)展,開(kāi)發(fā)者、企業(yè)用戶(hù)的反饋等各方面進(jìn)行權衡,(降價(jià))不是“價(jià)格戰”,(大模型價(jià)格)還是太貴了。
隨著(zhù)一個(gè)行業(yè)的成熟發(fā)展,其走向降價(jià)趨勢也是必然的,比如半導體行業(yè)的“摩爾定律”,即處理器的性能大約每?jì)赡攴槐?,但工藝的進(jìn)步會(huì )使成本下降為之前的一半。
但目前來(lái)看,大模型行業(yè)的降價(jià)速度已經(jīng)遠超“摩爾定律”,降價(jià)幅度接近100%,在這樣的背景下,大模型企業(yè)還能盈利嗎?或許對大模型行業(yè)來(lái)說(shuō),當前規模比利潤更重要。
一方面,暫時(shí)讓渡利潤已是大模型行業(yè)的共識,業(yè)內人士認為,大模型行業(yè)甚至可能已經(jīng)到了“負毛利時(shí)代”。
據《財經(jīng)》雜志報道,阿里云、百度智能云等多位負責人曾透露,今年5月以前,國內大模型推理算力毛利率高于60%,和國際同行基本一致,但在5月接連降價(jià)后,毛利率則跌至負數。
在大模型降價(jià)以后,使用者數量會(huì )持續增多,短期內調用次數越多,大模型的虧損就越大,因為每次調用模型都要消耗價(jià)格不菲的算力,也就是說(shuō)大模型企業(yè)不僅要降低售價(jià),還要面臨更高的成本投入。
但另一方面,大模型降價(jià)帶來(lái)的效果也是顯著(zhù)的。以阿里云為例,在大模型降價(jià)以后,阿里云百煉平臺的付費客戶(hù)數比上一個(gè)季度增長(cháng)了超過(guò)200%,更多企業(yè)放棄私有化部署,選擇在百煉上調用各類(lèi)AI大模型,目前百煉已服務(wù)超30萬(wàn)個(gè)客戶(hù)。
過(guò)去一年,百度文心大模型的降價(jià)幅度也超過(guò)90%,不過(guò),百度在2024年Q2財報電話(huà)會(huì )上披露,文心大模型日均調用量超6億次,半年內增長(cháng)超10倍。
如此看來(lái),大模型企業(yè)寧愿犧牲利潤也要降價(jià),所求的正是“預期”,即犧牲短期利益來(lái)?yè)Q取長(cháng)期回報。
有業(yè)內人士估計,目前各家大模型企業(yè)在模型調用領(lǐng)域的收入不會(huì )超過(guò)10億元,相較于百億元級別的總營(yíng)收,這筆收入只是“九牛一毛”。
但在未來(lái)1-2年,大模型調用次數至少有10倍以上的指數級增長(cháng),短期來(lái)看,用戶(hù)規模越大,大模型的算力成本越高;但長(cháng)期來(lái)看,在云服務(wù)領(lǐng)域,算力成本有望隨著(zhù)客戶(hù)需求增長(cháng)逐漸攤薄,企業(yè)將會(huì )迎來(lái)“回報期”。
隨著(zhù)行業(yè)的持續發(fā)展,AI對算力的拉動(dòng)會(huì )越來(lái)越明顯,阿里CEO吳泳銘曾表示,在算力市場(chǎng)上,超過(guò)50%的新需求都是由AI驅動(dòng)產(chǎn)生的,大模型正在加速商業(yè)化。
一方面,降價(jià)大大降低了企業(yè)客戶(hù)的使用門(mén)檻和試錯成本,特別是對政務(wù)、制造、能源等傳統行業(yè)來(lái)說(shuō),它們的業(yè)務(wù)規模更大,增量空間也更大。
當大模型能夠像其他基礎設施一樣人人可用時(shí),大模型的市場(chǎng)空間才能有望實(shí)現大幅增長(cháng),在這之前,大模型企業(yè)難免需要讓利給企業(yè)和開(kāi)發(fā)者。
另一方面,大模型降價(jià)后存量收入會(huì )下降,但增量收入會(huì )增長(cháng)。以百度為例,大模型不僅帶來(lái)了直接收入,比如文心大模型等產(chǎn)品的調用等,還能帶動(dòng)間接業(yè)務(wù)的收入,比如百度智能云業(yè)務(wù)。
過(guò)去幾年,外界對百度智能云戰略不乏質(zhì)疑,其在公有云市場(chǎng)并不占優(yōu)勢,但在A(yíng)I公有云這個(gè)細分市場(chǎng),百度開(kāi)始彎道超車(chē)。目前,百度智能云的大模型收入占比已從2023年四季度的4.8%提升到了2024年二季度的9%。
所以,目前大模型行業(yè)的共識,就是規模比利潤更重要,這一觀(guān)點(diǎn)在互聯(lián)網(wǎng)時(shí)代也是老生常談,比如“千團大戰”“網(wǎng)約車(chē)大戰”“電商大戰”等。大模型企業(yè)不能回避“價(jià)格戰”,就只能將活過(guò)價(jià)格戰作為初步目標,希望能成為淘汰賽結束后的最終受益者。
02 阿里著(zhù)力“AI大基建”
阿里也深知這一道理,其在近日宣布大模型再次降價(jià)后,也提出了“AI大基建”的概念。阿里云副總裁張啟表示,現在的AI相當于1996年前后的互聯(lián)網(wǎng),當時(shí)的上網(wǎng)資費很貴,這也限制了移動(dòng)互聯(lián)網(wǎng)的發(fā)展,只有把資費降下來(lái),才有可能談未來(lái)的應用爆發(fā)。
所以,阿里除了在2024年云棲大會(huì )上提出大模型再次降價(jià)之外,還發(fā)布了新一代的開(kāi)源大模型,一口氣上架了100 多個(gè)模型,涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數學(xué)模型和代碼模型,創(chuàng )造了大模型開(kāi)源的“數量之最”。
阿里云CTO周靖人表示,阿里云堅定不移地推進(jìn)開(kāi)源戰略,希望把選擇留給開(kāi)發(fā)者,讓開(kāi)發(fā)者會(huì )基于自己的業(yè)務(wù)場(chǎng)景去做模型能力增強和推理效率增強的權衡與選擇,同時(shí)也能更有效服務(wù)企業(yè)。
根據阿里的統計,截至 2024 年 9 月中旬,通義千問(wèn)開(kāi)源模型下載量突破 4000 萬(wàn),Qwen 系列衍生模型總數超過(guò) 5 萬(wàn)個(gè),成為僅次于 Llama 的世界級模型群,而Llama正是大模型開(kāi)源界的“頭把交椅”,全球下載量接近3.5億。
在“百模大戰”結束之后,多位行業(yè)大佬均認為“卷模型不如卷應用”,大廠(chǎng)也開(kāi)始聚焦“卷生態(tài)”。百度董事長(cháng)李彥宏曾表示,“沒(méi)有構建于基礎模型之上的、豐富的AI原生應用生態(tài),大模型就一文不值?!?/p>
目前,通過(guò)國家網(wǎng)信辦備案的大模型已達190多個(gè),注冊用戶(hù)超6億,但仍難以解決大模型“最后一公里”問(wèn)題,難點(diǎn)不僅是大模型應用太少,還有大模型不夠“接地氣”,比如在醫療、金融等專(zhuān)業(yè)領(lǐng)域中,單純依靠“喂數據”訓練,大模型還是很難直接落地應用。
大廠(chǎng)不可能躬身入局每一個(gè)細分行業(yè)來(lái)完成“最后一公里”,但可以通過(guò)打造完整的應用生態(tài),由下游企業(yè)或其他開(kāi)發(fā)者自行“煉成”符合需求的模型產(chǎn)品,不僅能進(jìn)一步優(yōu)化資源配置,也能在這個(gè)過(guò)程中積累更多高質(zhì)量數據,最終反哺給基礎大模型開(kāi)發(fā)。
阿里選擇降價(jià)、開(kāi)源,本質(zhì)就是希望降低大模型的使用門(mén)檻,通過(guò)更低的價(jià)格來(lái)驗證大模型的應用價(jià)值,讓更多企業(yè)和創(chuàng )作者參與進(jìn)來(lái)。只有大模型能夠真正滿(mǎn)足企業(yè)的復雜業(yè)務(wù)場(chǎng)景需求,生態(tài)才能發(fā)展起來(lái),行業(yè)才能進(jìn)入新的階段。
不過(guò),“百模大戰”最終可能只會(huì )留下3-5家大模型企業(yè),目前來(lái)看,行業(yè)第一梯隊已經(jīng)呼之欲出,它們也可能會(huì )是大模型行業(yè)未來(lái)最基本的底座。
因此,頭部的大模型企業(yè)更不可能主動(dòng)放棄價(jià)格戰,讓出自己的市場(chǎng)份額。除此以外,不少獨角獸也希望憑借價(jià)格戰殺出一條“生路”,部分企業(yè)也認為小模型或更具性?xún)r(jià)比。
事實(shí)上,今年5月的大模型價(jià)格戰并非始于阿里,而是一條名為“DeepSeek V2”的鯰魚(yú),在行業(yè)普遍推理價(jià)格還是百元/Tokens的背景下,其將支持32k上下文的模型API定價(jià)為1元/百萬(wàn)Tokens(計算)、2元/百萬(wàn)Tokens(推理)。
目前來(lái)看,大模型淘汰賽或還會(huì )持續2-3年,雖然最終留下的大模型企業(yè)并不會(huì )多,為了活下去,企業(yè)們也不得不使出渾身解數,但問(wèn)題是,當“低垂的果實(shí)”都被摘完之后,當下大模型行業(yè)的解題思路早已不是“便宜就完事”。
03 0模型能力仍是關(guān)鍵
不過(guò),對于大模型“價(jià)格戰”一事,行業(yè)也有不同的看法。零一萬(wàn)物創(chuàng )始人李開(kāi)復曾表示,沒(méi)有必要打瘋狂的價(jià)格戰,因為大模型不光要看價(jià)格,還要看技術(shù),如果是技術(shù)不行,然后靠賠錢(qián)來(lái)做生意,(公司)不會(huì )對標這樣的定價(jià)。
火山引擎總裁譚待在談及價(jià)格戰時(shí)也表示,當前主要關(guān)注的是應用覆蓋,而不是收入,要有更強的模型能力才能解鎖新場(chǎng)景,這才更有價(jià)值。
目前來(lái)看,“價(jià)格戰”的本質(zhì)還是因為產(chǎn)品能力不足,各家模型能力趨于同質(zhì)化,暫時(shí)無(wú)法形成斷檔的差距,所以才希望通過(guò)價(jià)格戰來(lái)增加大模型的普及,也能幫助廠(chǎng)商增加市場(chǎng)份額。
但等到市場(chǎng)摘完“低垂的果實(shí)”,新問(wèn)題也會(huì )接踵而來(lái),企業(yè)能否扛下下一階段的價(jià)格戰;大模型能否和對手拉開(kāi)差距;自己會(huì )否成為最終能夠留下來(lái)的企業(yè),這些問(wèn)題依然需要解決。
所以,大模型企業(yè)在打價(jià)格戰的同時(shí),也深知產(chǎn)品、技術(shù)、現金流的重要性,既要抗住降價(jià)壓力,又要和對手拉開(kāi)技術(shù)差距,持續提升模型性能和產(chǎn)品落地,才能形成良性的商業(yè)閉環(huán)。
一方面,大模型企業(yè)并非單純依賴(lài)“價(jià)格戰”。通常來(lái)說(shuō),大模型的推理包含時(shí)間、價(jià)格、生成 Token 數量三個(gè)變量,不能拋開(kāi)單位時(shí)間內的并發(fā)數量,只看 tokens 價(jià)格。
因為在實(shí)際跑業(yè)務(wù)的過(guò)程中,推理事件越復雜,越有可能要增加并發(fā)量。但目前降價(jià)大模型普遍使用的是預置模型(不支持增加并發(fā)量),真正大規模、高性能、支持高并發(fā)的模型推理均未有大幅降價(jià)。
另一方面,通過(guò)技術(shù)來(lái)進(jìn)一步優(yōu)化大模型的推理成本。以百度為例,旗下的百舸異構計算平臺對智算集群的設計、調度、容錯等環(huán)節進(jìn)行了專(zhuān)項優(yōu)化,能夠實(shí)現萬(wàn)卡集群上的模型有效訓練時(shí)長(cháng)占比超過(guò)98.8%,線(xiàn)性加速比、帶寬有效性分別高達95%,幫助客戶(hù)解決算力短缺和算力成本偏高等問(wèn)題。
微軟CEO薩蒂亞·納德拉曾舉例表示,過(guò)去一年 GPT-4 性能提升了6倍,但成本降低到了之前的1/12,性能/成本提升了70倍。不難看出,大模型技術(shù)的發(fā)展才是行業(yè)持續降價(jià)的底氣。
最后,則是打造出更有差異化的產(chǎn)品。低價(jià)策略能夠幫助大模型企業(yè)筑造生態(tài),但隨著(zhù)AI領(lǐng)域的不斷發(fā)展,創(chuàng )新速度的加快也使得技術(shù)更新?lián)Q代周期縮短,是否能夠持續提供有競爭力的產(chǎn)品,能否在實(shí)際應用中解決用戶(hù)痛點(diǎn),才是大模型企業(yè)的核心競爭力。
目前,大模型行業(yè)的商業(yè)邏輯,已經(jīng)從卷模式、卷成本,邁入到卷生態(tài)、卷技術(shù)的新階段。當然,低價(jià)還是快速建立生態(tài)壁壘的重要手段,但通過(guò)技術(shù)降低成本,才是推動(dòng)大模型快進(jìn)到“價(jià)值創(chuàng )造階段”的關(guān)鍵要素。
接下來(lái),大模型企業(yè)的新戰場(chǎng)將會(huì )是“性?xún)r(jià)比”,要在當前的價(jià)格基礎上,進(jìn)一步提高大模型的質(zhì)量和性能,讓模型能力更強、更多元,這么做或許不一定能孵化出“超級應用”,但吸引更多中小企業(yè)、創(chuàng )業(yè)公司的加入,才有機會(huì )為大模型企業(yè)帶來(lái)爆發(fā)式增長(cháng)的機會(huì )。
文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無(wú)償使用,請及時(shí)聯(lián)系我們,本平臺將立即更正。?
?