“卷王”豆包上桌,壓力給到了誰(shuí)?
@科技新知?原創(chuàng )作者丨思原?編輯丨蕨影
大模型賽道打了一年的價(jià)格戰,還在繼續……
就在新年前一天,阿里云宣布2024年度第三輪大模型降價(jià),通義千問(wèn)視覺(jué)理解模型全線(xiàn)降價(jià)超80%。
同樣,前不久火山引擎的Force大會(huì )上,除了大力宣傳豆包外,最值得關(guān)注的還是價(jià)格的再次下降。目前豆包視覺(jué)理解模型輸入價(jià)格為0.003元/千tokens,1塊錢(qián)可處理284張720P的圖片。
此前去年5月份,豆包通用模型pro-32k版,推理輸入價(jià)格為0.0008元/千tokens,價(jià)格不到1厘。此舉迫使阿里云對其三款通義千問(wèn)核心模型進(jìn)行新一輪降價(jià),降幅高達90%。而百度智能云則更為激進(jìn),宣布文心大模型旗下的兩款主打產(chǎn)品——ENIRE Speed與ENIRE Lite,將全面免費開(kāi)放。
按照火山引擎總裁譚待的說(shuō)法,“市場(chǎng)需要充分競爭,降低成本是技術(shù)優(yōu)化的結果,做得最好才能活下來(lái)”。顯然,在這場(chǎng)大模型的軍備競賽中,豆包想要上演“大力出奇跡”的戲碼。
但在字節大肆內卷之下,也有質(zhì)疑不斷:豆包的價(jià)格真的足夠便宜嗎?為什么大模型要卷價(jià)格?未來(lái)價(jià)格還會(huì )成為企業(yè)拿單重點(diǎn)嗎?
降價(jià)夸張?滿(mǎn)是套路
想要理解大模型商家的套路,就需要了解大模型的商業(yè)模式。據“遠川科技評論 ”梳理,目前來(lái)看各家提供的服務(wù)主要可分為三種:
一是包含模型推理的基礎服務(wù),指的是根據輸入的信息內容,給出回答的過(guò)程。簡(jiǎn)單來(lái)說(shuō)就是“實(shí)際使用”模型的過(guò)程。這部分各家都有不同的模型標準。
二是模型精調,廠(chǎng)商可以根據客戶(hù)需求按token使用量(訓練文本*訓練迭代次數)計費,訓練完成后出賬,按量后付費。
第三種便是模型部署,就相當于一個(gè)客戶(hù)獨占了一部分算力資源,屬于大客戶(hù),其收費模式,也是按照消耗的計算資源或者模型推理的token數量以量計價(jià)。
這3種收費模式,代表的也是大模型開(kāi)發(fā)由淺入深的過(guò)程。而各大科技公司瘋狂砍價(jià)的,其實(shí)是第一種基礎服務(wù),即標準版模型的推理費用。而這部分定價(jià)又分成了“輸入”和“輸出”兩部分。簡(jiǎn)單來(lái)說(shuō),輸入就是用戶(hù)提問(wèn)的內容,而輸出則是大模型的回答。
在調用大模型時(shí)往往會(huì )根據輸入和輸出的token數量,進(jìn)行雙向計費。這種細微差異,很容易成為大模型公司的套路。
例如,豆包的通用模型Doubao Pro-32k,輸入價(jià)格為“0.8元/百萬(wàn)tokens”,按照官方說(shuō)法是比行業(yè)便宜了99.3%,一些主流模型也都開(kāi)始了降價(jià),比如阿里云三款通義千問(wèn)主力模型Qwen-Turbo價(jià)格較之前直降85%,低至百萬(wàn)tokens 0.3元,Qwen-Plus和Qwen-Max的輸入價(jià)格分別再降價(jià)80%和50%,分別為0.8元/百萬(wàn)tokens和20元/百萬(wàn)tokens。
但輸出價(jià)格方面有所差別,2元/百萬(wàn)tokens的價(jià)格與Qwen-Plus、DeepSeek-V2等同行持平,甚至比比Qwen-Turbo、GLM-4-9B等一些同行產(chǎn)品價(jià)格更高。
再看最新的豆包視覺(jué)理解模型Doubao-vision-pro-32k,輸入化為每百萬(wàn)tokens的售價(jià)為3元,大概是0.4美元,輸出直接來(lái)到了9元,大概為1.23美元。按照豆包說(shuō)法,這個(gè)售價(jià)比行業(yè)平均價(jià)格便宜85%。
但對比幾個(gè)直接競爭者:阿里的多模態(tài)模型Qwen-VL系列在最近降價(jià)后與其價(jià)格一致;多模態(tài)的Gemini 1.5 Flash模型每百萬(wàn)輸入tokens報價(jià)為0.075 美元、每百萬(wàn)輸出tokens成本為0.3美元,對于較小的上下文(小于128k)還另有折扣價(jià);GPT-4o mini則是輸入0.15美元,輸出0.6美元。
不過(guò)不止豆包,國內其他廠(chǎng)商基本也都有類(lèi)似的降價(jià)“套路”。例如百度宣布免費的ERNIE-Speed-8K,如果實(shí)際部署,收費就變成了5元/百萬(wàn)tokens。還有阿里的Qwen-Max,實(shí)際與字節跳動(dòng)的豆包通用模型Pro-32k一樣,只是降低了輸入的價(jià)格。
值得一提的是,標準模型推理的降價(jià)確實(shí)可以讓中小開(kāi)發(fā)者降低成本,但只要稍微更進(jìn)一步的使用,就涉及到了模型微調和模型部署,然而這兩項服務(wù)一直都不是價(jià)格戰的主角,并且也沒(méi)有太大降價(jià)幅度。
簡(jiǎn)單來(lái)說(shuō),各家降價(jià)最狠的其實(shí)都是輕量級的預置模型;相比之下,性能更強悍的“超大杯”模型,實(shí)際降價(jià)幅度沒(méi)有那么夸張。例如精調的Doubao-pro系列的價(jià)格都在50元/百萬(wàn)tokens,比阿里、騰訊這些廠(chǎng)商的旗艦主力模型價(jià)格更高。
各大廠(chǎng)商風(fēng)風(fēng)火火的掀起的價(jià)格戰,就像是打網(wǎng)游,用各種形式吸引玩家,再在游戲中加上各種玩法,總之就是想要變強就要氪金。當然,即便如此,各個(gè)大廠(chǎng)也算是真金白銀的付出很多,那么為什么這些廠(chǎng)商在一直圍繞價(jià)格大費周章呢?
想做好,熱度不能停
?
縱觀(guān)大模型行業(yè),字節跳動(dòng)一定算不上起跑最快的那一批選手,甚至今年年初,字節跳動(dòng)CEO梁汝波在內部講話(huà)中提到“遲鈍”二字,直指字節對大模型的敏感度不如創(chuàng )業(yè)公司。
“直到2023年才開(kāi)始討論GPT,而業(yè)內做得比較好的大模型創(chuàng )業(yè)公司都是在2018年至2021年創(chuàng )立的?!彼f(shuō)。
后來(lái)者往往是最需要內卷的那個(gè),字節跳動(dòng)也是如此。從今年年中開(kāi)始,便開(kāi)始制造一輪又一輪熱度。
除了上文所說(shuō)的,豆包在B端的讓利降價(jià)意圖明顯外,C端市場(chǎng)豆包也是全力出擊。
面向C端,無(wú)論是線(xiàn)上平臺,還是線(xiàn)下公開(kāi)場(chǎng)所,都能看到豆包的身影。據“連線(xiàn)Insight” 援引AppGrowing統計,截至11月15日,國內十款AI原生應用中,Kimi和豆包是投放最瘋狂的兩個(gè)產(chǎn)品,分別投放了5.4億元和4億元。
拉長(cháng)時(shí)間線(xiàn)看,豆包的投流顯然更猛烈。據AppGrowing統計,2024年4月—5月,豆包投放金額預計為1500萬(wàn)元-1750萬(wàn)元。6月上旬,豆包再次啟動(dòng)新一輪大規模的廣告投放活動(dòng),投放金額高達1.24億元。
除了投流外,豆包還有抖音這一流量池,字節幾乎屏蔽了除了豆包以外所有AI應用在抖音上的投放。目的也很明確,就是要徹底解決大模型應用的“用戶(hù)焦慮”。
然而,現實(shí)往往事與愿違。據“智能涌現”報道,字節內部反思——豆包目前的用戶(hù)活躍度并不算高。豆包每周僅活躍2至3天,且每天用戶(hù)發(fā)送消息輪次僅為5到6次,單次2分鐘左右,用戶(hù)人均使用時(shí)長(cháng)僅為10分鐘左右。上述這些數據在過(guò)去一年中的增長(cháng)幅度并不顯著(zhù)。
簡(jiǎn)單來(lái)說(shuō),不計成本的投流,雖然讓豆包成了國內用戶(hù)數量斷層式第一的AI軟件,但仍然算不上是一款killer app。
字節管理層對此的判斷是,像豆包這樣的AI對話(huà)類(lèi)產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”。字節內部判斷,付費訂閱模式在中國不太可能走通。而時(shí)長(cháng)和輪次太低,又導致潛在的廣告空間較小,這都構成了這類(lèi)產(chǎn)品的隱形天花板。
所以長(cháng)期來(lái)看,更低門(mén)檻、更“多模態(tài)”的產(chǎn)品形式更具落地可能,剪映和即夢(mèng)可能是合適的入口,這也是此次大會(huì )豆包將部分重點(diǎn)放在視頻模型的本質(zhì)原因。
但站在用戶(hù)角度,根據“財經(jīng)雜志”報道,大部分用戶(hù)買(mǎi)單的原因是產(chǎn)品和服務(wù)能帶來(lái)價(jià)值,價(jià)值不光是解決具體問(wèn)題,如提升工作效率、提供情感陪伴等,市場(chǎng)上還有一類(lèi)價(jià)值是“符合政策方向”。更重要的要具備找到具體客戶(hù)并交付的能力,這考驗的是AI公司在技術(shù)和產(chǎn)品之外的能力,甚至在很多時(shí)候,這項能力比技術(shù)實(shí)力更能幫助AI公司成長(cháng)。
中國的AI市場(chǎng)和美國不同,很難通過(guò)平臺銷(xiāo)售軟件的模式打開(kāi)市場(chǎng),大部分時(shí)候需要抓住一個(gè)個(gè)的項目和工程來(lái)實(shí)現商業(yè)化。而這些項目和工程的來(lái)源,往往與自身熱度有關(guān)。
“一家成熟的企業(yè)在布局大模型時(shí),很難會(huì )去考慮一個(gè)不成熟的產(chǎn)品或者企業(yè)。在不考慮成本的情況下,大品牌往往是首選,這不僅是技術(shù)上的信任,更多是服務(wù)、整體質(zhì)量的信任”,一位科技企業(yè)管理人員向「科技新知」表示,“畢竟小廠(chǎng)的風(fēng)險還是有的,就像買(mǎi)車(chē),開(kāi)著(zhù)開(kāi)著(zhù)車(chē)廠(chǎng)倒閉了,那就損失大了”。
初創(chuàng )公司大肆制造熱點(diǎn)新聞,大概率是為了融資,是為了活下去,而豆包這種本就有背景的,則是想要靠著(zhù)熱度去找到并且固定更多客戶(hù),但圈內一個(gè)默認的事實(shí)就是,無(wú)論是誰(shuí)、無(wú)論技術(shù)多厲害,都要善于保持熱度,畢竟酒好也怕巷子深。
淘汰賽,或告別價(jià)格戰
?
其實(shí)不止豆包,目前市面上所有二線(xiàn)及以下的大模型廠(chǎng)商,都處在花錢(qián)買(mǎi)流量的階段,為的是留住用戶(hù)。因為這一場(chǎng)不折不扣的“卷王秀”背后,是瘋狂的產(chǎn)品能力和研發(fā)速度,更意味著(zhù)這場(chǎng)關(guān)于“擠泡沫”的大模型服務(wù)商淘汰賽,再次吹響了號角。
2024年已經(jīng)經(jīng)歷了一輪淘汰賽洗禮,讓大模型去九存一,產(chǎn)業(yè)格局更加合理,只留下了約10%的大模型進(jìn)入決賽圈。
然而,這并不是結束,而是開(kāi)始。只是在「科技新知」看來(lái),新一輪淘汰賽的重點(diǎn),價(jià)格不再是主導因素而是技術(shù)。
目前科技公司們也開(kāi)始陸續意識到,僅發(fā)布一個(gè)免費的應用,并不能為公司帶來(lái)直接收益,C端用戶(hù)量很難增長(cháng),獲客成本已經(jīng)明顯提升。更重要的是去直接觸及那些愿意付費的B 端客戶(hù),例如金融、政務(wù)、汽車(chē)等行業(yè)。
但是通常有大量公司集中進(jìn)入某個(gè)行業(yè)時(shí),會(huì )出現持久的價(jià)格戰,因為各家都需要打造一個(gè)標桿客戶(hù),來(lái)為之后的市場(chǎng)拓展鋪路。簡(jiǎn)單粗暴的價(jià)格戰會(huì )讓一些公司主動(dòng)或被動(dòng)退出,待市場(chǎng)穩定后,再將價(jià)格恢復常態(tài)。
但矛盾之處在于,“有錢(qián)”的領(lǐng)域大家都想進(jìn)入。而長(cháng)久的價(jià)格戰下,技術(shù)成本變成了制勝關(guān)鍵,簡(jiǎn)單來(lái)說(shuō),同樣的解決方案和報價(jià)下,誰(shuí)的技術(shù)成本更低,誰(shuí)就能虧得更少,活得更久。
而技術(shù)成本取決于企業(yè)的硬件成本和算法邏輯,這點(diǎn)目前國內主流的大模型廠(chǎng)商基本處在同一水準,并且迭代和互相追趕的速度也不相上下,但這不代表可以高枕無(wú)憂(yōu)。
今年9月,OpenAI的“王炸”o1模型的問(wèn)世也讓各家看到了差距,與現有的大模型相比,o1最大的特點(diǎn)就是“推理式AI”,它在回答復雜問(wèn)題時(shí)會(huì )花費更多時(shí)間來(lái)逐步推演問(wèn)題。這種延時(shí)思考并不是缺點(diǎn),反而讓o1更接近人類(lèi)真實(shí)的邏輯推理方式。
從“生成式AI”到“推理式AI”,o1的推出預示著(zhù)AI進(jìn)入了一個(gè)全新的階段。而更令人震驚的是,在o1發(fā)布的3個(gè)月后,下一代o系列產(chǎn)品o3便橫空出世,并且o3有完整版和mini版,新功能是可將模型推理時(shí)間設置為低、中、高,模型思考時(shí)間越高,效果越好。mini版更精簡(jiǎn),針對特定任務(wù)進(jìn)行了微調,將在1月底推出,之后不久推出o3完整版。
這也意味著(zhù)快速迭代下,目前主流的生成式AI,即將成為歷史產(chǎn)品。
“價(jià)格是影響大模型企業(yè)的因素,但更重要的還是技術(shù)能力,”一位大模型應用開(kāi)發(fā)者向「科技新知」表示,“目前國內如阿里、昆侖萬(wàn)維等企業(yè)也都推出類(lèi)o1模型,雖然有差距,但也代表了他們也都認同這一趨勢?!?/p>
一位業(yè)內專(zhuān)家也表示,國內企業(yè)走的思路是集成思維鏈、用搜索方式提升深度推理能力、加入反思策略和算法提升邏輯推理性能,但目前還未完全超過(guò)OpenAI。
值得一提的是,國內最近比較火的DeepSeek-V3,采用的蒸餾技術(shù)給行業(yè)提供了新思路,但同時(shí)也陷入“優(yōu)化GPT”的爭論。
而針對AI訓練可能使用合成數據(大模型生成數據)這一話(huà)題,倫敦大學(xué)學(xué)院(UCL)名譽(yù)教授和計算機科學(xué)家彼得·本特利表達了擔憂(yōu),稱(chēng)“如果繼續在其他AI的輸出上訓練AI,結果可能是模型崩潰。確保高質(zhì)量AI的唯一方法是,為其提供人類(lèi)的高質(zhì)量?jì)热??!?/p>
“缺乏參照的現成開(kāi)源架構,不清楚o1模型做后訓練時(shí)強化學(xué)習的方式以及使用的數據集,樹(shù)搜索、COT未開(kāi)源,訓練數據污染、國產(chǎn)模型推理性能提升困難,這些都是目前國內企業(yè)的難點(diǎn),”該專(zhuān)家補充道,“不過(guò)若有支持o1架構的開(kāi)源模型出現會(huì )加速這一過(guò)程,過(guò)程中會(huì )有兩三家先跑,其他家后跟進(jìn)?!?/p>
如果根據以往GPT系列的發(fā)展節奏,全廠(chǎng)商跟上o系列的步伐大概率會(huì )在2025年上半年到來(lái),而在這之后,目前的技術(shù)也將逐漸退出歷史舞臺,所以對于大模型廠(chǎng)商來(lái)說(shuō),與其坐等被淘汰,不如在淘汰之前讓迭代技術(shù)發(fā)揮更大作用。
總的來(lái)看,未來(lái)價(jià)格雖仍會(huì )是影響企業(yè)拿單的因素之一,但隨著(zhù)技術(shù)的快速迭代和行業(yè)的發(fā)展,技術(shù)能力將越發(fā)關(guān)鍵,只有不斷提升技術(shù)、降低成本、優(yōu)化服務(wù),大模型廠(chǎng)商才能在即將到來(lái)的淘汰賽中存活下來(lái)。
參考資料:
[1]《豆包再降價(jià),字節“飽和式”進(jìn)攻仍在繼續》, 連線(xiàn)Insight
[2]《大模型價(jià)格戰,還能再狠一點(diǎn)》,遠川科技評論
[3]《中國大模型洗牌年將開(kāi)啟,暗藏兩大邏輯》,財經(jīng)
[4]《字節內部判斷AI對話(huà)類(lèi)產(chǎn)品天花板可能不高,提升剪映即夢(mèng)優(yōu)先級》,智能涌現