亚洲欲色在线观看,一区二区三区在线视频免费观看,国产中文字幕剧情av,99视频精品全部在线播放,亚洲综合小说久久另类区

10/12
2025

有價(jià)值的財經(jīng)大數據平臺

投稿

精品專(zhuān)欄

大模型走到AI戰略分岔口,字節們面臨偏航危機

摘要:不少AI企業(yè)追求“大而全”,面臨商業(yè)上的挑戰和市場(chǎng)規模的限制。盡管深度推理具有長(cháng)遠價(jià)值,但敢于投入和堅持的企業(yè)為數不多。

@科技新知?原創(chuàng )

作者丨林書(shū)?編輯丨蕨影

最近,字節在A(yíng)I方面又搞了個(gè)大新聞。

一個(gè)字節的實(shí)習生,因為對團隊資源分配不滿(mǎn),用惡意代碼把模型訓練過(guò)程給投了“毒”,字節這邊損失不小。

盡管“資源分配問(wèn)題”這個(gè)說(shuō)法還沒(méi)完全坐實(shí),但既然一個(gè)實(shí)習生,都能隨便對訓練中的模型下毒手了,那至少說(shuō)明,字節對文本模型的訓練方面重視度不夠,因此才會(huì )出現“把關(guān)不嚴”的情況。

與文本大模型相比,字節在視頻方向上可謂打得火熱,推出了兩款最新的視頻模型PixelDance1和Seaweed2。

這種資源上的傾斜,反映的是國內大廠(chǎng)在當下LLM發(fā)展岔路上的關(guān)鍵分歧:算力資源有限的情況下,未來(lái)的大模型到底是要往視頻方向沖,還是繼續在文本上發(fā)力?

這樣的分歧,在OpenAI推出了能搞深度推理的o1模型后,顯得愈發(fā)棘手和關(guān)鍵。

AI視頻硬傷,遭遇市場(chǎng)冷眼

在這樣的關(guān)鍵抉擇上,百度CEO李彥宏前兩天放了個(gè)大招,直接撂話(huà)說(shuō)“百度不碰Sora類(lèi)的視頻生成”。

原因就在于,在百度看來(lái),現在的視頻大模型還不成氣候,離能真正進(jìn)行商用還早著(zhù)呢。用李彥宏的話(huà)來(lái)說(shuō),“10年、20年都可能拿不到業(yè)務(wù)收益”。

而這樣的判斷,也并非空穴來(lái)風(fēng)。

據SimilarWeb統計,位居全球前列的AI視頻生成企業(yè)Luma AI網(wǎng)站在9月的總訪(fǎng)問(wèn)量?jì)H為1181萬(wàn)次,環(huán)比下跌38.49%。

同樣地,身為AI視頻生成領(lǐng)域的“老大哥”的Runway在9月流量?jì)H755.8萬(wàn)次,不及ChatGPT的1/400;

用戶(hù)不買(mǎi)賬,首先得從產(chǎn)品上找原因。

以國內AI視頻生成模型為例,盡管從今年2月Sora出現后,國內的大廠(chǎng)如快手、字節、智譜清言等,都推出了各自的視頻模型,但平心而論,目前所有的視頻模型都存在兩個(gè)難以掩蓋的短板:

其一,是難以做到成本、質(zhì)量二者兼具。

圖源:可靈

以快手的可靈為例,雖然其生成的效果,在國內視頻模型中已算翹楚,但從成本上來(lái)說(shuō),其生成一個(gè)5秒的視頻,需消耗10個(gè)靈感值(1靈感值=1元),生成時(shí)間大約為2~5分鐘。

按照這樣的成本估算,如果要生成一分鐘的短視頻,用戶(hù)至少要花費十余元,等上半個(gè)小時(shí)左右。

而且,這還沒(méi)算上由于A(yíng)I理解不準確,需要重新生成的情況,實(shí)際成本只會(huì )更高。

圖源:可靈

相較之下,身為國內“AI六小虎”之一的智譜清言,雖然開(kāi)放了可免費使用的視頻模型“清影”,但其生成效果實(shí)在不敢恭維,其生成的畫(huà)面有一股濃濃的“90年代3D動(dòng)畫(huà)”的感覺(jué)。

況且,雖然免費了,但其生成時(shí)長(cháng)還是沒(méi)打下來(lái),用戶(hù)生成一個(gè)5秒的片段,照樣要等3~5分鐘。

圖源:智譜清言

AI視頻生成的另一大短板,便是那股始終揮之不去的“AI”味。

這幾乎是所有視頻模型的通病。

無(wú)論人物或物體的外觀(guān),看起來(lái)多么真實(shí)、多么形似,可觀(guān)眾總覺(jué)得哪兒不對勁兒。有一種活生生的“恐怖谷”效應,看著(zhù)就覺(jué)得渾身不自在。

說(shuō)白了,這就是一種技術(shù)不到位的表現。

因為大多數AI視頻生成算法,背后雖然在很努力地模仿現實(shí)世界的物理規則,模仿人和動(dòng)物的運動(dòng)方式,但仍無(wú)法完全理解數據背后的語(yǔ)義和情感。因此生成的內容,在某些細節上顯得缺乏“靈性”。

圖源:可靈

而這明顯的“AI”味,也成了當下大眾對AI作品懷有偏見(jiàn)的重要原因。

由于上述短板的存在,目前火爆于各大視頻平臺的AI視頻,大都以“玩?!薄案阈Α睘橹?,因為只有這類(lèi)“不正經(jīng)”的視頻,才不會(huì )對生成的成本、效果有太高要求。

更悲哀的是,當下的AI視頻賽道雖未大火,但早早面臨“未火先卷”的情況,多家AI視頻生成廠(chǎng)商都對功能進(jìn)行密集迭代,但大多是“錦上添花”而缺乏躍進(jìn)式體驗升級。

以快手的可靈為例,其推出的運鏡控制、高清生成、圖生視頻等功能,國內的各大視頻生成類(lèi)AI,例如智譜的清影、字節的即夢(mèng)也都有。

圖源:可靈

而這種同質(zhì)化的、聊勝于無(wú)的功能,并未能給用戶(hù)體驗帶來(lái)大幅度的改善。

說(shuō)到底,視頻生成類(lèi)賽道的內卷,本質(zhì)上是現在的LLM遇到瓶頸后,一種為了延續“AI故事”的無(wú)奈之舉,但悲哀的是,這樣的故事目前還沒(méi)有一個(gè)大廠(chǎng)能講好。

數據枯竭下,深度推理或是救星

在各種訓練數據行將耗盡的當下,LLM的scaling law的神話(huà)該怎樣繼續?

在OpenAI 的o1模型發(fā)布后,人們意識到,這個(gè)問(wèn)題的答案,就是強化學(xué)習。

對此,月之暗面的CEO楊植麟分析道:決定這一代AI技術(shù)的上限,核心是文本模型能力的上限。

從技術(shù)上來(lái)看,楊植麟此言非虛。

因為即使在多模態(tài)任務(wù)中,文本層面的理解和推理也是必不可少的。以Sora為例,其訓練數據包含了大量“視頻-文本對”,每個(gè)視頻片段都有對應的詳細文本描述,這種配對方式,讓模型能夠建立文本語(yǔ)義和視覺(jué)表現之間的映射。

同時(shí),倘若視頻模型要想取得更大進(jìn)展,例如發(fā)展出完整的敘事結構,就要求文本模型有執行復雜邏輯推理的能力。

如果文本模型無(wú)法規劃復雜敘事,視頻模型也難以突破這個(gè)上限。

因此,LLM未來(lái)的方向實(shí)際上已十分明了:文本模型決定了多模態(tài)的上限,而深度推理又決定了當前文本模型的上限。

正因如此,在o1推出后,國內的諸多大廠(chǎng)如字節、智譜清言、月之暗面等,都紛紛在自家的大模型中開(kāi)通了“深度搜索”功能,這算是深度推理功能的聯(lián)網(wǎng)版本。

但從實(shí)際表現來(lái)看,并非所有廠(chǎng)商都在這方面表現得盡如人意。

在這里,我們以一個(gè)較為考驗深度推理和分析能力的問(wèn)題,來(lái)對字節、智譜清言、月之暗面各自的大模型進(jìn)行一番對比。

這個(gè)問(wèn)題是:分析近三年全球智能手機市場(chǎng)的發(fā)展趨勢,包括各大品牌的市占率變化、技術(shù)創(chuàng )新,以及消費者偏好的變化。

圖源:豆包

首先測評的,是字節的豆包大模型。

可以看到,雖然在整體的水準上,確實(shí)有一些切中要害的關(guān)鍵點(diǎn),但在進(jìn)行回答時(shí),整體的內容、結構顯得十分臃腫、凌亂,并沒(méi)有做太多結構化、精細化的處理,使用戶(hù)在閱讀時(shí),仍感到很大的閱讀負擔和壓力。

圖源:智譜清言

接下來(lái)測評的,是智譜清言的智譜AI。

可以看到,與豆包相比,智譜AI在進(jìn)行深度推理時(shí),結構明顯比豆包更清晰、更有條理,且針對蘋(píng)果、三星、vivo等不同的品牌,具體列出了不同的市場(chǎng)表現、市場(chǎng)份額。

但從整體上來(lái)看,每一部分的總結與分析,仍顯得過(guò)于簡(jiǎn)略。

圖源:KIMI

最后登場(chǎng)的,是月之暗面的kimi。

在開(kāi)啟深度搜索功能后,Kimi在信息的分析、總結上,表現出了更加細致、深入的特點(diǎn),不僅以不同的年份,詳細展示了不同品牌在市場(chǎng)中的份額變化,以凸顯趨勢,且在對技術(shù)創(chuàng )新方面進(jìn)行分析時(shí),十分具體、細致地展示了不同年份中,不同品牌推出的具體技術(shù)。

綜合來(lái)看,Kimi在進(jìn)行復雜問(wèn)題分析時(shí),其推理的深度、精細度,要顯著(zhù)優(yōu)于豆包、智譜AI。

由此可見(jiàn),目前在“深度推理”這一頗為考驗LLM“內功”的分水嶺上,國內廠(chǎng)商已經(jīng)顯示出了顯著(zhù)的差距。

追求大而全,陷入戰略困境

如前所述,自從OpenAI推出o1后,當下大模型的發(fā)展,已經(jīng)到了一個(gè)進(jìn)行戰略選擇的分岔口。

而在這關(guān)鍵的戰略分叉點(diǎn)上,國內的部分大廠(chǎng)如字節,由于自身布局于短視頻業(yè)務(wù)的巨大慣性,并未在深度推理方向進(jìn)行深耕,只是靠著(zhù)低價(jià)競爭,以及“多而不精”的龐雜功能,才硬擠上國內大模型排行榜的頭部。

圖源:豆包

據火山引擎總裁譚待介紹,“豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千Tokens,比行業(yè)便宜99.3%?!?/p>

但一味地降價(jià)追求“性?xún)r(jià)比”,某種程度上透露出的是自身模型缺乏核心競爭力的表現。

與字節類(lèi)似,“AI六小虎”之一的智譜清言,也走上了一條追求“大而全”的路線(xiàn)。簡(jiǎn)言之,目前的智譜,也成了那種“繪畫(huà)、視頻、搜索都要一攬子拿下”的AI企業(yè)。

圖源:智譜清言

但實(shí)際上,這種“大而全”的追求,反映的是一種商業(yè)上的“困獸猶斗”。

這是因為,目前國內企業(yè)主對軟件購買(mǎi)意愿偏低,To B端大模型給企業(yè)帶來(lái)的價(jià)值仍處在割裂狀態(tài),2023年國內大模型市場(chǎng)規模僅有50億元,2024年也僅增加到120億元。

在B端市場(chǎng)狹窄、C端又尚未打開(kāi)的情況下,任何做大模型的企業(yè),唯有不停地融資、燒錢(qián),橫向地擴展用戶(hù),才能讓自己的模型活下來(lái)。

但這種跑馬圈地的邏輯,本質(zhì)上仍是互聯(lián)網(wǎng)時(shí)代的思維,這并不能真正地“救活”AI。因為與互聯(lián)網(wǎng)不同,AI產(chǎn)品的邊界,并不是由用戶(hù)數決定,而是由實(shí)打實(shí)的技術(shù)力決定。

一個(gè)有些反直覺(jué)的現實(shí)是:與視頻生成這類(lèi)耀眼的、更容易令人遐想聯(lián)翩的技術(shù)相比,真正能在C端帶來(lái)突破的,也許是深度推理這類(lèi)既難啃又不性感的技術(shù)。

原因就在于,視頻生成主要服務(wù)創(chuàng )意表達,應用場(chǎng)景相對固定,用戶(hù)群體、變現模式都較為單一,其價(jià)值體現在內容產(chǎn)出,ROI相對直觀(guān)。

從本質(zhì)上來(lái)說(shuō),它更像是一個(gè)效率工具,而不是一個(gè)能帶來(lái)顛覆性改變的技術(shù)。

相較之下,深度推理則屬于基礎認知能力,可以賦能各類(lèi)應用,其突破可帶來(lái)各方向的普遍提升,且其能力可以遷移復用,更易于產(chǎn)生協(xié)同效應。

更重要的是,隨著(zhù)這項技術(shù)的發(fā)展,它對用戶(hù)的理解會(huì )越來(lái)越深入,提供的建議會(huì )越來(lái)越個(gè)性化和精準。

這種持續學(xué)習和進(jìn)化的特性,讓其很難被簡(jiǎn)單的工具或服務(wù)所替代,這正是某些短命的“爆款應用”所需要吸取的教訓。

可惜的是,在這條難而正確的道路上,真正敢于堅持并做出成就的企業(yè),目前仍屈指可數。


亚洲欲色在线观看,一区二区三区在线视频免费观看,国产中文字幕剧情av,99视频精品全部在线播放,亚洲综合小说久久另类区