大廠(chǎng)紛紛入局,百度、阿里、字節搶奪Agent話(huà)語(yǔ)權
摘要:今年大廠(chǎng)們沖刺Agent成了共識,字節扣子“大戰”心響、夸克,但Agent還未到“GPT時(shí)刻”。
作者丨櫻木編輯丨江籬
2025年5月,紅杉資本AI峰會(huì )在舊金山落下帷幕,在這場(chǎng)包含 Open AI 創(chuàng )始人 山姆·奧特曼 以及 谷歌首席科學(xué)家Jeff Dean 等 150位全球頂尖AI公司創(chuàng )始人 、科學(xué)家以及投資人 的大會(huì )中,一個(gè)共識逐漸被確立下 來(lái) —— 即 下一輪 AI,賣(mài)的不是工具,而是收益。 這句看起來(lái)有些跳躍的話(huà), 紅杉 給出了 一個(gè)模式 性的解釋?zhuān)次磥?lái)AI將 從賣(mài)工具到賣(mài)協(xié)作,最終走向賣(mài)成果(Software as an Outcome)。
如何從賣(mài)工具到賣(mài)結果,這場(chǎng)紅杉的峰會(huì )更具落地的意義,也許在于強調了Agent的價(jià)值。隨后,硅谷大廠(chǎng)開(kāi)啟了第一波加速, 微軟CEO納德拉在主題演講中宣布:“我們已經(jīng)進(jìn)入了AIAgent 時(shí)代,正在見(jiàn)證AI系統如何以全新方式幫助我們解決問(wèn)題?!監pen AI CEO山姆·奧特曼宣布,推出面向開(kāi)發(fā)者的新Codex 智能體,稱(chēng)“這可能是編程史上最大的變革 ?!?/p>
而在大洋這一端的國內市場(chǎng),已經(jīng)蠢蠢欲動(dòng)的大廠(chǎng)們,似乎也有了相同的判斷,從字節、百度、阿里的動(dòng)作來(lái)看,頭部互聯(lián)網(wǎng)大廠(chǎng)紛紛加速布局Agent應用。據內部人士透露,字節已經(jīng)有7個(gè)團隊在競速Agent,而百度在前不久的create大會(huì )中直接拿出了心響,聲稱(chēng)其為直接可用的Agent。而在阿里一側,夸克內部已經(jīng)自我定位為“超級Agent”。
而除了通用Agent之外,各個(gè)大廠(chǎng)在垂類(lèi)Agent方面也在不斷加速。阿里飛豬問(wèn)一問(wèn),百度旗下的法行寶等也在不斷擴張。
Agent 作為大模型之后 的 第二波確定性浪潮,已經(jīng)開(kāi)啟了加速爭奪,而最后 影響戰局的變量 , 除了各家的生態(tài)厚度,還有對于心智、用戶(hù)習慣的占領(lǐng)。 這也就意味著(zhù)最終能夠參戰的,也許只剩下阿里與百度 、 字節、騰訊等少數玩家,而率先出牌的百度與阿里,能否搶得先機,值得一番拆解。
Agent爆發(fā)年,也是沖刺年
第一個(gè)叫醒大廠(chǎng)的,顯然是Manus,這家由真格基金投資的國產(chǎn)Agent團隊,在 2025年3月初 突然上線(xiàn)了Manus , 從開(kāi)啟內測伊始,就贏(yíng)得了全世界的關(guān)注?!?0萬(wàn)元搶一內測碼”、“一碼難求”等熱詞刺激著(zhù)人們的神經(jīng)。主流觀(guān)點(diǎn)第一次意識到,基于主流大模型的Agent居然能夠實(shí)現如此強大的實(shí)操型功能應用與用戶(hù)體驗。而大廠(chǎng)的動(dòng)作,似乎從那時(shí)起,就開(kāi)啟了加速。
字節是飽和攻擊的代表。在晚點(diǎn)的報道之中,3月初, 智能體應用 Manus 出圈前后,字節已有至少5個(gè)團隊在開(kāi)發(fā)不同智能體產(chǎn)品,其中有些是對內工具。 而這一數字在4月底時(shí),已經(jīng)達到了7個(gè)團隊。4月底,字節的flow團隊拿出 定位為 “用戶(hù)與AI Agent 協(xié)同辦公的最佳場(chǎng)所” 的扣子空間并開(kāi)啟內測,扣子 基于自研的豆包大模型(如豆包1.5Pro)構建,支持 MCP(模型上下文協(xié)議)協(xié)議,可調用飛書(shū)多維表格、高德地圖、圖像工具等組件 。
而百度的動(dòng)作,也可以從李彥宏的發(fā)言中看出端倪。在4月的百度create大會(huì )之中,李彥宏直接表明“ AI的終極價(jià)值在于應用落地,而智能體是連接模型能力與用戶(hù)需求的核心載體 ”,就在大會(huì )期間,百度一口氣拿出了通用智能體心響,同時(shí)宣布mcp全兼容。
而另一方面,阿里也沒(méi)有放松,基礎模型的優(yōu)勢,以及對夸克、釘釘的加碼,讓其在tob和toc端都有了競爭的實(shí)力。
從大模型的競爭,到Agent的競爭,大廠(chǎng)到底在角逐什么?簡(jiǎn)而言之,是技術(shù)加速后,交互方式的變化,對生態(tài)級別的入口爭奪。
一個(gè)典型的類(lèi)比,就是在大模型時(shí)代,當DeepSeek出現之后,由于其技術(shù)的領(lǐng)先性,沒(méi)有花費任何營(yíng)銷(xiāo)費用,就輕松獲取了龐大的用戶(hù)量,而騰訊憑借著(zhù)元寶對DeepSeek的鏈接,直接搶奪到了大模型時(shí)代的入場(chǎng)券。今天的Agent也是一樣的邏輯,技術(shù)的底層已經(jīng)成型,誰(shuí)家的產(chǎn)品可以快速的成型,就意味著(zhù)對市場(chǎng)碾壓級別的領(lǐng)先。
在紅杉分享會(huì )中,一個(gè)特殊的方向也被提到,即 企業(yè)級市場(chǎng)中,真正先跑出來(lái)的入口未必是通用大模型,而是Harvey(法律)、Open Evidence(醫療)這類(lèi)垂直領(lǐng)域智能體 OS,因為它們能聽(tīng)懂行業(yè)語(yǔ)言,理解真實(shí)需求。 而對于這兩個(gè)Agent,其中open evidence大家較為熟悉,投資人朱嘯虎在多次訪(fǎng)談中提及,作為 專(zhuān)為醫生設計的AI診斷輔助工具,通過(guò)精準的臨床支持和創(chuàng )新的商業(yè)模式,迅速在美國醫生群體中普及。
所以可以看到的是,Agent的潛力不僅局限在某一兩個(gè)應用上,更重要的則是生態(tài)級別的入口。而從這個(gè)角度來(lái)看,大廠(chǎng)無(wú)論是做智能體生態(tài),垂直應用Agent,還是做通用Agent(心響、扣子,以及夸克)似乎都是必須要爭奪的方向。
勝負手在哪兒?
“Manus能夠成功,我們可以看到它用的是cloude3.5模型?!泵厮?chuàng )始人在一檔播客欄目中曾經(jīng)評價(jià)到。從某種程度來(lái)說(shuō),這也意味著(zhù)行業(yè)內的共識,最明顯的例證來(lái)自于字節的扣子團隊。
在晚點(diǎn)的報道中 “扣子是個(gè)開(kāi)放的平臺,如果國內有大模型效果比豆包好,我們也會(huì )積極使用?!笨圩訄F隊開(kāi)發(fā)扣子空間時(shí),豆包深度思考模型還沒(méi)發(fā)布,他們曾考慮優(yōu)先使用 DeepSeek -R1,測試后發(fā)現它調用工具的能力不夠。
后來(lái)團隊又對比六款國內大模型,使用了豆包1.5 Pro為主的多款模型。因為豆包在指令遵循、調用工具,以及多模態(tài)處理能力上表現最好,而且推理成本很低,能支撐大規模調用。
而這一觀(guān)點(diǎn),也被行業(yè)內廣泛認同,拾象科技李廣密曾在播客中坦言,預訓練可能會(huì )重新變得重要,而大模型的能力也決定著(zhù)Agent等能力。
從這個(gè)角度來(lái)看,百度、阿里與字節幾乎可以說(shuō)不分伯仲。百度拿下了與蘋(píng)果的合作,從某種程度來(lái)說(shuō),蘋(píng)果作為智能手機行業(yè)最大的入口,承認了百度在模型能方向上的能力。而阿里則擁有qwen這個(gè)可能是最優(yōu)秀的開(kāi)源大模型。對于字節來(lái)說(shuō),基于豆包大模型的產(chǎn)品長(cháng)期霸占著(zhù)c端下載量,實(shí)力也非常出眾。而三方大量資源的傾注,讓這場(chǎng)爭奪愈發(fā)激烈。
當然,從Agent應用的角度來(lái)看,生態(tài)的厚度也是考量勝負手的關(guān)鍵。 Agent 的 本質(zhì)上其實(shí)就是能夠“讓 AI 真正實(shí)現自主完成任務(wù)” , 而相關(guān)能夠調用的應用的能力也是其能否贏(yíng)得戰役的關(guān)鍵。
這一點(diǎn),幾家大廠(chǎng)的選擇似乎有所區別, 百度 開(kāi)放了 大模型和千帆開(kāi)發(fā)平臺兼容,地圖、文庫、網(wǎng)盤(pán)、 Comate 也 開(kāi)放了MCP Server。 但字節則相對保守,更愿意自身成為全新的Agent工廠(chǎng),阿里把所有都集合在夸克之中,超級框的概念,就是另一種能力上的調用。
而從行業(yè)從業(yè)者3月的一份數據來(lái)看,阿里的厚度優(yōu)勢明顯。從該報告來(lái)看,國內調用較高的MCP Servers,包含了高德地圖、notion、支付寶,以及minimax,而其中高德地圖憑借著(zhù)提供全場(chǎng)景覆蓋的地圖服務(wù),包括地理編碼、逆地理編碼、IP定位、天氣查詢(xún)、騎行路徑規劃、步行路徑規劃、駕車(chē)路徑規劃成為被調用較高的APP。
當然,評價(jià)生態(tài)的厚度的變量還有很多,但可以看出的是,阿里的領(lǐng)先優(yōu)勢正在擴大。
從形態(tài)上來(lái)看, Agent 仍然是一種社交,而從社交的視角來(lái)看,騰訊系則無(wú)疑占據著(zhù)強大的優(yōu)勢。騰訊總裁劉熾平回應道:“在微信生態(tài)系統內,我認為我們有機會(huì )創(chuàng )造一個(gè)非常獨特的Agent,即AI與微信生態(tài)系統特有的內容相連接,包括社交、通信和社區能力以及內容生態(tài)系統,比如公眾號和視頻號,以及數以百萬(wàn)計的小程序。實(shí)際上你可以接入各種信息,以及許多不同垂直應用程序的交易和操作能力?!?/p>
獨一無(wú)二的社交生態(tài),讓騰訊特別是微信Agent也成為了不容忽視的力量。
此外,成本也是Agent能否完成蛻變的另一重關(guān)鍵。3月18日,The Information報道,Manus現階段的產(chǎn)品同時(shí)受制于其服務(wù)器容量和高昂的運營(yíng)成本。據兩位直接了解情況的人士透露,Manus使用人工智能公司Anthropic的模型,平均每完成一項任務(wù)需向Anthropic支付2美元。
總結來(lái)看,基礎模型能力、生態(tài)厚度、成本等都在成為Agent能否突出重圍的關(guān)鍵,而從當下來(lái)看,這些變量的發(fā)酵暫時(shí)難以區分明顯的優(yōu)劣。
Agent還未到“GPT時(shí)刻”
盡管大廠(chǎng)的競速與 Manus 等爆款產(chǎn)品的出現讓 Agent 賽道熱度飆升,但 可以確認的是,當 前行業(yè) 似乎 遠未達到類(lèi)似 GPT 的顛覆性臨界點(diǎn)。從技術(shù)成熟度、商業(yè)模式落地到用戶(hù)心智占領(lǐng),Agent仍需跨越多重鴻溝。
一方面, 當前 Agent 的核心能力仍高度依賴(lài)大模型,但模型本身存在顯著(zhù)局限性。CSDN博客指出,在處理多步驟任務(wù)時(shí),大模型的規劃能力容易崩潰,例如銀行轉賬這類(lèi)需十幾步操作的流程,模型常因邏輯鏈斷裂而失敗。
同時(shí), 盡管大廠(chǎng)紛紛推出 Agent 平臺,但生態(tài)整合仍處于碎片化狀態(tài) , “各自為戰”的局面導致工具調用接口不統一。不同 Agent 對其功能的調用方式差異顯著(zhù),開(kāi)發(fā)者需重復適配。
紅杉峰會(huì )提出的“Software as an Outcome”理念雖被廣泛認同,但落地路徑仍不清晰。當前 Agent 主要以訂閱制或按調用次數收費,本質(zhì)上仍是工具思維。例如, Manus 的高成本導致其難以向中小企業(yè)普及,而百度心響雖宣稱(chēng)直接可用,但企業(yè)用戶(hù)更關(guān)注其能否真正提升銷(xiāo)售轉化率或降低運營(yíng)成本。
此外, 垂直領(lǐng)域的探索雖初現曙光,但規?;孕钑r(shí)間。阿里飛豬問(wèn)一問(wèn)在旅游場(chǎng)景的表現可圈可點(diǎn),百度法行寶在法律領(lǐng)域也積累了案例,但這些垂類(lèi) Agent 的行業(yè)滲透率仍 然不高 。用戶(hù)對 Agent 的信任度尚未建立,尤其在涉及敏感數據的場(chǎng)景中,企業(yè)更傾向于保留人工審核環(huán)節。
當前 Agent 的用戶(hù)體驗呈現明顯的兩極分化。垂直場(chǎng)景如設計領(lǐng)域的Lovart,通過(guò)整合行業(yè)知識庫和多模態(tài)輸出,實(shí)現了“需求 - 交付”全閉環(huán),設計師可直接基于其生成的分層文件進(jìn)行迭代,效率提升數倍。但通用 Agent 如 Manus ,在處理復雜任務(wù)時(shí)仍顯得笨拙——例如生成設計圖時(shí)可能出現字體過(guò)小、元素堆砌等問(wèn)題,用戶(hù)需頻繁手動(dòng)調整。
更關(guān)鍵的是,用戶(hù)對 Agent 的期待與實(shí)際能力存在落差。部分用戶(hù)誤認為 Agent 能完全替代人類(lèi),而實(shí)際上其在模糊指令解析、任務(wù)邊界把控等方面仍需人工干預。
Agent 的爆發(fā)印證了AI從技術(shù)到應用的躍遷,但距離真正的“ GPT時(shí)刻”仍有漫長(cháng)道路。
當前的競爭本質(zhì)上是生態(tài)卡位與場(chǎng)景定義權的爭奪 ,大廠(chǎng)的角逐 布局 似乎都 在為未來(lái)的生態(tài)戰爭鋪路。而決定最終勝負的,不僅是技術(shù)迭代速度,更是對行業(yè)痛點(diǎn)的理解深度與商業(yè)模式的創(chuàng )新勇氣。當 Agent 能像水電煤一樣融入日常生活,真正的變革才會(huì )到來(lái)。
晚點(diǎn)latepost《字節AI再創(chuàng )業(yè):獨立組織、全鏈條的飽和攻擊》
新皮層newthings《 掌權一年半來(lái),吳泳銘是如何管理阿里巴巴的 》
騰訊科技 《 微軟一晚上發(fā)了50個(gè)新東西,要建一個(gè) Agent 互聯(lián)的“伊甸園” 》
AI深度研究員《 只談生存:AIAgent 倒計時(shí) 730 天,硅谷 3 位“異見(jiàn)者”給出 3 條活路 》
AI深度研究員《 紅杉 AI 峰會(huì )閉門(mén) 6 小時(shí),150 位創(chuàng )始人共識浮現:AI 不再賣(mài)工具,而是賣(mài)收益 》
中國企業(yè)家《 AI新戰場(chǎng),騰訊押注 Agent 》