@科技新知?原創(chuàng )作者丨林書(shū) 編輯丨蕨影
回望2024年,一眾手機廠(chǎng)商諸如蘋(píng)果、榮耀等,都試圖在A(yíng)I手機賽道闖出一條路來(lái)。然而,時(shí)至今日,又有多少廠(chǎng)商交出了令人滿(mǎn)意的答卷呢?
就在上周,華為發(fā)布了最新Mate70系列,不僅搭載了全新麒麟芯片,還支持純血鴻蒙HarmonyOS Next,特別在A(yíng)I影像、隱私保護和智能交互上進(jìn)行了重大升級。尤其是在A(yíng)I方面,華為通過(guò)推出AI動(dòng)態(tài)照片、隔空傳送、智能降噪等九大功能,試圖展示其在智能技術(shù)領(lǐng)域的持續投入。
然而,仔細審視這些創(chuàng )新,不難發(fā)現,它們本質(zhì)上仍然是現有技術(shù)框架下的漸進(jìn)式改良,而非真正意義上的顛覆性突破。例如最被其稱(chēng)道的AI隔空傳送功能,本質(zhì)上不過(guò)是對已有手勢識別技術(shù)的重新包裝。
從技術(shù)上來(lái)說(shuō),它所依賴(lài)的不過(guò)是手機前置攝像頭的感知能力,配合基礎的計算機視覺(jué)算法,實(shí)現簡(jiǎn)單的手勢追蹤和識別。這種技術(shù)在三星、小米等品牌早已有過(guò)嘗試,只不過(guò)都因為交互體驗不夠自然而逐漸被市場(chǎng)遺忘。
至于備受關(guān)注的"僅你可見(jiàn)"功能,其核心技術(shù)不過(guò)是基于面部識別的視線(xiàn)追蹤算法。這項技術(shù)在PC領(lǐng)域早已存在多年,如今不過(guò)是被移植到了手機端。況且,其實(shí)際使用中的局限性顯而易見(jiàn):它要求用戶(hù)必須保持特定的觀(guān)看角度和距離,稍有偏離就會(huì )影響識別效果。
除此之外,此次發(fā)布會(huì )上Mate70展示的其他AI功能,例如AI通話(huà)總結、AI修改照片等,更是一些已經(jīng)司空見(jiàn)慣的“標配技術(shù)”,總體上看并無(wú)太多新意可言。
這些所謂的AI創(chuàng )新,更像是華為在缺乏實(shí)質(zhì)性AI突破的情況下,不得不推出的一些表面功夫。在真正的AI革命面前,這些功能不過(guò)是浮于表面的點(diǎn)綴。
不過(guò),實(shí)事求是地說(shuō),這樣的“創(chuàng )新疲態(tài)”,并不僅僅發(fā)生在華為一家大廠(chǎng)身上。
AI手機的尷尬現實(shí)
事實(shí)上,這一年的AI手機賽道,更像是一場(chǎng)平平無(wú)奇的技術(shù)秀。
蘋(píng)果的iOS 18雖然大肆宣傳"Apple Intelligence",但除了少部分跨應用級的AI調用功能外,其他大部分能力,不過(guò)是將ChatGPT等現成技術(shù)稍作包裝,缺乏根本性的技術(shù)突破。
而榮耀在2024年MWC(世界移動(dòng)通信大會(huì ))上,也重點(diǎn)展示了AI領(lǐng)域的新技術(shù)突破,特別是在A(yíng)gent等方面的技術(shù)進(jìn)展。
從總體上看,其Agent技術(shù)展現出的自動(dòng)化能力,確實(shí)帶給了人們一種“手機即將邁入自動(dòng)駕駛”時(shí)代的想象。
但平心而論,這樣的想象背后,卻藏著(zhù)兩點(diǎn)難以忽視的隱憂(yōu)。
例如,在一鍵點(diǎn)咖啡的場(chǎng)景中,當用戶(hù)瀏覽相關(guān)信息或下達語(yǔ)音指令時(shí),手機Agent就會(huì )直接識別意圖,聯(lián)動(dòng)相關(guān)的外部應用(如支付、地圖、訂餐等),快速完成訂單生成和支付流程。
同樣地,面對“關(guān)閉APP自動(dòng)續費功能”這樣的請求,榮耀的AI Agent也能自動(dòng)操作,找到所有開(kāi)通APP自動(dòng)續費服務(wù)的項目,并詢(xún)問(wèn)用戶(hù)是否要取消。
但站在用戶(hù)的角度來(lái)看,這樣的“便捷”是否真的是一種直戳痛點(diǎn)的改進(jìn)?
在手機這塊方寸之間的屏幕上,各類(lèi)APP的操作,實(shí)際上已經(jīng)簡(jiǎn)化到了一個(gè)接近閾值的狀態(tài),對普通消費者來(lái)說(shuō),點(diǎn)咖啡這些任務(wù),本身并不耗費太多精力,現有的手動(dòng)操作方式已經(jīng)足夠便捷。在此基礎上加入自動(dòng)化功能,邊際效益不但不高,甚至有可能適得其反。
因為自動(dòng)化功能的加入,雖然看似高效,卻可能讓一些用戶(hù)感到學(xué)習和適應成本過(guò)高。
舉例來(lái)說(shuō),目前榮耀AI Agent 的啟動(dòng)方式,主要是依賴(lài)語(yǔ)音交互,但站在用戶(hù)體驗的角度看,這仍是一種被動(dòng)的,需要有意識地使用的功能。以點(diǎn)咖啡這個(gè)場(chǎng)景為例,每當用戶(hù)想下單時(shí),都需要被動(dòng)地用語(yǔ)音告訴手機:“我想點(diǎn)XX味的咖啡,要XX杯?!?/p>
既然都是被動(dòng),這和用戶(hù)自己用手指多花幾十秒操作,又有多大區別?況且,一個(gè)很影響體驗地方是:在公共場(chǎng)合,或其他不便于語(yǔ)音交互的嘈雜場(chǎng)景,這樣的互動(dòng)方式,多少會(huì )讓人覺(jué)得不自在。
此外,雖然Agent系統的主動(dòng)操作功能,強調安全性和隱私保護,但手機 Agent在任務(wù)自動(dòng)化過(guò)程中,總是需要訪(fǎng)問(wèn)用戶(hù)的個(gè)人數據,包括聯(lián)系人、位置信息,甚至是各類(lèi)APP的登錄密碼等。
要避免這樣的隱私問(wèn)題,Agent 系統只能在執行任務(wù)時(shí),一次次地請求用戶(hù)“授權”“確認”(例如其關(guān)閉自動(dòng)扣款的功能),如此一來(lái),便會(huì )不可避免地造成體驗割裂的現象。
既然對用戶(hù)的“擾動(dòng)”如此頻繁,那所謂自動(dòng)化的意義究竟何在?
對于這點(diǎn),前蘋(píng)果設計主管 Jony Ive 認為,AI Agent最大的價(jià)值不是取代用戶(hù)操作,而是創(chuàng )造更自然、更符合人類(lèi)直覺(jué)的交互方式。言外之意,真正的創(chuàng )新在于讓技術(shù)變得“無(wú)形”。
昂貴的AI軍備競賽
Jony Ive 最近與 OpenAI 合作開(kāi)發(fā)新一代AI設備時(shí)提出:“我們需要重新思考人機交互的本質(zhì)。AI不應該是一個(gè)需要學(xué)習使用的工具,而應該像空氣一樣自然存在?!?/p>
前蘋(píng)果設計主管 Jony Ive
對此,Jony Ive提出了關(guān)于“無(wú)形”設計理念的三個(gè)核心觀(guān)點(diǎn):
一是自然交互,當技術(shù)真正成功時(shí),它應該消失在背景中。就像我們不會(huì )意識到空氣的存在一樣,最好的AI交互應該是無(wú)需思考的;二是情境感知,AI Agent不是簡(jiǎn)單的命令執行器,而是要理解用戶(hù)的情境和意圖。它應該在適當的時(shí)候提供幫助,而不是打擾用戶(hù)的思維流;三是人性化設計,技術(shù)應該適應人類(lèi),而不是要求人類(lèi)適應技術(shù)。
簡(jiǎn)而言之,Jony Ive認為,AI應該更多地充當一個(gè)“預判者”的角色,在用戶(hù)產(chǎn)生需求之前就完成準備,而不是被動(dòng)地等待用戶(hù)的指令。
舉個(gè)例子,想象你正在開(kāi)車(chē),手機通過(guò)多維度數據分析(GPS定位、日歷安排、實(shí)時(shí)路況)發(fā)現你可能要去參加下午2點(diǎn)的一個(gè)重要會(huì )議。
這時(shí),AI系統會(huì )主動(dòng)檢測到當前路段正在施工,預計會(huì )造成15分鐘延誤。于是便自動(dòng)計算出你需要提前10分鐘出發(fā),在你還沒(méi)有主動(dòng)查詢(xún)的情況下,就把最優(yōu)繞行路線(xiàn)推送到你的車(chē)載系統。
這樣的交互方式,充分利用了手機作為隨身設備的特性,將各種零散的數據點(diǎn)(位置、時(shí)間、生理數據、日程表等)有機整合,主動(dòng)為用戶(hù)創(chuàng )造價(jià)值,而不是被動(dòng)等待指令。
這才是真正符合移動(dòng)場(chǎng)景的AI應用方式,而不是簡(jiǎn)單地把電腦上的Copilot或ChatGPT搬到手機上。
如果用這樣的標準來(lái)看,很顯然,無(wú)論是華為、榮耀還是蘋(píng)果,都未能達到這樣的“理想境界”。其所謂的“自動(dòng)化”,僅僅是用語(yǔ)音交互+Agent,將原本并沒(méi)多復雜的步驟再精簡(jiǎn)了些許。
這就引出了另一個(gè)重要問(wèn)題:對用戶(hù)來(lái)說(shuō),他們是否真的愿意為目前這些華而不實(shí),錦上添花的“AI功能”支付高昂的溢價(jià)?
對此,華爾街著(zhù)名的科技分析師、被譽(yù)為“科技股教父”之一的Dan Ives評論道:手機廠(chǎng)商在A(yíng)I領(lǐng)域的投入將在2024年達到歷史新高,但這種投入與實(shí)際收益之間存在巨大鴻溝。我們看到的是一場(chǎng)昂貴的“AI軍備競賽”,最終受害的是消費者的錢(qián)包。
前期優(yōu)勢正被稀釋?zhuān)?/p>
面對手機換機周期不斷延長(cháng),以及零部件成本持續攀升的雙重挑戰,對于榮耀來(lái)說(shuō),在過(guò)去的一年多里,其在A(yíng)I方面的投入,不可謂不激進(jìn),2023年,榮耀整體研發(fā)投入占到總營(yíng)收的11.5%,其中AI研發(fā)費用累計已達100億。
盡管自2024年初以來(lái),手機市場(chǎng)已有明顯的復蘇跡象;但如此“豪賭”AI的背后,其目前呈現的錦上添花式的AI功能,究竟能否在將來(lái)真正帶動(dòng)消費者的購機熱,這恐怕要打一個(gè)大大的問(wèn)號。
在獨立的三年多時(shí)間里,榮耀已經(jīng)發(fā)布了Magic系列、數字系列、V系列與X系列四大產(chǎn)品體系,布局了超過(guò)30款手機,覆蓋2000—10000元價(jià)位段。
但問(wèn)題是,為了在連續下行的全球手機市場(chǎng)中站穩腳跟甚至沖擊前五,榮耀不可能僅靠資本們很喜歡的高毛利高端產(chǎn)品來(lái)支撐銷(xiāo)量,還是需要大量的走量機型。
這就和AI手機高昂的投入,形成了一個(gè)尖銳的結構性矛盾。
更諷刺的是,在專(zhuān)業(yè)化的大模型企業(yè)的攻勢下,榮耀等手機廠(chǎng)商重金投入所鑄就的AI優(yōu)勢,實(shí)際上正一點(diǎn)點(diǎn)被稀釋。
今年10月,有著(zhù)國內“AI六小虎”之稱(chēng)的智譜AI,發(fā)布了自身基于A(yíng)gent技術(shù)的手機智能體AutoGLM,直接通過(guò)模擬人類(lèi)操作行為,來(lái)實(shí)現手機上的各種功能。
智譜AI的定位,實(shí)際上是通過(guò)AutoGLM這樣的技術(shù),創(chuàng )造了一個(gè)全新的價(jià)值層:它既不是傳統意義上的應用層,也不是系統層,而是一個(gè)“元操作層”。
大模型企業(yè)的入局,可能暗示了手機AI將來(lái)一個(gè)更大的變化:AI能力正在成為一種“基礎設施”,就像當年的互聯(lián)網(wǎng)一樣。對大模型企業(yè)來(lái)說(shuō),他們不需要完整的系統權限,因為未來(lái)的應用可能更多是基于A(yíng)PI調用的“組合式服務(wù)”,而不是傳統的獨立應用。
如此一來(lái),各大手機廠(chǎng)商推出的獨立AI系統,必定會(huì )受到更多挑戰。但平心而論,即使是這種“實(shí)用性存疑”的狀態(tài),對很多手機廠(chǎng)商來(lái)說(shuō),也已經(jīng)成為了一個(gè)難以觸及的門(mén)檻。
根據益普索發(fā)布的《AI Phone白皮書(shū)》中的衡量標準,目前業(yè)內的手機AI,正處在跨越AI Phone的L2級別,向L3邁進(jìn)。
L3級別要求手機“能夠識別人類(lèi)情感。實(shí)現任務(wù)級自主拆解閉環(huán),人與AI協(xié)作并監督”。
這就是目前榮耀、蘋(píng)果的Agent技術(shù)所達到的狀態(tài)。
然而,這樣一個(gè)并不太高的標準,vivo、OPPO這樣的大廠(chǎng),也不盡然能完全做到。
以vivo為例,其今年展示的AI系統,更多地將焦點(diǎn)放在了“一按一復制,或一按一拖拽”的這種更偏向傳統的AI交互形式。雖然其OriginOS 5號稱(chēng)搭載了vivo自研的手機智能體「PhoneGPT」,能實(shí)現自動(dòng)訂座這樣的功能,但截至目前,其并未展現出公開(kāi)的演示。
同樣地,號稱(chēng)自研了手機大模型的OPPO,在目前的公開(kāi)展示中,也只是將重點(diǎn)放在了AI識圖、AI一鍵問(wèn)屏,或是AI修圖等傳統的功能上,總體上給人感覺(jué)仍停留在不痛不癢,可有可無(wú)的AI Phone的L1級別。
從目前來(lái)看,總體功能聊勝于無(wú),交互方式不夠人性、自然,以及專(zhuān)業(yè)化大模型企業(yè)的競爭等因素,共同構成了目前手機AI所面臨的種種挑戰。
而對于上述的難題,即使是身為行業(yè)巨頭的蘋(píng)果,目前也未能拿出令人滿(mǎn)意的答案。
例如在自動(dòng)化操作方面,Apple Intelligence展示的所謂“智能代理”功能,實(shí)際上是對iOS快捷指令的升級版本。雖然系統能夠理解“幫我訂一張去紐約的機票”這樣的指令,但其執行過(guò)程仍然需要預先配置的應用程序支持。
這樣的情形,似乎讓手機AI陷入了一個(gè)尷尬的境地:既不夠革命性來(lái)滿(mǎn)足市場(chǎng)期待,又不夠完善來(lái)證明其存在的價(jià)值。
但如果回望過(guò)去,我們就會(huì )發(fā)現:這某種程度上,是因為手機廠(chǎng)商們正在重復PC時(shí)代的老路——過(guò)度強調功能堆砌,而忽視了用戶(hù)體驗的本質(zhì)。