摘要:國產(chǎn)大模型跑出一條有特色的超車(chē)彎道。
國產(chǎn)大模型跑出一條有特色的超車(chē)彎道。
@科技新知?原創(chuàng )
作者丨茯神編輯丨賽柯
ChatGPT橫空出世500天之后,OpenAI再給國內趕潮大模型的從業(yè)者潑了一盆冷水。
從一直未能開(kāi)放的中國用戶(hù)注冊和服務(wù),到如今關(guān)閉來(lái)自國內開(kāi)發(fā)者的API接口,領(lǐng)先者的冷漠讓人們感受到殘酷,卻更加清醒。大模型這個(gè)未來(lái)潛力廣闊的賽道上,國產(chǎn)替代已經(jīng)迫在眉睫。
然而,底層基礎設施上的先發(fā)優(yōu)勢,容不得忽略。當初驚艷的GPT-3.5現已升級到了強大的GPT-4,一年后可能還會(huì )隨時(shí)冒出,參數規模預計達到52萬(wàn)億級別的GPT-5。中國后輩們數次無(wú)限拉近身位,但終究落后一籌。
想要彎道超車(chē),國產(chǎn)大模型們只能從自身出發(fā),走出一條中國特色的大模型之路。那些在PC和移動(dòng)互聯(lián)網(wǎng)時(shí)代,脫胎于10億以上觸網(wǎng)人群和海量豐富的場(chǎng)景數據,積累下來(lái)的產(chǎn)品和應用經(jīng)驗,將成為效率最高的加速燃料。
2024年的國產(chǎn)大模型競賽,考較的就是“落地與應用”這道開(kāi)放式必答題。創(chuàng )新工場(chǎng)董事長(cháng)李開(kāi)復日前在公開(kāi)場(chǎng)合中就稱(chēng),中國AI大模型已經(jīng)進(jìn)入到落地為王的階段,今年會(huì )迎來(lái)大模型應用爆發(fā)元年。
作為種子考生之一,科大訊飛旗下的訊飛星火大模型,從去年誕生之初,就把對標以及超越GPT系列當作目標。它以每月都有小升級,半年就有大版本的迭代速度,穩穩走在同行前列,緊緊咬住OpenAI,不負大模型“國家隊”之名。
6月27日在北京的國家會(huì )議中心,訊飛星火大模型的4.0版本又如期亮相,自主可控的底層技術(shù)、軟硬多端的產(chǎn)品序列、豐富多元的場(chǎng)景應用,成為讓人眼前一亮的關(guān)鍵詞,也組合成一份堪稱(chēng)模板的大模型落地賽參考答案,值得同屆考生們汲取靈感。
Part.1
答題先拆題
見(jiàn)題先拆題,是學(xué)霸們常用的應考策略。
國產(chǎn)大模型們想要在今年的落地賽中脫穎而出,就必須認識到目前橫亙在眼前的三座大山:高能耗的算力成本、多環(huán)節的技術(shù)適配,以及產(chǎn)品化的需求定制。
大模型的盡頭是能源,這不是一句笑談。支撐通用大模型實(shí)時(shí)運算生成反饋內容的正是背后最先進(jìn)的無(wú)限算力。根據第三方數據機構SemiAnalysis的評估,OpenAI已經(jīng)使用了約3617臺HGX A100服務(wù)器,其中包含了采購自英偉達的近3萬(wàn)個(gè)GPU。
有媒體曾作出測算,英偉達新一代DGX系列服務(wù)器可整合8張A100共同工作,最大功率是6.5kW,這意味著(zhù)其運行一小時(shí)會(huì )消耗6.5度電,同時(shí)還需要搭配大約同等電量的散熱設備。假如按照平均工業(yè)用電每度0.63元的標準,1臺服務(wù)器工作1天的電費約200元,當規模上升到1000臺時(shí),一天的電費就高達約20萬(wàn)元。
當然,更多的大模型創(chuàng )業(yè)公司選擇了,把自家產(chǎn)品部署在云服務(wù)器廠(chǎng)商的平臺之上。這也導致微軟一邊不計成本地投入OpenAI,另一邊在云業(yè)務(wù)上收獲頗豐。但小公司寄人籬下,產(chǎn)品和服務(wù)又不得不面臨著(zhù)自主性和安全性的考驗。
翻過(guò)成本大山之后,還有技術(shù)適配和需求定制兩道關(guān)卡。
從OpenAI實(shí)驗室中走出來(lái)的大型語(yǔ)言模型技術(shù),早在2017年關(guān)注和立項,直到2022年底才在ChatGPT上大放異彩舉世矚目??萍汲晒霓D化落地不僅離不開(kāi)時(shí)間上的沉淀,更需要開(kāi)發(fā)產(chǎn)品聯(lián)接市場(chǎng)的企業(yè)們發(fā)揮能動(dòng)性。
GPT給國產(chǎn)大模型們指明了一個(gè)方向,卻不能提供數億規模的中文語(yǔ)料,更不懂國內已經(jīng)摸不著(zhù)石頭,走入“無(wú)人區”的工業(yè)和信息化行業(yè)。而打破這些市場(chǎng)、行業(yè)、企業(yè)之間的流通隔閡,引導技術(shù)一步步適配轉化落地的工作,才是后者需要努力攻堅,一分高下的主戰場(chǎng)之一。
基于中文語(yǔ)系的大模型,只是能夠在國內市場(chǎng)上落地,完整的商業(yè)閉環(huán)還少不了可變現的產(chǎn)品化定制。如果停在這最后一道門(mén)前,國產(chǎn)大模型只會(huì )淪為千篇一律的類(lèi)ChatGPT模式,用戶(hù)們看到的只有一個(gè)在搜索引擎上見(jiàn)慣了的輸入框。
微軟、谷歌這些國外的大模型領(lǐng)先者,都在嘗試把技術(shù)融入到自己傳統的辦公、搜索產(chǎn)品當中,國產(chǎn)大模型們更應該發(fā)揮自身優(yōu)勢,提前做好下游產(chǎn)品的需求挖掘和定制規劃。而這個(gè)過(guò)程中,那些本身已具備深厚的AI類(lèi)產(chǎn)品經(jīng)驗和市場(chǎng)積累的玩家,與考前押中一道大題簡(jiǎn)直無(wú)異。
以上大模型落地賽的三個(gè)難點(diǎn),既是門(mén)檻又何嘗不是機遇。剛剛發(fā)布的訊飛星火V4.0,就展示出其各種轉危為機的倒推式解題手法。
Part.2
倒推法解題
倒推式解題法是數學(xué)競賽中常用的解題思路,考驗的是答題者的逆向思維運用。面對市場(chǎng)給出的商業(yè)化大題,企業(yè)們采用倒推,從客戶(hù)或用戶(hù)的需求出發(fā),也不失為走出困境的良策。
訊飛星火V4.0的發(fā)布,給予自己的定位就是倒推得來(lái)。正在逐步走進(jìn)的AI時(shí)代,人們最需要的終極AI產(chǎn)品會(huì )是什么形態(tài)?不少科幻電影中其實(shí)已經(jīng)給出答案,就像《鋼鐵俠》系列中的超級智能管家“賈維斯”一樣。
賈維斯能夠在鋼鐵俠的工作、生活甚至拯救世界的過(guò)程中無(wú)縫切換、無(wú)微不至,訊飛星火V4.0就提出要做一個(gè)在你身邊,時(shí)刻懂你的AI助手。
面向C端,訊飛星火V4.0做到了懂用戶(hù)。它沒(méi)有只給用戶(hù)一個(gè)冰冷的輸入框,而是在A(yíng)PP中細分為寫(xiě)作、編程、工作、學(xué)習、生活、親子、翻譯等各種各樣的助手,讓用戶(hù)需求與場(chǎng)景自然融合,大大降低操作門(mén)檻。
正因如此,自去年9月訊飛星火正式全民開(kāi)放后,僅可統計到的安卓渠道下載量已經(jīng)累計1.31億次,部分高頻場(chǎng)景的用戶(hù)使用次數也達到了數百萬(wàn)甚至數千萬(wàn)次。
最新的版本中,為了實(shí)現千人千面的用戶(hù)體驗,訊飛星火加入了人設模板,可以一鍵設置個(gè)人助手的表達風(fēng)格;用戶(hù)如果想要打造只屬于自己的個(gè)性化助手,只需要在“個(gè)人空間”中上傳自己的工作、生活、學(xué)習等資料,再選擇性地結合外部信息一并參考,就能生成萬(wàn)千人海中獨一無(wú)二的存在??磥?lái)僅是懂用戶(hù)還不夠,要有針對性地懂每一個(gè)用戶(hù),才是訊飛星火的追求。
不僅是手機端的APP,由星火大模型在后臺賦能的訊飛智能助聽(tīng)器,讓湖北的一位老年用戶(hù)從聽(tīng)力受損的狀態(tài)中擺脫,既能智能檢測聽(tīng)力狀態(tài),又能精準過(guò)濾背景噪音提升有效信息音量。一個(gè)懂你的AI助手,甚至能改變一個(gè)人的生活軌跡。
面向B端,訊飛星火V4.0做到了懂企業(yè)。星火大模型為了解決企業(yè)大模型應用的“最后一公里”問(wèn)題,選擇用智能體平臺打造專(zhuān)屬于每個(gè)崗位的工作助手。
復雜的企業(yè)需求不能用簡(jiǎn)單的一句話(huà)去概括,但可以在清晰地認識到大模型能力的邊界后,把不同難度的任務(wù)分解成原子化的獨立需求,分別完成后再進(jìn)行串聯(lián)整合。
如此搭建出來(lái)的企業(yè)智能體平臺,是建立在科大訊飛的AI原子能力、外部信源集成,以及企業(yè)內部的IT系統打通等基礎之上的。目前的星火企業(yè)智能平臺已經(jīng)覆蓋到首批32個(gè)企業(yè)從生產(chǎn)、科研、辦公到管理中特別需要的相關(guān)智能體,如商機、銷(xiāo)售、客服、科技情報以及編程等。其中表現突出的代碼智能體iFlyCode,已經(jīng)趕上了現在GPT-4 Turbo的最新水平。
從不同終端場(chǎng)景中的需求出發(fā),訊飛星火V4.0沒(méi)有粗暴地統一標準對待,而是仔細分類(lèi)、認真匹配,但想要高效地滿(mǎn)足需求仍離不開(kāi)底層大模型技術(shù)的扎實(shí)過(guò)硬。
軟硬一體、自主可控是科大訊飛在大模型之路上追求的目標。去年10月,在科大訊飛提供大量算子庫和算法資源的基礎上,華為開(kāi)發(fā)出國內首個(gè)國產(chǎn)萬(wàn)卡算力集群“飛星一號”。星火大模型就是借此訓練而成,每一行代碼、每一個(gè)數據都牢牢握在中國人手里,還獲得國家網(wǎng)信辦等八個(gè)部委聯(lián)合認證。
如今升級到4.0版本的訊飛星火,已經(jīng)成功對標了目前最好的通用認知大模型GPT-4 Turbo,甚至在文本生成、語(yǔ)言理解、知識問(wèn)答、邏輯推理、數學(xué)等能力上實(shí)現超越,不過(guò)在代碼和多模態(tài)能力上還有差距,但在復雜指令的表現中又明顯領(lǐng)先。
先弄清楚市場(chǎng)真正想要什么,再設計出符合需求的產(chǎn)品形態(tài),最后為了達到產(chǎn)品目標,花大力氣自主科研,這條自下而上倒推的國產(chǎn)大模型之路,算是給今年的落地賽寫(xiě)下了一份可參考的答案。
Part.3
解法成共識
訊飛星火V4.0的發(fā)布,或許會(huì )成為國產(chǎn)大模型500余天征程路上的一道分水嶺。其所展露出的重視用戶(hù)、強調價(jià)值等理念,已經(jīng)見(jiàn)到市場(chǎng)上愈來(lái)愈多的同行跟上。
驀然回首,2023年的“百模大戰”恍如隔世。僅僅在2022年底ChatGPT發(fā)布幾個(gè)月后,國內宣布跟進(jìn)大模型賽道的互聯(lián)網(wǎng)大廠(chǎng)和初創(chuàng )企業(yè),就已經(jīng)超過(guò)了100個(gè)之多。
為了盡快問(wèn)世自己的產(chǎn)品,或者拿出能夠比肩ChatGPT的有效證明,參數級別和算力規模成為眾多企業(yè)爭相比拼的關(guān)鍵。有英偉達在國內的供應商曾對外表示,一年之內,A100芯片市場(chǎng)上的售價(jià)就翻了一倍,主要的大客戶(hù)涵蓋了騰訊、百度、字節跳動(dòng)、阿里巴巴等互聯(lián)網(wǎng)巨頭,而創(chuàng )業(yè)公司較少。
畢竟資本市場(chǎng)更加青睞快速驗證的輕資產(chǎn)模式,大筆現金燒向底層基礎設施,遠遠沒(méi)有快速落地產(chǎn)品試水市場(chǎng),來(lái)得劃算。紅杉資本去年就曾撰文《生成式 AI 的第二幕》稱(chēng),目前生成式 AI 應用的最大問(wèn)題,是需要證明自身的價(jià)值,因為目前基于基礎大模型開(kāi)發(fā)的應用用戶(hù)留存率明顯不夠。
大廠(chǎng)們的動(dòng)作不可謂不快。阿里巴巴內部孵化出的爆款應用妙鴨相機,一度在社交媒體上刷屏;字節跳動(dòng)旗下的豆包APP,也從上線(xiàn)初就非常注重擬人化的體驗;科大訊飛更是憑借多年在A(yíng)I產(chǎn)品和服務(wù)領(lǐng)域積累的經(jīng)驗,不僅推出訊飛星火APP,還把星火大模型內嵌到汽車(chē)、家電、教育、醫療等場(chǎng)景當中,讓用戶(hù)看不見(jiàn)卻用得著(zhù)。
C端卷的是應用,B端卷的就是客戶(hù)。
今年5月初,央企龍頭中國石油集團就傳出要加快數字化建設的步伐,隨后集團領(lǐng)導先后邀請百度李彥宏、科大訊飛劉慶峰交流會(huì )談,大有廣納業(yè)內賢才良言之意。最終在月底的昆侖大模型建設研討會(huì )上,中國石油選定的合作對象由中國移動(dòng)、華為、科大訊飛強強聯(lián)手,組成了一支能源化工領(lǐng)域的人工智能“國家隊”。而百度雖也早先贏(yíng)得與中國石油管道局設計院的合作,卻在這次工業(yè)大模型之爭中遺憾略遜。
競爭不會(huì )停歇,還要放眼未來(lái)。隨著(zhù)技術(shù)與行業(yè)之爭的白熱化,國家層面引導扶持的介入,也是一股不可小覷的力量。比如從2017年開(kāi)始多次改革的國家科學(xué)技術(shù)獎,更為強調國家戰略導向和與重大戰略需求的緊密結合。
就在這逐年趨嚴的背景下,2023年的國家科學(xué)技術(shù)獎評選中,華為、阿里云、科大訊飛、小米等科技巨頭紛紛上榜,其中科大訊飛又憑借“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項目,斬獲國家科學(xué)技術(shù)進(jìn)步獎一等獎,成為近十年來(lái)AI領(lǐng)域首個(gè)獲此殊榮的企業(yè)。
國產(chǎn)大模型們之爭還遠遠沒(méi)到終局的時(shí)候,僅是目前的落地賽,也不是一次交卷定輸贏(yíng)。訊飛星火V4.0的發(fā)布,走在了行業(yè)前面,更要耐得住同行的奮力追趕。未來(lái)的大模型不管再會(huì )卷向何方,但都不會(huì )背離商業(yè)化市場(chǎng)的本質(zhì)規律,那就是拼技術(shù)積累、拼用戶(hù)規模、拼客戶(hù)實(shí)力、拼社會(huì )認可。這可能就是訊飛星火一直都能領(lǐng)先一點(diǎn)的秘籍所在。