實(shí)測4款頭部PPT生成大模型:配圖錯誤頻發(fā)、數據可視化集體翻車(chē)
大模型從圖文、圖片、視頻卷到了PPT生成,但距離“一鍵生成”的終極目標還有明顯距離,這就得看誰(shuí)能持續“燒錢(qián)”完成進(jìn)步了。
@科技新知?原創(chuàng )
作者丨余寐?編輯丨賽柯
繼聊天機器人、文本創(chuàng )作、圖像生成、視頻生成之后,大模型高調“卷”入PPT生成中。
入局者既包括傳統辦公軟件開(kāi)發(fā)商,如金山辦公推出WPS AI、iSlide推出iSlide AI;也包括互聯(lián)網(wǎng)巨頭百度、阿里等攜百度文庫、夸克AI PPT出場(chǎng);還有科大訊飛、天工AI、月之暗面Kimi等AI領(lǐng)域的重量級選手。各家紛紛拿出看家本領(lǐng),爭相在PPT賽道上贏(yíng)得先機。
比如,國產(chǎn)大模型Kimi聯(lián)合AiPPT推出PPT助手,而科大訊飛也不甘示弱,發(fā)布了訊飛智文2.0版本的智能文檔AI助理,一鍵生成PPT升級版。這些工具不僅能提煉文檔核心生成大綱,還能一鍵切換主題模板,甚至支持多文檔到PPT的轉換……每一個(gè)功能都寫(xiě)著(zhù)“省時(shí)省力”,每一個(gè)營(yíng)銷(xiāo)點(diǎn)都體現著(zhù)“卷”的決心。
畢竟“天下苦PPT久矣”,PPT制作一直是職場(chǎng)人士的一大痛點(diǎn),技術(shù)的較量若能推動(dòng)辦公生產(chǎn)力的革新,用戶(hù)自然喜聞樂(lè )見(jiàn)。但是,面對如此硬核的用戶(hù)真需求,如若企業(yè)只是打著(zhù)AI的幌子交一份偽答卷,無(wú)疑將達到反效果,傷了用戶(hù)的心。
因此,「科技新知」本次將在國產(chǎn)大模型中挑選四名選手進(jìn)行實(shí)測,包括Kimi、訊飛智文、百度文庫、WPS,以觀(guān)察大模型企業(yè)對打工人的誠意幾何。
為確保測評結果的客觀(guān)性和參考價(jià)值,我們采用以下設定:
1.使用統一的中文提示詞,包括簡(jiǎn)易提示詞和復合提示詞;
2.每個(gè)大模型的測試項目都包括:輸入主題生成PPT、上傳文檔生成PPT;
3.統一使用電腦網(wǎng)頁(yè)版及其默認設置;
4.統一呈現一次生成結果,不進(jìn)行二次調整優(yōu)化。
以下是各個(gè)模型表現情況:
生成方式1: 輸入主題生成PPT
指令:你是一名經(jīng)驗豐富的影視產(chǎn)業(yè)觀(guān)察者,被邀請至高校的課堂做分享,主題是2024年國內五一檔電影及其票房分析,現在需要你據此做一份PPT,要求要有清晰的結構和邏輯,精準的數據支持,精美的視覺(jué)設計,須包含圖表,總頁(yè)數不超過(guò)20頁(yè)。
指令說(shuō)明:作為一個(gè)信息溝通工具,PPT應有效地在繁雜的信息中提煉要點(diǎn)、歸納總結,并將多數據部分做可視化呈現。因此,為測試這幾款AI PPT的基本能力,本輪測試專(zhuān)門(mén)選用具備多主體、多數據主題。
WPS AI:左右滑動(dòng)查看更多
WPS AI:近900字的PPT大綱,層級分明、內容全面,不禁讓人對這個(gè)匯報充滿(mǎn)期待,但最終生成的PPT卻只是把大綱填充進(jìn)用戶(hù)所挑選的模板中,具體內容仍需用戶(hù)自行檢索、歸納、分析。
如“背景介紹”部分,WPS AI非常直白地留下一句“分析2024年國內五一檔電影市場(chǎng),了解電影產(chǎn)業(yè)發(fā)展趨勢”,相當于只給用戶(hù)提供一個(gè)思考思路,但相信不少讀者跟「科技新知」一樣,希望AI能完成到分析這一步;對于“影視產(chǎn)業(yè)現狀概覽的市場(chǎng)規?!币矁H有一句“高度概括”的表述:國內影視產(chǎn)業(yè)持續增長(cháng),市場(chǎng)規模不斷擴大——水得太明顯了。
Kimi
Kimi:1分鐘的時(shí)間里,Kimi生成了近2000字的大綱,試圖用20頁(yè)PPT完成背景介紹、情況簡(jiǎn)介、票房數據分析、受眾分析、成敗因素分析、營(yíng)銷(xiāo)策略分析、政策環(huán)境與市場(chǎng)監管、未來(lái)市場(chǎng)展望……只能說(shuō)全面,十分全面。但問(wèn)題也在于此——主題不突出,未能聚焦“2024年國內五一檔電影及其票房分析”。
和WPS AI一樣,在“一鍵生成PPT”上,Kimi給到的也是一個(gè)思路框架、分析模板,如在“2024年票房數據分析”中,Kimi給出的回答是“詳細列出2024年五一檔期間各部影片的票房數據,包括總票房、單日票房、觀(guān)影人次等關(guān)鍵指標。分析票房數據背后的市場(chǎng)因素,如影片質(zhì)量、宣傳力度、觀(guān)眾口碑等?!辈坏貌怀姓J,這是一個(gè)相當完整的分析思路,相較于WPS AI也更為詳細。
百度文庫:左右滑動(dòng)查看更多
百度文庫:如圖所示,百度文庫所生成的PPT目錄頁(yè)即其大綱的全部,看起來(lái)是位惜字如金的選手。意料之外的是,低期待等來(lái)了小驚喜,在前三個(gè)產(chǎn)品的測試中,百度文庫幾乎是最符合「科技新知」對“一鍵生成PPT”所設想的,包括結構完整、詳略得當、主題突出、能引用官方數據并做分析。
但在生成大綱環(huán)節上,百度文庫出現兩段100%重復的內容,由此生成出來(lái)的PPT也同樣發(fā)生重復。但基于其在內容上的優(yōu)異表現,這點(diǎn)不足倒也影響不大,只增加了后期手動(dòng)刪除的步驟。
訊飛智文:左右滑動(dòng)查看更多
訊飛智文:出現多處排版疊字現象,但瑕不掩瑜,有別于WPS AI和Kimi的籠統和全面,訊飛智文對主題的把握更為準確,能夠合理分配各部分內容的比例,并能?chē)@主題對相關(guān)維度做有效分析,如不同影片類(lèi)型分布及特點(diǎn)、購票渠道與觀(guān)影模式、重點(diǎn)城市票房數據等;信息抓取和文本生成能力較為突出,符合主題且有足夠的豐富度。
生成方式2: 上傳文檔生成PPT
指令:你是一名大學(xué)生,要做一個(gè)課程期末匯報,文檔名稱(chēng)為“電影《傲慢與偏見(jiàn)》人物形象分析匯報”,字數1500,包含電影簡(jiǎn)介與創(chuàng )作者簡(jiǎn)介、故事梗概、主要角色人物形象分析、人物刻畫(huà)手法及小結,請你根據這份匯報講稿生成一份PPT。
指令說(shuō)明:這項測試是為根據文檔生成一份匯報演講稿。按一般人平均語(yǔ)速約240字/分鐘計算,整個(gè)匯報約6分半。主要評估AI的語(yǔ)言和場(chǎng)景理解能力、文本閱讀能力、概括提煉能力等。
WPS AI:左右滑動(dòng)查看更多
WPS AI:整體而言,是名簡(jiǎn)約派選手,包含封面及尾圖,成品僅6頁(yè)。排版合理,但配圖毫無(wú)關(guān)聯(lián);對文檔內容的處理中規中矩,只做了基于文檔本身的處理,沒(méi)有做文檔外的內容補充。
Kimi:左右滑動(dòng)查看更多
Kimi:盡管上傳的文檔已經(jīng)是完成的一篇匯報演講稿,但Kimi似乎有自己另外的想法,它基于演講稿的框架和模板做排篇布局,提煉要點(diǎn),但沒(méi)有展開(kāi)分析,而是提供給用戶(hù)思考的方向,更像是一份“半成品”。用戶(hù)需再根據其指示自行填充內容。此外,Kimi在本輪表現中竟存在內容與小標題顛倒(混淆?倒置?還是說(shuō)正文與小標題識別錯誤,位置顛倒之類(lèi)的會(huì )清晰一點(diǎn)?)的低級錯誤。
百度文庫:左右滑動(dòng)查看更多
百度文庫:根據其提供的選項,我們在“原文一致”和“適當擴寫(xiě)”中選擇了后者,成稿確實(shí)有基于文檔內容補充有效信息和完善,并且擴充內容能夠圍繞“人物形象”這個(gè)關(guān)鍵詞展開(kāi),邏輯合理。排版無(wú)太大問(wèn)題,較為致命的是配圖出現錯誤,用成《小婦人》的電影截圖。
訊飛智文:左右滑動(dòng)查看更多
訊飛智文:排版依舊沒(méi)有將模板和文字內容進(jìn)行合理編排,出現多處疊字現象,且PPT頁(yè)面字數過(guò)多,不僅影響觀(guān)感,也不利于觀(guān)眾對信息的快速獲取。但通過(guò)聯(lián)網(wǎng)擴寫(xiě),成品能基于演講稿對匯報內容進(jìn)行有效地完善。此外,其提供的AI配圖是個(gè)亮點(diǎn),雖然圖文相關(guān)性還有待加強,但已比前幾家的圖片表現要好。
生成方式3:其余相關(guān)維度測評
除整體成稿呈現外,我們還從以下幾個(gè)相關(guān)維度進(jìn)行測評:響應速度與效率、使用成本和價(jià)格、模板與樣式、用戶(hù)體驗與交互、安全與隱私保護。
四款AI大模型PPT生成時(shí)間
“一鍵生成”無(wú)疑是被PPT硬控的打工人和學(xué)生黨夢(mèng)寐以求的功能。畢竟,一份精美的PPT從挑選模板開(kāi)始,就要耗費大量的時(shí)間和精力。再到梳理結構、確定文本、斟酌用詞、排版布局、設計優(yōu)化等,可稱(chēng)為繁瑣的集合??傮w來(lái)看,本期測試的四款產(chǎn)品無(wú)論是通過(guò)輸入主題生成還是上傳文檔生成,成品時(shí)間都控制在2.5分鐘內。其背后考驗的是高效的數據管理機制及算法系統等。
看起來(lái),速度與質(zhì)量有時(shí)難兼得。在輸入主題生成中,訊飛智文以整體時(shí)間1分鐘的優(yōu)異成績(jì)勝出,且內容質(zhì)量高。在上傳文檔時(shí),WPS AI僅用了29s,但內容在四家中墊底。
四款AI PPT測評對象對比表
在使用成本方面,AI新秀Kimi出手相當闊綽,目前,其PPT助手功能均可免費使用。其余三家均采用付費會(huì )員權益。但在當前拉新階段,三家也都設有免費或低價(jià)限時(shí)體驗包。
挑模板往往是PPT人艱難的第一步。整體來(lái)看,四款產(chǎn)品的PPT模板庫均以教育、職場(chǎng)辦公、科技、商務(wù)場(chǎng)景為主,適用場(chǎng)景及主題還有待進(jìn)一步豐富。Kimi的大手筆貫穿全程,免費模板量居榜一,而百度文庫多數模板均為VIP權益,即使是免費模板,生成后下載到本地電腦也需付費。
從樣式上來(lái)看,各家生成的PPT在字體、動(dòng)畫(huà)效果和幻燈片切換上都以“基礎款”打底,支持在線(xiàn)編輯或下載后編輯。
WPS AI界面
Kimi界面
百度文檔界面
訊飛智文界面
從交互體驗來(lái)看,四款產(chǎn)品注冊登錄方式便捷,均可通過(guò)手機驗證碼注冊登錄;支持網(wǎng)頁(yè)操作;從界面上看,WPS AI、Kimi和訊飛智能走的是極簡(jiǎn)風(fēng),用戶(hù)能快速找到所需功能,百度文庫頁(yè)面則較為復雜,“AI生成PPT”則位于頁(yè)面最右的智能助手,操作界面只有整個(gè)首頁(yè)的五分之一。
在安全與隱私保護方面,四家均無(wú)明顯的隱私政策,未就如何收集、使用和保護用戶(hù)數據在顯眼處做相關(guān)說(shuō)明。
測評觀(guān)察:技術(shù)進(jìn)步與用戶(hù)期待的較量
不得不承認,在對四款AI PPT產(chǎn)品的測評中,我們見(jiàn)證了人工智能在內容創(chuàng )作領(lǐng)域的重要進(jìn)步。僅需簡(jiǎn)單輸入指令、點(diǎn)擊生成,一雙無(wú)形的手便以驚人的速度開(kāi)始編排并“立即生成”,這對于被PPT綁架的用戶(hù)無(wú)疑是一種解脫。
速度固然重要,但質(zhì)量才是核心。對話(huà)、文本生成是大部分企業(yè)切入賽道的第一個(gè)發(fā)力點(diǎn),在日復一日的數據訓練中,大模型的自然語(yǔ)言處理能力得到顯著(zhù)提升,這也為其往多模態(tài)發(fā)展打下了堅實(shí)的基礎?;诖?,在本次測評中,四款產(chǎn)品在邏輯分析上都有相當不錯的表現。
但在文本內容生成上,各家大部分還停留于“提供思路”的層次,在提取有效信息,生成準確且有深度的文本上還有待加強,如WPS AI和Kimi。相比較而言,百度文庫和訊飛智文在本次測試中表現出另一梯隊的水準。如果說(shuō)WPS AI和Kimi可以一鍵生成一份合格率為50%的PPT,那百度文庫和訊飛智文基本是80%的水平,這或許也得益于其背后百度、百度文庫和科大訊飛在知識引擎和內容數據上的積累。
欣喜有之,遺憾亦有之。在「科技新知」最期待的數據可視化部分,四名選手則無(wú)一例外地選擇“視而不見(jiàn)”。數據——懸在大廠(chǎng)人頭上的“達摩克利斯之劍”,同樣是PPT里的靈魂擔當,通常包含數據比對,并以圖表、圖形等形式呈現,使其更直觀(guān)、易懂。這也是當代打工人做PPT的共識。為此,在“輸入主題生成”測試中,我們專(zhuān)門(mén)挑選了有數據信息的主題,并下達具體指令,要求成稿“須包含圖表”,結果卻沒(méi)有看到相應內容的生成。遺漏用戶(hù)需求,也反映出對PPT使用痛點(diǎn)和場(chǎng)景理解的不夠深刻。
另一個(gè)不容忽視的問(wèn)題是,PPT常見(jiàn)應用場(chǎng)景既包括學(xué)校,也有科研機構、政府及企業(yè)等,也意味著(zhù)大量的數據隱私、商業(yè)秘密等。而當前AI PPT大模型產(chǎn)品在數據隱私保護上還顯得標準不足、底氣不足,也都默契地在宣傳營(yíng)銷(xiāo)層面避而不談。
這么看來(lái),PPT離“一鍵生成”的終極目標還有距離。各路玩家趕路之余,還需繼續練好內功。
大模型綜合能力的提升,很大程度上依賴(lài)于海量數據的喂養,其開(kāi)發(fā)與訓練是一項需要全方位資源投入的復雜工程。它不僅依賴(lài)頂尖人才團隊和前沿技術(shù),也離不開(kāi)豐富的高質(zhì)量語(yǔ)料庫,這要求開(kāi)發(fā)者具備持續的數據采集和處理能力。同時(shí),還需投資大量硬件資源以提供必要的算力資源。
簡(jiǎn)而言之,大模型的開(kāi)發(fā)是一場(chǎng)對技術(shù)深度、數據廣度和算力強度的綜合考驗,而每一項技術(shù)進(jìn)步的背后都是“燒錢(qián)”。
“百模大戰”是過(guò)去式了,已經(jīng)到了求生的階段。解鎖新應用場(chǎng)景,是大模型逐步走向商業(yè)化的必經(jīng)之路。據月狐數據測算,2024年6月智能PPT行業(yè)用戶(hù)規模已達到920萬(wàn),行業(yè)近3月用戶(hù)規模復合增速達21%。面對“PPT”這一需求龐大的內容生成領(lǐng)域,誰(shuí)又甘心在這場(chǎng)爭奪賽中掉隊?
搶占剛需的市場(chǎng),企業(yè)務(wù)必要拿出實(shí)實(shí)在在的真本領(lǐng)了。除此之外,針對用戶(hù)的培育模式也值得考究,它關(guān)乎企業(yè)能否長(cháng)遠地贏(yíng)得市場(chǎng)與人心?;仡欉@幾年全球流行的在線(xiàn)辦公軟件發(fā)展歷程,從一開(kāi)始的免費送福利造福上班族,到后來(lái)設置使用限制,逐步按功能收費“割韭菜”,引來(lái)一片罵聲。至今為止,關(guān)于這些企業(yè)的實(shí)際產(chǎn)出回報率及用戶(hù)留存率的具體數據仍顯匱乏,使得外界難以全面評估其經(jīng)營(yíng)成效。
面對你我日益被AI重塑的生活,不管拷問(wèn)得多細致都不為過(guò)。畢竟每一個(gè)為科技買(mǎi)單的用戶(hù),都還要再付諸時(shí)間、隱私及信任。承載著(zhù)打工人與學(xué)生黨厚望的PPT“幫手”,可別把好牌打得稀巴爛。