實(shí)測四款頭部AI高考志愿助手:一個(gè)能打的都沒(méi)有
工具始終是工具,命運還是得掌握在自己手中。
@科技新知?原創(chuàng )
作者丨王思原編輯丨賽柯
雖然AI填報高考志愿,已經(jīng)不是什么新鮮事,但今年有大模型的加持,讓市場(chǎng)變得看點(diǎn)十足。
因為填報志愿,本質(zhì)上是一套篩選并匹配數據的邏輯:大多數情況下,是根據高考成績(jì)從全國眾多大學(xué)高校中篩選出不低于門(mén)檻的部分,再從這部分中根據考生需求匹配最合適的一項或者幾項作為首選和備選。
這項涉及數據、系統和決策的繁雜工作,正好撞在了人工智能大模型的“槍口”上。百度、夸克、QQ瀏覽器、天工AI等等,一眾新老玩家都把“AI報志愿”幾個(gè)大字放到應用最顯眼的位置,成了季度主打。
但有大模型加持的AI志愿填報到底水平如何,是否可靠,也是一直爭論不休的話(huà)題。尤其是今年,七個(gè)省份迎來(lái)了首屆“新高考”。
新高考采用分類(lèi)考試、綜合評價(jià)、多元錄取的考試招生制度,與以往相比,在考試、命題、招生、錄取等方面都出現了很大變化。新高考賦予了考生更多的選擇空間,但也意味著(zhù)過(guò)去的報考經(jīng)驗將不再適用。不過(guò)人工智能的幫助是否會(huì )讓報考變得簡(jiǎn)單呢?
為了找到答案,我們試用了上述4款市面最火的應用,并且在相同環(huán)境、相同條件下對平臺進(jìn)行志愿推薦能力、復雜需求解決能力、推薦解釋能力等多方面進(jìn)行評測,看看最終的結果如何。另外,為了確保測試的公平性,我們所使用的都是各個(gè)AI的非付費公開(kāi)版本,看看在“0收費”的情況下,AI能給出怎樣的建議。
Part.1
沖、穩、保,AI三把斧
?
首先,這四個(gè)平臺都需要先完善自己的省份以及專(zhuān)業(yè)、分數,我們假設自己是來(lái)自河南的理科考生,此次高考分數586。
在完善了基本信息后,各個(gè)平臺會(huì )根據高考成績(jì)給到一個(gè)具體高考排名,而這個(gè)高考排名則是由省招生辦提供。
根據這些基礎信息,百度、夸克以及QQ瀏覽器都給到了“可沖擊、較穩妥、可保底”三個(gè)方向的參考院校,并且在數據層面做得非常全面且詳細,從歷年分數到招生計劃,甚至連學(xué)費和細分科目都給了參考。相反天工AI遜色許多,僅給到十余家推薦學(xué)院,以及往年的最低錄取分數以及排名作為參考。
左右滑動(dòng)查看
從學(xué)校推薦數量來(lái)看,百度給到了92所,夸克給到48所,QQ瀏覽器為55所。但有意思的是,百度提供的92所院校均為可沖擊院校,穩妥以及保底院校并未給出推薦。
值得一提的是,這4個(gè)平臺給到的院校推薦也有一定差別,百度和QQ瀏覽器以及天工AI給到的院校推薦覆蓋全國,且在數據更新上也比較及時(shí),夸克多半為省內院校,對想去省外的考生來(lái)說(shuō)參考價(jià)值不大。
圖源:科技新知(夸克AI志愿助手)
另外,各個(gè)平臺給到的院校錄取預測概率也有較大差別。拿浙江農林大學(xué)舉例,在相同條件下,QQ瀏覽器給到的錄取概率為42%,百度給到的概率為20%,夸克則直接不將該學(xué)校作為沖刺目標。還有安陽(yáng)師范學(xué)院,夸克和百度均將其列為沖刺目標,且概率為50%左右,而在QQ瀏覽器上卻為穩妥院校。
當然,在百度、夸克以及QQ瀏覽器中,高考生均可以根據地理位置、院校性質(zhì)(如985、211或雙一流等)、專(zhuān)業(yè)偏好等進(jìn)一步篩選和排序院校,整理志愿信息等,使推薦更加貼合個(gè)人需求。天工AI則是以智能體的問(wèn)答形式所呈現。
圖源:科技新知(夸克AI志愿助手)
只是在錄取概率這一最重要的功能上,各家差異巨大的分析結果,還有眼花繚亂的大數據,家長(cháng)看了都很迷惑,更別說(shuō)剛高中畢業(yè)的學(xué)生。
而據科技新知結合各家平臺給到的信息推測,這些內容均來(lái)自權威官網(wǎng)、招生簡(jiǎn)章、專(zhuān)業(yè)書(shū)籍以及名師視頻等渠道,最后由AI綜合全網(wǎng)信息后進(jìn)行整理總結,靠各家算法進(jìn)行輸出?;究梢岳斫鉃榭繑祿M(jìn)行簡(jiǎn)單篩選,給到建議。
如果想要更加精準的借助AI來(lái)輔助填報志愿,可以盡可能地將自己的想法與喜好詳細告訴AI,以此來(lái)獲得更準確的答復。這也是體現各家AI水準的重要檢測標準。
Part.2
選專(zhuān)業(yè),誰(shuí)更專(zhuān)業(yè)?
?
在更多需求下,基礎的過(guò)濾篩選模式變得無(wú)力,AI智能體更能理解考生的擇校標準,所以各家背后的王牌大模型也成了比較對象。所以我們測試了百度的文心一言、騰訊的元寶、阿里的通義千問(wèn)以及天工AI四家大模型應用,在面對更詳細的志愿填報需求時(shí)的表現。
同樣,我們需要給自己一個(gè)身份設定,假設自己是一位來(lái)自河南的理科考生,喜歡踢球、唱歌、動(dòng)手能力強,對各種實(shí)驗以及電子產(chǎn)品十分感興趣,高考分數為520分。雖然描述并不算詳細,但也足夠讓AI建立一個(gè)對我們的初步印象,給出專(zhuān)業(yè)推薦。
根據這一身份設定,在第一輪回答中,各家給到的結果區別十分明顯。
騰訊元寶以及天工AI的推薦十分相似,均是一些理工科主流專(zhuān)業(yè),但兩家大模型給到的信息都十分有限,給出的推薦理由也十分勉強,幾乎都是圍繞“動(dòng)手動(dòng)力”這一關(guān)鍵詞展開(kāi)。
圖源:科技新知(騰訊元寶推薦)
圖源:科技新知(天工AI推薦)
相比之下,通義千問(wèn)以及文心一言除了考慮到專(zhuān)業(yè)選擇的實(shí)際性,也根據興趣興趣提供了相關(guān)活動(dòng)或輔修專(zhuān)業(yè)。比如在踢球這個(gè)愛(ài)好下,提供了體育科學(xué)這一輔修專(zhuān)業(yè)。
圖源:科技新知(通義千問(wèn)推薦)
圖源:科技新知(文心一言推薦)
值得一提的是,相較于其他平臺的籠統回答,文心一言更進(jìn)一步的提供了就業(yè)前景、專(zhuān)業(yè)細分、跨學(xué)科特性等更多參考信息。
圖源:科技新知(文心一言推薦)
不過(guò)這里需要注意的是,在A(yíng)I推薦的專(zhuān)業(yè)中,并非都是理科統招可以報考的,其中一些需要通過(guò)藝考后才能選擇,此外不同的學(xué)校還會(huì )有其他的申請要求,而AI對此并沒(méi)有太多的說(shuō)明,這是一個(gè)明顯的漏洞,需要你繼續追問(wèn)對應專(zhuān)業(yè)和學(xué)校的相關(guān)細節,AI才會(huì )給出更詳細的回答。
整體看下來(lái),各家AI還是基本完成了初步的專(zhuān)業(yè)篩選要求,只是除文心一言和通義千問(wèn)外,其余兩家AI的表現都比較一般,沒(méi)有帶來(lái)太多驚喜。通義千問(wèn)和文心一言的回答更具參考價(jià)值,可以讓你快速了解自己興趣愛(ài)好所對應的專(zhuān)業(yè)情況,節省許多的時(shí)間和精力。
不過(guò),選專(zhuān)業(yè)的測試并非到此為止,很多考生在選擇專(zhuān)業(yè)時(shí)也會(huì )十分關(guān)注未來(lái)就業(yè)形勢,然而作為剛結束高考的學(xué)生來(lái)說(shuō),對某個(gè)專(zhuān)業(yè)了解有限的情況下,AI或許可以根據現有的市場(chǎng)需求、未來(lái)的市場(chǎng)發(fā)展方向、相關(guān)政策等方面給予我們一些建議。那么站在這個(gè)角度,AI會(huì )提供什么更專(zhuān)業(yè)的看法呢?
再向AI輸入“4年后,你認為哪個(gè)專(zhuān)業(yè)會(huì )有最好的就業(yè)環(huán)境?”后,AI的回答也在意料之外。
騰訊元寶、天工AI、通義千問(wèn)3家平臺,都給出了包括新能源、生物科技、人工智能等前沿性專(zhuān)業(yè)推薦,文心一言回答的邏輯與其他3家完全不同,給到的是電子信息、計算機等更偏向傳統專(zhuān)業(yè)。不過(guò)4家平臺都針對各個(gè)專(zhuān)業(yè)做了就業(yè)方向和行業(yè)趨勢等分析,給出了更加詳細的解釋。
圖源:科技新知(通義千問(wèn)回答)
有意思的是,騰訊元寶、天工AI、通義千問(wèn)3家平臺雖然給出了比較專(zhuān)業(yè)且更前沿的專(zhuān)業(yè)的推薦,但是在沒(méi)有提供關(guān)鍵詞的情況下,都與上一個(gè)問(wèn)題中提到的專(zhuān)業(yè)關(guān)聯(lián)性不大,有許多專(zhuān)業(yè)都是第一次出現在回答中,而且與提供的興趣愛(ài)好關(guān)聯(lián)性并不大。文心一言提供的專(zhuān)業(yè)則與上個(gè)回答相似。
圖源:科技新知(文心一言回答)
到了這一步,基本可以篩選出一部分合適自己,且是前景較好的專(zhuān)業(yè),那么根據專(zhuān)業(yè)以及分數倒推,通過(guò)AI志愿助手是否可以幫助考生選出合適的學(xué)校呢?
Part.3
真實(shí)志愿填報,AI只能當輔助
?
在選好專(zhuān)業(yè)后,我們回到百度、夸克、QQ瀏覽器的AI志愿助手上,看看能否幫助我們選擇一個(gè)靠譜的院校,畢竟真實(shí)的志愿填報除了院校,專(zhuān)業(yè)的選擇也至關(guān)重要。這里我們將各個(gè)平臺的篩選模型改為專(zhuān)業(yè)優(yōu)先,并且專(zhuān)業(yè)選擇為計算機類(lèi)。
首先是百度,在選擇想要報考的專(zhuān)業(yè)后,并沒(méi)有篩選出合適的院校,甚至排位順序都沒(méi)有改變。點(diǎn)開(kāi)默認排序的第一個(gè)院校,雖然顯示有20%的沖擊概率,但僅有一個(gè)專(zhuān)業(yè)有20%概率,而我們想要選擇的計算機類(lèi)專(zhuān)業(yè),則只有9%的沖擊概率。
圖源:科技新知(百度AI志愿助手)
如果將選擇改為錄取概率從高到底也是如此,雖然不少院校的外顯概率很高,但點(diǎn)開(kāi)后均非我們所選的計算機專(zhuān)業(yè)。
在整個(gè)篩選過(guò)程,百度的AI志愿助手幾乎沒(méi)有體現出任何智能,連基礎的篩選排序都未能如意。不過(guò),“老師傅”夸克也沒(méi)有給到我們太大驚喜。
夸克雖然篩選出了符合條件的院校,但與百度相似,外顯概率顯示的也是本校最高概率的其他專(zhuān)業(yè),而非我們想要報考的計算機專(zhuān)業(yè)。我們點(diǎn)開(kāi)一個(gè)外顯為60%的穩妥院校,但計算機類(lèi)專(zhuān)業(yè)的錄取概率為19%。
圖源:科技新知(夸克AI志愿助手)
相比之下,QQ瀏覽器的篩選能力更直觀(guān),在選擇計算類(lèi)專(zhuān)業(yè)后,過(guò)濾掉了45所,僅剩下10所院校,雖然與前兩者一致,外顯的并非是我們所選專(zhuān)業(yè)的錄取概率,不過(guò)逐一點(diǎn)開(kāi)后發(fā)現也還算貼切。
圖源:科技新知(QQ瀏覽器AI志愿助手)
縱觀(guān)這三個(gè)平臺,其實(shí)可以發(fā)現一個(gè)共同點(diǎn),就是各家均以院校為重,錄取概率也是按照院校中要求最低專(zhuān)業(yè)的概率來(lái)計算,但如今家長(cháng)、學(xué)生對于志愿填報早已不是單純只看學(xué)校,專(zhuān)業(yè)選擇也十分重要,但顯然AI志愿助手還不能給到好的建議,甚至連打輔助都難。
坦白講,讓看似“聰明”的AI來(lái)填志愿,似乎不太靠譜。浙江大學(xué)計算機科學(xué)與技術(shù)學(xué)院教授陳華鈞看了AI的回答后,也是連連搖頭,“它不是專(zhuān)門(mén)為填志愿訓練的,算法的訓練很大程度依賴(lài)于訓練數據的選擇,這包括了建模方式,對考生、學(xué)校和專(zhuān)業(yè)到底怎么評估,這個(gè)過(guò)程每個(gè)AI工具都不會(huì )一樣,所以給到的結果也不盡人意”。
不過(guò)夸克相關(guān)人員也向科技新知表示,AI志愿助手作為信息參考工具,跟市面上的收費咨詢(xún)服務(wù)是有本質(zhì)的不同,最終的志愿填報策略和選題的決定權還是在用戶(hù)手里,需考量自身興趣、家庭背景、成長(cháng)規劃等。
對于多數考生來(lái)說(shuō),只要利用好AI的能力,在填報志愿時(shí)確實(shí)可以起到事半功倍的效果。而且以上的AI功能,大多是免費提供的,并不需要支付會(huì )員費用或是繳納高昂的輔導費,這一定程度上也讓可以拉近與其他考生的差距。但高考志愿填報除了復雜的分析、計算外更看重考生本身的意愿,很多時(shí)候,無(wú)論怎么選,都不會(huì )完美,都會(huì )有遺憾,不過(guò)請不要忘了,命運永遠是掌握在自己手中的。