亚洲欲色在线观看,一区二区三区在线视频免费观看,国产中文字幕剧情av,99视频精品全部在线播放,亚洲综合小说久久另类区

<sub id="v7kgl"></sub>

<style id="v7kgl"></style>

<style id="v7kgl"></style>

12/01

2025

中訪(fǎng)網(wǎng)

有價(jià)值的財經(jīng)大數據平臺

精品專(zhuān)欄

誰(shuí)是中國版Sora？

來(lái)源：中訪(fǎng)網(wǎng)

作者：科技新知

點(diǎn)擊量：176356

發(fā)布時(shí)間：2024-02-20 18:41

摘要：Sora再現GPT時(shí)刻。

鏖戰一年的“百模大戰”還未結束，兩個(gè)海外AI巨頭又給國內科技大廠(chǎng)出了難題。

就在春節假期的尾聲，谷歌和OpenAI毫無(wú)征兆地放出了各自的 AI新“核武”。

谷歌拿出的新一代多模態(tài)大模型Gemini 1.5 Pro，將性能提升到了百萬(wàn)級別，完全秒殺了OpenAI的GPT-4 Turbo，暫居地表最強。

而后者發(fā)布的首個(gè)文生視頻模型Sora ，則基于視覺(jué)美學(xué)的驚艷表現，更讓人印象深刻，迅速成為全球科技圈追捧的熱點(diǎn)。

在生成視頻的保真度、長(cháng)度、穩定性、一致性、分辨率、文字理解等各方面，Sora已經(jīng)超過(guò)Gen-2、SVD-XT、Pika等主流產(chǎn)品，做到了當前最優(yōu)，可以說(shuō)一出手就是王炸。

去年，國內的百度、阿里、科大訊飛等互聯(lián)網(wǎng)公司紛紛推出了自研大模型，爭搶智能變革時(shí)代的船票；華為、小米、OPPO、vivo等手機廠(chǎng)商也布局大模型，希望新技術(shù)為見(jiàn)頂的市場(chǎng)帶來(lái)新的生機；眾多創(chuàng )業(yè)公司也進(jìn)入該賽道，試圖輕裝上陣、彎道超車(chē)。

但物理意義上的鴻溝讓國內的大模型產(chǎn)品在性能、生態(tài)等方面還與ChatGPT有著(zhù)不小的差距。而如今視頻生成模型Sora的誕生，不出意外也將再次掀起一波跟風(fēng)的浪潮。

然而，顛覆性的效果往往來(lái)自顛覆性的思路。從當前節點(diǎn)來(lái)看，在A(yíng)I大模型領(lǐng)域國內企業(yè)與世界前端到底還有多大差距？差在哪里？又有哪些種子選手可能脫穎而出？

恐慌

對于Sora的橫空出世，馬斯克的評論“gg humans（人類(lèi)認輸了）”，算是一種主流看法。

此前，雖然已經(jīng)有大量文生視頻技術(shù)，但尚未實(shí)現技術(shù)收斂，主要實(shí)現路徑是通過(guò)各種手段讓單幀的圖片“動(dòng)”起來(lái)，類(lèi)似定格動(dòng)畫(huà)。而從用戶(hù)的實(shí)際需求來(lái)看，視頻每一幀之間的連貫性與自然度是價(jià)值的關(guān)鍵，也就是視頻每幀語(yǔ)義信息的無(wú)縫銜接才是核心。

也就是說(shuō)，Sora這種圍繞需求提供對應技術(shù)解決方案的產(chǎn)品，要遠遠優(yōu)于通過(guò)技術(shù)可實(shí)現的角度來(lái)創(chuàng )造產(chǎn)品。

根據OpenAI官網(wǎng)上的介紹指出，Sora與之前的文生視頻思路并不一樣，是讓模型一次預測多幀畫(huà)面，并且確保視頻主體保持不變。這正是其巧妙之處——在視頻幀上做突破，提升了生成視頻的使用上限。

360創(chuàng )始人周鴻祎也給予了極高評價(jià)，他認為Sora的誕生意味著(zhù)AGI（通用人工智能）的實(shí)現可能從十年縮短至一兩年。

作為Sora的前輩，AI文生視頻創(chuàng )企Runway聯(lián)合創(chuàng )始人兼CEO Cristóbal Valenzuela感慨道，以前需要花費一年的進(jìn)展，變成了幾個(gè)月就能實(shí)現，又變成了幾天、幾小時(shí)。

Sora發(fā)布前還曾有很多煙霧彈式的信息被放出。比如OpenAI 組建了研究?jì)和踩男聢F隊，或是正準備推出 GPT-4.5-turbo，但真正的“殺手級更新”被隱藏得很好。這也導致像Pika、Runway一樣的明星創(chuàng )業(yè)公司，面對Sora措手不及。

其實(shí)，國內外大廠(chǎng)對于A(yíng)I視頻生成的態(tài)度一直模棱兩可。根本問(wèn)題在于，現在的人工視頻質(zhì)量、效果更好，且成本也能接受；AI 視頻生成此前沒(méi)有大家想象的那么顛覆，所以整體策略偏向防御，而非進(jìn)攻。

值得一提的是，國內的字節跳動(dòng)以及百度的嗅覺(jué)更加敏銳。百度早在去年3月文心一言的發(fā)布會(huì )上，便發(fā)布了AI文生視頻的功能，百度AI會(huì )自動(dòng)根據文字內容尋找合適的視頻素材，生成視頻后并自動(dòng)發(fā)布，這是屬于文心一言AIGC的TTV（文本內容情感化分析）功能。

字節跳動(dòng)則在去年11月發(fā)布了PixelDance，可以通過(guò)上一個(gè)視頻片段尾幀，為下一個(gè)視頻片段頭幀提供指導的思路，在視頻時(shí)長(cháng)上有所突破，但至今仍然沒(méi)有開(kāi)放用戶(hù)測試，所以具體效果如何還是未知。

如果從GPT的發(fā)展路徑來(lái)看，所有做AI視頻生成甚至做大模型的公司將面臨新一波危機。就像周鴻祎所說(shuō)，盡管?chē)鴥却竽Ｐ桶l(fā)展水平表面看已經(jīng)接近GPT-3.5，但實(shí)際上跟4.0比還有一年半的差距。OpenAl手里應該還有一些秘密武器，無(wú)論是GPT-5還是機器自我學(xué)習自動(dòng)產(chǎn)生內容。

但是危險中也蘊藏著(zhù)機遇。OpenAI證明了用大模型的思路做視頻是可行的，文生視頻能蔚然成風(fēng)成為全球新一輪AIGC競賽的焦點(diǎn)，也給短視頻平臺上的直播電商、內容創(chuàng )作等帶來(lái)更高的天花板。其他互聯(lián)網(wǎng)企業(yè)和內容平臺，需要做的只是證明自己也可以用大模型做出視頻。

從技術(shù)角度來(lái)看，Sora屬于多模態(tài)混合模型，由大語(yǔ)言模型和文圖生成器拼接而成。這也意味著(zhù)多模態(tài)模型迭代節奏加快，不出意外2024年的第一波AI風(fēng)潮將就此展開(kāi)。

風(fēng)起

自2022年末ChatGPT嶄露頭角，其強大的影響力如野火燎原般蔓延至國內科技圈。百度、阿里巴巴、騰訊等一眾互聯(lián)網(wǎng)大廠(chǎng)，以及以米OV為代表的智能硬件公司，仿佛嗅到了新時(shí)代的氣息，紛紛宣布推出自家的大模型，意圖在這波AI浪潮中占據一席之地。

與此同時(shí)，文生圖、文生視頻等多模態(tài)AIGC產(chǎn)品也在有序推進(jìn)。實(shí)事求是地來(lái)看，AI生文、生圖的應用，早已層出不窮，相關(guān)的技術(shù)不斷日新月異。相比之下，AI文生視頻，卻是一個(gè)遲遲未被攻下的陣地，難度和價(jià)值一樣巨大。

公開(kāi)信息顯示，包括字節跳動(dòng)、百度、阿里、?？低?、萬(wàn)興科技、拓爾思、當虹科技在內的科技公司，都在積極布局文生視頻，但與Sora相比存在不小的差距。

簡(jiǎn)單來(lái)講，之前的AI文生視頻工具，僅僅停留在“模擬現實(shí)”的層面，Sora則已經(jīng)躍升到了“構建現實(shí)”的新高度。兩者的根本區別在于，前者只是對現實(shí)世界的表面模仿，難以深入捕捉現實(shí)世界的物理規則和動(dòng)態(tài)變化；而后者則是在虛擬世界中重新構建了一種與現實(shí)世界并行的存在。

Sora不僅學(xué)習了像素與畫(huà)面的呈現，更深入理解了現實(shí)世界的“物理規律”。例如在現實(shí)世界中，我們每咬下一口食物，食物上都會(huì )留下咬痕，這是遵循物理規則的自然現象。Sora生成的視頻中，同樣能夠精準地再現這一細節，做到“咬下去有痕跡”，從而在虛擬世界中完美再現了現實(shí)世界的真實(shí)感。而這是其他文生視頻產(chǎn)品所做不到的。

以百度的文心一言為例，雖然其能夠根據輸入的文本生成視頻，但在處理復雜場(chǎng)景和細節描繪方面仍存在不足。并且百度AI文生視頻也更像是從已有素材庫中找到更接近文字意思的視頻進(jìn)行拼接，單靠AI很難生成新的視頻內容。

今年初，字節跳動(dòng)發(fā)布了一款超高清文生視頻模型MagicVideo-V2。據悉，該模型輸出的視頻在高清度、潤滑度、連貫性、文本語(yǔ)義還原等方面，比目前主流的文生視頻模型Gen-2、Stable Video Diffusion、Pika 1.0等更出色。

抖音的張楠已于2月初辭去CEO崗位，聚焦在剪映業(yè)務(wù)上。這意味著(zhù)，抖音將加強對AI生圖和視頻產(chǎn)品的布局，其中文生視頻自然是重中之重。

不過(guò)在張楠的規劃中，AI視頻所應具備的更高保真度生成效果、更清晰生成畫(huà)面、更順暢自然的邏輯理解能力等，也被Sora一朝之間吊打。

相對于互聯(lián)網(wǎng)巨頭的低調表現，一些上市公司在近期卻積極發(fā)聲，紛紛披露自己在視頻生成模型領(lǐng)域的業(yè)務(wù)情況。

據不完全統計，包括萬(wàn)興科技、博匯科技、易點(diǎn)天下、數碼視訊、漢王科技、當虹科技、東方國信、神思電子、因賽集團、拓爾思、國脈文化、佳都科技在內的超10家A股上市公司，近三個(gè)月以來(lái)在互動(dòng)平臺上各自披露了相關(guān)視頻生成模型領(lǐng)域的業(yè)務(wù)情況。

但不能否認的是，真正達到前沿水平的公司鳳毛麟角，許多公司只是在跟風(fēng)炒作，缺乏真正的技術(shù)儲備和研發(fā)能力。

東方國信直言不諱地表示，他們在A(yíng)I視頻生成領(lǐng)域尚無(wú)成熟的技術(shù)儲備；而神思電子則回應稱(chēng)，公司正在對文生圖、圖生文、視頻生文、文生視頻等多模態(tài)數據互相跳轉的收斂性質(zhì)進(jìn)行深入研究，言下之意，他們在這方面的技術(shù)也還在探索階段。

AI文生視頻的顛覆性，可以具體到實(shí)際運用層面來(lái)看。圖片、視頻生成能幫助提高企業(yè)的商業(yè)化需求，如幫助降低廣告客戶(hù)成本、便捷制作視頻等。拿字節跳動(dòng)舉例，其廣告客戶(hù)投放總成本中有一到兩成為視頻制作成本，而去年開(kāi)始字節已經(jīng)用相關(guān)產(chǎn)品幫助廣告客戶(hù)壓縮這部分投入。

與上一波ChatGPT的風(fēng)潮相似，盡管在推出類(lèi)似AI文生視頻產(chǎn)品方面國內企業(yè)難免落后一步，但也不失為一個(gè)摸著(zhù)Sora過(guò)河的機會(huì )。

涌動(dòng)

從全球市場(chǎng)來(lái)看，AI仍然引領(lǐng)著(zhù)整個(gè)科技商業(yè)前進(jìn)的方向，而且多模態(tài)成為主流。從大語(yǔ)言模型到多模態(tài)，再到通用人工智能的路徑已經(jīng)逐漸清晰，分歧點(diǎn)還是在于節奏的判斷。

此前，OpenAI花了大約半年時(shí)間來(lái)測試大語(yǔ)言模型GPT-4。如果測試Sora需要差不多的時(shí)長(cháng)，這個(gè)強大的視頻生成工具可能會(huì )在今年8月份開(kāi)放。而這半年時(shí)間便是其他企業(yè)積累力量的窗口期。

畢竟ChatGPT已經(jīng)問(wèn)世一年多，但還有大量用戶(hù)沒(méi)有使用過(guò)聊天機器人相關(guān)產(chǎn)品，這也為其他企業(yè)迎頭趕上提供了機會(huì )。

而目前國內企業(yè)面臨的最大問(wèn)題，還在于第一梯隊的AI公司如百度、科大訊飛的股價(jià)，因各種原因被打到了地板價(jià)，而國外的頂級企業(yè)，如英偉達、微軟的股價(jià)創(chuàng )出新高，OpenAI的估值仍然在不斷上升。這也意味著(zhù)海內外AI企業(yè)在資本、人才、技術(shù)、市場(chǎng)號召力等方面存在著(zhù)天然的優(yōu)劣差異。

周鴻祎認為，科技競爭最終比拼的是人才密度和深厚積累。事實(shí)也是如此，Sora應用的是Transformer+Diffusion。從模型架構來(lái)看，如果以Transformer為基準，那么文生視頻依舊是龍頭科技企業(yè)更有優(yōu)先權，但是如果生成式視頻架構依舊圍繞Diffusion展開(kāi)的話(huà)，創(chuàng )業(yè)企業(yè)機會(huì )要更大一些。

不過(guò)沒(méi)有一騎絕塵的技術(shù)，只有螺旋式上升的產(chǎn)業(yè)繁榮。

Sora雖然可以一次性生成幾十秒到一分鐘的視頻，但是真正在應用階段，如果產(chǎn)品沒(méi)有提供足夠多的微操空間，確保用戶(hù)能夠將其整合到自己的工作流中，那么大概率也只能叫好不叫座。

好在技術(shù)的擴散才剛剛開(kāi)始，不會(huì )有任何一家公司“猝死”在新技術(shù)的出現上。OpenAI更像是一個(gè)開(kāi)拓者，強項在于鋪路，普及應用尚需要生態(tài)的力量。

就像是在文生文模型上的模塊化組合，是否會(huì )有類(lèi)似手機、智能音箱一樣的專(zhuān)有智能設備問(wèn)世？讓更多用戶(hù)可以在端側使用模型，構建起開(kāi)源+小參數模型+移動(dòng)端的思路，把當下的產(chǎn)品做一次革新。這是國內廠(chǎng)商所擅長(cháng)的，但同時(shí)也是未來(lái)內卷的陣地。

從單點(diǎn)的突破來(lái)看，Sora具有里程碑意義；但是從商業(yè)化需求和混剪工作流效率提升來(lái)看，Sora本身的價(jià)值和落地效果還有待考究。

想僅靠AI生成的一分鐘視頻成為下一個(gè)董宇輝、李佳琪并不現實(shí)，更別說(shuō)制作長(cháng)視頻或者電影、電視劇了，即便是做一個(gè)短視頻，是通過(guò)一遍遍修改提示詞更加有效率，還是在視頻剪輯軟件里按照創(chuàng )作者的想法調整素材更快？顯然，期待Sora變得更強，不如期待視頻剪輯軟件中盡早增添AI模塊，從而切實(shí)提升工作效率。

即使最終Sora全面放開(kāi)注冊，普通用戶(hù)也難以做出如當前演示案例般的視頻Demo。所以最終各個(gè)大廠(chǎng)的決勝點(diǎn)還是在于如何普及多模態(tài)的應用，如何在工具中加入AI功能，更直接地優(yōu)化工作流程。

新興技術(shù)具有普適性，并不是某個(gè)企業(yè)的專(zhuān)屬。對于國內企業(yè)來(lái)說(shuō)，在多模態(tài)上的探索不妨可以參考GPT的發(fā)展、落地方式，在特定垂直領(lǐng)域的應用層面找到自身的優(yōu)勢，并以此作為方向實(shí)現快速發(fā)展。

只是在這個(gè)過(guò)程中，拼的還是人才密度、落地程度以及犯錯誤的次數。

AI財評

從財經(jīng)視角來(lái)看，OpenAI的Sora模型和谷歌的Gemini 1.5 Pro的發(fā)布，標志著(zhù)AI技術(shù)在多模態(tài)領(lǐng)域的重大突破，尤其是Sora在文生視頻領(lǐng)域的應用，預示著(zhù)AI技術(shù)將深刻影響內容創(chuàng )作、廣告、娛樂(lè )等多個(gè)行業(yè)。這些技術(shù)的進(jìn)步將推動(dòng)相關(guān)產(chǎn)業(yè)鏈的升級，包括硬件制造商、云服務(wù)提供商以及內容平臺等。然而，國內企業(yè)在A(yíng)I大模型領(lǐng)域的追趕面臨技術(shù)積累、資本投入和人才儲備的挑戰。盡管存在差距，但這也為國內企業(yè)提供了學(xué)習和借鑒的機會(huì )，特別是在垂直領(lǐng)域的應用和商業(yè)化路徑上。未來(lái)，隨著(zhù)技術(shù)的普及和成本的降低，AI技術(shù)將更加深入地融入各行各業(yè)，推動(dòng)產(chǎn)業(yè)變革和經(jīng)濟增長(cháng)。國內企業(yè)應抓住這一機遇，通過(guò)技術(shù)創(chuàng )新和商業(yè)模式創(chuàng )新，實(shí)現跨越式發(fā)展。

Sora

科技新知

IP屬地：河南
賬號類(lèi)型：財商領(lǐng)域創(chuàng )作者
賬號主體：鄭州新知百略科技有限公司

洞察技術(shù)變化背后的產(chǎn)業(yè)變遷。

最新文章

三端齊發(fā)！阿里上線(xiàn)團購，高德重塑到店生態(tài)
2025-09-20 15:28
云計算被卷到“芯”高度
2025-09-04 11:08
追覓跟牌影石、大疆的跨界局
2025-09-02 10:34
AI眼鏡陷入退貨潮，大廠(chǎng)的入口夢(mèng)碎了嗎？
2025-08-29 11:16
百度智能云發(fā)布“AI創(chuàng )投加速計劃” 入選創(chuàng )企可獲得億級算力資源
2025-08-12 15:55

亚洲欲色在线观看,一区二区三区在线视频免费观看,国产中文字幕剧情av,99视频精品全部在线播放,亚洲综合小说久久另类区

<form id="lx33i"></form>