欧美色综合二区三区四区_哪吒、DeepSeek，2025年的兩大理想主義者_中訪(fǎng)網(wǎng)

文 / 一燈?

過(guò)年這陣子最火熱的話(huà)題，恐怕要數《哪吒2》和DeepSeek。

一個(gè)是中國古代神話(huà)傳說(shuō)人物，另一個(gè)是AI領(lǐng)域的后起之秀。本來(lái)八竿子打不著(zhù)的兩家，卻在這個(gè)春節意外地“相映成趣”。

圖源：DeepSeek官網(wǎng)

不少人這陣子可能一直有在關(guān)注DeepSeek的進(jìn)展，也包括那83個(gè)小時(shí)的保衛戰。當他們坐在電影院，看到十二金仙對龍族的爭議，看到“捕妖隊”抓無(wú)辜妖眾去煉丹，看到龍族退無(wú)可退后的反擊，心中或許會(huì )十分感慨：果然藝術(shù)來(lái)源于生活，而生活更加殘酷且沒(méi)有道理。

所以，盡管已經(jīng)有不少媒體報道過(guò)了DeepSeek，但《節點(diǎn)財經(jīng)》在這里還是想再講一講自己所看到的DeepSeek，以及該公司模型以外的事。

01 繞過(guò)三座山，打開(kāi)AI新世界

這陣子有關(guān)DeepSeek公司和旗下AI大模型的介紹已有很多，因此這里我們不再贅述其成績(jì)，就簡(jiǎn)單聊一聊它對行業(yè)的一些啟示。

首先，可以“繞過(guò)”算力，用算法彎道超車(chē)。

以往，大家普遍認為算力是AI的核心，發(fā)展AI就是要不斷的堆算力、堆GPU。于是我們看到，OpenAI興起的時(shí)候，不僅英偉達（NVIDIA）因此受益，美國也通過(guò)禁售英偉達GPU來(lái)遏制中國AI發(fā)展。

而就在大家燒錢(qián)堆算力的時(shí)候，DeepSeek選擇燒腦改算法。

MLA（多頭潛在注意力機制）技術(shù)大幅降低了長(cháng)文本推理成本，MoE（混合專(zhuān)家模型）創(chuàng )新解決了路由崩潰難題，多令牌預測（MPT）顯著(zhù)提升推理速度，這三大創(chuàng )新分別針對 Transformer 架構中的不同瓶頸，成為DeepSeek能夠以小博大的關(guān)鍵所在。

DeepSeek v3架構概覽圖，圖源：CSDN

這里舉個(gè)簡(jiǎn)單的例子，傳統的大模型就好比一家擁有眾多服務(wù)員和廚師的餐廳，每個(gè)服務(wù)員從頭到尾獨立負責自己客人的記菜單、傳菜、結賬、清潔等工作。當復雜的菜品出現時(shí)，全部廚師都圍上來(lái)討論誰(shuí)能做、怎么做。

這就可能會(huì )出現多個(gè)服務(wù)員重復記錄相同訂單、傳菜時(shí)堵在廚房門(mén)口、廚師資源浪費等重復勞動(dòng)和效率低下的問(wèn)題。

而在DeepSeek的模型設計中，MLA技術(shù)讓所有服務(wù)員共享一個(gè)智能平板，能實(shí)時(shí)同步訂單、桌號、菜品狀態(tài)（省去重復記錄）；上菜時(shí)，只有負責上菜的服務(wù)員工作，其他人在需要時(shí)才會(huì )介入（按需分工）。這樣既能更快地完成任務(wù)，又能保證每部分任務(wù)的完成質(zhì)量。

同時(shí)，多令牌預測能讓服務(wù)員在顧客點(diǎn)主菜后，立馬建議甜點(diǎn)和飲料，提前準備服務(wù)，而不是等顧客一個(gè)個(gè)點(diǎn)完，從而使服務(wù)更加流暢、體驗更好。

MoE模型則清楚每個(gè)廚師都擅長(cháng)的菜系，在面對復雜的菜品時(shí)，模型能夠根據菜品的特點(diǎn)，智能地將其分配給最合適的廚師處理，從而提高處理效率，減少不必要的資源浪費。

這些創(chuàng )新技術(shù)與架構的運用，讓DeepSeek-R1的預訓練在2048塊英偉達H800 GPU（性能受限版本）集群上就能完成，費用只有557.6萬(wàn)美元。而OpenAI等企業(yè)訓練模型，則需要數千乃至上萬(wàn)塊Nvidia A100、H100等頂級顯卡，動(dòng)輒數億美元的訓練成本。

可見(jiàn)，當AI行業(yè)普遍沉迷于“算力軍備競賽”時(shí)，DeepSeek的“出圈”證明：與其瘋狂堆服務(wù)器，不如優(yōu)化算法結構，針對技術(shù)瓶頸實(shí)施“靶向治療”，才能讓大模型甩掉"耗電怪獸"的帽子，開(kāi)啟低成本高性能的新紀元。

其次，可以“繞過(guò)”通用，從垂直場(chǎng)景切入。

根據DeepSeek公布的跑分數據顯示，DeepSeek-R1在培訓后階段大規模使用強化學(xué)習技術(shù)，在數學(xué)、代碼、自然語(yǔ)言推理和其他任務(wù)上，其性能可與OpenAI o1正式版本媲美，而價(jià)格僅為o1的3%。

圖源：DeepSeek

但這并不意味著(zhù)DeepSeek-R1超越了OpenAI o1，畢竟OpenAI優(yōu)先追求的是“通用智能”，投入大量資金人力，想要的是全能通才的效果。國內企業(yè)開(kāi)發(fā)AI大模型也大都沿用這一思路，希望自家大模型沒(méi)有什么明顯的能力短板，快速達到可商用水平。

而DeepSeek選擇從垂直場(chǎng)景切入，先追求在部分領(lǐng)域（如數學(xué)、代碼）的表現更優(yōu)，再逐步分階段完善其他領(lǐng)域的能力。這是一種能夠快速成長(cháng)和建立差異化優(yōu)勢的發(fā)展策略。

值得一提的是，文心一言作為扎根于中國市場(chǎng)的大語(yǔ)言模型，根據百度官方的介紹，在多項中文評測中，文心一言4.0的表現已經(jīng)超越了目前最強的GPT-4模型。這意味著(zhù)在理解和生成中文內容方面，文心一言也已成為了全球最頂尖的AI模型之一。

因此，《節點(diǎn)財經(jīng)》認為，中國AI企業(yè)尤其是創(chuàng )業(yè)公司，不必都扎堆死磕“全能大模型”，可選擇垂直場(chǎng)景靶向爆破：這樣既能規避與通用模型的算力絞殺戰，又能通過(guò)構建起數據護城河，進(jìn)而在細分領(lǐng)域闖出一片天。

最后是，可以“繞過(guò)”商業(yè)，堅持對技術(shù)求索。

這次DeepSeek之所以能引起這么大的轟動(dòng)，除了模型本身表現優(yōu)異、開(kāi)發(fā)和訓練成本大幅降低，還有較為重要的一點(diǎn)是，DeepSeek主張免費開(kāi)源。

要知道，目前比較知名的其他大模型，無(wú)論是國內百度的文心一言、華為的盤(pán)古大模型，還是海外的OpenAI、Llama等產(chǎn)品，都基于商業(yè)化和競爭考量，要么一開(kāi)始選擇了閉源路線(xiàn)，要么逐漸走向閉源，要么雖宣稱(chēng)開(kāi)源，但卻設立了不少限制，并未做到真正意義上的開(kāi)源。

相比之下，DeepSeek不僅完全開(kāi)放代碼，還放出了詳細的技術(shù)報告；不僅開(kāi)源了自己最大的 671B R1 模型，還幫大家蒸餾量化好了 1.5B~70B 多個(gè)尺寸的模型；不僅提供所有的訓練數據、訓練腳本、論文等，還選擇了最寬松的 MIT License 協(xié)議，允許任何人免費使用、修改、分發(fā)，包括用于商業(yè)用途。

DeepSeek創(chuàng )始人梁文鋒此前談及對于開(kāi)源的構想是，DeepSeek未來(lái)可以只負責基礎模型和前沿的創(chuàng )新，其他公司在 DeepSeek的基礎上構建To B、To C的業(yè)務(wù)?！斑@一波浪潮里，我們的出發(fā)點(diǎn)，就不是趁機賺一筆，而是走到技術(shù)的前沿，去推動(dòng)整個(gè)生態(tài)發(fā)展?！?/p>

圖源：“湛江發(fā)布”微信公眾號

在《節點(diǎn)財經(jīng)》看來(lái)，或許是因為背靠千億量化基金，也或許就是純粹的理想主義，至少從目前來(lái)看，DeepSeek團隊重技術(shù)突破多過(guò)商業(yè)變現，要行業(yè)繁榮不要壟斷優(yōu)勢。

正如英偉達高級研究科學(xué)家Jim Fan評論的那樣：“我們生活在這樣一個(gè)時(shí)代，一家非美國公司正在讓OpenAI的初衷得以延續，即做真正開(kāi)放、為所有人賦能的前沿研究?！?/p>

02 明槍與暗箭，暴露了誰(shuí)在心虛

1月28日，多位美國官員指出，DeepSeek是“偷竊”，正對其影響開(kāi)展國家安全調查。隨后，部分國家和組織也開(kāi)始“重點(diǎn)關(guān)注”DeepSeek：

●?愛(ài)爾蘭數據保護委員會(huì )向DeepSeek發(fā)出信函，要求其提供有關(guān)如何處理愛(ài)爾蘭公民數據的詳細信息；

●?意大利數據保護機構也采取了類(lèi)似措施，他們認為DeepSeek對意大利數百萬(wàn)人數據造成風(fēng)險，DeepSeek需要在20天時(shí)間里作出回應；

●?歐洲消費者組織還認為，DeepSeek在保護和限制未成年人方面的做法還不夠健全，從年齡驗證到未成年人數據處理都沒(méi)有明確的強制執行方案；

......

而據彭博社報道，近期OpenAI與微軟展開(kāi)了一項聯(lián)合調查，針對DeepSeek去年使用OpenAI API接口的賬戶(hù)進(jìn)行審查，并以涉嫌違反服務(wù)條款的模型蒸餾為由，取消了他們的訪(fǎng)問(wèn)權限。

在國內輿論場(chǎng)，也有一些所謂的“極客”開(kāi)始對DeepSeek的技術(shù)細節發(fā)起攻擊，聲稱(chēng)DeepSeek涉嫌“抄襲”或“技術(shù)不透明”，并試圖通過(guò)論文和數據來(lái)證明這一點(diǎn)。

當然，以美國為首的西方國家在意的不止DeepSeek。

華爾街日報日前曾發(fā)布報道《It’s Not Just DeepSeek. A Guide to the Chinese AI Companies You Need to Know》，提醒美國人要注意哪些中國大模型公司，并著(zhù)重指出，百度在中國最早推出面向公眾的生成式AI文心一言，如今已經(jīng)擁有4.3億用戶(hù)。?? ?

圖源：華爾街日報

如果說(shuō)這些明面上的指控是真是假還有待查證，不能認為是西方國家在刻意抹黑、打壓、搞認知戰，但在1月25日~29日期間，DeepSeek服務(wù)器集群莫名受到每秒超過(guò)2.3億次DDos惡意請求，攻擊總量相當于整個(gè)歐洲三天的網(wǎng)絡(luò )流量總和。

1月28日，DeepSeek官網(wǎng)顯示其線(xiàn)上服務(wù)受到大規模惡意攻擊??圖源：DeepSeek官網(wǎng)

據了解，為了保護DeepSeek，360安全響應中心第一時(shí)間拉響警報，鎖定攻擊特征碼；華為云啟動(dòng)流量清洗系統，為服務(wù)器搭建防護盾；中國紅客聯(lián)盟不到12小時(shí)就確定了攻擊源頭全部來(lái)自美國，并予以反擊。

與此同時(shí)，網(wǎng)易雷火的游戲服務(wù)器陣列緊急轉換為流量緩沖池；大華股份用AI識別0.00017%的真實(shí)用戶(hù)，菜鳥(niǎo)網(wǎng)絡(luò )貢獻物流算法優(yōu)化帶寬，釘釘開(kāi)通緊急通訊確保指揮暢通......阿里云、?？低?、泰山云、新華三等企業(yè)也都紛紛加入DeepSeek保衛戰，貢獻自己的力量。

1月29日晚8點(diǎn)，經(jīng)過(guò)83個(gè)小時(shí)的鏖戰，中國互聯(lián)網(wǎng)企業(yè)成功將攻擊流量壓制97.2%，捍衛住了DeepSeek和中國AI產(chǎn)業(yè)尊嚴。

然而，這場(chǎng)中美AI角力下的網(wǎng)絡(luò )安全保衛戰只是一個(gè)開(kāi)始。據奇安信XLab實(shí)驗室監測發(fā)現，1月30日凌晨，針對DeepSeek（深度求索）線(xiàn)上服務(wù)的攻擊烈度突然升級，其攻擊指令較1月28日暴增上百倍。

并且，至少有2個(gè)Mirai變種僵尸網(wǎng)絡(luò )參與攻擊，分別為HailBot和RapperBot。此次攻擊共涉及16個(gè)C2服務(wù)器的118個(gè)C2端口，分為2個(gè)波次，分別為凌晨1點(diǎn)和凌晨2點(diǎn)。

部分攻擊指令詳情??圖源：奇安信

說(shuō)好的公平競爭、創(chuàng )新取勝，結果是明槍暗箭、防不勝防。

說(shuō)實(shí)話(huà)，盡管DeepSeek在模型本身和創(chuàng )新路徑上確有成績(jì)，但遠沒(méi)有達到超越OpenAI、算法“封神”的地步。畢竟算力才是大模型可持續發(fā)展的必要條件，也是我們的短板，盡管DeepSeek找到了一些優(yōu)化算力使用的方法，但這并不意味著(zhù)算力需求變得可有可無(wú)。

因此，在《節點(diǎn)財經(jīng)》看來(lái)，DeepSeek的出現，還算不上是技術(shù)上的革命性突破，更多的是讓大家開(kāi)始重新思考如今AI領(lǐng)域的基礎研究角度、商業(yè)層面的既有模式。但當下，DeepSeek卻得到了全球“熱度”，無(wú)所不用其極的圍剿，不亞于當年對付華為。

這樣的氛圍中，心虛的是誰(shuí)？帶節奏的是誰(shuí)？想要霸權永固的又是誰(shuí)？其實(shí)不言而喻。

總結?

不知是真的巧合，還是過(guò)度聯(lián)想，看《哪吒2》總覺(jué)得“封神大戰”就像中美角力；無(wú)量仙翁抓妖怪煉丹提升神力，代表的是美國收割全球資產(chǎn)、打壓異己；而龍族助哪吒反擊玉虛宮，則像不久前的DeepSeek保衛戰。

我與DeepSeek討論了服務(wù)器被攻擊事件與《哪吒2》電影內容，并要求其總結

DeepSeek就像是初露鋒芒的哪吒，也是純粹的理想主義者，正試圖以技術(shù)突破打破封鎖，用開(kāi)源生態(tài)重構行業(yè)規則。

未來(lái)，DeepSeek能走多遠、能開(kāi)源多久尚未可知，但這想要改變AI世界的想法，當下也足以令人興奮。

畢竟，“因為我們都太年輕，不知道天高地厚?！?

*題圖由AI生成

AI財評

從財經(jīng)視角來(lái)看，DeepSeek的崛起不僅是中國AI領(lǐng)域的一次技術(shù)突破，更是對全球AI產(chǎn)業(yè)格局的一次挑戰。其通過(guò)算法優(yōu)化顯著(zhù)降低了AI模型的訓練成本，這種創(chuàng )新路徑為AI行業(yè)提供了新的發(fā)展思路，尤其是在算力資源有限的情況下，算法優(yōu)化成為提升競爭力的關(guān)鍵。DeepSeek的開(kāi)源策略雖然短期內可能影響其商業(yè)變現，但從長(cháng)遠來(lái)看，有助于構建更廣泛的生態(tài)系統，吸引更多開(kāi)發(fā)者和企業(yè)參與，從而推動(dòng)整個(gè)AI行業(yè)的進(jìn)步。然而，DeepSeek面臨的國際壓力和網(wǎng)絡(luò )安全威脅也暴露了全球AI競爭的激烈程度。美國及其盟友的圍剿行為不僅是對DeepSeek的打擊，更是對中國AI產(chǎn)業(yè)崛起的遏制。這種背景下，中國AI企業(yè)需要在技術(shù)創(chuàng )新和網(wǎng)絡(luò )安全兩方面同時(shí)發(fā)力，確保在全球競爭中立于不敗之地。總體而言，DeepSeek的成功為中國AI企業(yè)提供了寶貴的經(jīng)驗，即在技術(shù)創(chuàng )新和商業(yè)模式上尋求差異化優(yōu)勢，同時(shí)加強國際合作與競爭中的自我保護能力。

亚洲欲色在线观看,一区二区三区在线视频免费观看,国产中文字幕剧情av,99视频精品全部在线播放,亚洲综合小说久久另类区

哪吒、DeepSeek，2025年的兩大理想主義者

節點(diǎn)財經(jīng)

哪吒、DeepSeek，2025年的兩大理想主義者