<p class="ql-block"><br></p><p class="ql-block ql-indent-1">《圣經(jīng)·撒母耳記》記載,歌利亞是腓力斯丁聯(lián)軍的巨人,身高2.9米。在梭哥戰(zhàn)役中連續(xù)四十日挑釁以色列軍隊。是勝利的保證。牧童大衛(wèi)以投石擊中其額頭將其殺死,此役后大衛(wèi)成為以色列王。</p><p class="ql-block ql-indent-1">大衛(wèi)以弱勝強的敘事,成為西方文化中勇氣對抗強權(quán)的原型,其故事被《進擊的巨人》《哈利·波特》等作品引用,衍生出對文明與野蠻、權(quán)力隱喻的現(xiàn)代解讀。</p><p class="ql-block ql-indent-1">本文說說AI新領(lǐng)軍人物——中國數(shù)字大衛(wèi)——深度求索公司創(chuàng)始人梁文鋒劍指現(xiàn)代科技歌利亞——英偉達的事。</p><p class="ql-block ql-indent-1">“AI”是什么?英語artificial intelligence的縮寫。中文翻譯過來就是人工智能。通俗來說,就是讓機器具備類似人類的感知、學(xué)習(xí)、推理、決策等能力 。???</p><p class="ql-block ql-indent-1">全世界都知道,現(xiàn)今AI只有兩大玩家——美國和中國。美國 AI 公司排名前十?的是:英偉達、微軟、谷歌、蘋果、Meta、亞馬遜、特斯拉、OpenAI、甲骨文和 Palantir。這些企業(yè)在芯片算力、大模型研發(fā)、云服務(wù)及終端應(yīng)用等關(guān)鍵領(lǐng)域占據(jù)主導(dǎo)地位。其中,英偉達毫無疑問是全世界AI的霸主。</p><p class="ql-block ql-indent-1">然而,英國《自然》雜志網(wǎng)站日前公布了2025年度十大科學(xué)人物榜單,中國深度求索公司(DeepSeek)創(chuàng)始人梁文鋒榜上有名。</p><p class="ql-block ql-indent-1">《自然》雜志評論指出,梁文鋒的深度求索,在今年初發(fā)布的DeepSeek大語言模型“震驚了世界”,以更低的資源成本實現(xiàn)了與頂級模型相當(dāng)?shù)男阅埽斑@一開源模型,對科學(xué)家們來說無疑是一大福音?!盌eepSeek創(chuàng)始人梁文鋒的入榜,折射出國際社會對打破技術(shù)壁壘、彌合全球科技鴻溝、促進全球科研公平參與這一趨勢的高度重視。</p><p class="ql-block ql-indent-1">時間回溯到2025年1月20日,杭州深度求索公司(DeepSeek)梁文鋒團隊發(fā)布了開源大語言模型DeepSeek-R1,之后又在除夕當(dāng)天(1月28日)發(fā)布了開源文字生成圖像大模型Janus-Pro 7B。</p><p class="ql-block ql-indent-1">“開源”,是指源代碼可以被訪問或獲取,感興趣的人都能查看、修改和分發(fā)其中的代碼,與其相對的是“閉源”,其源代碼只有軟件開發(fā)者有權(quán)限查看和修改??梢哉f,開源的思想極具理想主義和浪漫主義色彩,是科技自由與技術(shù)平權(quán)思想的延伸。</p><p class="ql-block ql-indent-1">DeepSeek一經(jīng)發(fā)布,就驚艷國內(nèi)外,在美國大模型排名榜Chatbot Arena上的基準測試排名上升至全類別大模型第三,在風(fēng)格控制類模型分類中與美國OpenAI的GPT-o1并列第一。DeepSeek終結(jié)了中國AI模型落后于美國模型半年到一年的局面,而且作為國產(chǎn)模型,它對中文支持更好,能夠更好地滿足國內(nèi)和其他國家中文使用者的需求。</p><p class="ql-block ql-indent-1">DeepSeek有不同版本,目前主流版本是V3和R1,二者的定位有所差異。DeepSeek V3對標OpenAI的GPT-4o,屬于L1級別的聊天機器人,優(yōu)勢是性價比,主要面向自然語言處理任務(wù),能為使用者提供文本摘要、內(nèi)容生成等多項服務(wù)。DeepSeek R1則對標OpenAI的GPT-o1,屬于L2級別的推理優(yōu)化模型產(chǎn)品,特別適用于涉及邏輯推理和問題求解的應(yīng)用場景。</p><p class="ql-block ql-indent-1"><br></p> <p class="ql-block ql-indent-1"><br></p><p class="ql-block ql-indent-1">梁文鋒DeepSeek的出色表現(xiàn),源于其基礎(chǔ)模型,是基于深度神經(jīng)網(wǎng)絡(luò)的大語言模型。語言模型的建立包括兩大部分,一是模型訓(xùn)練,二是模型推理。</p><p class="ql-block ql-indent-1">模型訓(xùn)練是模型的研發(fā)階段,研發(fā)人員通過設(shè)計好的訓(xùn)練方法,開發(fā)出可被部署使用的模型,它們由多層神經(jīng)網(wǎng)絡(luò)組成,包含數(shù)十億至數(shù)萬億參數(shù)。模型訓(xùn)練可以分為預(yù)訓(xùn)練和優(yōu)化訓(xùn)練兩部分。</p><p class="ql-block ql-indent-1">預(yù)訓(xùn)練是指通過數(shù)據(jù)訓(xùn)練模型,使其掌握通用的語言理解與生成能力。優(yōu)化訓(xùn)練即微調(diào),是在預(yù)訓(xùn)練模型的基礎(chǔ)上,通過特定任務(wù)的數(shù)據(jù),進一步調(diào)整模型參數(shù),使其適應(yīng)實際應(yīng)用場景。模型在優(yōu)化訓(xùn)練階段,一般通過有監(jiān)督的微調(diào)或強化學(xué)習(xí)等方法,學(xué)會根據(jù)指令回答問題,符合人類的偏好和需求。</p><p class="ql-block ql-indent-1">模型推理是提供服務(wù)。人們可以對DeepSeek輸入信息,以獲得多種產(chǎn)品和完成多種任務(wù),如讓其生成文本、分析問題、提供參考答案(包括文字、表格和代碼)等。</p><p class="ql-block ql-indent-1">總體而言,DeepSeek在性能、成本和開源程度等方面,均表現(xiàn)卓越。DeepSeek V3模型的訓(xùn)練成本,僅為約558萬美元,而Meta同規(guī)格的Llama 3.1模型的訓(xùn)練成本,高達9240萬美元!在推理成本方面,DeepSeek V3、R1模型的價格分別為OpenAI GPT-4o、o1模型的1/10和1/20!</p><p class="ql-block ql-indent-1"><br></p> <p class="ql-block">?</p><p class="ql-block ql-indent-1">不久前(2026年4月10日),英偉達總裁<span style="font-size:18px;">黃仁勛在訪談中,直言不諱表達自己的恐懼:“如果DeepSeek率先基于華為算力平臺完成迭代發(fā)布,對美國科技產(chǎn)業(yè)而言,將是?災(zāi)難性的后果??!?lt;/span></p><p class="ql-block ql-indent-1">英偉達恐懼梁文鋒?,源于其創(chuàng)立的DeepSeek在AI領(lǐng)域的一系列顛覆性突破,直接挑戰(zhàn)了英偉達在高端AI芯片與CUDA生態(tài)的壟斷地位。</p><p class="ql-block ql-indent-1">首先,低成本+高性能,動搖英偉達護城河?。</p><p class="ql-block ql-indent-1">DeepSeek-V3以?不到600萬美元?的訓(xùn)練成本,實現(xiàn)了與GPT-4o相當(dāng)甚至在數(shù)學(xué)、代碼等能力上超越的性能,而同類模型訓(xùn)練成本通常高達數(shù)千萬美元。這一“性價比革命”讓市場開始質(zhì)疑:是否還需要投入天量資金購買英偉達的GPU集群?</p><p class="ql-block ql-indent-1">其次,實現(xiàn)了AI的戰(zhàn)略轉(zhuǎn)向。全面“去CUDA化”,構(gòu)建了我們的國產(chǎn)AI生態(tài)?。</p><p class="ql-block ql-indent-1">2026年4月,DeepSeek發(fā)布V4預(yù)覽版,?徹底拋棄英偉達GPU與CUDA生態(tài)?,全面適配華為昇騰950芯片及CANN異構(gòu)計算框架。這意味著中國首個頂級大模型實現(xiàn)了從底層算力到模型架構(gòu)的全棧國產(chǎn)化,打破了美國在AI底層技術(shù)上的封鎖。</p><p class="ql-block ql-indent-1">再次,對AI全行業(yè)造成重大影響。英偉達可能從“賣鏟子”落到“被拋棄”?。</p><p class="ql-block ql-indent-1">英偉達長期被視為AI時代的“賣鏟人”——無論誰做AI,都離不開它的GPU和CUDA。但DeepSeek的轉(zhuǎn)向意味著:</p><p class="ql-block ql-indent-1">我們的國產(chǎn)AI企業(yè)可不再依賴英偉達?;</p><p class="ql-block ql-indent-1">?開發(fā)者生態(tài)可能向國產(chǎn)平臺遷移?;</p><p class="ql-block ql-indent-1">美國芯片出口限制,反而加速了中國自主生態(tài)的形成?。</p><p class="ql-block ql-indent-1">正如美國《金融時報》所評:梁文鋒正成為“數(shù)字大衛(wèi)”,用極低的算力成本挑戰(zhàn)“科技歌利亞”英偉達。</p><p class="ql-block ql-indent-1"> <span style="font-size:18px;">總之,梁文鋒團隊的DeepSeek,以掀桌子的氣概魄力,破除了英偉達、谷歌、蘋果、甲骨文等構(gòu)建的AI生態(tài)神話。</span></p><p class="ql-block ql-indent-1">好樣的,梁文鋒——中國又一個年僅四十歲的“任正非”!又一個助力中國崛起的科技脊梁!</p><p class="ql-block ql-indent-1"><br></p>
河北区|
岐山县|
永吉县|
英山县|
水城县|
曲周县|
伽师县|
三台县|
威远县|
祁门县|
南汇区|
武邑县|
连云港市|
玛沁县|
浠水县|
马龙县|
邹平县|
巴林左旗|
平顶山市|
岢岚县|
平乡县|
平昌县|
信丰县|
瑞昌市|
浦县|
柳江县|
桦川县|
德保县|
河源市|
白银市|
陇南市|
阿图什市|
阿克苏市|
通道|
明光市|
拉萨市|
贵定县|
星子县|
兴仁县|
天峻县|
和顺县|