《外交政策》:DeepSeek 正在重塑中國人工智慧格局;打消了人們關於北京落後的幻想:六度解析20250202

大家好!歡迎來到我們的六度解析節目。在今天的節目中,我們將深入探討中國人工智慧實驗室DeepSeek的崛起,這個位於杭州的實驗室正在重新塑造中國的人工智慧格局。1月20日,DeepSeek發布了其革命性的產品R1,讓全球驚艷不已。這款產品的品質指數在全球十大AI模型中名列前茅,並且以令人震驚的定價策略挑戰了市場的既有格局。

隨著DeepSeek的V2和V3車型的推出,中國與美國在人工智慧領域的差距正在迅速縮小,許多曾經高高在上的美國科技公司如OpenAI和Meta也不得不重新評估自己的競爭優勢。中國政府的支持和行業內的快速創新使得DeepSeek的成功不僅是偶然,更是中國人工智慧崛起的縮影。

在這個競爭激烈的時代,中美之間的技術競爭已經達到白熱化的程度,DeepSeek的成功無疑將成為中國企業的指標,激勵更多本地科技公司追隨其腳步。面對美國的出口管制,中國的創新和資本流入正在加速,未來的AI市場將由誰主宰,似乎變得更加撲朔迷離。

請大家繼續收看詳細內容,讓我們一同深入探討這場技術革命的背後故事!

DeepSeek 正在重塑中國人工智慧格局

中國人工智慧實驗室的成立打消了人們關於北京落後的幻想。

《外交政策》作者Ray Wang

1 月 20 日,中國人工智慧實驗室 DeepSeek 發布其產品“R1”,震驚世界。

英特爾前執行長 Pat Gelsinger在 LinkedIn 貼文中將新款 DeepSeek R1 的突破稱為「世界級的解決方案」。目前,人工智慧分析的 AI 模型品質指數在十大模型排名中列出了兩個 DeepSeek 模型,其中 DeepSeek 的 R1 排名僅次於 OpenAI 的 o1 模型。

這並不是這家位於杭州的人工智慧實驗室第一次給業界留下深刻印象。該實驗室由母公司High-Flyer(曾位列中國四大量化對沖基金之一)資助,並持續利用其開源模型突破人工智慧創新的界限。 2024 年 5 月,DeepSeek 的 V2 車型震驚了中國人工智慧產業——不僅是因為它的性能,還因為它顛覆性的定價,以更低的成本提供與競爭對手相當的性能。

開源 V2 模型的推出顛覆了市場,其 API 定價僅為每百萬代幣 2 元人民幣(約 25 美分),約為 ChatGPT-4 Turbo 定價的 1%,大大低於幾乎所有中國競爭對手。具體來說,API 定價是指公司向使用者透過網路存取其 AI 服務所收取的費用,以 AI 處理的文字(或「代幣」)量來衡量。一個標記可以小到一個單詞,或一個單字的一部分。

2024年12月,DeepSeek憑藉當時全新的V3模式在全球AI業界獲得了更多的關注。 V3 模型在所有常用於評估模型效能的指標(例如推理、編碼和定量推理)上已經優於 Meta 的最新開源模型 Llama 3.3-70B,並且與 Anthropic 的 Claude 3.5 Sonnet 相當。更令人印象深刻的是,這款型號是在 Anthropic 推出最新型號僅兩個月後發布的,也是 Meta 發布 Llama 3.3 的同一個月。再次,DeepSeek 的最新 R1 模型是在 Open AI 於 2024 年 9 月發布其 o1 模型的預覽版後僅四個月發布的。

中國人工智慧實驗室與美國競爭對手之間的差距正在迅速縮小,自2022 年底發布GPT-3(首個引發全球人工智慧狂潮的大型語言模型(LLM))以來,該行業繼續以驚人的速度發展。此前,許多美國政策制定者和商界領袖(包括谷歌前執行長埃里克·施密特)認為美國在人工智慧領域領先中國幾年——這種看法現在看來顯然是不準確的。

中美人工智慧產業競爭愈演愈烈,兩國政府都對此表現出濃厚興趣。 DeepSeek 創辦人兼執行長梁文峰最近與中國國務院總理李強舉行會晤,成為會場上唯一的人工智慧產業代表。 DeepSeek R1 發布一週後,中國銀行公佈了《人工智慧產業發展行動計畫》,計劃在未來五年內提供至少 1 兆元人民幣(1,370 億美元)支持中國人工智慧基礎設施建設和人工智慧技術的發展。應用範圍從機器人技術到低地球軌道經濟。

中國銀行最新的人工智慧計畫只是北京多年來在該產業推動的眾多項目之一。早在 2017 年,中國國務院就公佈了《新一代人工智慧發展規劃》,這是一套宏偉的戰略指導方針,旨在到2030 年讓中國成為人工智慧領域的全球領導者,並設定了中期里程碑,以加強人工智慧基礎設施、研究和更廣泛的產業整合到2025年。等。

其中包括最近的舉措,例如9月的《人工智慧能力建構行動計畫》 、同月發布的 《人工智慧安全與治理架構1.0 》以及2024年7月發布的《人工智慧產業標準體係指南》。

雖然這些措施體現出一定的決心,但迄今為止,中國政府在塑造該行業方面更多的是發揮引導和監管作用,而不是投資作用。這與半導體、電動車(EV)和太陽能板等產業形成鮮明對比,政府在這些產業的發展中發揮更關鍵的作用。

同時,中國企業也主動開展人工智慧計畫——儘管有時也會藉助國有銀行的融資機會——希望能夠利用已知的市場潛力。在ChatGPT-3展示了人工智慧技術的突破之後,這一點變得尤為明顯,促使百度、阿里巴巴、騰訊和字節跳動等主要科技巨頭紛紛深入研究LLM開發。

這家中國公司的成功也許並不代表政府需要對該領域進行大規模投資。

中國大型科技公司百度在 ChatGPT-3 發布後僅用了四個月的時間,就於 2023 年 3 月推出了其首個法學碩士課程Ernie Bot。裡,中國已經開發了至少240 個法學碩士,根據一位中國法學碩士研究人員在 Github 上的數據。這些模型包括由前面提到的領先科技巨頭 Tas 以及 MiniMax、智浦 AI、Moonshot AI 和 01.AI 等新創公司創建的模型,以及由北京大學和清華大學等知名學術機構開發的模型。

這項快速發展凸顯了中國在人工智慧方面的重大進步和重視,業內人士表示,如今如果沒有內部人工智慧模型才奇怪。

小米就是這一趨勢的一個引人注目的例子,這家公司傳統上專注於消費性電子產品,最近又涉足電動車領域。

就連小米現在也越來越多地涉足人工智慧領域,開發自己的法學碩士學位,這凸顯了人工智慧發展在中國各個領域的廣泛整合。另一個例子是美團,一家傳統上專注於配送服務的公司,它也開發了自己的法學碩士學位並在其平台上部署了人工智慧助理。

展望未來,DeepSeek 的成功將大大重塑中國人工智慧領域。 DeepSeek 的開源模式提供了寶貴的技術指導,使本地科技巨頭能夠利用其豐富的資源快速採用和建立其尖端方法。這也將為中小型 LLM 開發人員提供可行的路線圖,使他們能夠在資源有限的情況下與科技巨頭競爭。

中國 LLM 開發人員可能會迅速優化 DeepSeek 的創新,並以對美國公司構成嚴峻挑戰的速度部署它們。 DeepSeek 的推理模型是一種先進的模型,正如 OpenAI 對自己作品的描述那樣,它可以「在回答之前思考,在回應用戶之前產生一個長長的內部思維鏈」者的眾多模型之一。

此外,DeepSeek 的成功可以為投資者和當地政策制定者註入新的信心,使他們加倍加大對產業的支持。信心是關鍵——過去兩年,由於對快速變化的監管和不利的宏觀經濟環境的擔憂,中國私募股權和創投行業獲得的資金一直處於歷史最低水平。

但DeepSeek的影響不會只限於中國人工智慧產業。它將超越其V2和V3模型,進一步滲透到矽谷。事實上, 1 月底《資訊》雜誌發表的一篇報道稱,美國最大的開源參與者 Meta 正在「爭先恐後」地趕上 DeepSeek 的 V3 和 R1 模型的「專有技術」。 DeepSeek 的 R1 是MIT 授權的,允許在全球進行商業使用。 Perplexity 執行長 Aravind Srinivas 在最近接受 CNBC 採訪時也表達了類似的觀點。

在華盛頓,關於美國出口管制遏制戰略是否需要改革的爭論愈演愈烈。

Paul Triolo、Lennart Heim、Sihao Huang、經濟學家Lizzi C. Lee、Jordan Schneider、Miles Brundage 和Angela Zhang等分析師已經對 DeepSeek 的成功所產生的政策影響進行了評估。分析家普遍認同兩點:一是DeepSeek的模型是貨真價實的;二是中國的人工智慧產業正快速縮小與美國的差距。

然而,將美國於2022年10月和2023年10月分批實施的針對高階人工智慧晶片和半導體的出口管制貼上完全無效的標籤是不公平的。中芯國際等中國企業顯然面臨著挑戰​​,例如先進的 7 奈米 (7 nm) 晶片的良率較低,以及在 7 nm 節點之後的進展有限,正如華為最新的7 nm 智慧型手機處理器和Ascend 910B圖形處理器所證明的那樣( GPU)是驅動人工智慧的關鍵晶片,採用中芯國際的 7 奈米製程節點製造。

這表明出口管制確實影響了中國獲取或生產人工智慧加速器和智慧型手機處理器的能力,或至少影響了其生產採用 7 奈米及以下先進節點製造的晶片的能力。

在美國宣布 2023 年 10 月的限制措施之前,中國公司也囤積了 GPU,並在限制措施實施後透過第三方國家或灰色市場購買這些 GPU。這些漏洞應該受到前總統喬·拜登最近頒布的人工智能擴散規則的限制——事實證明,這項規則在業內非常有爭議,因為業界認為,這些規則可能會通過限制美國人工智能公司的芯片在海外銷售,削弱它們的全球競爭力,但需要一些鑑於其有 120 天的評論期和復雜的執行情況,需要時間和強有力的執行才能有效。

這些儲備的晶片使得中國人工智慧公司能夠在GPU(例如H100、H800 和A100)上訓練模型,而這些GPU 的性能並不比美國實驗室使用的GPU 差太多,同時還能推進華為的Ascend 910B 和即將推出的910C GPU 等國內替代品。

儘管如此,出口管制仍對中國企業施加壓力,限制其獲得下一代晶片,例如 Nvidia 最新的 Blackwell GPU(該 GPU 於 2024 年第四季度開始在全球發貨,但中國仍無法購買)以及Nvidia 的下一代Rubin系列GPU。由於這些最新一代GPU 比前幾代具有更好的整體性能和延遲,它們將使美國人工智慧實驗室在硬體和運算方面比中國公司更具優勢,儘管DeepSeek 的成功證明硬體並不是決定模型成功的唯一因素——目前是如此。

儘管如此,毫無疑問的是,過去兩年美國的出口管制對中國的創新和投資起到了重要的催化作用,特別是在直接受到這些監管限制影響的人工智慧和半導體等領域。作為回應,中國政府加大了對重點產業的支持力度,認為這些產業對國家競爭力至關重要。

這項政策轉變,加上人工智慧推動的市場潛力不斷增大,以及美國公司在中國的缺席所帶來的額外市場機會,吸引了越來越多的國內參與者。其中包括 GPU 領域的華為、Biren 和 Moore Threads 等公司,以及中芯國際、中微和 Naura 等半導體製造和設備公司,它們渴望獲得政府支持或利用市場。

上述出口限制導致的硬體資源壓力,促使中國工程師採取更具創意的方法,特別是優化軟體以克服硬體限制——這種創新在 DeepSeek 等模型中有所體現。

美國日益增多的限制也促進了國內人工智慧價值鏈從上游到下游的合作,使中國企業之間建立了更緊密的合作夥伴關係,並且在許多情況下促進了中國政府和私營部門之間日益密切的聯繫。這些發展大大加快了國內創新的步伐,進一步加強了本地供應鏈,並削弱了外國公司在中國站穩腳跟的能力。因此,正如一些專家指出的那樣,中國在半導體和人工智慧領域的技術進步日益顯著。

綜合起來,這些發展確實令人對美國的出口管制驅動方式及其在限制中國關鍵技術進步與無意中加速這些領域進步之間取得平衡的能力產生質疑。這是一個至關重要的問題,但華盛頓基本上仍未解決。

美國戰略背後的理由是,透過限制中國獲取先進的人工智慧硬體並限制其生產此類硬體的能力,美國可以保持和擴大其在人工智慧領域的技術優勢,鞏固其全球領導地位並加強其在更廣泛的戰略中的地位。

然而,雖然前總統拜登政府已經推出了有關人工智慧治理和基礎設施的一般性指導方針,但專門旨在增強美國人工智慧競爭力的重大具體舉措卻很少。

這項策略的缺陷在於只注重減緩競爭對手,而沒有優先加速國內的創新與發展。正如前述經濟學家李所強調的那樣,必須採取關鍵措施來提升韓國的人工智慧競爭力。此外,考慮到先前提出的出口管制主導策略的潛在負面影響,未來的出口管制應更加謹慎地實施,並進行徹底的成本效益分析

美國的戰略不能依賴中國無法克服限制的假設。相反,如果要在這場競爭中獲勝,它必須以積極主動和謹慎的政策框架為基礎,確保美國在人工智慧發展方面超過中國。

未來幾週和幾個月可能會出現幾項關鍵進展。

包括DeepSeek在內的中國人工智慧公司將面臨美國更嚴格的審查。川普政府也可能製定更詳細的計畫來增強美國人工智慧的競爭力,可能透過旨在支持國內人工智慧產業和放鬆監管限制以加速創新的新措施。

最後,公部門和私部門都可能加大力度解決人工智慧領域的「斯普特尼克時刻」。這些發展都顯示中美技術競爭日益激烈。

正如川普1月27日所說:“中國公司發布DeepSeek AI應該給我們的行業敲響警鐘,我們需要全神貫注於競爭才能取勝。”雖然川普的星際之門計畫是增強美國人工智慧競爭力的一步,但前面的路還很長。

Ray Wang是一位駐華盛頓的分析師,曾駐台北和首爾。他專注於中美經濟和技術政策研究;中國外交政策;以及中國、韓國和台灣的半導體和人工智慧產業。

謝謝大家收看六度探索!這是一個由科學家、經濟學家、媒體人、工程技術人員合作建立的新型媒體,網友與六度Ai參與、合作完成各種內容,這些內容不能作為任何決策或法律的意見。這是一個新型的試驗性媒體方式,我們希望得到大家的支持,修正錯誤。網友可以參與討論,也可以向萬能的六博士提出你能想出的任何問題,六度世界網址是6do.world!請介紹給你的親朋好友!