美國媒體報道說,美國晶片出口管制措施已經阻礙了中國人工智能公司DeepSeek(深度求索)的新模型進程。
The Information周四(6月26日)引述知情人士的消息說,因為中國市場短缺英偉達(Nvidia)伺服器晶片,這將限制中國雲端服務商為DeepSeek新模型提供服務的速度和規模。
知情人士是向企業客戶提供DeepSeek模型的中國主要雲端服務提供商的員工。他們表示,預計DeepSeek即將推出的大型語言模型R2在中國的普及速度和規模可能都不如其前身R1。
DeepSeek依靠英偉達的硬件和軟件進行訓練,並且在英偉達晶片上運行時性能最佳。知情人士還透露,雖然中國國內晶片公司——包括華為等提供了英偉達晶片的替代品,但DeepSeek的模型完全以英偉達硬件和軟件為基礎進行優化,因此換中國晶片來運行這些模型會更難管理,效率也會更低。
禁H20晶片出口 限制雲端服務商為DeepSeek服務
中國雲端運算公司的員工表示,如果R2模型的性能超越現有的開源模型,那麼對它的後續需求將使中國的雲端服務提供商不堪重負,因為這些服務提供商已經在努力應對英偉達晶片短缺的問題。
他們表示,在目前使用R1模型的雲客戶中,大多數都使用英偉達的H20晶片運行模型。
儘管DeepSeek尚未確定何時發布R2,但雲端運算公司員工透露,該公司一直在與一些中國雲端運算公司保持密切溝通,為他們提供技術規範,以指導他們在伺服器上託管和分發該模型。這些計劃包括為希望使用完整版R2的客戶準備足夠的H20晶片。
美國4月份的禁令粉碎了中國雲端運算公司囤積更多H20晶片的希望。如果依賴中國現有的H20晶片庫存,這可能會限制企業使用R2的程度。
美國禁令凸顯中國仍然嚴重依賴美國技術的現實。H20晶片於2023年發布,是英偉達對美國收緊出口限制的回應,該限制實際上禁止英偉達向中國銷售其強大的Hopper系列圖形處理器晶片。隨後,英偉達訂製面向中國市場銷售的縮減版H20晶片。
中國雲端運算公司之前因DeepSeek大量採購H20晶片
在R1發布之前,中國的一些雲端運算公司和開發者一直迴避H20,因為其規格受限,不足以運行大型語言模型(LLM)。
但在R1發布後,情況發生了改變,幾乎所有中國企業——從雲端運算公司和科技初創公司到國有企業和政府機構——都爭相使用R1。
為了滿足對R1的激增需求,包括字節跳動、阿里巴巴和騰訊控股在內的科技巨頭在2025年前三個月訂購了價值160億美元的H20晶片,相當於120萬片晶片。相比之下,據SemiAnalysis估計,英偉達2024年全年一共向中國發貨了100萬片H20晶片。
由於美國出口管制,這在今年早些時候R1需求激增時就已經對中國構成了晶片挑戰。為了彌補缺口,許多國內企業購買了英偉達專為電子遊戲設計的晶片,例如RTX 5090和RTX 4090,來驅動R1。這兩種晶片也被限制在中國銷售,但在黑市上比獲得Hopper晶片更容易買到。
DeepSeek仍在完善R2模型 傳梁文鋒對結果不滿意
據兩位知情人士透露,DeepSeek尚未確定R2模型的具體發布時間。DeepSeek的工程師在過去幾個月裏一直在緊張開發R2,但行政總裁梁文鋒對新模型的表現並不滿意。知情人士說,工程師們正在努力完善R2模型,直到梁批准發布。
今年1月,總部位於杭州的DeepSeek在科技界引起軒然大波,引發對美國高端晶片是否適用的質疑。該公司聲稱其R1推理模型與美國領先模型相當,而成本卻僅為後者的一小部份。
美國公司OpenAI指控DeepSeek在R1的訓練過程中使用了他們的AI模型。
美國國務院高級官員周一(23日)接受路透社專訪時透露,DeepSeek正在利用變通手段逃避美國出口管制,獲取美國製造的先進晶片。
該官員表示,DeepSeek手上有「大量」英偉達高端H100晶片。自2022年以來,美國全面禁止H100晶片出口到中國,因為美國擔心北京可能會利用這些晶片來提升軍事能力或在AI競賽中領先。
「DeepSeek試圖利用東南亞的空殼公司逃避出口管制,並且正在尋求進入東南亞的數據中心,以遠程訪問美國晶片。」官員說。#
----------------------
♠️中美關係藏暗湧♦️
1️⃣ 美國境內的秘密戰爭
https://tinyurl.com/bdhrdnt7
2️⃣ 跨國鎮壓技倆一覽
https://tinyurl.com/4xst7r2d
3️⃣ 評論:習近平實權暗地移交 新決策層如何抉擇?
https://tinyurl.com/3c8h2d9n
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores