最新消息指出,中國人工智能新創公司DeepSeek因在使用華為晶片進行訓練時遭遇技術故障,被迫推遲最新R2模型的發布。此事凸顯北京在推進本土化AI發展方面仍面臨嚴峻挑戰。
據《金融時報》引述三位知情人士透露,DeepSeek在今年1月推出R1模型後,應監管部門「鼓勵」,改用華為昇騰(Ascend)處理器取代美國輝達(Nvidia,輝達)系統。
但在R2訓練過程中,昇騰晶片反覆出現穩定性與性能問題,最終DeepSeek只能採取「訓練用輝達、推理用華為」的折衷方案,原定5月的發布被迫延後,錯失市場時機。
訓練是指通過大量數據讓模型學習並優化參數的過程;推理則是利用已完成訓練的模型生成結果或預測,例如聊天機械人的回覆。
報道稱,華為曾派遣工程師團隊駐紮DeepSeek辦公室協助開發,但仍未能在昇騰晶片上完成一次成功的完整訓練。DeepSeek仍在與華為合作,嘗試讓R2模型在推理階段完全適配昇騰晶片。
知情人士表示,DeepSeek創辦人梁文峰對R2研發進度不滿,並推動加大資源投入,以打造能保持領先優勢的先進模型。
輝達H20在華發展情勢
輝達近日與美國政府達成協議,同意將其H20晶片在華銷售收入的15%上繳美方,以換取出口許可。該公司強調,若完全退出中國市場及開發者社群,將削弱美國的全球經濟競爭力與科技影響力。
然而,中共網信辦上月末約談輝達,要求解釋H20晶片是否存在可遠端追蹤或關閉的「後門」安全風險,並提交相關證明材料。
輝達於8月6日發表聲明,明確否認旗下GPU晶片含有後門功能、遙控關機開關或間諜軟件。
路透社報道,中共當局雖未正式全面禁止H20銷售,但已明令要求騰訊、字節跳動、百度等主要網絡企業在使用H20時需提交「合理說明」,尤其涉及政府或敏感用途時。
報道表示,儘管中國市場仍對H20有需求,持續的政治與監管壓力可能促使企業減少採購量。#
----------------------
♠️中美關係藏暗湧♦️
1️⃣ 美國境內的秘密戰爭
https://tinyurl.com/bdhrdnt7
2️⃣ 跨國鎮壓技倆一覽
https://tinyurl.com/4xst7r2d
3️⃣ 評論:習近平實權暗地移交 新決策層如何抉擇?
https://tinyurl.com/3c8h2d9n
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores