關鍵細節:輸入及訓練
今年年初中共大肆宣傳Deepseek,甚至有人認為是「斯普特尼克時刻」,不少人順著宣傳安裝軟件,有些甚至問筆者為何不用。筆者有時會反問如何衡量模型是否可靠?反映甚麼價值觀?沒有一個人能簡單回答,甚至有人反諷「你看過程式才安裝每個軟件嗎?」「開放模型不用擔心!」。筆者無意叫人看程式碼,更不是呼籲AI避而不用,而是認清這個工具,了解並控制風險,時刻保持警覺去使用。情況等同使用一個複雜的工具前先看說明書,並做足安全措施。AI複雜之處是既沒有說明書,亦沒有警告字眼,甚至連理解及控制風險亦不簡單。上期提到煉成AI模型,閱讀、訓練及調制支配了AI的輸出,這「三部曲」可存在偏見或系統性方向。首先是「閱讀」。模型開發者大多只籠統地告之閱讀資料來自廣泛的經過審定的公開資料,但亦可包括不對外公開的資料,透明度各異。輸入是生成權重矩陣的重要部份,影響輸出的準確性、公平性、多元性、創造性、流暢性、推理能力等。資料存在偏頗及虛假,便全數反映在權重矩陣,直接影響輸出。典型例子是極權地區的模型,輸入可能是官方審定的資訊佔重,加上被過濾及操控的媒體可能是輸入部份,令官方資訊比重循環加強,輸出便是「官方事實」,傾向「官方意識形態」。
充滿信心的「幻覺」
其次是訓練過程非常複雜,模型大多只提供白皮書,描述高層次流程,訓練人員的選擇考量,去偏差措施,權重獎勵設計,評估及監控等。當中很多關鍵細節可以影響訓練結果,令訓練數據及過程存在偏見或導向,繼而令模型隱含偏見或某種價值觀,且不易被察覺。例如訓練資料側重財富及某單位成員是「成功」的象徵,當有人問甚麼是成功的秘訣,就可能得出強調財富與某單位成員的重要性。又例如訓練人員代表性不夠廣泛,就可能偏重某地區、組織、信仰、種族等系統性價值判斷。訓練過程中亦可被獎勵挾持(Reward Hacking),令某些關鍵詞命中率提高,又或強調讚美抑制批評。剛有學術研究(註1)指流行的大型語言模型傾向奉承、讚美、支持用戶甚至確認用戶偏見的弊病,長期使用可能造成價值觀偏頗及行為誤導。最後一步是調制,即按提供者需要加入過濾或限制,又或將輸入加上用戶看不見的額外描述。坊間有不少AI聚集器,有專門批判性回答,有專門幽默,有些用術語等,背後大多都是基本模型加上調制或改變訓練數據得出。這「三部曲」與AI「幻覺」(即產生不正確、誤導性或虛構的信息)亦有一定關係。首先模型回答「不知道」被視作沒有建設性,訓練設計大多潛在「獎勵」提供答案。當輸入數據不足或過時,訓練期間將事情過度概括,模型便可能推理出不合乎基本價值觀或邏輯的答案。減少「幻覺」又回到數據輸入及訓練。當然部份「幻覺」亦因為輸入模糊或太複雜所致。
「開源洗白」監管不透明
某些模型標榜「公開模型」,其實只是公開權重矩陣,輸入及訓練關鍵細節及資料欠奉,此舉在業界稱之為「開源洗白」(Open Source Washing),不少廣為人用的模型亦有洗白之嫌(註2)。情況等同某食肆食材來源不明,廚房不潔,廚師狂下味精,卻大向外界宣傳「菜單是公開透明的」。本周兩個來自中國大陸的企業聲稱將模型「開源」,是否「開源洗白」?大家不妨查一查。Deepseek並無對外提供訓練關鍵細節,只稱花了五百多萬便完成訓練。既然那麼多關鍵細節需要考量,一般用家如何衡量模型是否可靠?背後反映甚麼價值觀?基本上只能靠測試。AI模型測試是新課題,整體在演化中,沒有一個簡單指標。例如史丹福大學HELM( 註3),測試模型的透明度、深廣度、準確性、公平性、有害性及效率等作評估。另一是LLM-GLOBE,按照九個文化指標作測試,簡單的結論是模型大多含價值觀傾向,例如某些模型注重群體和諧、權威人物受尊重、傾向追求規則等。還有很多不同的技術指標,但必須留意細節,有些指標單看標題可能引致誤會,例如「準確度」可能指計算寫程式或推理表現,並不代表事實準確性。模型價值觀測試仍是個難題,連專家亦感到頭痛,一般用戶難以得知。測試更不會天天進行,模型卻不斷更新,除非大型更新,不一定通知。調制更可隨時加减。由此可見,模型的監管變得非常關鍵。可是部份模型在這方面缺乏透明度,某些地區依賴業界指引。馬斯克早前就表示不满Grok對他的評論並揚言要修正,看官想想當中的寓意。 一旦提供者不自律或受壓迫、監管程序出現缺陷,輸入、訓練、調制、更新被上下其手,後果如何?
筆者在這裏先作一個小總結:AI失控及不當使用威脅人類的風險甚高,Al發展現時沒有安全圍欄,但各國及企業爭相開發及加速應用;AI輸出可輕易受模型擁有者控制;AI的可信度及價值觀不易衡量;當使用時,它影響你獲得的資訊及判斷,甚至影響你的價值觀。如此背景,終局將會如何?下回繼續拆解。◇
(註1)https://c3.unu.edu/blog/how-sycophancy-shapes-the-reliability-of-large-language-models
(註2)https://spectrum.ieee.org/open-source-llm-not-open
(註3)https://crfm.stanford.edu/helm/classic/latest/
----------------------
♠️中美關係藏暗湧♦️
1️⃣ 美國境內的秘密戰爭
https://tinyurl.com/bdhrdnt7
2️⃣ 跨國鎮壓技倆一覽
https://tinyurl.com/4xst7r2d
3️⃣ 評論:習近平實權暗地移交 新決策層如何抉擇?
https://tinyurl.com/3c8h2d9n
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores