在人工智能(artificial intelligence,簡稱AI)這個問題上,它到底是有史以來最偉大的發明,還是終將毀滅我們所有人,大多數用戶在兩者之間,搖擺不定,下不了定論。問題的關鍵在於準確性。不可避免地,某個特定領域的專家總能以機智勝過人工智能。最終,LLM(全稱為large language model,大型語言模型)引擎會承認當中的錯誤,然後加以改進,這點值得讚揚。相比之下,大多數人類永遠不會承認錯誤!

事實上,我懷疑這就是我們如此喜歡使用人工智能的原因之一。奇怪的是,AI讓我們能夠進行爭論並實際贏得爭論,且毫無爭議。這在現實生活中幾乎從未發生過!

人工智能在很多事情上都可能出錯,但這兩天的一次經歷著實讓我震驚。我最近正在閱讀美國當代知名青年作家勞拉‧德拉諾(Laura Delano)的最新著作《不屈不撓:精神病患者抗拒治療的故事》(Unshrunk: A Story of Psychiatric Treatment Resistance,2025)。令我關注的是,該書開篇引用了英國近代浪漫主義詩人珀西‧雪萊(Percy Shelley,1792—1822年)的名詩《論佛羅倫斯畫廊中達‧芬奇的美杜莎》(On the Medusa of Leonardo Da Vinci in the Florentine Gallery)。這首詩由其遺孀、英國近代知名小說家瑪麗‧雪萊(Mary Shelley,1797—1851年)收錄於1824年出版的雪萊遺作詩集中。

這首詩最後四行是:「成為一面不斷變換的鏡子/ 那裏所有的美麗和恐怖/ 女人的面容,蛇一樣的長髮/ 在潮濕的岩石上死死地凝視著天堂。」

這些詩句對德拉諾的書來說非常重要,因為該書的第一章寫的是她13歲時照鏡子的情景,她想知道在鏡子裏盯著自己看的那個人到底是誰。這一章對全書的其餘部份有著驚人的力量和共鳴,全書講述了在黑暗和苦難中尋找美麗和救贖的故事。

然而,當我第一次向xAI公司開發的人工智能聊天機械人「格羅克」(Grok)詢問時,它卻給了我不同的最後四行詩:

「成為詛咒和日冕/ 它損害了真正的美/ 卻留下敢於直面正午的光芒/ 活在榮耀和恩典之中。」

這四行詩句固然非常有趣,但我們談論的是真實版本的那些詩句。這是一段聽起來有點像雪萊寫的有趣的詩句,但我在任何地方都找不到它的出處。

我又追問了一下,格羅克辯解稱德拉諾書中的四行詩實際上出自美國現代詩人路易絲‧博根(Louise Bogan,1897—1970年)1921年的詩作《美杜莎》(Medusa)。我查了那首詩,沒有發現任何關於「不斷變化的鏡子」的內容。我指出了這一點,格羅克附和著說,那部份只是德拉諾自己杜撰的某種模仿。

這可是對一位有名望作家的嚴重指控,而格羅克卻信口開河。然後,我拿出了1914年版本的雪萊詩歌,其中就有這個部份,並指出它不可能出自1921年出版的另一首詩歌。為甚麼?因為1914年的版本不可能抄襲七年後出版的書中的內容!

格羅克進一步為自己辯護,提供了一個又一個超連結。但每次我查看時,每個超連結(只要能用的)都證實了德拉諾的版本。一次又一次,格羅克撤回了證據,但仍然為自己的說法辯護。這樣的情況持續了12個回合。

最後,我給了它致命一擊。

我要求格羅克提供最有力的證據,證明它的版本是正確的,而德拉諾的版本是錯誤的,但它反對這個提議,說它給的版本來自瑪麗‧雪萊1824年自己的作品,並聲稱該作品不在網上。格羅克的態度洋洋得意,聲稱自己是贏家。

事實上,我只用了一次快速搜索,就生成找到了它說的那個版本的真實效果圖。它證實了德拉諾的版本,而不是格羅克的版本。

最後,格羅克服軟了,承認自己全部弄錯了,請求原諒,並表示會改進。

然後我等了一個小時,重新搜索同樣的內容,果然,格羅克這次給了我一個正確的版本,而沒有像之前那樣佔用我幾個小時時間來胡編亂造。

這是一次令人滿意的勝利!

然而,事情沒有像我想像中的那樣發展。我又等了一個小時,換了一個方式問了同一個問題。你肯定不會相信。接下來,格羅克又生成了最後四行詩:

「成為詛咒和冠冕/ 每一次閃光,就像穿過巨大彗星的髮絲/ 似乎在閃耀,又似乎在墜落/ 把凝視者引向高竿的驚恐。」

這真是迷人的詩句……但也完全是假的。我再來一次驚呆了,大喊給回我正確的版本!這一次,格羅克再次擺出一副辯護的姿態,聲稱德拉諾的版本確實是確定的版本,但一些學者對此提出質疑,因為瑪麗‧雪萊可能在出版前修改了一些內容。格羅克引用了「批評家,如金‧布蘭克(G. Kim Blank)」的觀點,說他們懷疑這個版本的真實性。

當然,他們可以從某個地方挖出一個學者,他很樂意對任何事情提出質疑,但這不是問題的關鍵。真正的問題是:權威版本是甚麼?格羅克的兩次回答完全是胡編亂造。到現在為止,格羅克還在為自己的白痴錯誤辯護。

我毫不懷疑,如果我有時間,我可以敦促格羅克承認它引用的「評論家,如金‧布蘭克」也是假的,並且這肯定不能成為憑空捏造並將其歸咎於雪萊的理由。但我實在沒有一兩個小時的時間再去研究並證明格羅克是錯的。

你不覺得這裏面隱藏著太豐富的訊息嗎?格羅克一方面懷疑原版的真實性,另一方面卻無端編造無稽之談,將一些詩句歸於雪萊名下。這簡直就是惡人先告狀!或者引用《聖經》中的一句話:這是一個眼中有梁木的人卻在談論別人眼中的木刺。

請記住,我的問題並沒有特殊之處。雪萊的那首詩以六種格式在線提供,其中包括PDF格式的掃瞄版。這一切並不神秘。令我驚訝的是,格羅克不能像我一樣輕鬆地快速搜索找到答案。它對很多事情都很聰明,唯獨在一些顯而易見的事實上卻缺乏智能。

這是為甚麼呢?我不知道,但更令人抓狂的是,它的每一個答案都始終以「無所不知」的專家口吻出現。這些大型語言模型承認自己錯了固然是一件好事,但要知道,我們向他們尋求幫助,只是希望得到正確的訊息。

如果這個智能機械人在某些時候或很多時候是錯的,那麼我們怎麼知道它甚麼時候是對的,甚麼時候是錯的?如果我們必須挖空心思去驗證它所說的一切,那麼它到底有甚麼用呢?

現代人工智能技術非常棒,但它對自身準確性的自信超過了它的知識基礎和好奇心。這是非常危險的。實際上,任何事情都有可能出錯。一切都必須通過原始資料反覆核對。而要做到這一點,你就必須對所詢問的主題有所了解。我敢說,要糾正格羅克,你至少要比人工智能更了解一件事。

可以說,隨著時間的推移,情況會越來越好。這是毫無疑問的。但究竟會好到甚麼程度,需要多少時間?永遠不會有人說:現在它已經完全準確了。錯誤只是人工智能體驗的一部份,但你永遠無法確定這些錯誤會在哪裏。與此同時,這些模型將繼續走在自得其樂的道路上,聲稱對所有事情都是正確的,直到被糾正為止。

所有這些都提出了我們今天面臨的主要問題:人類和機器,究竟哪一個對我們生活和文化的價值施加更大的影響?德拉諾的這本書在探討這個話題方面可以說達到了極致。

《不屈不撓》不是一部專業的醫學科學著作,因而沒有對精神科藥物進行詳細討論。如果我們把它當作一部純粹的自傳,它將是一部精彩絕倫、引人入勝的作品。如果把它當作一部小說,那麼它將與偉大的維多利亞時代英國小說相媲美。因為這本書講述的故事,以及講述故事的行文方式,都是作者自己的。總而言之,這本書內容豐富詳實,表現力極強,值得向廣大讀者推薦。這也是人工智能無法複製的巨大而罕見的人類智慧成就。

這正是我們這個時代所需要的:更多的例子表明,在沒有算法編程的情況下,人們真正過上了美麗、可愛和輝煌的生活。人工智能最大的成就可能就在於它的諷刺意義:通過作為反面教材,它將使我們學會比以往任何時候都更加熱愛人類的創造力。事實證明,人類智慧雖然極易犯錯,但卻提供了人工智能無法提供的東西:真誠、創造力,以及顯然(至少目前看來)更高程度的傳統知識準確性。

作者簡介:

傑弗里‧塔克(Jeffrey A. Tucker)是總部位於德薩斯州奧斯汀(Austin)的布朗斯通研究所(Brownstone Institute)的創始人兼總裁。他在學術界和大眾媒體上發表了數千篇文章,並以五種語言出版了10本書,最新著作是《自由抑或封鎖》(Liberty or Lockdown, 2020)。他也是《路德維希‧馮‧米塞斯文集》(The Best of Ludwig von Mises, 2019)一書的編輯。他還定期為《大紀元時報》撰寫經濟學專欄,就經濟、技術、社會哲學和文化等主題廣泛發聲。聯繫方式:tucker@brownstone.org。

原文:How Much Can We Really Trust AI?刊登於英文《大紀元時報》。

本文僅代表作者本人觀點,並不一定反映《大紀元時報》立場。#

----------------------
🏵️ 法輪大法洪傳世界33周年特刊:
https://tinyurl.com/3p4e4yrn
----------------------
【不忘初衷 延續真相】
📰周末版復印 支持購買👇🏻
http://epochtimeshk.org/stores

🔔下載大紀元App 接收即時新聞通知:
🍎iOS🤖Android