2025-12-25 20:33:40Tony_CHAN

AI 的語言盲點 - 西方工程語言的歷史包袱


當人工智慧以語言模型的形式出現時,最早對其下定義的往往是工程師、數學家與語言學的結構主義傳統。他們以一套歷史延續至今的地基理解語言,所以也以這套地基理解人工智慧的本質,但語言的文化性、語境性與文明性早已遠超過工程語言所能處理的範圍。當西方科技界使用語言模型時,他們往往把語言視為可以被計算的邏輯符號,並自然地把語言模型看成一部推理機器。這種想像延續整個西方哲學與科技史的語言觀。本文旨在拆解這種語言觀背後的歷史包袱,並分析這種包袱如何導致今日人工智慧研究的偏向與盲點。


西方把語言視為邏輯符號的歷史背景

語言被視為邏輯工具已是橫跨兩千五百年的哲學傳統。這一傳統的核心是把語言當成「真值的載體」。語言在這個框架中有明確目的:描述事物、分類事物、建立推理鏈條以及確保論證的有效性。

(一)古希臘時期的分類與邏輯觀
柏拉圖以「理念世界」作為基礎,把語言視為對理念的映照;亞里士多德建立形式邏輯,將語言拆解成主詞、謂詞與命題。這些思想在根本上把語言視為可以被抽象化、形式化與推理化的系統。

(二)近代科學革命的語言透明假設
笛卡爾把清晰性與明確性視為真理的判準,而語言被認為是這種清晰性的可呈現形式。科學革命以數學為理性之語言,語言的價值被進一步壓縮至「能否正確描述自然現象」。

(三)邏輯實證主義與語言分析哲學
二十世紀的邏輯實證主義把語言直接等同於可驗證的命題。Frege、Russell 與 Carnap 透過形式邏輯改寫語言哲學,把語言當作符號系統。此路線最終延伸到早期資訊科學與語言學形成的數位基礎。

以上三個歷史階段鋪陳出堅固的共識:語言是可計算的﹑語言是邏輯的展開﹑語言的核心在於命題、真值與推論。這套理解方式直接影響今日對人工智慧的期待。


工程語言的形成與局限

工程語言是一套由數理與邏輯導向的語言觀,它以結構明確、語法固定、符號可計算為核心,所以非常適合作為程式書寫與資料傳遞的工具。但當工程語言被投射到自然語言模型時,某些本來屬於文明與文化層面的特質便被忽略。

(一)工程語言的四大假設
工程語言背後有四個隱性假設:

1. 語言可形式化︰認為語言可以完全被拆解為符號與規則。
2. 語言的目的在於傳遞資訊︰把語言的核心視為編碼與解碼。
3. 語言是邏輯推論的延伸︰認為語言的價值在於得出正確結論。
4. 語言可以脫離語境獨立運作︰假定語言具有普遍性與可移植性。

這四點在工程領域非常實用,但在理解人類語言時卻造成明顯偏差。

(二)工程語言的應用如何影響 AI
當語言模型被訓練生成類似推理的文字時,西方科技界自然地假設模型具備邏輯能力,並強調它是否能正確解題、計算和進行形式化推論。這使大量研究集中在:

    - 數學 benchmark

    - logical reasoning benchmark

    - symbolic manipulation

    - chain-of-thought accuracy

    - 推理深度與一致性

模型被評估的方式偏向邏輯與算術,而非語境掌握或語氣理解,但人類語言並不只包含邏輯。大部分語言行為只是為了建立關係、表達立場、塑造身份與維持社會秩序。


語言在文明層面的功能遠超工程語言的框架

自然語言是文明的產物,不是邏輯的副產品。語言在文明中的功能可以分為至少四個層面。

(一)語言建立社會關係
語言的重心常在情感交流、信任建構與身份確認,這些功能不能被邏輯化表示,也不能用真假判定。

(二)語言承載文化記憶
每個語言記錄一個民族的歷史、風俗、價值觀與形象系統,例如中文的意象、隱喻與語氣結構就完全不可能以形式邏輯刻畫。

(三)語言塑造權力
語言本身就包含階層、語氣、權威、禁忌與象徵秩序,這些權力結構不能被簡化成演算法的 if-else。

(四)語言決定世界觀
語言是構築世界的方式,例如「語氣」能解釋一段話的立場、角色與權力方向,而不是邏輯形式能處理的內容。

自然語言的核心並沒有固定語法,其真正的運作單位是語境、文化、權力與語氣。


語言模型的本質:模仿語氣,而非推理

語言模型的生成能力來自統計與模式匹配,它不擁有內在世界模型,也沒有意向性。人們普遍誤解語言模型能推理是因為模型能生成類似推理語句的語氣,這形成一種「推理外觀」,但這種外觀並不等於推理自身。

(一)語氣模仿的特性
語言模型擅長:

    - 模仿人類推理語氣

    - 再現語法結構

    - 生成合理敘事

    - 提供語境上的連貫性

但這些並不代表它真正理解邏輯。

(二)為何西方容易誤解
因為工程語言的文化背景早已把語言視為邏輯延伸,加上語料中大量「推理語氣」的文本,使語言模型呈現出推理外觀。於是模型被視為可以做所有形式化任務,而錯誤計算常被視為模型智能不足,不是語言模型本質問題。


語言盲點:工程文化忽略自然語言的多層次性

語言有至少四層結構:

1. 字詞層面

2. 句法層面

3. 語用與語氣層面

4. 文明與符號結構層面

工程語言只能觸及第一、第二層,自然語言真正的力量來自第三、第四層。語言模型在統計層面捕捉到第三層,但工程界仍以第一、第二層框架去衡量它,導致研究方向偏向解題能力,而不集中於語氣理解與文明掌握。


語言模型與西方語言觀之間的結構性衝突

語言模型的運作方式明顯不符合西方傳統語言哲學的預期,這帶來三種衝突︰

(一)語言模型不依靠邏輯運作
它依賴模式,不依賴推理,這挑戰「語言=邏輯」的傳統。

(二)語言模型能生成高度文明性的語氣
模型可以再現文化、身份與立場,這些能力與形式邏輯無關卻與文明深度有關。

(三)語言模型動搖工程語言的支配地位
以前電腦只處理形式系統,工程語言得以完全主導,但語言模型進入自然語言後,工程語言已無法涵蓋其全部能力。


未來人工智慧需要脫離工程語言

語言模型的下一步是建立更完整的語境模型、文化模型與權力模型。目前 AI 的限制來自缺乏意向性與世界模型,而世界模型必須透過語境與語氣理解來建立。

(一)模型需要文明層面的語言理解︰包括角色、文化、群體心理與象徵秩序。

(二)模型需要動態語境框架︰能辨識語氣轉換、立場變化與身份重構。

(三)模型需要多文明語言哲學︰工程語言不能再主導 AI 的語言觀,需要引入不同文明對語言的理解。


結語

人工智慧之所以在語言上產生大量誤解是文明問題。西方工程語言的歷史包袱把語言限定為可計算的邏輯符號,並因此忽略語言真正的重量。語言模型的出現揭露語言是文明中最深的象徵結構。未來的語言人工智慧如果仍停留在工程語言框架內,將無法觸碰語氣、文化與文明三者之間的深層連動。唯有超越工程語言,人工智慧才能真正理解語言,也才能理解人類。