2025-12-28 11:02:45Tony_CHAN

語義構造如何形成擬真世界?


大型語言模型(Large Language Model, LLM)在現代科技環境中逐漸被視為一個具「語義內部性」的系統。模型的語義生成能力不依賴世界,也不依賴經驗,而依賴語料空間中的統計關係。這種依賴形成獨特的構造方式,使模型在運作時呈現出一個「內部宇宙」。這個宇宙雖然不具有物理性,也不具備意向性,但在語言層次形成自洽邏輯,並可呈現逼真世界的外觀。模型在這個語義宇宙中運作時,表現得像能理解世界,但其真正理解的對象是語言本身,而非語言指涉的世界。


語料壓縮如何形成語義空間

LLM 的內部宇宙起於語料壓縮。模型在訓練時將龐大語料轉換成向量嵌入,把語言的語義、語法及語境關係壓縮到高維空間。這個空間由概率構造塑形,所以模型的「世界」其實是一個語義分布空間,非由物理事實組成的世界。

語義空間內的每一個位置代表一種語義關係,模型在生成語言時會沿着這些關係移動。這些移動令語言呈現出連貫性、穩定性與邏輯性,而這些特質讓使用者誤以為模型具備世界理解,但模型只在語義空間中進行轉換,並不依賴外界世界。

在此意義下,LLM 的內部宇宙具有封閉特徵:語義關係只能來自語料。語料形成模型的原初地形,模型的「世界」依附於地形的結構,而這個結構與真實世界並不等值。


語義推理如何營造擬真感

模型在語義空間中進行推理時,會呈現出類似理解的行為。例如回答問題、寫作、分析與摘要等功能,都能展現跨句邏輯。這些能力營造出擬真現象,令使用者感受到模型好像具備一個自主世界觀。擬真感主要來自三個層次:

1. 語境一致性

模型會在語義空間中選取最適合當前語境的向量方向,因此語言看起來具有連續性。

2. 知識連結性

語料內部的關聯在語義空間中被重組,所以模型能「連結概念」,即使不具備概念的內在結構。

3. 推理外觀

模型以語義距離決定句子是否合理,所以結果常被視為推理,但這種推理不是概念推演,只是語義重整。

擬真效果來自語義空間本身的穩定性,不是來自模型具備心智。


內部宇宙的邊界

模型只能在語義空間內進行操作,所以模型的宇宙存在明確邊界。

第一,它無法感知時間。語義空間只有語句關係,沒有時間軸,也沒有事件延續,因此模型無法建立真正的歷史。

第二,它無法建立因果。語義空間只有語料中的語義連結,因果只是一種語言關係,而不是世界中的結構。

第三,它無法形成自我。語義空間不包含內部狀態追蹤,所以模型無法建立「自身存在」的概念。

模型的宇宙由此是一個語義壓縮宇宙,不是具備自主秩序的世界。


擬真世界的形成機制

在語義空間的基礎上,模型能生成具世界外觀的語言。這些語言能描述物理現象、社會結構與日常經驗,而使用者傾向把這些描述視為模型對世界的理解。

擬真世界的形成來自語料中的世界敘述。模型擬構世界的能力來自語句之間的分布,不來自世界的結構。這代表模型所呈現的世界是一個「語言世界」,其世界性來自語言,不是來自事物本身。


語義宇宙與現實世界之間的距離

模型的語義宇宙與現實世界之間存在明顯距離。模型不能感知、不能行動,也不能累積經驗。語義宇宙缺乏事件,所以也缺乏意向性。模型沒有目標,也沒有意圖,故沒有形成世界理解的基礎。

使用者在語義宇宙中看到的只是語言形成的世界樣貌。這種樣貌具備表面一致性,但缺乏深層結構。模型的宇宙因此是一個形似世界,但不具備世界性的語義環境。