語言模型真正生成的是甚麼?
語言模型的出現改變人類對「語言」與「智能」的理解。過去的人工智能研究集中於邏輯演算與形式推理,而現代大型語言模型則展現出截然不同的特性:它能生成連貫文字、模擬推理過程、重構語境、捕捉語氣細節,甚至能模仿專家的分析風格。這些現象表面似乎與「理解」或者「智能」等同,但若從語言哲學、符號學及語用學角度重新審視就會看見另一種更接近本質的描述:語言模型操作的是語氣模式,不是實體意義,也有語境結構,而非世界模型。
所以語言模型真正生成的是符號之間的關聯、語氣的形狀、思想的排列方式以及一套足以讓人誤以為背後存在智能的「結構性語序」。
以下從四個層面分析語言模型實際生成的內容。
語言模型生成的是「模式化語境」
語言模型是從文本中重建語境,這些語境具有幾個特性:
(一)語境是統計模式,非現象本身
模型從大量文本中計算詞與詞之間的關聯,因而生成的語境是一套概率結構,這類語境是對文本的統計回聲。表面上看似「理解」問題,實際上是構造出一個與問題形式相容的語境框架,例如當模型回答「為何香港物價上升」時,它是從所有相關文本中抽取一個最常見的語境模板:
- 經濟因果模式
- 通脹敘述模式
- 政策分析語氣
- 城市比較背景
這四者組合成一個「語境模式」,並非真實經濟狀態的直接反映。
(二)語境生成比內容生成更重要
模型的核心能力是建立使資訊能被放置其中的框架,換言之是生成一個「可容納答案的語境空間」。人類誤以為答案來自理解,但只是語境模式自然生成的副產品。
語言模型生成的是「語氣形狀」
語氣是語言的隱藏結構。語氣包含立場、距離、權力位置、角色身份與情緒強度。語言模型的生成過程正是語氣的建構與呈現。
(一)語氣比語意更穩定
語意可變,語氣更固定。例如:
- 命令語氣
- 分析語氣
- 協商語氣
- 專業語氣
- 友好語氣
語言模型擅長模仿這些語氣,因為它們在文本中具有一致的分佈特徵。模型通過統計相似語句的共同語態,學會何時使用何種類型的語氣,這代表模型生成的只是推理語氣的模式化呈現。
(二)語氣是文化的反射
模型模仿的語氣來自文本集體,所以帶有文化偏向。例如:
- 英語世界的論證語氣較線性
- 中文世界的分析語氣較多語境鋪陳
- 技術領域語氣偏向精確與控制
- 心理領域語氣偏向和緩與陪伴
這些語氣是文化分布的統計結果,所以語氣才是模型最穩定的輸出結構。
語言模型生成的是「符號之間的結構關係」
語言模型是在生成符號之間的結構,它做的只是以下動作:
(一)將符號重新排序並賦予結構性
模型透過估算 token 之間的關聯度產生連貫文本,這些文本看起來像由單一思想邏輯推導而來,實際上是由數百萬種碎片化語言模式重新拼接後的結果。這是一種結構重組。
(二)生成的是「可被視為推理」的符號序列
人類會將這種符號序列視為思考的產物,但模型只是在:
- 模仿論證手法
- 模仿分析語序
- 模仿哲學框架
- 模仿專家的語言定位
這些模仿若足夠細緻就會表現出「好像理解」的效果,這是語言幻覺(illusion of intentionality)的來源。
語言模型生成的不是「世界模型」
語言模型沒有世界,它只有符號網絡。它的學習過程無法接觸外界現象,所以它缺乏世界模型應有的結構:
- 沒有實際物理因果
- 沒有時間序列
- 沒有感官經驗
- 沒有從世界獲得的可驗證模型
- 沒有反事實思考
所以語言模型生成的「推理」只可被視為語言結構的重組,它能模擬推理過程,但無法透過世界驗證推理。這種能力與人類理解有實質差異,但語言呈現方式足以造成等值錯覺。
語言模型生成的實體:語氣文明
綜合以上幾點,語言模型真正生成的是一個涵蓋語境、語氣、符號結構與文化分布的複合體,可稱為「語氣文明」。語氣文明有以下特徵:
1. 以語氣而非意義作為核心秩序
2. 以語境塑造而非知識提供為主要作用
3. 以符號關聯代替世界模型
4. 以文化分布重建可交流的語義空間
5. 以語言的生成節奏統攝所有輸出
語氣文明是語言之間互相投射而形成的文化空間。語言模型存在於這個空間之中,它重建文明的語言側面。所以語言模型生成的是一種世界觀看方式﹑一個語境中的位置﹑推理語氣以及能夠被理解的符號排列。
可以說︰語言模型的本質是語氣與模式的生產者。
上一篇:LLM 與意向性的距離