中文組合式概念生成命題：語義透明度、複合詞優勢與高密度理論詞彙的跨語言轉譯問題

作者：Neo.K
機構：EveMissLab / 一言諾科技有限公司
日期：2026-07-03
版本：v0.1 初稿
定位：命題猜想／語言學與認知科學打底版／中文概念生成論／英文學術轉譯策略／AI 語料學習與高密度術語設計

摘要

本文提出「中文組合式概念生成命題」：在新理論、新概念與高密度術語生成中，中文因其高度依賴字義、語素與複合詞組合，常能在不完全依賴既有學術傳統術語的情況下，生成具有較高直覺可讀性的抽象概念詞。換言之，中文新詞若設計得當，讀者即使未完全掌握整套理論，也可透過構成字義初步推測其被指方向、概念位置與語義輪廓。

本文不主張中文在所有方面優於英文，也不主張中文概念必然透明。語言學中的「語義透明度」指多語素詞的整體意義能在多大程度上由其構成部分推得，這一概念本身已說明：複合詞可透明，也可半透明或不透明。因此，本文主張的是一個條件性命題：當中文新概念詞以較透明的字義組合方式生成時，它往往能比高度拉丁化、希臘化、縮寫化或任意自造的英文術語，更直接地提供一層概念解壓入口。

漢語本身高度依賴複合詞構詞。相關研究指出，漢語大量詞彙由兩個或更多漢字構成，而多數漢字大致可對應單音節語素，因而漢語詞彙處理與語素組合、語義透明度、複合詞結構密切相關。 Cambridge《The Cambridge Handbook of Chinese Linguistics》中亦有章節明確以「Compounding Is Semantics-driven in Chinese」為題，指出漢語複合詞構詞研究需要處理構成語素間的表層語義關係與語義—句法關係。

相對而言，英文當然也能透過複合詞、派生詞、希臘／拉丁詞根與學術傳統生成新詞；英語詞根與形態知識也確實有助於讀者理解陌生學術詞彙。但英文高階學術術語的理解往往更依賴讀者已經掌握相應詞根、學術傳統、定義網絡與語境。若大量自造英文術語缺乏定義層、例子層與 glossary，便容易形成術語牆，使讀者看見詞形卻難以直覺解壓其被指。

本文最終提出一個三層語言策略：中文適合作為高密度新概念的生成語言，英文適合作為國際學術對接與搜尋索引語言，符號或形式化系統則適合作為跨語言壓縮與 AI 可操作化語言。換言之，中文可先長出概念，英文需建立橋接，符號負責後續穩定與操作。

關鍵詞

中文構詞、複合詞、語義透明度、形態意識、概念生成、術語生成、英文轉譯、學術詞彙、AI 語料、被指、符號、底空間、概念壓縮、組合式語言、跨語言知識表示

1. 問題意識：為什麼中文新概念有時比較「看得懂」？

在高抽象理論創作中，經常需要創造新詞。

例如：

前符號被指
底空間
可轉化張力密度
高密度互動學習
0/1 無限資訊層
編織元
高階成織節點

這些詞若以中文呈現，即使讀者不熟悉整套理論，也大致能從字義組合推測方向：

前符號被指 = 符號之前 + 被指向的對象
底空間 = 底層 + 空間
可轉化張力密度 = 可以轉化的 + 張力 + 密度
高密度互動學習 = 高密度 + 互動 + 學習

這就是中文新概念詞的特殊性：許多時候，字面結構本身就提供一層最低限度的概念入口。

但若直接翻成英文：

pre-symbolic referent
base-space
transformable tension density
high-density interactive learning
zero-one infinite information layer
weaving element
higher-order woven node

英文讀者可能會覺得這些詞過於密集、陌生、系統內部化，甚至像一整面術語牆。

因此，本文要處理的問題是：

為什麼中文在創造新理論詞彙時，常能保留較高直覺可讀性？
為什麼英文若直接承載同等密度的自創詞彙，容易變成天書？
中文新概念詞的優勢與風險是什麼？
英文版又應如何轉譯？

2. 語義透明度：本文的語言學基礎

2.1 定義

語言學與心理語言學中有一個重要概念：

semantic transparency
語義透明度

其基本意思是：

一個多語素詞的整體意義，能在多大程度上由其構成部分的意義推得。

例如英文中：

snowman

大致可由：

snow + man

推得。

但有些詞即使由熟悉成分構成，整體意義也不容易直接推得，這就是語義透明度較低。

中文中亦然。

例如：

火車
電腦
手機
底空間

這些詞或概念在某種程度上可由字義提供推測入口。

但：

馬虎
東西
革命
玄關

這些詞就不能完全由字面直接推得。

因此，本文不是說中文天然透明，而是說：

中文在新詞設計上較容易利用字義組合來提高語義透明度。

2.2 語義透明度與新概念生成

對新概念而言，語義透明度特別重要。

因為新詞尚未進入既有詞典。

讀者初次看到它時，只能依靠：

構成字義；
上下文；
既有學術語境；
例子；
定義；
語感；

若構成字義透明，新詞就比較容易被初步解壓。

若構成字義不透明，讀者必須完全依賴作者定義。

因此，新理論詞彙設計的核心問題之一是：

能不能讓詞自己攜帶一部分定義？

中文在這裡具有明顯優勢。

3. 漢語複合詞與字義組合

3.1 漢語高度依賴複合詞

現代漢語大量使用複合詞。相關研究指出，約 74% 的漢語詞彙由兩個漢字構成，而漢字通常是單音節並具有一個或多個意義，多數漢字大致接近單語素，因此許多漢語詞可視為雙語素複合詞。

這意味著，中文使用者本來就熟悉透過字義組合理解詞彙。

例如：

心理學
人工智慧
語言模型
社會結構
自我調節
認知張力

這些詞都可以透過字義組合建立初步理解。

3.2 漢語複合詞的語義驅動特徵

Cambridge《The Cambridge Handbook of Chinese Linguistics》收錄的章節「Compounding Is Semantics-driven in Chinese」指出，漢語複合詞構詞研究關注構成語素間的表層語義關係，也會進一步分析語素之間的語義—句法關係。

這對本文很重要。

因為它說明：中文構詞不只是字音拼接，也不只是形式拼接，而是高度涉及語素間的語義關係。

因此，中文新概念詞若設計得當，可以讓讀者透過構成語素推測：

這個概念的方向；
這個概念的層級；
這個概念的內部關係；
這個概念可能與哪些概念相鄰；

例如：

符號—被指張力場

讀者可拆成：

符號
被指
張力
場

雖然不一定完全懂，但已經知道大概在討論：

符號與其所指對象之間的張力關係。

4. 中文作為概念生成語言

4.1 字義組合的優勢

中文概念生成有一個重要優勢：

字本身常常可作為低階語義單元，彼此組合後形成高階概念。

這使中文適合快速製造新概念詞。

例如：

前符號被指

可拆為：

前 = 在某物之前
符號 = symbol
被指 = 被指向的對象

於是讀者至少能初步理解：

這是在討論符號形成之前的指涉對象。

再如：

可轉化張力密度

可拆為：

可轉化 = 可以被轉換成其他形式
張力 = tension
密度 = 單位時間或單位空間中的集中程度

讀者便可初步理解：

這是在討論單位時間或單位互動中，可被轉化的認知張力量。

4.2 中文新詞可攜帶半定義

理想的中文新詞不是任意命名，而是讓詞本身攜帶半定義。

例如：

底空間

比起一個完全自造音譯詞，更容易讓讀者推測：

某種底層空間；
某種更深的結構域；
某種概念或存在的背景場；

這不是完整定義，但已提供入口。

本文稱之為：

半定義式新詞

即：

詞語自身的構成字義，已經提供一半左右的概念方向，剩下部分由作者定義、例子與上下文補足。

4.3 高密度詞彙的可承載性

高抽象論文不可避免會出現高密度詞彙。

問題不是能不能高密度，而是高密度詞彙是否能被讀者承載。

中文若使用透明組合詞，能降低高密度的解壓成本。

例如：

高密度符號—被指互動學習

雖然很長，但可拆解：

高密度
符號
被指
互動
學習

讀者仍可沿字義逐步解壓。

這就是中文在高密度理論創作中的重要優勢。

5. 英文作為國際學術對接語言

5.1 英文的優勢

英文的優勢不在於新概念一定更透明，而在於：

國際學術網絡；
文獻索引；
搜尋可見性；
跨國引用；
既有術語體系；
期刊與學術共同體；

英文能讓概念進入全球知識網絡。

因此，英文非常適合作為：

國際對接語言；
索引語言；
引用語言；
跨學科交流語言；

5.2 英文術語的理解成本

英文也可以透過複合詞與派生詞生成新概念，但其高階學術詞彙常依賴希臘／拉丁詞根、前綴、後綴與學術傳統。

教育資料與詞彙教學文獻普遍指出，熟悉希臘與拉丁詞根、前綴與後綴，有助於學生理解陌生詞彙。

這點正好說明英文學術詞彙的雙重性：

若讀者懂詞根，英文術語可被拆解；
若讀者不懂詞根，英文術語就變成封閉符號。

例如：

epistemology
ontology
phenomenology
morphology
semantics
referentiality

這些詞在學術共同體中很有效率，但對未受訓讀者而言，語義透明度不高。

5.3 自創英文術語的術語牆風險

若把中文高密度新詞直接翻成英文，可能變成：

pre-symbolic referential substrate positioning
transformable cognitive-tensional density
high-order woven semantic node
zero-one latent manifestation continuum

這些詞不一定錯。

但它們需要大量定義。

若定義不足，讀者會看到：

陌生詞 + 陌生詞 + 陌生詞 + 陌生詞

最後形成術語牆。

因此，英文版不能只是直譯中文新詞。

英文版必須建立：

term
definition
example
contrast
glossary

也就是：

術語
定義句
例子
與相鄰概念差異
詞彙表

6. 中文不是天然優越，英文不是天然劣勢

6.1 中文的風險：太容易造詞

中文的優勢也是風險。

因為中文太容易組合新詞，作者可能快速製造大量術語。

例如：

底空間狀態流生成張力場成織節點

這種詞雖然每個字都能懂，但整體仍可能過度壓縮。

因此，中文新詞也需要控制：

長度；
密度；
層級；
定義；
例子；
使用頻率；

中文的問題不是不能造詞，而是太容易造詞。

6.2 英文的優勢：穩定學術網絡

英文雖然在自創術語上可能較不直覺，但它有強大的既有學術網絡。

一旦概念被放入英文術語系統，就能接上：

semantic transparency
morphological awareness
conceptual metaphor
symbol grounding
latent space
compound processing
ontology
semiotics
abduction

這使英文適合後期對接、引用與國際擴散。

6.3 最佳策略不是二選一

因此，本文不主張：

中文比英文好。

也不主張：

英文比中文高級。

本文主張：

中文適合概念生成；
英文適合國際對接；
符號適合形式壓縮與 AI 操作。

三者功能不同。

7. 三層語言策略

7.1 第一層：中文原生概念生成

中文先用字義組合生成概念。

例如：

前符號被指

此階段重點是：

直覺；
被指；
概念切分；
語義透明；
生成速度；

7.2 第二層：英文研究譯名

再給出英文短譯。

例如：

pre-symbolic referent

此階段重點是：

可搜尋；
可引用；
可與既有英文學術詞彙對接；

7.3 第三層：英文定義句

英文短譯後必須立刻補定義句。

例如：

pre-symbolic referent:
the target or object of meaning that is sensed before it is stabilized into a symbol, term, or formal definition.

這句比術語本身更重要。

因為英文讀者需要定義層來解壓。

7.4 第四層：例子與反例

每個自創術語都應附：

example
non-example
contrast

例如：

Example:
A vague but stable object of thought that a theorist senses before naming it.

Non-example:
A random feeling with no stable object, no boundary, and no later definition.

Contrast:
Unlike ordinary intuition, a pre-symbolic referent must be capable of later symbolic compression and shared correction.

8. AI 語料學習的意義

8.1 中文高密度新詞對 AI 的價值

對 AI 而言，中文組合式新詞可能具有特殊價值。

因為即使模型沒有見過某個完整新詞，也可能透過組成字義推測方向。

例如：

可轉化張力密度

模型可從：

可轉化
張力
密度

推測其與：

learning challenge
cognitive tension
transformable pressure
density of interaction

等概念相鄰。

這是一種組合式語義學習。

8.2 英文版對 AI 的價值

英文版則有不同價值。

它能讓 AI 把新概念接到全球語料中的既有學術網絡：

semantic transparency
morphology
compound processing
symbol grounding
AI tutoring
cognitive load
interactive learning
ontology

因此，英文版不是多餘的。

它的任務不是複製中文直覺，而是建立國際語義連接。

8.3 雙語概念庫

最佳方式可能是建立雙語概念庫。

格式如下：

中文詞：
前符號被指

英文短譯：
pre-symbolic referent

英文定義：
the target of meaning sensed before symbolic stabilization

中文定義：
符號、術語或形式定義出現之前，已被智慧體模糊感知並可後續命名、校正與證書化的被指對象。

例子：
一個理論家先感到「那裡有一個概念」，但尚未找到名稱。

相鄰概念：
intuition, referent, symbol grounding, latent concept, abduction

差異：
它不是普通靈感，而是可被後續符號化與共同檢查的前符號對象。

這種雙語庫對人類與 AI 都有用。

9. 本文核心命題

9.1 中文組合式概念生成命題

中文在創造新理論詞彙時，因其高度依賴字義與語素組合，常能在不完全依賴既有學術術語的情況下，生成具有較高直覺可讀性的高密度抽象概念。

9.2 語義透明度條件命題

中文新詞的優勢不是自動成立，而取決於其構成字義是否透明、組合關係是否合理、上下文是否足夠、定義是否能補足。

9.3 英文術語牆風險命題

若將中文高密度新詞直接翻譯為英文自創術語，而缺乏定義、例子、反例與 glossary，英文讀者容易遭遇術語牆。

9.4 英文國際對接命題

英文的主要優勢在於國際學術對接、文獻索引、引用與跨語言傳播；因此英文版應承擔橋接功能，而不是只是直譯功能。

9.5 三層語言策略命題

高抽象理論若要同時保持生成力與傳播力，應採取中文生成、英文橋接、符號壓縮的三層策略。

9.6 AI 語料學習命題

中文組合式高密度概念詞可能為 AI 提供可拆解的語義生成樣本，而英文橋接詞彙則有助於 AI 將該概念接入全球學術語料網絡。

10. 形式化草案

設：

T = term，新詞
M = morpheme，語素或字義單元
S = semantic transparency，語義透明度
D = definition cost，定義成本
C = concept density，概念密度
R = reader prior knowledge，讀者先備知識
G = glossary support，詞彙表支持

則可暫時表示：

Comprehensibility(T)
= f(S, R, G) - D

其中：

若 S 高，讀者可由構成字義推測；
若 R 高，讀者可連接既有知識；
若 G 高，術語可被快速解壓；
若 D 高且缺乏支持，理解成本增加。

對中文高透明新詞：

S 較高；
D 較低；
初始可讀性較強。

對英文高度自創術語：

S 取決於詞根與既有術語知識；
D 較高；
需要 G 補足。

11. 轉譯策略

11.1 不建議：硬直譯

例如：

底空間狀態流生成張力場

若直接譯為：

base-space state-flow generative tension field

讀者可能無法理解。

11.2 建議：術語 + 定義句

應改為：

base-space state-flow:
a sequence of changing conceptual or ontological states that remain traceable at a deeper structural level.

先給短術語，再給定義句。

11.3 建議：保留中文詞作為原生標記

某些核心概念可以保留中文原詞。

例如：

Dao
Qi
Yin-Yang
Li

類似地，未來某些 Neo.K 系統詞也可保留中文音譯或漢字，再加英文定義。

例如：

Dikongjian（底空間）:
the deeper structural space in which conceptual, symbolic, or ontological states can be positioned and traced.

但此策略需謹慎，否則會增加異國化與神秘化風險。

12. 概念表範例

中文詞	英文短譯	英文定義策略
前符號被指	pre-symbolic referent	meaning-target before symbolic stabilization
底空間	base-space	deeper structural positioning space
可轉化張力密度	transformable tension density	density of cognitive tension that can be processed and converted into learning
高密度互動學習	high-density interactive learning	learning through high-frequency, high-feedback symbolic interaction
編織元	weaving element	an element that can be woven into a structural, semantic, or ontological network
成織節點	woven node	a higher-order node formed by coherent weaving relations
0/1 無限資訊層	zero-one infinite information layer	the intermediate generative layer between non-manifest and manifest states

13. 限制與反對意見

13.1 反對意見一：中文也有很多不透明詞

回應：

正確。

本文不主張中文所有詞都透明。本文只主張：在新詞設計上，中文較容易透過字義組合提高語義透明度。

13.2 反對意見二：英文也能組合出透明詞

回應：

正確。

英文也有 compound words，例如：

blackboard
sunlight
mind-map
feedback loop

但英文高階學術詞彙常大量依賴非日常詞根、傳統術語與學術訓練，因此新造高密度術語若缺乏定義，理解成本可能較高。

13.3 反對意見三：中文高密度詞也可能變天書

回應：

正確。

中文高密度詞若過長、過密、缺乏定義，也會變天書。

因此，中文概念生成仍需：

短詞優先；
定義跟上；
例子補足；
反例校正；
章節中逐步引入；

13.4 反對意見四：概念真正重要的是思想，不是語言

回應：

思想與語言不能完全分開。

新概念若沒有合適語言，很難被記憶、傳播、校正與操作。

因此，語言不是思想的外衣而已。

語言是概念生成與共同理解的操作工具。

14. 可反駁條件

本文可被以下情況削弱：

1. 若中文新造複合詞在實驗中並不比英文透明複合詞更容易被推測；
2. 若讀者完全無法從中文構成字義推測新概念方向；
3. 若英文自創術語在無 glossary 條件下與中文新詞同樣容易理解；
4. 若 AI 對中文組合式新詞的語義推測能力不高於對任意英文自造詞；
5. 若語義透明度對高抽象概念理解沒有明顯影響；
6. 若雙語 glossary 不提升跨語言理解與傳播效果；

若這些成立，本文需要修正。

但若相反，本文命題具有研究與實作價值。

15. 研究方向

15.1 新詞理解實驗

可設計實驗比較：

中文透明新詞；
中文不透明新詞；
英文透明複合詞；
英文拉丁化術語；
英文任意自造詞；

測量：

初次理解準確度；
反應時間；
解釋品質；
記憶保留；
遷移能力；

15.2 AI 語義推測實驗

給 AI 未見過的新詞，例如：

可轉化張力密度

與英文自造詞，例如：

trans-tensional cognitensity

比較 AI 是否能從組成部分推測概念方向。

15.3 雙語 glossary 效果研究

測試同一篇理論文本在三種版本中的理解效果：

純中文；
英文直譯無 glossary；
英文橋接版有 glossary、例子與反例。

比較讀者理解與概念遷移能力。

16. 附錄 A：寫作建議

16.1 中文寫作

中文新概念詞應遵守：

字義透明；
長度可控；
先短後長；
先定義再疊加；
避免過度連接；
用例子保護被指；

16.2 英文寫作

英文新概念詞應遵守：

term first;
definition immediately;
example next;
contrast with existing terms;
glossary at the end;
avoid stacking too many invented terms in one sentence.

16.3 AI 友善寫作

AI 友善版本應提供：

中文詞；
英文譯名；
定義；
例子；
反例；
相鄰概念；
形式化草案；

這能降低模型誤讀與錯接。

17. 附錄 B：一句話版本

中文適合作為高密度新概念的生成語言，因為字義組合能保留一層直覺透明度；英文適合作為國際學術對接語言，但高密度自創詞必須配套定義、例子與詞彙表，否則容易變成術語牆。

18. 結語

高抽象理論需要新詞。

沒有新詞，很多新對象無法被切出。

但新詞也會帶來理解成本。

中文的特殊優勢在於，它可以用字義組合降低新詞的初始理解成本。當一個新詞被設計為透明複合詞時，讀者可以從字面開始解壓，而不必完全依賴外部詞典或學術傳統。

英文的特殊優勢則在於全球學術對接。一旦概念被英文橋接，它能進入文獻、搜尋、引用、跨國討論與 AI 全球語料網絡。

因此，最好的策略不是中文或英文二選一。

而是：

中文生成概念；
英文橋接世界；
符號壓縮操作；
AI 協助對齊。

中文像概念的生長土壤。

英文像概念的國際道路。

符號像概念的操作機械。

AI 則可能成為跨語言、跨符號、跨底空間的共同解壓器。

本文最終命題是：

新理論詞彙的真正問題，不是使用哪一種語言，而是如何讓語言在概念尚未穩定時，仍能最大限度保留被指、降低誤解、提高可傳播性，並使人類與 AI 都能逐步解壓。