Chomsky 生成语法理论

来自GSXAB的知识库
生成语法
术语名称 生成语法
英语名称 generative grammar

生成语法(generative grammar)是语言学中的一个学说,尝试跨过分类语言现象的手段,描写解释语言能力本身,以解决语法规则根据现象逐渐增多,却没有相应解释且无法解释儿童可以迅速习得语言语法的矛盾。

生成语言学学派主张人类天生具有遗传的语言能力,使得所有语言有共性的深层规则,自然语言间的差异被称为参数。比如说这一学派认为所有语言主语必须实际上存在,只是一些语言允许省略主语、一些语言主语谓语顺序不同等参数,导致了看起来一些语言中可以缺失主语、可以有不同的位置关系。

尽管生成语言学对于自然语言的解释仍然存在争议,但其中主要理论对形式语言的形式化有巨大的影响。

生成文法

需要注意,习惯上在这个语境下使用“文法”而不是“语法”。

主条目:生成文法

比如规则“S→NP+VP”(“句子→名词性短语+动词性短语”)指当需要一个“句子”时,可以被“重写”为需要一个“名词性短语”和一个“动词性短语”。最后在全部符号被重写并替换为不同的实际单词后就得到了合理的句子。

比如可以认为三个基本规则为:

  • S → NP + VP
  • VP → V + S
  • NP → NP + S

其中 S 是句子,带 P 结尾的是短语,不带 P 的是中心项。

其中存在短语层次递归的规则,使得名词性短语可以由很多不同句子(作为定语)与一个中心项(作为中心词)构成(但是具体顺序以及形式会由语言中的参数决定)。

这种语法使得全部生成过程构成一棵生成语法树,根结点为句子 S ,叶子结点为实际单词。这种生成树也用来解释句子结构不同引起的歧义。

Chomsky 层级

Chomsky 的理论认为形式语言按照规则限制程度,可以分为四个层级,并对应不同的计算能力与自动机模型。称为 Chomsky 层次(Chomsky hierarchy)。

这四个层级从上到下限制逐渐增强,表达能力逐渐受限,解析效率逐渐增加。