Ch15 特征 与 合一
基于约束的形式化方法(constraint-based formalism):把特征中的信息用约束来表示。
基于约束的表示策略:能够表示细颗粒度的信息,可以模拟比上下文无关语法更加复杂的现象,可以有效地计算句法表示的语义。
基于特征结构和合一来实现这个表示策略。
15.1 特征结构
特征结构(feature structure):是「特征—值」(feature-value)偶对的简单集合:
「特征」是从某个有限集合中抽取出来的不能再分析的原子符号
「值」可能是原子符号,可能是特征结构
特征结构的表示方式:「特征—值」矩阵(Attribute-Value Matrix,AVM)。
特征路径(feature
path):是在特征结构中引导到一个特定的值的各个特征所组成的一个表。
重入结构(reentrant
structure):是一种特征结构,所包含的特征共享某些特征结构作为值。
在重入结构下,两条特征路径可以通向结构上完全相同的结点。从而可以非常简洁地来表示语言中概括性的现象。
15.2 特征结构的合一
为了使特征结构可以计算,需要合一(unification)运算来实现两种主要的操作:
相容(compatibility):一种操作是合并两个结构的信息内容
失败:一种操作是拒绝合并不相容的结构
合一运算:是一个二元算子(用 ⊔
表示),接受两个特征结构作为运算单元,当合一成功时返回一个特征结构作为合一的结果。
特征结构:是一种用于表示某些语言学实体的局部信息的方法;也是一种把信息约束加到可以接受这个信息的语言学实体的方法。
合一运算:是一种将各个特征结构中的信息进行合并的方法;也是一种描述满足两个约束集合的语言学实体的方法。
合一运算:是单调的(monotonic)。如果一个特征结构的描述是正确的,那么这个特征结构与其他的特征结构合一的结果所形成的新的特征结构仍然满足原来描述的要求。
合一运算:是与顺序无关的(associative)。给定特征结构的一个集合进行合一时,可以按任意的顺序来进行计算,得到的结果都是相同的。
两个特征结构进行合一,产生一个新的特征结构,这个新的特征结构或者与原来输入的特征结构等同,或者比原来输入的特征结构更加特殊(具有更多的信息)。
不特殊(更加抽象)的特征结构蕴涵于(subsume)等同的或者更加特殊(具有更多信息)的特征结构。
“蕴涵于使用” ⊑ 表示,“蕴涵于”关系是偏序关系(partial
order)。因为每个特征结构蕴涵空结构[],特征结构之间的关系可以定义为半格(semilattice)。
合一:是整合来自不同约束的知识的一种实现方法。
给定两个相容的特征结构作为输入,合一能够产生出更加特殊的特征结构,并且这个新的特征结构包含了输入中的全部信息。
给定两个不相容的特征结构,合一运算就失败了。
15.3 语法中的特征结构
把上下文语法规则中的成分都加上特征结构的说明,然后使用适当的合一运算来表达对于这些成分的约束,就可以实现以下目标:
把复杂特征结构与词典条目和语法范畴的示例联系起来
根据语法成分的组成部分的特征结构,指导如何把这些特征结构组合成更大的语法成分
加强语法结构各个部分之间的相容性约束。
两种约束形式说明:
一种约束形式说明,在给定的路径终点发现的值必须与特定的原子值进行合一
一种约束形式说明,在两条给定的路径的终点发现的值必须是可以合一的
新方法的基本点:
上下文无关语法规则的成分增加了与它们相关的基于特征的约束。这反映了从原子式的单纯语法范畴到表示该成分各种性质的更加复杂的范畴的转移
与单个的规则相联系的约束可以参照并且处理与带有这些约束的规则的部分相联系的特征结构
合一运算能够处理的语言现象:
- 15.3.1 一致关系(agreement):合一运算处理英语中的主要的一致现象
- 「主语—动词」一致关系
- 「限定词—名词性成分」一致关系
- 15.3.2 语法中心语(grammatical heads):
- 把一致关系特征结构向上贡献给父结点的成分(子女结点)称为短语的中心语
- 动词是动词短语的中心语
- 名词性成分是名词短语的中心语
- 名词是名词性短语的中心语
- 被复制的特征称为中心语特征
- 一致关系结构特征是一个中心语特征
- 把一致关系特征结构向上贡献给父结点的成分(子女结点)称为短语的中心语
- 15.3.3 次范畴化(subcategorization):通常称为「配价」(valence),是为研究动词而提出来的。但是其他词类也有相似的行为。可以表示为复杂的次范畴化框架。
- 动词各个类的次范畴化框架之间的这些关系称为「论元结构交替」(argument-structure
alternation) - 其他词类的次范畴化:形容词或者名词
- 次范畴化框架的标记集
- COMLEX标记集,包括动词、形容词和名词
- ACQUILEX标记集,包括动词
- 动词各个类的次范畴化框架之间的这些关系称为「论元结构交替」(argument-structure
- 15.3.4 长距离依存关系(long-distance dependencies)
- 两种长距离关系形式
- 动词次范畴化的成分在局部的范围内并不出现,它们与谓词之间保持着一种长距离关系。
- wh-非主语疑问式结构。
- 长距离依存关系的解决办法:使用间隔表(Gap
List),体现为特征GAP,在剖析树中,特征GAP从一个短语转移到另一个短语,从而处理长距离依存关系的问题。在间隔表中,可以设立一个填充成分,使这个填充成分与某个动词的次范畴化框架进行合一。
- 两种长距离关系形式
15.4 合一的实现
输入的特征结构使用非成圈有向图,即有向无环图(DAG)来表示。在DAG中,特征作为标记记录在的边上,特征值或者是原子符号,或者是DAG。
合一运算的实现是递归的图匹配算法。算法需要把一个输入中的特征都走一遍,试着去发现在另一个输入中相匹配的特征。如果所有的特征都匹配,则合一成功。只要有一个特征不匹配,则合一失败。为了正确地对于那些以特征结构为其值的特征进行匹配,需要使用递归。
15.4.1 合一的数据结构
每个特征结构包括两个域:
- 内容域(content field):可以为空,也可以包含一个普通的特征结构
- 指针域(pointer filed):可以为空,也可以包含一个指向其他特征结构的指针
- 如果DAG的指针域为空,那么DAG的内容域就包含实际被处理的特征结构
- 如果DAG的指针域不空,那么指针的方向就代表了实际被处理的特征结构
合一运算的合并可以通过在处理过程中改变DAG的指针域来实现。合一的结果创建出了一个新的结构,这个结构包含了来自原来两个项目的信息的并。
15.4.2 合一的算法
解除参照(dereferencing):如果在扩充的特征结构中的指针域不空,那么这个结构的真实内容就顺着指针域中的指针去查找,顺着指针查找的结果就称为解除参数。
递归的三种可能的基本情况:
两个项目相同
两个项目中的一个项目的值是零,或者两个项目的值都是零
这些项目既不是零,也不等同
15.5 带有合一约束的剖析
合一运算与合一的顺序无关,但是合一运算并不能够减少在搜索过程中剖析器的搜索空间。
15.5.1 Earley剖析器结合合一的剖析
把特征结构和合一运算结合到Earley算法中的目的有两个:
使用特征结构可以给剖析的组成成分提供丰富的表达方式
使用特征结构可以阻止成分进行破坏合一约束的非良构成分的线图中
15.5.2 基于合一的剖析
包含语义成分的规则(Ref:Ch17)。语法规则可以对特征结构的成分加上各种约束,也可以包括用句法范畴的概念不能描述的约束。
15.6 类型与继承
基本的特征结构存在的两个问题:
特征结构无法把一个约束准确地放到相应特征值的位置
特征结构无法从众多的特征中捕捉到贯穿这些特征的一般性的东西
解决上面两个问题的办法是使用类型(types):
每一个特征结构使用一个类型来标记
每一个类型都有适切性条件(appropriateness
condition),即表示什么样的特征对于这个类型是适切的。各种类型被组织成一个类型层级体系(type
hierarchy),在这个层级体系中,比较具体的类型继承比较抽象的类型的性质。对合一运算进行修改,使之既能对特征和特征值进行合一,还能对特征结构的类型进行合一。
类型化的特征结构(typed feature
structure)系统中,类型是一种新的类别,与标准特征结构中的属性和值是类似的。
类型分为两种:
简单类型(simple types),也称为原子类型(atomic types)。是一个原子符号
,代替标准特征结构中的简单原子值。所有的类型组织成一个有多种继承关系的类型层级体系(type
hierarchy),这种体系结构是一种偏序(partial
order)结构,称为格(lattice)。复杂类型(complex types),
与类型相适应的一组特征
对于这些特征的值的限制(用类型的项来表示)
在这些值之间的相等性约束
15.6.1 合一的扩充
类型扩充
路径不等式
否定
集合值特征
析取
小结
本章的重点是基于特征结构进行的合一运算
特征结构是特征——值偶对的集合,
特征是来自某个有限集合的不可分析的原子符号
特征的值是原子符号或者特征结构
特征结构
使用属性——值矩阵表示
使用有向非成圈图,即有向无环图(DAG)表示
特征是有向的、有标记的边
特征的值是图中的结点
合一是一种运算
结合信息:把两个特征结构的信息内容合并
比较信息:拒绝合并并不相容的信息
短语结构规则:使用特征结构和特征约束来增强和提升
特征约束:表示短语结构规则成分的特征结构之间的关系
次范畴化约束:表示关于中心语动词(或其他谓词)的特征结构
一个动词的次范畴化成分
可以出现在动词短语之中
可以离开动词很远,就是 远距离依存关系。
类型化的特征结构
对给定的特征结构能够取值的类型进行约束
把类型组织到类型层级体系之中,用以捕捉贯穿这些类型的一般化的东西