《自然语言处理综论》学习笔记

ZhuYuanxiang 2019-06-06 00:00:00
Categories: Tags:

译者序

计算机对自然语言的研究和处理需要经过以下4个过程:

  1. 把需要研究的问题在语言学上加以形式化,使之能以一定的数学形式,严密而规整地表示出来;

  2. 把这种严密而规整的数学形式表示为算法,使之在计算上形式化;

  3. 根据算法编写计算机程序,使之在计算机上加以实现;

  4. 对于所建立的自然语言处理系统进行评测,使之不断地改进质量和性能,以满足用户的需要。

Bill Manaris对自然语言的定义:

自然语言处理可以定义为:研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。

自然语言处理要研制:语言的表示能力(linguistic
competence)和语言的应用模型(linguistic
performance),通过建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,设计各种系统来实现这样的语言模型,并探讨这些实用系统的评测技术。

建立自然语言处理模型需要的知识:

P8 图0.1 自然语言处理系统中的知识平面:

→(话语)→音位学平面→(音位)→形态学平面→(语素)→词汇学平面→(单词)→句法学平面→(句法结构)→语义学平面(意义表示)→(语义解释)→语用学平面→(语用解释)