内容摘要:本文是作者应本刊的邀请于1988年12月2日在第二届《国外语言学》编辑工作研讨会上所作的专题演讲。
关键词:马希文;计算语言学;汉语信息处理;汉语语法;应用语言学
作者简介:
大家大概是想让我讲一些跟计算语言学有关的东西,但计算语言学的技术性很强,使从事这方面工作的人不得不花很大的力气去钻研技术细节。我想在现在这个场合讲那些东西恐怕是不大合适的。
我今天想讲的是:以计算语言学为背景提出来的语言学问题是什么?问题当然是多方面的,我想集中谈一下语法间题。为什么要谈语法呢?一个原因是语法方面的问题容易讲得比较清楚;另一个原因便是在这方面针对英语的研究有比较成功的实例,把这些东西拿来和汉语比较一下就可以发现汉语与英语的许多深刻区别。如果不讲语法,而去讲语义,那就很不容易讲清楚,因为很多语义问题和哲学有关,就在英语里也搞不清楚。
1.刚才陆俭明教授讲过:研究语法不可能把语法向题和语义完全分开;但是.,研究语法也不等于研究语义,而是要研究那些明显地对语法形式产生影响的语义向题。为什么只研究那些跟语法有关的语义呢?我在给学计算语言学的学生讲课时,喜欢这样去表述:首先,每句话都是有歧义的。同样一句话在不同场合去说含义是不一样的。有的语义根本无法在语言学里研究,因为你要弄清一句话的所有含义就必须要弄清这句话的所有语境,要弄清所有语境,就得弄清所有的社会情况。这当然不是语言学家要去研究的问题。
为什么要这样提问题呢?是有其道理的。因为计算机要模仿一个人的语言能力的时候,首先要具备一些东西来模仿这个人的语言环境,如果没有这些语境就无法完全模仿这个人的语言能力,模仿的话也便成了抽象的符号。但是,语境是无限的,所以计算机模仿语境的系统也只能是开放的,是永远也描述不完的。我们研究语言不能把每句话都放在这种永远也描述不完的语境里去研究,那样研究语言的条件未免太差了。同样的道理,计算机也不能用那种开放的,永远也不完备的系统去模仿人的语言能力。
当然,人所说的每句话都是跟这个人所处的环境有关系的,但不是跟环境的所有条件都有关系,而只是同其中的某些条件有关系。然而,语境中的所有条件都可能跟某句话有关系。所以,我们在研究一句话的语义时,不能去研究这句话的所有语境,相反地我们只能去研究和这句话有关的那些语境中的某些细节。
从计算语言学的历史来说,一开始人们认为一句话就是一个逻辑命题,后来人们认识到这样不行,计算机只知道每句话的意义还不够,还得要知道人说每句话的目的是什么。于是,60年代末70年代初在计算语言学的领域内便产生了一门新学科叫作“过程语义学”。这种过程语义学认为:每句话都应理解为机器必须执行的一系列操作。这种学说在当时是很流行的,但现在看来当时的认识是相当肤浅的,因为它只看到了问题的一个侧面,人们说一句话的目的究竟是什么?语言学是无法回答的,因为这是一个社会行为问题。







