- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
形态剖析的另一种方法称为生成检测法(generate-and-test)或综合式分析法(analysis-by-synthesis)。Hankamer(1986)的keCi是一个土耳其语的形态剖析器,该剖析器是在土耳其语的语素的有限状态表达式的指导下进行工作的。程序首先匹配单词左边部分的语素,对这些语素使用各种可能的音系学规则,针对输入检测每一个结果。如果一个输出成功了,程序就根据有限状态语素顺序规则继续分析下一个语素,继续对输入进行匹配。
用有限状态转录机来模拟拼写规则的思想来源于Johnson(1972)早期关于音系规则具有有限状态性质的思想。可惜Johnson的这种远见卓识没有引起学术界的注意,后来Roland Kaplan and Martin Kay独立地发现了这样的规律,首先是在未发表的谈话中谈到这个规律(Kaplan and Kay,1981),后来终于发表了(Kaplan and Kay,1994X参见前面关于多重独立发现的论述)。Koskenniemi(1983)继续研究Kaplan和Kay的发现,并且做了大量的研究工作,描写了芬兰语的有限状态形态规则。Karttunen(1983)根据Koskenniemi的模型,建立了一个称为KIMMO的程序。
Antworth(1990)细致地描述了双层形态学及其在英语中的应用。除了Koskenniemi对芬兰语的研究和Antworth(1990)对英语的研究之外,形态学的双层模型和其他有限状态模型也在很多其他语言的研究中开展起来,例如,Oflazer(1993)对土耳其语的研究,Beesley(1996)对阿拉伯语的研究等。
Antworth(1990)联系了各种复杂的形态处理问题,例如,Tagalog语的中缀化和重叠化,希伯来语的三辅音词根等,总结了语言中有限状态分析的研究情况。Karttunen(1993)很好地总结了双层形态学在音系规则中的应用。Barton et al.(1987)提出了双层模型的几个计算复杂性问题,Koskenniemi and Church(1988)回答了这些问题。
对于自动机的数学基础的细节,有兴趣的读者可以阅读Hopcroft and Ullman(1979)或Lewis and Papadimitriou(1981)。Mohri(1997)和Roche and Schabes(1997b)给出了有关语言应用的更多算法和数学基础。Sproat(1993)是关于计算形态学的导论性读物。
责任编辑:admin