- 签证留学 |
- 笔译 |
- 口译
- 求职 |
- 日/韩语 |
- 德语
尽管有限状态转录机和有限状态自动机在数学上十分相似,但这两个模型却是在不同传统的基础上发展起来的。有限自动机是在Turing(1936)的算法计算模型和McCulloch及Pitt的与有限状态模型极为相近的神经元模型的基础上发展起来的。但是,Turing机器对于转录机的影响却不那么直接。Huffman(1954) 在Shannon(1938)关于转接电路的代数模型的基础上,提出了状态转移表来模拟时序电路的行为。在Turing和Shannon以及鲜为人知的Huffman的工作基础上,Moore(1956)为了描述使用输入符号字母表和输出符号字母表并且具备有限个数目的状态的机器,引入了有限自动机(finite automaton)这个术语。Mealy(1955)进一步推广并综合了Moore和Huffman 的研究成果。
Moore在原来的文章里所描述的自动机与Mealy后来推广的自动机有着重要的区别。在Mealy自动机中,输入/输入符号是通过状态之间的转移来联系的。而一些有限状态转录机就是Mealy自动机。在Moore自动机中,输入/输出符号是通过状态来联系的。这两种类型的转录机是等价的,Moore自动机可以转换成等价的Mealy自动机,反之亦然。
很多早期的形态剖析程序使用词缀剥离法(affix-stripping)来进行剖析。例如,在Packard(1973)的古希腊语剖析器中,就反复地剥离输入单词中的前缀和后缀,使剩余的词根突显出来,然后再在词表中查找剩余的词根,并返回与被剥离的词缀相容的词根。这个方法等价于自底向上(bottom-up)剖析法。
AMPLE(A Morphological Parser for Linguistic Exploration,用于语言研究的形态剖析器)(Weber and Mann,1981;Weber et al.,1988 ; Hankamer and Black, 1991)是另一个早期的自底向上的形态分析器。AMPLE包含一个词表,在词表中存储每个语素的所有可能的表层变体(称为语素变体,allomorphs),以及它们出现时的限制(例如,英语中的-es这个表示复数的语素变体只能出现在s, x, z, sh或ch之后)。该系统要找出与输入相匹配的每个可能的语素序列,然后进行过滤,把那些不满足限制条件的序列去掉。