会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 行业文章 > 笔译技术 > 正文

国外部分英语语料库简介及访问网址

发布时间: 2016-04-27 09:41:24   作者:etogether.net   来源: 网络   浏览次数:
摘要: 国外部分英语语料库简介及访问网址

 

 (一)国际英语语料库( ICE)
分别由英国英语分库、美国英语分库、新加坡英语分库、澳大利亚英语分库等组成。每个分库都由300篇口语、120篇独白、200篇书面语、150篇印刷语组成。其可提供对英语系国家不同英语的比较。用户可以通过http: / /www.ucl.ac.uk /english - usage / ice /htm访问该库。
 
(二) 美国英语语料库
1990 年由美国布朗大学的Nelson Francis 和HenryKucera开发,容量为100万词次。它包含的主要是书面英语,包括了15种文体的500个文本,这些文本分为标注文本( tagged text)和未标准文本( un2tagged text) 。其MARC版本可以支持两种检索方式:从语料库检索完整的句子和关键词、上下文生成索引行。该语料库的主要特征是能反映语言的共时性。该语料库可以通过http: / /www.lextutor.ca/concordancers/concord_e. html访问。
 
(三)英国英语语料库
SEU语料库( Survey of English Usage) 1959年由英国伦敦大学教授Quirk建立,书面语和口语各占一半,每篇约为500字。其贡献在于它是第一个大型电脑语料库。用户可以通过http:/ /www.ucl.ac.uk/english - usage /访问。
此外还有: LOB语料库(Lancaster/Oslo - Bergen Corpus) ,词库容量为100万词次。其贡献在于该语料库采用了TAGIT标注系统,以统计的方式建立换算机率矩阵,把标注正确率提高到了96%。用户可以通过http:/ /www.edict.com. hk/con2cordance /WWWConcappE.htm进行在线检索。
 
LLC口语语料库(London - Lund Corpus of Spoken English) ,其内容为500, 000词次的口语,内容分为五大类:面对面谈话、电话、讨论、即席演讲、专题演讲。它是第一个英语口语语料库。用户可以通过http:/ /khnt.hit.uib.no/icame /man2uals/访问。
 
COBU ILD语料库( Collins Berminhan University International Language Database)由John Sinclair在1980 s建立。其贡献在于它是第一个动态语料库,用户可以通过http:/ /www.collins.co.uk /Corpus/CorpusSearch. aspx进行在线检索。
Longman语料库(Langman Corpus) ,该库从地域上讲,跨越了英国、美国及其他国家。用户可通过http: / /www. longman. com /dictionaries/ corpus/ index. html了解该库的情况。
 
(四)澳大利亚英语语料库

澳大利亚语料库(Australian Corpus of English) 容量为100万词次,以LOB语料库和BROWN语料库为蓝本,收集了书面和口头英语。该库没有进行标注。用户可以通过http: / /khnt. hit. uib. no / icame /manuals/ 访问。



微信公众号

[1] [2] [3] [下一页] 【欢迎大家踊跃评论】
我来说两句
评论列表
已有 0 条评论(查看更多评论)