会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    超值满减    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 行业文章 > 笔译技术 > 正文

国外部分英语语料库简介及访问网址

发布时间: 2016-04-27 09:41:24   作者:etogether.net   来源: 网络   浏览次数:


 
(九)新加坡英语语料库
国际英语语料库新加坡分库( ICE - IP, International Corpus of English, Indian Component)容量为100万词次,收集的是新加坡书面和口头英语。该库进行了文本、话语、词性和句法标注,用户可以通过http: / /www. ucl. ac. uk / english - usage /ice / index. htm访问。
 
(十)英语混合语语料库
VO ICE语料库(Vienna Oxford International Corpus of English)容量为25万词次,并且正在扩充中收集的是英语口语、英语作为混合语的交流、大量没有文本的英语学习者之间的交流。用户可通过http: / /www. univie. ac. at/Anglistik /voice /访问。
 
ELFA语料库(English as a L ingua Franca in Academic Settings) ,容量为50 万词次。内容为口头学术英语。http: / /www. uta. fi/ laitokset/kielet /engf / research / elfa /可访问。
 
(十一)英语历史语料库
ARCHER 语料库(A Rep resentative Corpus of Historical English Registers)容量为170万词次。该库有1, 037个文本,涉及10个领域,包括英国英语和美国英语,并进行了词性标注。用户可通过http: / /www. cal. nau. edu / english /degree_programs. asp访问。
CEECS语料库( Corpus of Early English Correspondence Sampler)容量为45万词次。内容为个人书信。用户可通过http: / /www. eng. helsinki. fi/varieng/main / corpora1. htm访问。
 
Lampeter早期现代英语语料库(Lampeter Corpus of Early Modern English Tracts)容量为110万词次。该库收集的是非文学散文文本,并进行了文本标注。用户可通过http: / /www.tu - chemnitz. de /phil/ english / chairs/ linguist/ real/ independent/lampeter/manual/pages/manual. html访问。
 
语料库标注和解标注软件有AnnoTool, GoTagger,DeTagging, 语料库检索软件有WordSmith4. 0, PowerFREP, MicroConcord,ParaConc, ConcappV4, 文件格式转换工具有SoundScriber, Vwalker2, 基于数据驱动学习的工具有Dropper, WordPilot, Xcloze, 搭配工具有CNgramtool, CollocExtract, kfNgram2005。
 

 

微信公众号

[上一页][1] [2] [3] 【欢迎大家踊跃评论】
我来说两句
评论列表
已有 0 条评论(查看更多评论)