美国林肯人类语言技术实验室(HLT)集团,着力于跨语言的搜索引擎研究,该研究小组应用现有的技术,如语言识别,说话人识别,语音识别,机器翻译,及信息检索至自动语言处理的优势,以使普通民众可以更有效地分析其它语言的文本及语音。
这款被称为CLASE (Cross-LAnguage Search Engine) 的跨语言搜索引擎可以帮助只会说英语的分析人员搜索和过滤外语文档。据实验室的研究人员透入,该技术应用了三种算法:查询翻译,文档翻译和概率CLIR。在查询翻译中,讲英语的分析师通过英文词组查询外文文档;该查询语句由机器翻译成外语。然后将最相关的外文文献翻译成英文,并返回到了分析师。在文档翻译中,外语文档被翻译成英文;分析师然后通过英文词组查询翻译文档,以及最相关的文档返回给分析师。概率CLIR,是基于机器翻译的点阵(在图形中表现为相关翻译的边缘连接)。
原文:https://rwsl.ll.mit.edu/news/Finding-relevant-data-in-sea-of-languages.html
上一篇:中译语通B轮融资2.5亿元 推出首款跨语言大数据平台
下一篇:“I译+”知识产权语言服务平台(新版)正式上线
微信公众号搜索“译员”关注我们,每天为您推送翻译理论和技巧,外语学习及翻译招聘信息。
相关新闻