会员中心 |  会员注册  |  兼职信息发布    浏览手机版!    精选9.9元!    人工翻译    英语IT服务 贫困儿童资助 | 留言板 | 设为首页 | 加入收藏  繁體中文
当前位置:首页 > 翻译新闻 > 产业新闻 > 正文

洞察eBay自动翻译机器

发布时间: 2016-11-02 11:17:28   作者:etogether.net   来源: 本站原创   浏览次数:
摘要: eBay上有超过8亿个产品列表,对于这些产品列表,机器翻译在这种情况下显然是更适合。
 
eBay自动翻译机器
 
目前在eBay上有超过8亿个产品列表。考虑到每个列表有大约300个词,你认为需要多少的语言学家及需要多长时间翻译这些列表?而且一些列表可能只在线一天或一周,且库存会不断变化。所以靠人翻译是不可行的。对于这些产品列表,机器翻译在这种情况下显然是更适合。但其他类型的内容,如UI,客户支持等,都是由我们的本地化语言专家团队负责。
 
也许我们最大的挑战之一是产品列表是由用户编写的,而不是由专业作家或内容开发人员编写。他们会以非常不同的方式,使用不同的设备,而且用不同的注意力。正如你可以猜到的,翻译用户生成的内容对于任何MT系统都是件困难的事情,因为它需要学习如何处理打字错误,语法不规则,缺乏标点符号,外来语等等。
 
我们系统的另一个巨大挑战是它们必须处理不同类型的内容。在eBay上有超过12,000个类别,从汽车零件到古董,从原创漫画艺术到电动工具。这意味着我们的MT引擎必须处理针对每个类别的术语。为一个特定领域训练MT系统相对容易,但是当需要涵盖这么多不同的主题时,事情变得更复杂。
 
 
第三个挑战是特定领域,真的很难找到特定领域内数据来训练我们的引擎。我们使用统计翻译模型。简而言之,这意味着翻译是由大量平行语言数据(源和目标语言中的对齐文本)生成的结果。公开场合不难找到一般科目的并行数据,但是尝试找到大量关于棒球装备或动作数字的双语文本。不是那么容易。
 
但考虑到eBay市场上有超过1.5亿活跃用户试图查看这些产品列表,而且这些用户分布在超过30个国家及地区。eBay的MT团队只能努力的解决这个问题。
 
搜索查询:这是用户在搜索框中输入的内容,以便找到他们想要购买的内容。这是唯一把用户语言文本翻译成英语,以匹配查询与库存,主要是英语。查询真的很难翻译,因为没有上下文,并且许多单词是多义的,即,它们具有多于一个意义。例如,当用户搜索“眼镜”时,他们想找到太阳镜还是啤酒瓶?
 
项目标题和描述:每个列表都有一个标题,因此您可以快速找出项目是什么,以及描述,以便您可以找到项目的条件,测量,规格等信息。如果您熟悉任何电子商务网站中使用标题,您可能已经注意到,他们几乎没有句子或遵循正确的语法规则。它们通常是一个单词的集合,一个接一个,有时大量加载同义词。一个真正的例子:“1 pcs good quality hard pencil bait fising lures tackle bait crankbait 3d eyes”。用于翻译标题的MT系统需要使用这种类型的内容专门训练,以产生具有期望的“格式”的翻译。
 

微信公众号

[1] [2] [下一页] 【欢迎大家踊跃评论】
我来说两句
您尚未登录,请登录后发布评论! 【马上登录
评论列表
已有 0 条评论(查看更多评论)