北京海天瑞声科技有限公司(简称:海天瑞声 Speechocean)是一家全球领先的、多语言、跨领域的人工智能数据资源及相关数据服务的提供商。
自1998年成立以来,“海天瑞声”一直致力于为全球用户提供高品质的大规模工程化数据资源、以及数据采集制作、数据深度加工、数据分析处理等服务。我们的数据库资源及数据服务覆盖语音合成、语音识别、机器翻译、网络搜索、自然语言理解、图像识别等人机交互技术领域。
凭借专业的技术能力、经验丰富的项目经理团队和国际语言学专家资源,我们能够提供从文本设计、数据采集、数据转写和标注、数据评测,到多语种语言学咨询等服务在内的一站式数据定制解决方案,帮助我们的客户在模式识别、自然语言处理、机器学习等人工智能领域取得技术进步和市场突破,并赢得了Microsoft、IBM、Google、Samsung、Canon、Nuance、Verint、Toshiba、Panasonic、Siemens、百度、腾讯等众多国际知名客户的高度认可,并建立了长期的战略合作伙伴关系。
随着业务的发展壮大,我们先后在中国香港、英国、德国、西班牙、加拿大、俄罗斯等国家和地区建立了分支机构和办事机构,这使得我们具备了在全球进行语音、文本和图像数据采集和本地化数据转写和标注的高效率网络。
同时,“海天瑞声”也是全球最大的工程化人工智能数据资源供应商之一。截止2014年年底,“海天瑞声”旗下运营的“天籁数据中心”已经拥有近500个可授权使用的大型工程化数据库,涵盖了110多种语言、覆盖全球70多个国家和地区。其中包括语音合成数据库资源、语音识别数据库资源、文本语料数据库资源、图形图像数据库资源和视频数据资源,这些数据库都拥有独立的知识产权,并具有不同层级的转写和标注,其数据规模和品质可以完全满足客户在人机交互技术领域的产品开发和模型训练的需要。(请点击“天籁数据中心-工程化数据资源” 了解详情)。
“天籁数据中心”还具有海量的高品质科研数据,以满足科研机构、高校、企业和个人在人工智能领域进行科研、实验和测试的需要。这些数据以免费或以远远低于其价值的象征性价格开放给全球的研究者和数据需求者。同时,“天籁数据中心”也并是一个全球研究者分享和交流数据的平台。(请点击这里进入“天籁数据中心-科研数据资源”了解详情)。
“客户第一、合作双赢、开拓创新、共同成长”,一直是“海天瑞声”经营理念。通过持续的研发投入、技术创新和组织发展,我们不断向着“全球领先的数据服务提供商”的企业愿景目标靠近。
|