阿里达摩院陈博兴博士应邀做学术报告
root 2019-12-02T09:47:24+00:00阿里达摩院陈博兴博士应邀做学术报告 2019年11月29日下午,应实验室孙乐研究员和韩先培研究员邀请,阿里巴巴达摩院机器智能技术实验室陈博兴博士到访实验室,为实验室师生作了题为“语音翻译的技术及其应用”的学术报告。 陈老师的报告主要介绍了阿里巴巴集团近年来在语音翻译方面的相关工作。从主要挑战、技术策略以及实际应用等多个方面介绍了阿里巴巴公司在语音翻译方面的研究及落地情况。 首先,陈老师简单回顾了在语音翻译方面的两个主要的技术路线:级联式以及端到端的方法。虽然近年来端到端的方法得到的广泛的关注,但因其对于数据量的要求较高,阿里巴巴公司目前仍然采用级联式的语音翻译方案。 接下来,陈老师总结了在级联式语音翻译中的主要挑战:糟糕的翻译输入(主要来自于语音错误、断句错误、不通顺、非正式语言),缺少相关的标注语料(缺少非正式语言的平行语料等)以及在MT任务上的一些传统挑战。 针对上述的一些重要挑战,陈老师分别详细地介绍了阿里巴巴公司在级联式方法的翻译输入以及翻译过程上的一些相关工作。 比如在语音识别错误纠正上,特别是中文的人称代词(他/她/它)上的纠正工作。 使用noisy training加入Bert [...]