7月15日至7月20日,计算机语言学领域的顶级学术会议ACL在墨尔本召开。ACL会议(Annual Meeting of the Association for Computational Linguistics)是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办,每年一届。
值得一提的是,拥有今日头条、抖音等产品的字节跳动公司本次入选论文是由一位90后博士完成的。他在机器翻译方向的研究内容「Modeling Past and Future for Neural Machine Translation」被Transaction of ACL收录,并受邀在ACL2018做现场报告。
论文针对神经机器翻译系统并没有显示地对已翻译和未翻译的内容做建模这一现状,提出了一种全新的机制。它在解码过程中动态地将源端信息分成两个部分:已经翻译的内容(Past)和未翻译的内容(Future),并设计两个不同的循环神经网络层对其进行建模。通过将两部分信息动态地输入到注意力模型和解码器状态中,从而使整个神经翻译模型更好地在当前状态下区分已翻和未翻的内容。
图说:论文模型图
实验结果表明,该论文提出的模型在中英,德英和英法三个标准数据集上可以显著地提高基线系统的性能,相比于覆盖率模型拥有更好的翻译质量和对齐质量。
据了解,目前该翻译方法已成功应用至字节跳动旗下的多款国际产品中,为不同国家的用户提供内容翻译服务,促进信息更便捷的流动。公开资料显示,仅抖音海外版在全球就已覆盖超过150个国家和地区,先后在40多个国家应用商店排名前列。目前抖音全球月活用户超过5亿,是世界范围内增速最快的短视频应用。
图说:ACL现场参会者在字节跳动展台前观看技术展示
成立仅仅两年的字节跳动AI LAB专注于人工智能领域的前沿技术研究,在CVPR、ACL及NAACL等人工智能顶级学术会议上,均有论文入选。
作为最早一批将人工智能应用到产品中的企业,字节跳动致力于将研究成果应用于相关的产品中,让新技术更好地帮助内容创作、分发、互动、管理。过去几年间,实验室不仅研发出自动问答、封面图自动选取、自动写稿机器人xiaomingbot等多种实用性功能,同时也创造了抖音尬舞机、3D全景博物馆等深受用户喜爱的功能。
今年6月,字节跳动CVPR入选论文“基于半监督空间转换网络的球衣号码识别”的相关技术也已经应用于旗下产品近期的世界杯图文直播中。比赛精彩片段GIF图、控球率分布图、比赛热力图等内容均基于该技术由机器自动实时生成。