语言是人类区别于其他生物的最重要特征之一。自然语言处理,研究利用计算机理解并运用人类语言的理论和方法,涉及计算机科学、语言学、认知科学等多种学科,是人工智能领域的关键核心技术,具有重大研究和应用价值。
工程研究中心在自然语言处理技术创新和应用方面取得丰硕成果:突破知识增强深度语义理解技术,发布了系列知识增强大模型,包括在GLUE排行榜上以世界上首个超过90分的成绩夺冠的ERNIE、首个知识增强千亿模型ERNIE-Titan,以及首个大规模隐变量对话模型PLATO和支持200多种语言互译、日均翻译量超千亿字符的神经网络翻译系统,等等;领先的自然语言处理技术支撑搜索引擎升级为智能搜索,支撑智能推荐、智能交互、地图等为用户提供更优服务和体验,同时也在制造、能源、金融、媒体、政务等领域发挥价值,助力智能化升级。
未来工程研究中心以自主知识产权的深度学习框架为基础,依托高质量大规模数据和多源异构知识图谱优势,面向真实丰富的产业化应用场景,在知识增强语义理解、开放域人机对话、多语言机器翻译、高精度深度问答、智能化语言生成等领域开展研究,推动技术不断进步和实现大规模产业化应用。