视觉技术是感知、理解、重建世界的重要技术支撑,既有科研价值,也是人工智能产业落地的排头兵,有重大社会价值和经济价值。
工程研究中心重点在视觉感知与理解、视觉生成、增强现实等方向持续耕耘。视觉感知与理解方向,覆盖基于2D/3D的分类、检测、分割等通用技术,以及人脸/人体/车辆/文字/商品等垂类技术,广泛赋能各行各业的智能化升级;视觉生成方向,重点研究图像视频编辑、智感超清、虚拟人等前沿方向,提升视觉内容生产的效果与效率;增强现实方向,通过视觉定位与增强、神经网络渲染等技术,实现对物理世界的数字化重建,并与真实世界融合交互。
同时,工程研究中心在大模型训练、模型设计与压缩等方向持续投入,提升模型效率和泛化能力,为产业发展和智能化升级提供重要支撑。