深度学习技术及应用国家工程研究中心

首届WAVE SUMMIT 2019深度学习开发者峰会

2019-04-24 阅读量 (11989)

迈入开源第三年，深度学习平台PaddlePaddle又发重磅升级。

4月23日，由深度学习技术及应用国家工程实验室与百度联合主办的首届WAVE SUMMIT 2019深度学习开发者峰会上，PaddlePaddle首秀全景图，并连抛11项重磅发布！

开发环节，全新发布工业级NLP开源工具集PaddleNLP，以及业界首个视频识别工具集；训练环节，展现大规模分布式训练、工业级数据处理两大特性；部署环节，首发预测服务Paddle Serving和用于模型压缩的PaddleSlim；工具方面，首发预训练模型管理工具PaddleHub、深度强化学习工具PARL重要升级、自动化网络结构设计AutoDL Design正式开源；服务方面，发布了价值一亿人民币的算力支持计划以及企业深度学习实战营。

深度学习推动人工智能进入工业大生产阶段，深度学习框架是智能时代的操作系统。从开发、训练、部署、工具到服务，PaddlePaddle展现了历经产业实践打磨的“趁手利器”所拥有的全面、稳定与高效。

一、开发：新增NLP、视频两大模型工具集

在模型库方面，PaddlePaddle已开源 60 多个经过真实业务场景验证的官方模型，涵盖视觉、自然语言处理、推荐等 AI 核心技术领域，成为官方支持模型最多的深度学习平台。而此次，PaddlePaddle再次全新发布工业级NLP开源工具与预训练模型集PaddleNLP，以及业界首个视频识别工具集。

PaddleNLP是基于PaddlePaddle 打造的面向工业应用的中文NLP工具集，覆盖全面的中文处理任务，工业使用效果突出。PaddleNLP提供全面丰富的中文处理任务，并拥有当前业内效果最好的中文语义表示模型ERNIE和基于用户大数据训练的应用任务模型。基于PaddlePaddle深度学习框架构建的基础NLP算法模型和NLP应用任务的灵活组合，同类型算法模型可灵活插拔，真正高效易用。

此外，PaddlePaddle还发布了业界首个视频识别工具集，旨在为开发者提供解决视频理解、视频编辑、视频生成等一系列任务的便捷、高效的模型。工具集提供了适合视频任务的通用骨架代码，覆盖视频识别方向的7大主流领先模型，包括StNet、Attention LSTM 、Attention Cluster三大帮助百度视觉团队夺得国际竞赛冠军的自研领先模型。目前，该领先的视频理解技术已在百度多项核心业务中使用，如百度 Feed 流，百度搜索，百度云 VCA 系统等，视频标签集Top5准确率达到96%，百度 Feed 流短视频分类全免人审。

二、训练：业界最强的超大规模并行深度学习能力

训练环节，超大规模深度学习并行技术一直是PaddlePaddle的优势之一。此次大规模分布式训练主要从三方面实现了升级，首先是对多机多卡训练的的全面支持，实现了良好的可扩展性。同时发布了针对网络条件不好的情况下的稀疏通信技术，大幅降低了带宽对训练速度的影响。

其次，针对超大规模稀疏参数的挑战，设计并开放了大规模稀疏参数服务器，开发者可轻松下载相关镜像使用。基于真实的推荐场景的数据验证，PaddlePaddle 在 100 节点*10线程/节点的情况下，根据batch size的不同吞吐量可达 60 万~ 140 万 /s，每小时可处理20 ~ 50亿数据，且达到batch size为 512 的情况下90%的加速比。该系统已应用于百度feed流以及凤巢商业推广系统中，可有效地解决超大规模推荐系统、超大规模数据、自膨胀的海量特征及高频率模型迭代的问题，拥有超大吞吐量及高效率。

第三，大规模分布式训练支持在各种容器上高速运行，同时支持在K8S生态下使用PaddlePaddle进行训练。

在这种大规模数据场景下，数据的吞吐非常关键，对于数据做处理往往是一大痛点，对此，PaddlePaddle研发了数据处理组件方便开发者使用。优化分布式IO，增加远程文件系统流式读取能力。GPU多机多卡同步训练通过增加稀疏通信能力提升带宽不敏感训练能力，在低配网络带宽网络环境下，例如10G网络下，同步训练可提速10倍。

三、部署：首发预测服务Paddle Serving、用于模型压缩的PaddleSlim

开发和训练后，将模型部署到各种应用场景下是非常关键的一个步骤。部署环节需要高速的推理引擎，在此基础上，为了部署在更多的硬件上往往需要做模型压缩，在真正使用时，还需要软硬一体能力的支持。

（PaddlePaddle端到端全流程部署方案）

目前，PaddlePaddle提供完整的端到端的全流程部署方案。基于多硬件的支持，PaddlePaddle提供性能全面领先的底层加速库和推理引擎。此次大会，PaddlePaddle全新发布了预测服务Paddle Serving，以及用于模型压缩的PaddleSlim。

Paddle Serving可与核心框架的模型训练环节无缝衔接，提供深度学习预测云服务，内置模型，可批量预测。Paddle Serving目前已在百度的很多产品线使用。

而PaddleSlim实现基于PaddlePaddle的模型压缩，能够在精度损失较小的情况下高效进行模型体积压缩，覆盖目前主流的网络剪枝、量化、蒸馏三种压缩策略。参数集中管理，两行python代码即可调用自动化模型压缩。针对体积已经很小的MobileNet模型，它仍能在模型效果不损失的前提下实现70%以上的体积压缩。

四、工具：开源AutoDL Design、升级PARL、首发PaddleHub

灵活、高效、易用是PaddlePaddle大受欢迎的重要原因。在多项全新发布及重磅升级中，工具组件方面显得尤为突出。此次，PaddlePaddle不仅重磅开源AutoDL Design、升级深度强化学习框架PARL，并首次提出并发布预训练模型管理工具PaddleHub。

传统的神经网络的结构设计是由人根据经验设计，并不断的进行调参训练获得最优结果，这个过程较为复杂和费时费力。AutoDL Design自动化网络结构设计是用深度学习设计深度学习，理想状态下，只需要使用者提供一份数据集，整个系统就可以根据数据集自身，不断尝试不同类型的网络结构和连接方式，训练若干个神经网络模型，逐步进行自动化反复迭代和尝试，产出模型。本次重磅开源了基于PaddlePaddle实现的AutoDL Design源码，以及在CIFAR-10数据集上训练出来的一共6个模型，这6个模型进行融合，可获得超过98%的准确率。

PARL是一款基于百度PaddlePaddle打造的深度强化学习工具，继1.0版本开源了NeurIPS 2018假肢挑战赛冠军训练代码以及主流强化学习模型后，本次升级聚焦并行，通过一个简单的修饰符即可实现并行化。数据预处理以及simulator仿真等计算密集型的任务经过这个修饰符之后，会自动部署到用户指定的计算资源上运行，不再占用主线程的计算资源。以通过PARL实现的IMPALA算法的评估结果为例,在雅达利这个经典评测环境中，Pong 游戏最快可在7分钟内达到20分，breakout游戏在25分钟达到400分。

PaddleHub是一款简明易用的预训练模型管理框架，提供包括预训练模型管理、命令行一键式使用和迁移学习三大功能，旨在帮助用户更高效地管理模型并开展迁移学习的工作。

模型管理上通过hub命令行可完成基于PaddlePaddle的预训练模型下载、搜索、版本管理等功能。无需代码，通过命令行即可直接使用预训练模型进行预测，快速调研训练模型效果。迁移学习方面，提供了基于预训练模型的Finetune API。活动现场，马艳军演示了低至10行代码即完成迁移学习的惊艳Demo。

五、服务：算力支持计划，价值一亿人民币！

算力是深度学习发展不可或缺的重要“能源”。为此PaddlePaddle宣布了一个振奋全场的“土豪”计划——百度一站式开发平台AI Studio重磅推出价值一亿人民币的算力支持计划，为开发者破除算力桎梏。

据悉，免费算力主要以两种模式提供，第一种是一人一卡模式，使用邀请码即可获赠算力时长。另外一种是远程集群模式，PaddlePaddle提供高性能集群，开发者只需登录AI Studio，便可以免费使用。

百度对于深度学习开发者的支持不仅于此。面向高校，推出深度学习师资培训班、协同育人专项基金、AI Studio教育版。面向开发者，提供免费在线课程、免费算力支持、并举办不间断的赛事互动。面向企业，推出深度学习架构师培养计划黄埔学院，此次进一步推出了可覆盖1000家企业的企业深度学习实战营——AI快车道。

更精进的基础框架设计、更丰富的算法模型、更强大的系统性能和稳定性、更完备的异构硬件支持、更全面贴心的开发者生态……开源三年，PaddlePaddle始终在实践中不断锻造锤炼，为中国开发者打造趁手“神兵”。

风云骤起的智能时代何以亮剑？或许PaddlePaddle可以成为你的选择。