百度吴甜:从基础设施到应用、生态、人才培养

网络知识 2022-06-29 12:01www.1681989.comseo网站推广

AI 新基建是一项全方位的工作,基于AI基础设施,不断产生应用价值,形成生态系统,培养AI应用人才,合力加速产业智能化。

核心提示

1. AI基础设施是构建于云平台基础上,以算力平台和数据平台支撑形成的AI技术开发平台、能力平台、场景技术方案综合的、具备AI安全保障能力的大型技术系统和工程系统。

2. 在基础设施之上,要不断在应用场景当中发挥应用价值,以此形成正向的循环,能够促进基础平台进一步发展,促进整个AI系统进一步进化。

3. 在AI产业化过程当中,因为其过程链条长、决策复杂,需要社会全方位多方整合力量进行积木式创新,共生共赢的生态系统就应运而生了。

4. 重视人才培养,加大力度培养既懂应用场景,又懂AI技术的复合型新型人才,通过构建相应的教育、培训体系以及职业体系保障,多方位培养AI技术及应用人才。

编者按本文由4月7日超级沙龙「新基建」系列第三期直播整理而来,有删减。

最近这段时间,随着加快新基建的要求提出,新基建的建设现在已经是非常重要的话题了。所以我今天带来的是关于人工智能新型基础设施建设的理解。后面我简称为AI新基建。新型基础设施建设虽然简称“新基建”,但它其实是以5G、人工智能、工业互联网、物联网等为代表的新型基础设施。本质上来说,它是信息数字化的基础设施。

一、AI基础设施

,我先来介绍下作为AI新基建中最基础,而且也是最重要的硬核部分——以AI技术平台及以AI技术平台为核心构建的一套基础设施。

关于算力框架与平台介绍,我今天以百度的工作为例来介绍。AI技术涵盖的子领域非常广,整个的AI技术系统本身开放性很强,它和应用场景也有非常多的结合,和应用紧密相关,而且会随着应用的发展,持续地进行自身进化,所以它并不是一成不变的,而是一个不断演进演化的系统。

图一

百度大脑是百度AI技术的集大成者,可以看图一简单地回溯一下百度大脑的发展历程。特别是在2018年的时候,百度大脑核心技术进入到“多模态深度与理解”的阶段。所谓多模态就是综合语音、视觉、文本的理解能力,并且是深度多层次的语义理解。而AI能力在这个阶段也已经开始了多维度、多层次的开放状态。2019年,百度大脑进一步升级为软硬一体AI大生产平台。在这段时间里,百度大脑也进入到了AI的能力和应用场景融合创新的阶段,和各行各业的场景广泛结合,成为了AI时代的大生产平台。

图二

那么AI大生产平台,是一个什么样的平台?这个名字听上去可能会觉得有一些黑盒,如果我们打开黑盒去看,整个组成部分最基础的是算力和数据平台。在整个生产平台上,深度学习平台是底座基础。通过深度学习平台,开发者可以去开发自己的AI应用。这里也会提供给大家通用的AI能力,比如语音的、视觉的、自然语言、处理知识图谱等一系列的AI能力的调用。

再结合到场景当中,因为有大量的应场景需要进行定制训练的需求,所以开放了定制训练平台。最终整个平台上所积累的能力需要能够和业务系统进行部署和集成,所以也提供了部署与集成的工具和平台,在此基础上也形成技术解决方案。整个的平台大生产中,平台本身由AI安全保驾护航。因为在AI的整个应用过程当中,安全也是重要的话题。

接下来我们从整个平台的底层向上,逐层来看一看,现在这些内容的含义以及进展。

最底层是AI基础架构,这是整个大生产平台的计算底层。随着AI算法能力提升,它对算力的要求是越来越高的。有这些计算力的基础资源才有可能对大数据进行计算,产生AI的算法模型。

图三

面对即将到来的AI+5G时代,未来计算将会无处不在。它会从云扩展到端、边缘等等,在我们身边时刻都能进行各种各样的计算。在百度大脑上,全新的AI计算架构,通过芯片层、互联层、系统层以及调度层,进行协同设计和技术创新,最终可以提供百万TOPS量级的强大的计算力(见图三)。与此芯片之间、系统之间,还有设备之间都能够互相连接,将不同场景中的计算连接在一起,从而产生一个综合的更强大的计算能力。

图四

百度在使用经典的芯片基础上,也有在自研芯片。我介绍两款自研芯片,一个是云端通用AI处理器,百度昆仑,这是一款云上的处理器。在这款芯片上,我们针对语音、自然语言处理,还有图像进行了专门优化,优化之后,性能可以更加提升。百度昆仑和飞桨等深度学习平台的框架进行了非常好的深度适配,使得编程灵活度更高,能够灵活地支持训练和预测。总体来说,在同等性能下使用昆仑可以在成本上降低10倍。

图五

还有一款是在端上的百度鸿鹄,这是一款专用于远场语音交互的芯片。在100毫瓦功耗情况下,鸿鹄芯片可以支持远场语音交互核心的阵列信号处理和语音唤醒能力,这些能力会用在哪呢?主要在车载语音交互、智能家居等场景,会带来低功耗、高性能的计算能力,也能够给这些场景带来更大的想象空间。

鸿鹄芯片在流片的就已经实现了量产,现在已经在百度的相应产品当中去使用了。

在算力层向上,向下连接芯片,向上连接了应用场景的就是深度学习框架及平台。在AI时代能够帮助开发者便捷、快速完成深度学习技术的研发,这是深度学习平台的使命,深度学习平台是智能时代的操作系统。在飞桨产业级深度学习开源开放平台上,我们已经构建起了整个全方位、全功能的平台。

图六

图六是飞桨的全景图,它在核心框架层能够支持开发者进行开发、训练、预测等全流程的研发工作,在飞桨上还发布了百度自己以及百度的行业伙伴一起打磨过的工业级的一系列模型,覆盖到了像自然语言处理、视觉推荐、语音等等,这些主流的AI算法方向上的官方模型库。

在真实场景中应用的时候,往往还需要有端到端的配套的开发套件,以让场景的整个开发过程更加便捷、便利,并且能够去复用以前已经做好的各种各样的积累。现在飞桨在语义理解、目标检测、图像分割,以及点击率预估这四大场景上都有配套的套件,可以非常便捷地使用。

Copyright © 2016-2025 www.1681989.com 推火网 版权所有 Power by