在近日举行的“第十六届CCF全过高性能计算学术年会”上,中国工程院副院长、中国科协副主席、中国工程院院士陈左宁发表了题为《人工智能进展对算力需求分析》的演讲。在演讲中,她阐述了人工智能模型和算法的七大发展趋势。
陈左宁表示,经典的HPC的算力环境可支持现有人工智能的模型算法,但性能功耗比和性价比都较低,并非最适合的,需要创新体系结构和软件架构。
据介绍,人工智能的发展经历了三个历程。从符合主义到连接主义再到行为主义。符号主义主要是用公理和逻辑体系搭建一套人工智能系统。连接主义源于仿生学,主张模仿人类的神经元,用神经网络的连接机制连接人工智能。行为主义控制论意为假设智能取决于感知和行动。
陈左宁称,三大流派日趋融合,协同发展,人工智能的核心特征之一是“关系”。
据介绍,“关系”计算的表现形式有三种。一是连接关系,神经网络中神经网元间的连接。反向传播算法中的梯度传播;进化算法中的变异。二是逻辑关系。RNN中的循环连接以及知识图谱中的关联关系。三是因果关系,贝叶斯、决策树以及强化学习中的控制连接。
在演讲中,陈左宁详细介绍了人工智能模型和算法发展的七大趋势。
趋势一、向无监督的方向发展。主要表现为:适应“小数据”,减少标注需求,减少计算开销。要向无监督方向发展要经历几个阶段。人工智能主动学习阶段,算法主动提出标注请求,将一些经过筛选的数据提交给专家标注。迁移学习阶段,增强训练好的模型,解决目标领域中仅有的少量有标签样本数据的问题。强化学习阶段,用agents构成系统来描述行为并给予评价和反馈学习。
趋势二、可解释(XAI)越来越重要。深度学习如何进一步设计算法和参数,提高泛化能力,需要模型算法可解释。对抗样本导致模型失效,训练数据不可理的被局部放大。模型愈加复杂,失去了可调式性和透明度。
“此时,对于技术的需求就是将可解释技术融入软件环境中去。有两个方法。第一为现有软件框架增加可解释技术接口。提供事后解释的基本技术,比如可视化能力,局部数据分析,特征关联等。现有的软件原生支持多种可解释算法。提供算法或指标评估模型的可解释能力。第二是“人—AI”系统结合。以人为中心,由决策理论驱动的XAI的概念框架。” 陈左宁表示。
趋势三、人工智能的自学习、自演化。这个过程有三个阶段。一是自动化机器学习,主要是利用数据驱动方式来做决策。而是限制约束条件的AutoML。三是不舍初始条件,搜索空间极大丰富的自演化AutoML。这一趋势对于技术的需求有计算框架支撑、大算力支撑以及辅助设备支撑。
趋势四、多种算法、模型的有机结合。单一的算法或模型难以解决实际问题。比如问题分解和多种模型有机组合。人工智能模型的发展希望融入多种技术来解决已有问题。比如,通过贝叶斯技术增强因果关系分析;通过数据生成技术减少标注数据需求;通过AutoML技术提高搜索和挖掘能力。与此同时,人工智能的应用流程也越来越复杂,如,不同流程设计的设备以及环境多样;需要不同的算法和模型组合。多种算法、模型的有机组合的需求是计算存储等可拓展能力。基础软件能力提升,支持复杂模型,不同类型软件的协同和交互。
趋势五、人工智能应用需求需要关注全生命周期。全周期不同人物具有不同时间,空间和计算需求。全生命周期都要考虑可解释、公平等需求。
趋势六、分布式、分散式的需求越来越突出。首先,大型、复杂模型,海量数据需要并行,分布式计算。其次,联邦学习等分散场景需要分布式ML原生算法。使多个参与者可以在不共享数据的情况下构建通用的,健壮的机器学习模型,从而解决关键问题。不同节点上的数据集异构(分布不相同),大小可跨越几个数量级。节点可能不可靠,节点之间的互联可能不稳定。类别优集中式、分散式以及迭代式。这一趋势对安全性、架构、提升效率和效用、健壮性有需求。
趋势七,深度推理。从计算到感知再到认知和意识,人工智能模型和算法的发展趋势七是认知理论的进一步突破。这一趋势的需求有效应对多种形式的不确定性。其中概率计算根据不同精度计算需求设计硬件。根据数据和计算的稀疏分布设计。另外,这一趋势的需求还有类脑、仿脑体系结构以及模拟计算。
陈左宁总结说,总体来说,AI趋势对算力的需求主要是对软件栈的需求。从AI发展趋势的特点来看,关系、概率、近似计算更突出;不要求高精度、高容错;节点上计算简单;人在环路中需求明显。因此,对软件栈的需求更加多样,比如复杂、动态、分布式和分散;支撑新场景以及架构创新。目前AI算法仍在基本计算模式中。
陈左宁坦言:“未来的复杂问题可能会超越此模式,目前的模型和算法主要是低精度张量计算。”