神经|英特尔下一个时代的『CPU』,10倍以上性能提升,1000倍能耗降低( 二 )


神经|英特尔下一个时代的『CPU』,10倍以上性能提升,1000倍能耗降低
文章插图

比如气味传感器,与基于传统深度学习的方法相比较,神经拟态计算可以有效地学习多达三千倍的数据。
在机器人学习方面,基于神经拟态计算也展现出在机器手臂系统变化中的鲁棒性,在一些实时出现的偏差中,Loihi也可以识别到,然后可以回归预期轨道重新布局电路。
“过去的几个月中,神经拟态计算在量化优化领域取得了非常好的结果。”Mike兴奋的表示。
相比而言,英特尔与德国铁路公司的合作更能展现神经拟态计算未来的应用前景。Mike介绍,“使用Loihi解决铁路调度问题,速度比德国铁路公司运营的Dion's使用的先进商业云计算处理器快一个数量级以上,这是1000倍的低能耗。这表明高阶规划决策优化问题可以在以前根本不可能实现的形式因素中得到支持。”
还有一个例子,一些早期的研究显示,热扩散方程(一个基本的物理行为属性)已经在Loihi中建模,桑迪亚国家实验室完成的这项研究极大地减少了科学计算存在功耗过大方面问题的可能性。
“我们对Loihi的结果非常满意。但与此同时,我们发现了硬件的一些限制。”Mike同时指出。
迈向下一个CPU时代
更强大的硬件
“我们有了一个编程性极强的神经元,可配置性极强的神经元模型,但它是一个固定功能类型的神经元。”Mike进一步表示,“自然界没有单一的神经元,实际上有1000种不同类型的神经元,它们在大脑中有许多不同类型的动态。我们想尝试支持的应用确实需要更多的灵活性,以使芯片中的神经元更加多样化。”
雷锋网了解到,英特尔通过一个微码指令集来解决灵活性的问题,这个微码指令集定义了神经元模型,几乎可以编程任意的模型,涵盖了研究界试图探索的不同类型的方法。
“我们还扩展了脉冲的概念,这将提升结果的精确度,还可以缩小网络的大小,以支持特定的问题。”Mike介绍,“在功能上,我们在Loihi2上还加强了芯片的学习能力。”
这些研究层面和功能层面的进步需要更强大的硬件支撑。在电路层面,Loihi 2比Loihi 1快2到10倍,这取决于特定的瓶颈和你测量的特定参数。例如,基于模拟的结果显示,在前馈神经网络中,Loihi2比Loihi快10倍。
工作负荷层面,Loihi2的神经元的数量提升了8倍,同时将芯片的面积缩小了一半(芯片总内存大致相同),即基于核心大小为0.21 mm2的Loihi 2,最多支持 8192个神经元,对比核心尺寸为0.41 mm2的Loihi,最多支持1024个神经元。
神经|英特尔下一个时代的『CPU』,10倍以上性能提升,1000倍能耗降低
文章插图

Mike解释,“第一代Loihi做了固定分配,芯片中的每个核心都支持1024个神经元。但我们发现,在许多应用中,神经元的数量是一个有限的因素,芯片中的其它内存资源却没有得到充分利用。因此,Loihi 2的架构允许资源在有限的程度上进行交换,同时不影响架构的格式和效率,从而当应用工作负载受限于神经元数量时(通常会发生),能够提供更多的资源来扩展到更多的神经元。”
与此匹配,需要先进的半导体制造工艺。“神经拟态计算的架构相对于其他架构需要更大的资源密度,Intel 4制程能够提供更大的晶体管密度,我们可以在同样大小的芯片上放置更大的神经网络。”Mike还说,
“与以往的制程技术相比,Intel 4制程节点采用的极紫外光刻(EUV)技术简化了布局设计规则,使Loihi 2的快速开发成为可能。”
采用预生产版本的Intel 4制程其实还有英特尔展示其先进制程领导力的作用。需要指出的是,神经拟态架构是一个非常同质的架构,这对于仍处于产量优化过程中的早期工艺来说有很大优势,因为它可以容忍大量的缺陷。

推荐阅读