CPU和GPU之后的下一代计算机系统

发布者:上海IT外包来源:http://www.lanmon.net点击数:891

近几十年来,电子计算的力量呈指数级增长,从根本上改变了我们的工作,生活和互动方式。未来甚至会导致未来的进一步发展变化。回望历史,的计算能力基于摩尔定律的两个因素开发:电子设备1、和减少设备规模的庞大规模2、显著提高了成本,速度和能源消耗。为了保持这一趋势,必须投入大量资源来维持扩张趋势。现在,可以批量生产集成数十亿纳米晶体管的芯片,并为当今的智能手机和超级计算机提供计算能力。然而,随着制造成本的增加和下一个基本的物理限制的增加,单独的器件的增益不再能提供所需的性能增益。


基于忆阻器模式的人工神经网络的硬件实现
在每个交叉点形成忆阻器以同时存储数据和处理信息。在这种方法中,矢量矩阵的乘法可以通过读取欧姆定律和基尔霍夫定律的简单操作来获得。此外,忆阻器的内部动力学可用于忠实地模拟生物突触的潜在过程。我看到,施加到第i行的电压; Ij,通过列j的当前电流; Gij,忆阻器在第i行和第j列交叉处的电导率。
神经形态硬件是忆阻器的研究领域特别有吸引力,因为神经网络的系统级功能,可以为许多设备今天容忍低于理想的,因为设备的内在变化。事实上,设备运行时的随机性可用于模拟现实世界的突触属性,并可在训练期间进行优化。此外,实际的网络操作不需要多年的数据保留,并且还可以放宽设备的耐用性要求,因为重量更新通常不那么频繁。
从数学的角度来看,该neuromórfico计算可以分解为一系列向量矩阵,其由横忆阻器结构由乘法。在这些系统中,“学习”功能是通过突触连接的相对改善和弱化来实现的。近年来已经证明了基于忆阻器的神经网络硬件模式。例如,证明了执行分类模式,最初使用的2×10的矩阵,然后扩大到12×12 2016的矩阵忆阻器硬件,一个马达通用产品被引入到指向应用neuromórficas他们使用了忆阻器矩阵,并通过在线学习进行了主要组件分析的演示。在SNN,学习的共同规则取决于模式同步峰:当峰突触后神经元的峰值之前的突触前神经元,两个神经元的增加之间的突触,而如果没有另外。事实上,有些人甚至认为memristivo效应可以解释与峰值同步相关的塑性行为。到目前为止,许多研究人员已经基于使用实验装置参数模拟整个系统来研究忆阻器-SNN。
一般而言,神经网络模型的开发和探索目前非常活跃。使用不同的神经元,突触和网络模型来探索几种新的计算模型。例如,在生物系统中,SNN峰值被认为是实现高能量和计算效率的关键。目前通过模拟深部脑学习技术实现最先进的对象分类精度。如上所述,忆阻器作为硬件系统的优点是,它可以在计算和神经形态机器学习模型中使用。此外,我们注意到,上面描述的相同的矩阵矢量运算可以用来解决问题如古典矢量算术函数和线性代数。因此,忆阻器可以实现计算解决方案有前途的存储器,其消除瓶颈和拥塞存储器数据和硬件系统为不同类型的密集的任务数据的提供低功耗和高效率。
挑战和解决方案。
尽管忆阻器已经显示了巨大的潜力,记忆,计算和神经网络的应用程序,还有解决材料和器件应用问题的需要。当然,这些问题可能因应用而异。例如,在存储器应用中的高性能,如更换DRAM,减少电流编程和电压,提高耐用性和性能选择器减少泄漏电流是至关重要的,而这一切与实现最少的设备。显然,这对研究界来说是一个巨大的挑战。幸运的是Neuromorphology和类似的应用,其中一些规范可以放松和新的要求,如模拟状态下的稳定性,是非常重要的。
如何减小设备的尺寸,增加集成规模?
虽然忆阻器近年来有了很大的改进,但值得注意的是忆阻器研究仍处于起步阶段。 Memristivos系统的研究仍然在学术研究团体,并且最演讲重点放在概念的证明,而不是真正的系统。为了进入基于在实际应用忆阻器的计算机硬件,既要着眼于进一步发展的三个方面:扩大规模的设备集成、,、多功能集成和系统集成与CMOS。
图4:忆阻器技术的快速发展。第一种方法是增加忆阻器功能网络的大小。系统规模的扩大在很大程度上取决于可以集成到系统中的设备数量。真实存储器或计算机系统可能需要数十亿个功能存储器设备。实现这种集成度需要增加忆阻器设备制造的生产以及大学研究人员和行业合作伙伴之间的密切合作。此外,开发和优化系统层次结构以提高硬件可伸缩性。令人鼓舞的是,这项研究已朝着这个方向发展。
另一方面是通过在同一硬件系统中执行多个任务来改进系统的功能。例如,相同的物理结构可用于执行不同的功能,即神经网络,算术运算和数据存储功能。该方法可以产生可扩展的计算系统,其可以动态地重新配置以适应不同的工作负载。在这种情况下,可以在运行时在软件中动态地重新配置(重新定义)相同物理存储器结构的功能,而无需对硬件进行任何物理修改。为了使这样的系统成为现实,仍然需要解决一些挑战。例如,使用忆阻器执行算术运算需要比存储和神经网络更严格的设备分配。此外,可能需要设备的长耐久性循环以允许有效执行逻辑任务。最近的设备研究工作已经显示出有希望的结果,我们相信基于可重新配置忆阻器的计算系统可以成为扩展系统功能的有吸引力的替代方案。
第三个因素是系统之间的整合。系统之间扩展的成功主要取决于与忆阻器的可靠CMOS集成。通常,仍然需要一些CMOS电路来基于忆阻器系统的操作提供必要的接口和控制操作。因此,忆阻器-CMOS的有效集成是实现系统增益的关键因素。基于芯片级集成或通过硅通路的典型方法将不在忆阻器层和CMOS电路之间提供所需的带宽。忆阻器和CMOS电路的成功3D集成可以显着提高系统密度,而不仅仅是设备的简单缩放。3D的基本扩展可以为物理和概念中的更多认知架构创造新的机会。例如,通过大尺寸的神经网络的启发,认知前期工作研究大脑如何呈现的概念和关系,因为散落在高维空间中的向量。这些主管的尺寸可达10,000,这在一定程度上可以通过神经系统的连接来证明。在这么大的空间(也受随机性和分散)工作导致认知操作(结合的概念,如人的性别和名字),可以通过相对简单的操作,如乘法,加法和置换来实现。形成这个空间的代数称为超维计算。高维计算的挑战是,这些操作还是非常内存密集型,考虑到规模和向量的预期数目(例如,在英文10万个字)。最近的工作探索采用3D矩阵memristivas垂直结构来产生随机向量,并执行乘法,加法和原位置换超尺寸计算的实现。实现大规模硬件系统的能力显然取决于三维扩展的能力。
化学和生物计算。
在生物启发计算中,人们的目标是模仿已知的大脑,并希望在此基础上构建更高效的计算机系统。但是,特定任务所需的生物细节数量仍然是一个悬而未决的问题。例如,不需要大量的生物细节结构,并且只有通过网络拓扑的深度神经网络可以在经过充分训练之后以高精度执行诸如图像分类之类的任务。然而,最近的发展表明,即使对于深度神经网络,最有效的训练算法与生物学中观察到的基于峰值的学习规则显示出惊人的相似性。实施生物特性和缺乏这些特性如何导致实际功能(神经)了解成本的上升:生物信息的详细结构的作用的辩论是由两个因素的。在这个意义上说,如果一个人能忠实地模仿硬件与成本几乎没有增加系统中的生物学行为,这个问题可能会更容易通过使用原生生物地理的设备来回答。基于此类设备的硬件系统将在人工神经网络中提供新功能,甚至可以帮助加速神经科学中假设的开发和测试。最近的发现表明,在没有额外补偿的情况下,可以在忆阻器装置中实现生物地理特征。代表性的例子是钙效应。在突触后神经元钙离子浓度的前神经元峰事件后增加然后衰减到几十毫秒的时间尺度。如果突触后神经元也这个时间内发出,钙的浓度可以高于触发突触改善的阈值增加。相反,增加的钙强度取决于神经元之前和之后峰值的相对时间。这种机制被认为是观察到峰可塑性和时间依赖和潜在的速过程背后没有意识到该系统的成本。在设备级别实现这样一个机构的实际水平是非常有吸引力的,当涉及到生物灵感的网络。
另一个有趣的例子是化学的生物系统,其中所述突触权重是由结合神经递质在接合过程和受体活性是由驱动受体的活性测定中的作用的研究化学反应,如,酶 - 使生物催化反应。从设备的角度来看,一个类似的化学反应可以帮助减少操作设备和提高装置的可靠性所需的能量。例如,电阻的忆阻器的变化期间,该设备切换到另一稳定克服这两个状态的状态之间的能量势垒。能量障碍越大,状态越稳定。然而,更高的能量势垒意味着更高的偏置电压,因此需要更多的功率来对器件进行编程。模拟生物学和化学使用协助换向过程中,有效的屏障能量可以显著切换期间降低,而阻挡高能量被维持,以确保释放的化学品之后的装置的稳定性“闭合” 。可以使用离子低能垒(第实施例,锂离子),以驱动在充电和放电类似的电池方式的导电沟道的氧化还原反应而得到“上”这种化学物质的效果。在这种情况下,切换可以在非常低的电压(例如,5毫伏)来进行,从而导致优异的功率效率。
除了突触行为,memristivos系统可以替换神经元接收,处理和传输在计算机系统中仿生信息。神经元的主要特征通过接受其他神经元和存储,它,克服了阈值之后,产生对应的动作电位的输入负载。神经动力学模型在生物保真度方面可能有很大差异。然而,在神经元的复制行为的关键因素是有源增益,即,小的输入信号可以,如果合适的话,产生大量的扩增和动态输出的。因此,固态神经元的实现必须满足一些基本动力学。可以在忆阻器中执行“神经元”特性的动态物理学的一个重要参数是器件中的局部温度。温度强烈地影响电子(传输)和离子(迁移率)的性质,并且反过来可能受它们的强烈影响。作为一个简单的例子,当电压增大忆阻器,增加的焦耳加热和局部温度活化的电子传输,这进一步增加了焦耳加热模式强烈的正反馈。对于某些材料系统,该过程产生观察到的负微分电阻(NDR),这导致电导强烈但不稳定的变化。实际上,许多形式的NDR最终可以被描述为基于耦合到电子传输的内部温度的正反馈脉冲的效果。因此,由于固有的正反馈,仅需要少量输入信号来产生大的效果,因此提供了上述所需的神经元放大。
结论
基于忆阻器的架构展示了在冯·诺伊曼瓶颈和摩尔定律时代之后开发未来计算机系统的巨大潜力。在短期内,通过忆阻器提供了高密度非易失性存储器芯片可以显著提高基于冯·诺依曼的传统系统的性能,并且可以找到应用,包括机器学习系统,高性能应用性能低下。用于物联网的嵌入式芯片。设备技术和架构开发的其他发展可以导致基于忆阻器的神经形态计算系统的大规模实现。 Memristive交叉开关为大规模并行和节能矢量矩阵运算提供了原生解决方案,构成了神经形态学运算的基础。此外,精心设计的忆阻器设备可以模拟生物学上等效的动力学。最后,我们期望一个基于忆阻器的通用内存计算平台。这种高效且可重新配置的计算平台称为内存处理单元,可以执行不同的任务:数据存储,算术,逻辑和神经形态计算。可以说,处理单元基于存储器忆阻器的架构是计算范例的自然进化,以下由于中央处理单元向处理单元的图形相同的趋势,移动一个高度并行的结构和高度平行。
计算机系统的可能演变
用与成千上万小晶核和更快的存储器存取的处理器和单独的存储器(中央处理单元,CPU),一个处理单元(GPU)传统架构开始已成为骨干今天的数据密集型计算任务。存储器处理单元(MPU)的结构提出了这种趋势将继续下去,最终与逻辑和粒状最小存储器共存于单一装置层级能够有效地管理多个计算任务。最后,我们注意到生物学已经并将继续成为开发实现低功耗,实时学习系统的方法的巨大灵感。然而,正如野外的鸟类可能激发了现代航空技术的灵感,我们终于开始朝着新的方向和能力前进,以更快的速度,更高的负载能力和完全不同的燃料需求。同样,在计算中,现代应用必须超越自然界面临的应用,例如搜索大型数据库,有效编程资源或解决高度耦合的微分方程系统。有趣的是,忆阻器中观察到的一些特征也可以通过新设备的动态行为和生物学启发的网络拓扑为计算中的“超越生物学”提供机会。从这个意义上讲,内存处理单元等概念代表了一个真正令人兴奋的机会。为了实现未来的这些和其他新的计算系统,连续的和创造性的研究,已超出任何个人的纪律将被要求,并应包括神经科学,物理学,化学,计算机科学与电气和计算机工程方面的知识。
IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部