圣彼得堡国立大学物理学家开创新一代超高速神经网络架构

圣彼得堡国立大学的科学家们开发出了超高效极化子神经元,可用于超高速神经形态系统,该系统能够比现有技术更高效地识别手写数字和语音命令。
在短短的时间里,人工神经网络已经成为全球技术发展的重要推动力。它们引起了各领域专家的关注,并广泛应用于识别图像、决策分析和大数据处理等任务。该技术不仅加速了多个行业的发展,也显著推动了医疗健康、自动化机器人技术等领域的进步。
研究成果已于杂志 Light: Science & Applications发表
传统神经网络依赖冯·诺依曼架构,这是一种经典的计算机结构模型。在该模型中,数据和程序存储于共享内存中,信息处理通过中央处理器按顺序执行。然而,这种系统存在显著的局限性,主要问题源于计算单元(中央处理器)与存储单元(内存)之间的物理分离。这种分离导致数据交换速度大幅降低,同时能耗显著增加。因此,许多科学家认为,传统神经网络的潜力尚未被充分挖掘。
为了突破这些限制,圣彼得堡国立大学自旋光学实验室负责人、大学首席研究员阿列克谢·卡沃金与该实验室高级研究员叶夫根尼·谢多夫携手开发了一种基于“光滴”二维晶格的神经形态架构。这一新型系统能够快速且准确地识别手写和语音命令,展现出巨大的应用潜力。
该架构的构建基础是激子-极化子的玻色凝聚态(简称极化子)。极化子是由光子与半导体中的激子相互作用形成的准粒子,兼具光的属性,并能够相互作用,因此被形象地称为“液态光量子”。这些特性使其成为构建新型神经网络的理想材料。
圣彼得堡国立大学自旋光学实验室负责人、大学首席研究员阿列克谢·卡沃金
阿列克谢·卡沃金解释道:“当极化子聚集在一起时,它们会形成一种特殊的集体状态——玻色-爱因斯坦凝聚。如果两个这样的凝聚体相邻,它们会开始交换粒子,并形成由明暗条纹构成的图案。通过激光束的照射,这种图案可以被调控,例如将亮条纹变为暗条纹,或反之。这种变化被用作输出信号,使这些结构在神经网络中扮演人工神经元的角色。
作为俄罗斯联邦政府大型资助项目的一部分,圣彼得堡国立大学乌拉尔采夫自旋光学实验室于2011年成立。该实验室目前拥有超过40名员工,其中大部分为年轻科学家,包括8位取得圣彼得堡国立大学博士学位(PhD)的学者。实验室由全球引用率排名前2%的科学家阿列克谢·卡沃金(Алексей Кавокин)领导,他曾荣获多项国际奖项。作为大学核心领域之一,该实验室的研究工作曾在纪录片《第一大学》中得以展现。
圣彼得堡国立大学的物理学家们提出了一种创新架构,隶属于二元神经网络(Binary Neural Networks, BNN)范畴。与传统神经网络处理连续变量不同,BNN采用二进制信号处理神经元的输入和输出。这一特性使其在信息处理速度上更快,内存占用更少,从而显著降低能耗并提升可扩展性。得益于此,BNN特别适用于能源受限的设备,例如物联网和边缘计算场景。在这些领域,速度和效率往往比超高精度更为关键。
该架构通过解决两个任务进行了测试。第一个任务涉及识别MNIST这一全球最大的手写数字数据库中的手写数字。圣彼得堡国立大学科学家开发的系统在识别准确率上超过了97.5%。在第二个任务中,为进一步评估该网络在处理不同类型数据时的适应性和通用性,团队利用Speech Commands数据集测试了语音命令识别能力。结果表明,该架构在准确性上超越了所有现有解决方案和方法,凸显了其优越性能。