科技日报记者 张佳欣
2日发表在《自然·光子学》杂志上的论文称,美国麻省理工学院科学家开发出一种全集成光芯片。它能以光学方式执行深度神经网络所需的所有关键计算,为制造能实时学习的高速处理器打开了大门。
这种新型光芯片能够在不到半纳秒的时间内,完成机器学习分类任务的关键计算,性能与传统硬件相当。该芯片由相互连接的模块组成,形成一个光学神经网络,并采用商业代工工艺制造,这有助于技术的扩展和与电子产品集成。
深度神经网络由多层相互连接的节点组成,执行线性和非线性操作以处理复杂数据。其中,非线性运算(如激活函数)使深度神经网络能够解决复杂问题。2017年,麻省理工学院恩格伦德小组与马林·索尔贾契奇实验室合作,在光芯片上演示了能执行矩阵乘法的光学神经网络,但这种设计无法在芯片上直接进行非线性操作。设计的难题在于,触发光学非线性非常耗电。
后来,研究团队开发了一种非线性光学功能单元(NOFU),克服了这一挑战。他们通过结合电子学和光学技术,在芯片上实现了非线性操作,从而实现在光芯片上构建光学深度神经网络。其中,神经网络参数编码作为光信号,通过可编程分光镜阵列进行矩阵乘法,再由NOFU实现非线性功能,无需外部放大器,能耗极低。
该光芯片在训练测试中准确率超96%,推理准确率超92%,且执行关键计算时间不到半纳秒。整个电路采用与制造CMOS芯片相同的基础设施和工艺,有利于大规模生产和降低制造误差。这一研究为在光芯片上高效训练深度神经网络提供了可能。
从长远来看,光芯片有望实现更快、更节能的深度学习,适用于激光雷达、天文学和粒子物理学等领域的研究或高速电信等计算要求高的应用。