对光传播进行编程可创建高效的神经网络

发布时间:2024-01-26 16:47:13 栏目:精选知识

    导读 当前的人工智能模型利用数十亿个可训练参数来完成具有挑战性的任务。然而,如此大量的参数带来了巨大的成本。训练和部署这些巨大的模型需要

    当前的人工智能模型利用数十亿个可训练参数来完成具有挑战性的任务。然而,如此大量的参数带来了巨大的成本。训练和部署这些巨大的模型需要巨大的内存空间和计算能力,而这些空间和计算能力只能由机库大小的数据中心提供,其过程消耗的能源相当于中型城市的电力需求。研究界目前正在努力重新思考相关的计算硬件和机器学习算法,以可持续地保持人工智能当前的发展速度。

    由于单元之间连接的低功耗实现,神经网络架构的光学实现是一种有前途的途径。《Advanced Photonics》中报道的 新研究 将多模光纤内的光传播与少量数字可编程参数相结合,并在图像分类任务上与具有超过 100 倍可编程参数的全数字系统实现了相同的性能。该计算框架简化了内存需求,减少了对能源密集型数字处理的需求,同时在各种机器学习任务中实现了相同水平的准确性。

    这项开创性工作由 EPFL(洛桑瑞士联邦理工学院)的 Demetri Psaltis 和 Christophe Moser 教授领导,其核心在于通过波前整形技术精确控制多模光纤内的超短脉冲。这使得能够以微瓦级的平均光功率实现非线性光学计算,为实现光神经网络的潜力迈出了关键的一步。“在这项研究中,我们发现,通过一小组参数,我们可以从光学提供的权重库中选择一组特定的模型权重,并将其用于目标计算任务。这样,我们使用自然发生的现象作为这项工作的主要合著者伊尔克·奥古兹 (Ilker Oguz) 表示:

    这一结果标志着在解决对大型机器学习模型不断增长的需求所带来的挑战方面迈出了重大一步。通过利用多模光纤光传播的计算能力,研究人员为人工智能领域的低能耗、高效硬件解决方案铺平了道路。正如所报道的非线性光学实验所展示的那样,这种计算框架还可以用于有效地对不同的高维非线性现象进行编程,以执行机器学习任务,并且可以为当前人工智能模型的资源密集型特性提供变革性的解决方案。

免责声明:本文由用户上传,如有侵权请联系删除!