▶ 本报特约作者 唐乾元
当地时间10月8日,瑞典皇家科学院宣布将2024年诺贝尔物理学奖授予美国和加拿大科学家约翰·霍普菲尔德(John Hopfield)和杰弗里·辛顿(Geoffrey Hinton),以表彰他们在人工神经网络和深度学习领域的开创性贡献。他们的工作展示了如何用从统计物理学中的基础概念出发,利用能量最小化、概率建模和优化等方法帮助计算机通过可计算的方式实现学习和记忆。他们开创性工作的科学价值在于:不仅为人工神经网络提供了理论支撑,还让深度学习成为解决现实复杂问题的强大工具,比如图像识别和自然语言处理。
为计算神经科学提供了重要的理论工具
约翰·霍普菲尔德的贡献可以形象地理解为给机器设计了一种“联想记忆”的能力。就像人们看到模糊破损的老照片,也能通过记忆把它拼凑完整一样,霍普菲尔德的网络能够通过不断调整自身状态重现原始图像。这种网络模型模拟了物理系统趋向最低能量状态的过程,类似于在拼图时尝试让每个拼块自己找到最合适的位置。这项研究不仅在理论上带来了对人工神经网络如何储存和重构信息的全新视角,还为计算神经科学提供了重要的理论工具,帮助科学家探索大脑如何实现高效的计算和记忆。霍普菲尔德的工作还激发了后续关于关联记忆、模式识别和联想过程的大量研究,为理解大脑中的计算过程奠定了基础,也为后来出现的各种神经网络架构、类脑计算等提供了理论依据。
杰弗里·辛顿一直活跃于人工神经网络研究的第一线。从上个世纪80年代开始,他不断地在人工神经网络结构设计和训练方法上作出重要贡献,还推动深度学习的诞生,或者说,深层人工神经网络的复兴。2006年,辛顿提出深度信念网络的概念,这是现代深度学习的起点。在一个多深层的人工神经网络中,网络能够逐步提取到更为抽象和高层级的特征,从而从大量数据中学习到有意义的信息,这使得深度学习成为解决许多现实问题的关键工具。辛顿的工作帮助深度学习在计算机视觉和自然语言处理等领域取得突破性进展,为今天的人工智能奠定坚实的理论和实践基础。2019年,杰弗里·辛顿与另外两位深度学习领域的先驱者Yoshua Bengio 和Yann LeCun一起获得当年的图灵奖。
物理学是研究物质、信息、能量等对象及其相互作用的基本规律的学科,它既包括对具体现象的探索,比如理解自由落体、天体运动、电磁波的传播、量子纠缠,也包括对描述和预测复杂行为的抽象模型的研究,如理解社会集体行为、设计优化人工神经网络等。以物理学家的思维方式解决来源于各种不同学科中具有普适性的科学问题,使物理学的边界超越了传统领域。
人工神经网络研究曾经历“暗夜”时刻
20世纪80年代初,当时人工智能的主流是基于符号逻辑的专家系统,例如,基于语法规则实现机器翻译,这些系统依靠大量手工编写的规则,试图用逻辑推理模仿人类的思维过程,而神经网络的研究在那个时候并不受重视,很多人认为它缺乏实用性。约翰·霍普菲尔德是一位具有分子生物学和神经科学背景的物理学家,他受到生物神经元工作的启发,认为可以通过数学模型模拟大脑处理信息的方式。霍普菲尔德大胆地提出使用物理学中的能量最小化原理设计人工神经网络,使这些网络能够通过不断调整自身状态找到最符合保存信息的方式。
杰弗里·辛顿的研究旅程则充满了坚持与突破。辛顿出生在一个科学世家,他的曾祖父乔治·布尔发明了布尔代数,这种数学工具如今是计算机科学的基础。辛顿延续了家族对科学的热情,但他的道路并非一帆风顺。尽管人工神经网络的研究一度在上个世纪80-90年代迎来了一波小热潮,然而由于计算机计算能力的限制,许多人工智能方面的权威都认为,人工神经网络只能用于解决一些相对简单的问题。人工神经网络的研究也因此进入了长达十余年的低潮期,很多研究人员选择了转向其他方向。在面对学术界的质疑和研究资金的匮乏时,辛顿坚持不懈地推动神经网络的研究。他相信,正如同大脑的工作方式并不能被简单的逻辑规则描述,机器学习也应该需要从概率和能量的角度来理解。因此,虽然当时的计算能力无法支持复杂的深度网络训练,但他相信这种方法在未来一定会实现。他的远见和坚持为后来的深度学习铺平了道路。深层神经网络在图像和语音识别任务中表现出色,让全球范围内的科学家们重新认识到神经网络的潜力,也引起了工业界的广泛关注。
深度学习的应用变革了科技产业
霍普菲尔德和辛顿的工作通过运用物理学中的概念和方法,为机器学习提供了新的视角和理论框架。这种跨学科的合作超越了传统科学研究的边界,推动了新的研究领域的发展。如今,越来越多的科学家投身于机器学习研究,不仅利用他们在统计物理、统计学、信息论等方面的专长推动机器学习与人工智能领域的发展,还利用人工智能方法解决物理学、化学、生物学等学科中的难题,从而形成了“Science of AI”和“AI for Science”的双向互动。这种双向互动加速了许多新的突破。
尤其值得一提的是,深度学习还在生物医学领域取得了显著成果,例如用于蛋白质结构预测的AlphaFold模型,这使得科学家能够在极短的时间内解决过去需要数月乃至数年才能完成的蛋白质结构解析,从而极大地推动了生物化学和医药研究的发展。此外,今天的科学家可以利用深度学习模型模拟和预测复杂的自然现象与物质性质,如气候变化、材料特性、生物分子模拟以及量子系统中的粒子行为。深度学习的计算能力使得科学家们能够处理大规模的数据,结合科学理论进行更精确的预测和分析。这种跨学科的应用不仅提高了科学研究的效率,还为理解自然界提供了新的工具和方法。
从技术应用的角度看,深度学习已成为推动人工智能进步的核心技术,广泛应用于未来产业和日常生活中的各种场景。例如,图像和语音识别、智能手机中的语音助手、自动驾驶技术、图像与视频生成技术等都得益于深度学习的突破。
深度学习的应用改变了科技产业,还推动了多个传统行业的变革。例如,在医疗行业中,深度学习用于医学图像分析,帮助医生进行更精确的诊断,从而提高治疗的效率和准确性;在制造业中,深度学习被用来实现生产过程的自动化与智能化,提升生产效率和产品质量;在能源行业中,深度学习被用于预测电力需求和优化能源分配,帮助提高能源使用的效率,减少浪费;在零售行业,深度学习被用于顾客行为分析和个性化推荐,帮助商家更好地理解顾客需求,提供更加精准的服务;在物流行业,深度学习被用于优化运输路线和仓储管理,通过实时分析交通情况和库存数据,提高配送的效率,降低成本。
上述这些应用使人工智能成为推动各行各业变革的重要驱动力。这些突破将改变人们看待世界的方式,推动科技进步,为人类社会带来深远的影响。
(作者:唐乾元,博士,香港浸会大学物理系助理教授)