业界资讯|智源发布线虫生命模型,超级人脑有望在未来15-30年实现

作者:田玮靖
5月31日,作为国际性、权威性、专业性和前瞻性的“内行AI盛会”——智源大会开幕,会上,智源研究院发布了其最新研究成果线虫生命模型 – 天宝1.0。再次引发了业界对通用人工智能和生命模拟技术的新思考,生命模拟的最新进展和面临挑战是什么,距离实现具有自我意识的超级人脑还有多远?CSDN针对上述问题采访了智源研究院院长、北京大学教授黄铁军和智源研究院生命模拟研究中心负责人马雷,为我们作出解读。
通向强人工智能的线虫生命模拟
通常,在AI与生命科学交叉的研究领域,会选择一些方便观测且具有代表性的“模式生物”如线虫、果蝇、斑马鱼,小鼠、猴子等,其中线虫(这里指秀丽隐杆线虫,Caenorhabditis elegans)是一种不到1mm的微小动物,由302个生物神经元组成,是具备发育、生成、觅食、逃跑等各种复杂功能的“通用生命智能”。因为生命的复杂程度差别较大,所以从研究最简单的线虫体的神经系统开始,能够大幅促进人工智能基础理论的发展。
早在1965年,科学家Sydney Brenner就利用线虫作为分子生物学和发育生物学研究领域的模式生物。随着研究的不断深入,科学家认为如果将延长蠕虫生命的科学应用到人类身上,人类活到500岁将不只是梦想。秀丽隐杆线虫的两个基因通路使通过遗传相互作用进行抗衰老治疗成为可能。同样,作为最小的通用生命智能载体,秀丽隐杆线虫因其确定的神经元规模、较容易满足的模拟算力需求,也成为强人工智能研究的第一选择。
但在强人工智能的研究道路中,从图灵机诞生至今近70年,以科学计算为基础的人工智能并未真正触及智能的核心问题,它只是在解决规模越来越大、越来越复杂的应用问题如语音识别、图像识别、下围棋等,与人类大脑所表现出的能力相差甚远。2018年,智源研究院院长黄铁军发表非学术文章《人类能制造出超级大脑吗?》,指出人类大脑是强人工智能唯一参照物,未来15-30年,我们将亲眼见证超级人脑的诞生。他所说的超级人脑,是一个具有自我意识、能够适应环境、应对挑战,且能力超越人类的智能机器。
而要通向强人工智能,必须从生物机理模拟角度启发下一代人工智能,线虫生命模型由此诞生。
据黄铁军介绍,本次发布的线虫生命模型经过仿真环境的训练,由高精度神经系统控制,实现了与三维动态仿真环境的实时交互,表现出能够像真实线虫一样嗅探并控制身体蠕动到感兴趣的目标的智能行为。线虫生命模型单个精细神经元所表征的计算复杂度可类比5-8层DNN( 2021年8月10号,《Single Cortical Neurons As Deep Artificial Neural Networks》指出用DNN模拟生物神经元,需要5-8层人工神经元才能达到单个生物神经元的复杂度),这意味着虽然线虫只有302个神经元,但由于它的复杂性,或许需要用上千层人工神经元才能完成线虫生命的所有行为。而现有研究表明,19个线虫生物神经元组成的神经回路就有可能控制自动驾驶汽车(《Neural circuit policies enabling auditable autonomy》 Nature Machine Intelligence,2020.10)。
【业界资讯|智源发布线虫生命模型,超级人脑有望在未来15-30年实现】据马雷透露,目前线虫生命模型虽然已达最高精度,但智源研究院仍想把它向更通用的智能方向发展,如在仿真环境中训练、进化,激发更多的智能行为,以应用到更广泛的人工智能研究与应用中。同时,智源研究院希望外界发现线虫生命模型的价值,进一步将它落地到行业应用中。
线虫生命模型对生命模拟技术发展的意义
那么,站在生命模拟技术的角度,线虫生命模型对智能生命的发展又意味着什么呢?
总的来说,无论是研究线虫还是研究人脑,对于人工智能和生命科学而言,都需要彻底了解研究对象的结构和功能。例如,生命科学中的两项重要进展:进化论、基因,进化论讲述了生物功能与行为的演变,基因从物质基础角度解释了生物结构。
对于线虫的研究而言,线虫如何通过蠕动身体接近事物或躲避毒物,这种现象即反映了线虫具备的功能。而线虫302个神经元的连接便是它的结构,这在20世纪80年代就已经确定。清楚了线虫的结构与功能后,下一步是否能基于软件、硬件模拟线虫生命模型,重现线虫行为?如果线虫生命模型能够在数字空间很好的运行,并且与真实的线虫生命体有着同样的表现,那么它的意义是重大的。通过对线虫神经系统与肌肉的研究,就可以观察和总结更复杂的生命体,进而构造更复杂的仿真生物。19个生物神经元控制自动驾驶便是很好的例子,以低代价实现高价值。
再例如果蝇,大脑中富含三十多万个神经元,它的飞行能力比当前的无人机更强大,但消耗的能源极小,如果能将果蝇的生命仿真模型应用于人工智能飞行器的设计中,效益是巨大的。
从线虫仿真到果蝇仿真,再到类脑或超级人脑,取得的每个研究成果都是阶梯式的,不能一蹴而就。但就目前而言,生命模拟还面临较大挑战。
生命模拟面临的三个挑战
目前生命模拟主要面临硬件、技术、发展这三个方面的挑战。
硬件挑战:承载智能的新型物质基础。 很多人认为人工智能是一种抽象的科学,忽略了任何智能都需要物理载体。载体对人工智能的作用正如肉体之于精神,没有物理载体的智能是走不远的。
黄铁军认为,将来人工智能的发展在一定程度上得益于智能算法的训练。而计算机、芯片等现实载体的算力有限,从长远来看,需要创造新的物质载体,除了降低功耗、提升效率等基础需求外,还要关注如何用新材料、新器件创造更大的可能性。目前已有专家在探索新的物质基础,但尚未成体系,
技术挑战:生理表现的真实性。 生命模拟面临的技术挑战较多,其中生理表现的真实性是具有代表性的一项挑战。
据马雷介绍,模拟生物的过程是动态的,需要准确判断生物每个动态行为的生理表现并实现“复刻”。与三维动画中的生物形象不同的是,生命模拟讲究生理的真实性,这是艰难的。因为目前虽然已经有膜片钳等技术可以记录生物神经元信号,但囿于实验成本和技术普及等原因,目前记录到线虫神经元电生理动力学数据非常有限。也尚未完全形成共识。另外,同时读取整个神经系统每个神经元树突的信号更是极大挑战。所以没有完整实现输入与输出神经脉冲信号的训练,就很难达到真实性。
举个例子,线虫靠嗅觉感知食物,当它闻到气味后会驱使它的神经元调动肌肉,然后爬向食物。对于这个过程,研究人员需要尽可能一致地按照线虫的结构搭建神经网络,并且需要针对每一种神经元设计一个模型,模型的参数预估要靠经验,还要依赖复杂的算法进行不断调试以接近预测,过程中不能出错才有可能模拟出正确的神经信号,进而需要近似出刺激肌肉过程,肌肉收放与环境互动,模拟线虫爬向食物的行为。
黄铁军表示,智源研究院能够做出高精度的线虫生命模型证明其算力平台已经比较完善了,但目前还处在自用阶段,要达到他用的水平,还需要付出不少的努力。生命模拟的技术挑战可见一斑。
发展挑战:尚在科研阶段。 生命模拟特别是精细神经计算技术作为一个研究领域,在国际上研究者颇多,但由于投入较多、短期难见收益,在国内研究生命模拟的学者或机构较少。智源研究院黄铁军表示,生命模拟不仅是对某项技术的研究,而是体系化的,需要硬件的支撑并搭建算力平台,模拟大规模的神经系统,智源研究院投入生命模拟技术的研究较早,目前在国内处在比较领先的位置。但黄铁军坦言,生命模拟技术尚在科研阶段,还谈不上产品与应用的落地。
从生命模拟到超级大脑
即使线虫作为结构最简单的模式生物,要实现仿真线虫都不简单,从宏观角度而言,它是通往超级大脑的一个台阶。由简单到复杂,是科研的必然过程,
如前文所述,黄铁军认为未来15-30年实现超级人脑是确定的事情,但就工程实现而言,还存在技术难度。而随着时间的推移、科技的进步,技术方面的困难都会被克服。据黄铁军分析,从线虫生命模型到超级大脑,技术的实现主要有三个步骤。
第一步是解析大脑。线虫不是大脑,所以只停留在神经系统解析,但也需要清楚神经元之间的信号加工与信号传输,挑战较大。仅观察拥有302个神经元的线虫就花费了数十年的时间,未来要研究拥有上千万甚至上百亿个神经元的人类,困难重重,没有光电仪器的进展就无法拥有观测人类的能力。但好在仪器的进步飞快,所以智源研究院有信心在未来15-30年与领域内各方研究者一起努力能做到这一点。
第二步是让生物神经网络在数字空间良好地运行。通过对神经网络的建模使其在数字空间运行,并通过训练使它具备更强大的功能,目前,这一步已经启动,但挑战在于算力,当训练数据达到成百上千万时,计算复杂度是难以估量的。
第三步是创造新的物质载体,用硬件的形式将模型呈现,而不是停留在模拟阶段。无论是自动驾驶、无人机还是其他人工智能应用,都需要用芯片的形式承载生物神经网络使其高效运行,充分利用技术成果的价值。因此,未来的生命模拟需要一个新的智能物质基础。到那时,生物大脑变成电子大脑,而电子大脑可能具备与生物大脑相同甚至更低的功耗,但性能更高。这样一来,生命模拟技术就可以在人工智能应用中发挥核心作用。
目前,研究人脑已经具备了两项利好条件,即大规模的数据和优秀的软硬件条件。一方面,得益于神经科学的快速进展,使得大脑解析和实验数据获取变得更加容易。2021年,已经有科研团队从极小的人脑解析中获取了大量数据,即使脑数据还不完整。而随着生命科学的发展,使越来越多的数据实现可用,另一方面,要想模拟每一个复杂的神经元,对硬件层面的算力要求和软件层面的算法优化需求极高。而借助越来越优秀的软硬件条件,算力才得以大幅度提升,使训练大型神经网络成为可能。

    推荐阅读