最高精度“线虫大脑”,它来了。
这颗“大脑”所模拟的是一只秀丽隐杆线虫的全生物神经系统。
(注:秀丽隐杆线虫是“最简单的生命智能体”,拥有302个神经元)
这一次,国内的学者不仅把秀丽线虫全部的神经元网络还原了出来,更是细到了它们的亚细胞级连接关系。
据了解,它的精细程度已经达到了当前已知的最高水平:
此前,一项研究对单个生物神经元的计算复杂度进行了研究,文章指出,一个深度神经网络需要 5 到 8 层互联神经元才能表征单个生物神经元的复杂度。
而通过这样的精细构建的“大脑”,已可以让这只“智能线虫”完成动态蠕动前行。
这,便是来自北京智源人工智能研究院的最新研究成果,背后的“利器”则是天演项目。
而且这只“智能线虫”——天宝(MetaWorm)1.0的诞生,不仅仅是生命模拟精度上的一次突破,根据研究团队的介绍:
这是迈出人造智能生命关键一步。
最高精度大脑,是怎么炼成的?
这次大脑选择的秀丽隐杆线虫,可以说是“拥有神经系统的最简单生物之一”——
它既具有完整的神经系统,感知逃逸觅食交配都能完成,整体结构又非常简单,成虫只有大约1000多个体细胞。
就是这只长约1mm的透明小生物,已经是科学研究界的“常客”,近20年来有三次诺贝尔奖都与它有关。
对于神经科学家们来说,秀丽隐杆线虫的神经系统已经被完整破解,实时图谱还登上了当年的Nature封面,非常适合用来研究并模拟“脑回路”。
△雌雄同体,共有302个神经细胞
更重要的是,线虫体内存在的乙酰胆碱、多巴胺等神经递质,在哺乳动物体内也同样存在。
研究它的神经系统,对于研究人类神经系统的调控机制也有重要作用。
但研究结构是一回事,用计算机建模又是另一回事了。
要知道,模拟一个生物的神经元可不是简单地像卷积那样,做个线性变换就完事,它所模拟的(如细胞间)物质交换、神经元间动作电位的产生和传导等行为非常复杂。
例如,仅仅是突触之间递质的传递,就涉及数量、速度、浓度、反流、方向等多个参数,用数学模型来计算模拟还会更加复杂。
即便模拟出了完整的神经系统,如何用计算机模拟出接近真实环境的“赛博空间”,并在其中训练“智能线虫”模型,又是另一大研究难点。
此前,虽然已经有不少团队在进行线虫仿真方面的研究,但无论是精度、还是仿真环境都与现实有一定差距,就像我们常见的仿生机器鱼远达不到鱼的精度一样。
这次,天演团队成功建模出了最高精度的智能“赛博线虫”,实现了让它在3D流体仿真环境下动态蠕动前行、并具备简单趋利避害的能力。
那么,这只“智能线虫”究竟长啥样?
首先,团队利用大量公式和模型,建模出线虫的“电子神经元”。
用到的模型主要有三种:多种离子通道模型、Hodgkin-Huxley模型和多舱室(多房室)模型(Multi-compartment Model)。
其中,多种离子通道模型顾名思义,用于模拟细胞膜上的各种离子通道,天宝 1.0模型使用了14种离子通道;
Hodgkin-Huxley模型(HH模型),能将神经元的每个部分都模拟成不同的电路元件;
△HH模型示例,图片来源于维基百科—真·生物是一台精密的电子仪器
多舱室模型,将神经元视为一个系统,按动力学特点分为若干个舱室,每个舱室所包含的离子通道数目也各不相同。
△图片来源于江小芳, 刘深泉, 张煦晨著论文《中等多棘神经元的多房室模型分析》
这三种模型组合起来,就能将神经元的构造、神经元细胞膜上动作电位和梯度电位的形成与传导、以及物质在各机体部分间传导的速率模拟出来。
施工完成后的这只“智能线虫”,精细建模了秀丽隐杆线虫(雌雄同体)的302个神经元、以及这些神经元之间的数千个连接,使用了14种离子通道,细节达到了亚细胞级别。
线虫的302个神经元分为感官神经元、中间神经元和运动神经元等,在这其中,团队又针对106个感知和运动神经元进行了高精度建模,高度拟合了它们的电生理动力学。
统计下来,单个神经元最多舱室(compartment)数2313个,最少10个。302个神经元平均每个52个舱室。神经元之间的突触连接精细到神经突(树突、轴突)的水平:
然后,团队构造了一个3D流体动态仿真环境,让线虫在接近真实的场景下 运动起来。
注意,模拟环境这一步尤为重要,它是研究线虫如何自适应微观环境运动方式的关键步骤。
线虫建模精细到亚细胞(微米级别)后,物理定律的尺度都缩小了,摩擦力与粘滞力的作用要比重力大上几个数量级。
在这种情况下,线虫还能自如地吃饭喝水供能,与其和环境交互的巧妙方式密不可分。
因此,天演团队结合计算神经学、运动力学、图形学等多学科交叉,为智能线虫“天宝”构造了逼真的线虫肌肉和身体软体模型,建立了更适合人工智能体训练的流体仿真环境。
具体来说,这个环境框架由包含三维建模、有限元求解、简化流体模型、强化学习、可视化等多个模块,能最大程度上模拟线虫与环境的交互方式。
相比目前国际领先的OpenWorm线虫仿真项目,天演团队的流体仿真环境规模更大,也更适合作为生命体的多体/群体智能行为仿真环境、完成智各种能体学习训练复杂任务等。
最后,团队将线虫模型放到仿真环境中,完成了初步训练。
这些都是未来天演平台的组成部分。具体来说,这是一个还在建造中的多GPU集群平台,可用于高精度、大规模生物神经元的模拟。
在场景尺度超过1300个线虫身长的仿真环境下,团队现在已经初步训练出了能够根据环境化学信号分布自主行动的“智能线虫”,而这一场景也能支持更大空间和多线虫群体仿真。
据团队表示,“智能线虫”模型能够高效、精准地计算与流体环境相互作用的规律,在相同计算资源下,单线虫单次仿真时间小于0.1秒。
下一阶段,天演团队计划让这只“赛博线虫”实现避障、觅食等更复杂的智能任务。
事实上,类脑智能研究一直是个全球性课题。
国际上,包括欧盟脑计划支持的Blue Brain项目、美国脑计划等都在进行类脑研究;科技巨头如谷歌,近5年一直在发布脑图谱、脑工具;高校研究机构如MIT,用19个线虫模拟神经元实现了自动驾驶控制……
然而,单从类脑研究来看,各团队的研究方向却有很大不同,甚至有相当一部分团队藉由先设计芯片、再设计算法的方式来实现类脑计算。
但这样的研究,反而会被芯片等硬件约束了算法的设计与实现,最终与实现类脑智能的目标相距甚远。
相较之,天演团队选择从实现AI的角度,去研究并实现类脑智能。
但即便如此,费尽心力建模一个线虫大脑,真的有意义吗?
线虫“大脑”,有什么用?
若是用一句话来概括这个问题,那便是:
这是迈出人造智能生命的关键一步。
自人工智能诞生以来,把“机器打造得像人一样”,便成为了研究人员一直努力研发的方向。
然而随着时间的推移,哪怕到了现今以深度学习为主的发展阶段,人工智能还是没有达到真正意义上的智能程度。
即便是像2016年AlphaGo轰动世界的那场围棋比赛,也只是刷新了人们对于人工智能的认知。
但也正如CMU教授Hans Moravec所述:
要让电脑像成年人一样下棋是相对容易的;但是要让电脑拥有一岁小孩水平的感知和行动能力,却是相当困难,甚至是不可能的。
那么,问题到底出在了哪里?
在2016年的时候,智源研究院院长黄铁军就给出过答案。
他认为,深度学习本质上依赖于人工神经网络,而生物的智能所依靠的是生物神经网络。
其中,人工神经网络更接近于“实现功能”,而生物神经网络模拟的则是“实现功能的结构”,二者在“体量”上便不是一个级别的,后者明显要庞大得多,也更重要——
因为结构决定功能,而生物神经网络才是智能的载体。
因此,黄铁军基于这种情况下所提出的“解法”是:
从脑机理模拟的角度出发。
简单来说,就是要去探索生脑大脑内部的“运作模式”,这才是通向通用人工智能的途径之一。
无独有偶,在更早的2009年,瑞士洛桑联邦理工学院的Henry Markram教授也提出过类似的观点。
当时他宣布了一个计划——将在理解大脑结构的基础之上,用超级计算机建立大脑模型。
这项计划后来得到了欧盟的大力支持和关注,因为这种方式的意义不仅仅是理解人类大脑智能的本身,甚至还可能为脑疾病找到别样的治疗方法。
但问题也接踵而至,要想模拟人类整个大脑神经网络,靠计算机是相当困难的。
这不仅仅是因为计算模拟的复杂度,更是因为生物大脑本身的复杂度。
毕竟人类大脑的含有神经元数量高达1011,其所需的计算量和成本可见一斑。
而人类实际上通过大脑去做推理、创作等一系列行为时,所消耗的功耗仅为20-25瓦。
也就是说生物大脑具备了“高智能”、“低功耗”的特性。
这也就是为什么说研究生物大脑,是通向通用人工智能最佳蓝本的原因所在 了。
而且这种信号也已经开始浮现。
例如2021年发表于顶刊NEURON上的Single Cortical Neurons as Deep Artificial Neural Networks研究表明——
一个深度神经网络需要5到8层互联神经元才能表征单个生物神经元的复杂度。
这也就证明了单个神经元所具备的计算力之强,所以若是能够对单个神经元做非常精细化的刻画,便可更加逼近生物处理信息的复杂过程。
但更精细化地模拟生物大脑的意义还远不止于此。
目前人类在大脑方面仍然存在许多较为棘手的疾病,例如阿尔兹海默症、抑郁症和脑损伤等。
研究各种脑疾病的过程更是消耗巨大人力和物力的过程,若是能够精细地模拟具备生物性质的大脑,那么或许会在解决方案上提供另一种可能性。
……
总而言之,更好地模拟和认识大脑,是在认识大脑本身的同时,也是在重视人类自己。
来自图灵奖得主都参与的大会
回归到此次最高精度模拟的“智能虫”,它的亮相,正是在2022北京智源大会。
在这场大会上,包括学术界、产业界的各个AI大牛,都会介绍自己最前沿、最关键的AI研究成果。
而除了“智能线虫”之外,这场峰会还发布了其它多项重要研究成果。
例如九鼎智算平台。
它的算力高达1000P(在建中),剑指计算新范式,包括通用智能大模型、AI for science等趋势性科研方向。
据了解,九鼎智算平台有别于目前已有的商业云计算。
首先在任务方面,现有的公有云主要是以高并发的推理任务为主;但九鼎智算平台则是面向大模型训练为代表的大规模混合计算任务。
其次在结构方面,九鼎智算平台在现有的处理器和加速器的异构计算云平台资源上,需要构造一套能融合以深度学习为代表的AI和高性能计算任务的云平台架构。
最后在适配方面,平台需要支持多家厂商的异构AI加速芯片,九鼎团队希望探索自动适配的新方法,让自动每一款异构计算芯片能发挥其最佳运算能力,提高平台的整体效率。
不难看出,AI大模型和AI forScience,是九鼎智算平台的“主旋律”了。
而除了技术和平台的发布之外,在“把技术用起来”这事上,智源研究院也公布了最新进展。
也就是此前推出的悟道大模型。
例如悟道GLM模型已经在美团App上使用,约7亿用户享受到了它的能力。
据了解,在智能客服方面带来了11%的效能提升,搜索广告收入提升约2.7%。
悟道CogView文图生成模型则是把“生成图片”效果的逼真度拉上了一个新台阶。
现在通过这个模型生成动物的图片,其质量已经堪比摄影照片,这将具备非常大的商业潜在价值。
悟道CogVideo模型,则已经可以实现“一句话生成视频”。例如只要说:
让绿巨人在屏幕上咆哮、蜘蛛侠在空中吐丝、蒙娜丽莎对你嫣然微笑、梵高的星空璀璨律动……
那么与之对应的视频画面,分分钟内便可以打造出来了:
但除了项目和成果的发布之外,与会嘉宾也是此次北京智源大会的一大亮点。
今年不仅请来了图灵奖得主Adi Shamir,Karl Friston、Cynthia Dwork等多位世界级科学家。
还有全球顶级AI实验室的科研代表,例如DeepMind首席AI科学家Richard Sutton、OpenAI研究团队负责人Meta AI 西雅图负责人等。
他们会在此次大会中,针对机器学习、多模态、大模型、AI开源等研究方向做最新进展报告。
目前,大会依旧处于“进行时”,感兴趣的朋友可以戳下方链接进行参与。