「让人们看见以前看不到的东西,红外线,紫外线,无线电……我认为换一种说法就是,我们想给人类超能力。」
在7月10日的一场直播中,马斯克表示脑机接口的最终目标不仅是修复残障人士丧失的头脑功能,还要赋予人类超能力。
2016年,Arbaugh颈部以下瘫痪。1月,他成为第一个通过手术植入马斯克创立的Neuralink公司制造的芯片的人。
从那时起,阿博就开始用意念操作手机和电脑,上网、玩文明(一款游戏)、下棋。
Neuralink并不是唯一一家利用脑机接口 (BCI) 将人类思维与机器融合在一起的公司,通过一系列试验,越来越多因脊髓损伤、中风或运动疾病而瘫痪的人正在恢复失去的能力。
加利福尼亚州斯坦福大学的神经外科医生Jaimie Henderson表示,手术地成功让许多研究人员都感到惊讶。「这是一段令人难以置信的新旅程。」
但新科技会将我们带向何方还有待观察。马斯克最近考虑制造一种仿生植入物,让人类能够与超级人工智能竞争。
「未来,你可以操纵人类的感知、记忆、行为和身份,」纽约哥伦比亚大学的Rafael Yuste说。
人机融合的植入技术听起来固然强大而诱人,但也将面临诸多挑战。
脑机接口
脑机接口的工作原理是首先使用金属盘、电线或电极检测来自神经元的电信号,这些设备要么插入大脑、颅骨下方,要么放置在头皮上。
然后,这些信息被发送到计算机进行处理并翻译成命令。例如,让人能够输入句子或控制机器人设备。
几十年来,科学家一直以这种方式从大脑中获取数据。1998年,研究人员将第一个由两个电极组成的侵入式脑机接口植入到一位名叫Johnny Ray的建筑工人的大脑中,他在中风后几乎完全瘫痪。
Ray学会了如何通过想象用手移动光标、控制键盘上的字母,来调整发送给植入物的信号,从而能够缓慢地拼写单词。
但这种早期脑机接口的功能和可靠性都很差,通常这些设备需要经过数周或数月的调试才能使用。
即便如此,这种设备也只允许人们每分钟选择几个字符,并且很容易出错。
其中一个要解决的问题就是,仅由几个电极制成的设备,根本无法收集足够的数据。
人脑中有数十亿个错综复杂连接的神经元,研究已经表明,是神经元组(而不是单个细胞)的活动模式决定了我们的思想、行动和感知。
为了能够解码数以亿计的神经元模式,BCI 研究人员希望测试和部署能够同时拾取许多神经元信号的技术。
为了实现这一目标,他们开始致力于采用由犹他大学Richard Normann发明的一项技术,通过刺激大脑视觉皮层来恢复视力。
Normann的4毫米见方的芯片被称为「犹他阵列」(Utah array),上面布满了大约100个可以穿透大脑外层的微电极。
该阵列经过重新设计,可以跟踪单个神经元的放电,每个阵列可以同时记录大约100个神经元的数据。
罗德岛州布朗大学的Carlos Vargas-Irwin说,「这使我们能够观察神经元群并看到真正丰富的信号。」
从2000年还是一名大学生时,他就开始研究Utah Arrays。这些神经元群的集体输出代表大脑的语言,指导诸如伸手、书写、行走、说话、微笑和思考等功能。
与瘫痪患者设备最相关的信号位于运动皮层,这是一条像头带一样缠绕在大脑顶部的组织,负责计划和执行运动。
它大致的分布与身体部位组织对应。比如,在它的面部区域,有控制面部肌肉的神经元,在腿部区域,有操作腿部的神经元,等等。
BCI 研究人员经常将电极放置在手部区域,因为人们往往会发现很容易想象移动双手来做有用的事情,例如打字,或操作操纵杆、机械臂。
2004年,BCI 联盟BrainGate的研究人员报告称,可以将Utah阵列植入瘫痪患者体内。
人们纷纷自愿接受脑部手术,推动了这一领域的发展。
一名因刀伤而上下半身瘫痪的男子用意念引导光标,打开模拟电子邮件、操作电视,以及打开和关闭假手。
两个中风后瘫痪的人通过「心灵感应」操纵机械臂来够到并抓取物体;其中一个人喝了一瓶咖啡。
一名因肌萎缩侧索硬化症(一种神经退行性的瘫痪疾病)而导致肌肉无力的女性将光标指向屏幕上的最多八个目标。
「每次我们进行此类手术并与参与者合作时,都会学到很多东西,」Henderson说,他是BrainGate的成员,也是Neuralink的顾问,拥有Neuralink的股权。
Yuste表示,在过去的几年里,将大脑活动转化为运动甚至语音的设备能力水平突飞猛进。
借助越来越强大的算法,研究人员可以从神经元组中破译日益复杂的活动模式的含义。
据报道,Dennis DeGray于2021年创下了用Utah Arrays实现的虚拟打字速度新纪录——每分钟90个字符。
DeGray通过想象自己在便笺簿上书写来打字,他的大脑为此发出了所需的精细、多关节运动的信号。
然后,人工智能工具对这个想象的笔迹的神经信号进行解码,并将其映射到单个字母。
同样,在未发表的工作中,Vargas-Irwin和他的同事表示,他们已经找出了数十种手势以及同时涉及双手的单个手指运动的大脑「代码」。
在Vargas-Irwin于2022年发表的研究中,一名颈部以下瘫痪的男子植入了两个Utah Array,通过想象移动任意一只手上的特定手指来弹奏一架有10个琴键的钢琴。
Vargas-Irwin说,虽然他目前还不能演奏较为复杂的曲谱,「但这已经证明了他们可以独立控制每个手指。」
最令人震惊的发展之一是脑机接口的出现,它可以使瘫痪的肢体重新行动。
去年,洛桑瑞士联邦理工学院的Grégoire Courtine和他的团队报告称,他们发现了一种侵入性较小的「皮质电图描记」(ECOG)阵列。
该阵列位于运动皮层腿部区域上方的头骨下方,不穿透脑组织,并与人工智能一起进行阅读大脑中的信号并将其转发到脊髓中的刺激器。
这使得双腿瘫痪的Gert-Jan Oskam能够站立和行走,甚至可以走楼梯和不平坦的地形。「我们建立了一座将想法转化为行动的数字桥梁,」Courtine说。
此外,人工智能识别的活动模式正在挑战我们对大脑的理解。
在更基础的层面上,脑机接口研究表明,运动皮层细胞群的管辖范围超出了单个身体部位,扩展到多个关节和多个身体部位。
研究发现,尽管DeGray的阵列被放置在运动皮层的「手部区域」,但它也可以拾取产生语音所需的运动模式。
Henderson说,「我们让他说话,令我们大吃一惊的是,我们认为大脑中一个专门负责手功能的区域出现了非常强烈的音节信号。」
这一发现和其他发现使人们对负责协调行动的大脑区域有了更细致的了解。运动皮层神经元不像心脏病专家那样专注于身体的某个部位,而似乎更像是具有亚专业的全科医生。
「即使在一小块运动皮层中,你也可以获得一些有关整个身体正在做什么的信息——比如手臂、腿、脸、舌头。所有这些信息都有回声,」Vargas-Irwin说。这表明运动皮层是根据复杂的概念(例如动作)而不是身体部位来组织的。
解码思想
据报道,去年,一位名叫Ann Johnson的妇女在中风后丧失了说话能力,她利用脑皮层成像库列在Johnson附近的电脑上操作一个化身以每分钟78个单词的速度替她发生。
该化身的人工智能声音是根据Johnson中风前的声音录音训练而成的,并能做出棚栩如生的嘴部动作。
每当Johnson尝试做出与这些情绪相关的面部表情时,它还能根据阵列的读数显示出快乐、悲伤或惊讶等面部表情。加州大学旧金山分校的神经外科医生Edward Chang领导了这项研究。
Henderson的团队等人正试图解码将这种虚无缥缈的交流,以此了解思想是如何变成交流语言的。
Henderson说,「我们可以开始了解概念信息是如何在整个大脑中表现出来的。有朝一日,这种理解可能会带来一些设备,让中风后有想法却无法用语言表达的人恢复语言能力。这也更接近于真正读懂一个人的思想。」
工程方面的挑战仍然困扰着这一领域。像Utah和Neuralink阵列这样的脑嵌入式设备可以更精确地捕捉大脑活动,但随着时间的推移,信号质量可能会下降。
与此同时,一些BCI装置涉及的电线从端口处伸出,存在持续感染的风险,而且大多数装置最终都必须拆除或更换。
撒开这些麻烦不谈,要真正实现马斯克设想的人脑与机器的融合,将需要一个双向信息流,既能从「大脑的各个方面」读取信息,也能向「大脑的各个方面」写入信息。
这方面已经取得了逐步进展。2021年,一项研究报告称,一名脊髓损伤的男子在电极刺激其大脑感觉区域的同时,用意念指挥机器人拾取物品并将其放置在平台上。
伦敦帝国理工学院的Juan Alvaro Gallego说,但这与植入记忆等技能的视觉效果还有很大距离。「记住小时候早餐吃的松饼的口感与感觉到有人在揉搓你的大拇指是不同的。」我们不知道如何将记忆或知识写入大脑。
此外,实验性 BCI无法在不同的活动之间快速切换,而这些活动占据了大多数人的日常生活,例如一会儿打字,一会儿和朋友聊天,一会儿又去厨房吃零食。
Gallego表示,「我们无法建立一个模型,在日常生活的所有这些活动中都能发挥作用。」
通用植入体
为了朝这个方向迈出第一步,他和他的同事们已经找到了一种方法,可以让单个任务的编程变得更容易。
目前,BCI是为每个参与者个性化设计的,但Gallego的团队创造出了一种通用解码器,至少在猴子和小鼠的不同大脑中都能工作。
它是通过追踪神经元群中出现的跨物种共享模式来实现这一点的。例如,「你可以在动物1中建立一个模型,预测动物1是如何移动它的手的,并将其用于动物 2。」
如果这种算法也能在不同的人脑中发挥作用,那么它就能为更多功能的BCI铺平道路。
诸如此类的进步不断缩小我们的精神世界与产生这些世界的神经活动之间的鸿沟。
Neuralink与Synchron和Blackrock Neurotech(生产Utah Arrays)等类似公司一样,经常被视为实现这一目标的合作伙伴。
但是,真正实现人机融合的目标仍道阻且长,完全通用植入体也暂未出现清晰的实现方法。
参考资料:
https://www.newscientist.com/article/mg26335023-100-will-implants-that-meld-minds-with-machines-enhance-human-abilities/
文章来自于微信公众号“新智元” 作者耳朵 乔杨
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales