ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
华人团队用大模型实现“读心术”:大脑活动直接变文字 | NeurIPS 2023
5364点击    2023-12-18 15:13

NeurIPS收录的一项新研究,让大模型也学会“读心术”了!


通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。


而且整个过程不需要大型设备,只要一块特制的“头巾”就能实现。



这项成果名为DeWave,能在不通过侵入式设备和MRI的情况下解读脑电波并翻译成文本。


由于用了大模型来读脑,因此报道DeWave的iFLScience也管它叫BrainGPT。



DeWave虽然不是最早实现脑电波解码的技术,但是它第一个做到了非侵入且无需MRI的脑电波-文本转换。


如果能够规模化运用,DeWave将为脑部瘫痪的人群提供交流上的帮助。


那么,DeWave的表现到底怎么样呢?


测评成绩超SOTA


由于DeWave采用非侵入式方法,信号中的噪声更强,解析难度更高,但相比于此前的SOTA方法,DeWave的测试成绩还是有所提高。


研究团队采用了公开的ZuCo数据集,其中包含了一万多个不重复的句子;受试者进行自然阅读的同时,研究团队对他们的脑信号和正在阅读的文本进行记录。脑电波信号采样频率为500Hz,包含128个信道。


如果输入的EEG信息已经按照眼动追踪方式的特征切分好,那么DeWave大概可以准确解读出句子的三分之一;即使不切分也能够成功捕捉一部分的关键词。


研究结果还显示,DeWave对单词的解析准确率高于整句,对动词的准确率高于名词。



数据方面,研究团队一共让DeWave对29名受试者的脑电图进行了采集和解析。


结果显示,有切分时,DeWave在BLUE-N数据集上成绩比传统方法高出了3-18%,在ROUGE-1数据集上也有最高6.35%的提升。


如果不做切分,DeWave与相同条件的传统方法相比,表现最多提升了120%。



为了评估DeWave的鲁棒性,团队对其进行了跨受试者(Cross-subject)测试。


这轮测试一共有18名受试者,其中一人的脑电波相信被用于训练。


然后,研究团队观察了模型在其他17人上进行测试时的表现,与被用于训练的人差距越小,说明模型的鲁棒性越强。


结果显示,DeWave的分数下降值低于传统模型,显示出了更强的鲁棒性和泛化能力。



那么,DeWave是如何实现脑电波解码的呢?


用大模型解读脑电波


DeWave的核心是引入了名为“离散码本”的概念。


通过向量化编码器,连续的脑电图信号被拆分为离散形式,分别与词汇进行对齐。


之后,研究团队将离散化的数据送入Transformer编码器,得到上下文语义融合的向量表示。



将向量化的文本信息作为监督数据,用得到的向量化信号对BART大模型进行训练,就得到了DeWave。


新的信号解析过程也与之相似——先进行离散化和向量化编码,然后用BART对其进行解读,就得到了文本信息。



同时,为了增强可解码性研究团队还通过正负样本对编码进行调节,使DeWave解析出的语义更接近目标文本词向量。


作者简介


DeWave团队一共有五名成员,全都是华人。


第一作者是悉尼科技大学的Yiqun Duan,来自H(Human-centric)AI研究中心,研究方向是机器智能和脑机接口。


除了DeWave,Duan此前还有一项基于扩散模型的“反向成果”——把文字转换成脑电波的工具BrainDiffusion。



该研究中心主任Chin-Teng Lin教授是本文的通讯作者。


同实验室的Jinzhao Zhou和Yu-Kai Wang,以及悉尼大学的Zhen Wang也参与了此项目。


论文地址:


https://arxiv.org/abs/2309.14030v2


参考链接:


https://www.iflscience.com/new-mind-reading-braingpt-turns-thoughts-into-text-on-screen-72054


文章来自于微信公众号“量子位”(ID: QbitAI),作者 “克雷西”
关键词: 大模型 , DeWave , BrainGPT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI