ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
非侵入设备贴在脖子上,就能代替人类发声,研究登《自然通讯》
7953点击    2024-03-31 14:00
研究人员开发了一种由 AI 驱动的发声贴片,可以非侵入性地粘附在喉部帮助发声。


在你看不到的地方,说话这件小事对于许多人来说「难于登天」:2014 年美国一项针对发声障碍的研究发现,近 1800 万成年人在使用声道说话时存在困难,而该群体中超过一半的人经历过言语衰弱问题的时间超过 10 年。


现在,一种新型非侵入式可穿戴设备成为了这一医疗需求新的解决方法。该技术包括粘附在脖子上的轻质贴片,该贴片可以测量人的颈部运动。接着,设备处理器将这些信号转换为语音,然后播放语音音频来代替人类发声。



这项研究由来自加州大学洛杉矶分校(UCLA)生物医学工程助理教授 Jun Chen 领导的研究小组完成。相关研究登上《自然通讯》。



论文地址:https://www.nature.com/articles/s41467-024-45915-7


该团队创造了一种灵活的电磁响应可穿戴设备,可以测量细微的颈部肌肉运动。然后,下游设备(不是传感贴片)使用经过训练的可识别一组短语词典的机器学习算法,将贴片感应到的肌肉运动解码为语音。


这项技术可以造福那些受伤或患有声带麻痹疾病的人,以及那些做过喉切除术的人。


不过,该设备可以播放的句子数量有限,目前的原型 AI 模型仅能从五个句子中做出选择:嗨,你今天过得怎么样?;希望你的实验进展顺利!;圣诞节快乐!; 我爱你!; 我不相信你。此外,该模型根据没有任何言语障碍的人的颈部运动进行了训练和测试。


无声的医疗技术


医疗设备公司 Atos Medical 的临床教育家 Barbara Messing 博士表示,「为患者提供更多选择有助于提高他们的生活质量,这就是我们所有人都想要的。」


为了让用户听得见声音,该设备将感应到的肌肉运动信号传递给在外部处理器上运行的机器学习模型。该模型经过训练,可以检测与固定数量的预定义句子相对应的肌肉运动模式。当它检测到这些短语之一时,处理器就会通过像扬声器一样的振动贴片来播放该句子。



研究人员开发了一种由人工智能驱动的发声贴片,可以非侵入性地粘附在喉部。然后,磁感应线圈和其中的柔性磁性材料就可以推断皮肤下颈部和喉咙的运动。


这个系统的喉部贴片应用了 Jun Chen 教授小组的关于新材料科学的研究成果,他们利用了材料当中一种称为磁弹性的特性。在这种特性下,材料在被拉伸和压缩时,其磁场强度会发生变化。日常活动和颈部运动会拉伸贴片,导致磁场发生变化,然后由内置的柔性感应线圈进行测量。这些材料协同工作,感知用户颈部肌肉的微小 3D 运动。


新型磁弹性材料的灵活性使其能够粘附并准确跟踪用户颈部肌肉的运动,这是先前已知的由磁弹性材料制成的类似传感器无法做到的。为了进一步提高其灵敏度,该小组将材料塑造成剪纸图案(一种类似于折纸的纸工艺,允许切割),使传感器在较小的拉伸和偏转下表现均匀。


Jun Chen 教授表示,未来他们致力于将其研究成果转化为医疗设备,不断的优化设备并标准化批量生产的制造程序,改进软件和硬件,增加翻译词汇量和准确性,让设备更加人性化。Jun Chen 教授估计,他们将在 3-5 年内生产出一种可行的医疗设备。


原文链接:https://spectrum.ieee.org/assistive-tech-voice-patch


文章来自微信公众号“机器之心”,作者:机器之心


关键词: AI驱动 , AI发声 , AI医疗 , AI生物