# 热门搜索 #
搜索
嗅觉数字化!AI还原记忆中的味道
7378点击    2024-04-17 11:18


人类嗅觉的数字化,它来了!


当今的计算机算法,尤其是AI技术,几乎已经把人类的视觉和听觉完全虚拟化了。


文字和语音的相互转换、文生图和视频的效果已经出神入化、难辨真假。


但同为人类最古老的感官之一,嗅觉却似乎没有相应的进展。



——别急,在这么卷的时代,科研人员不会遗漏任何东西。下面将要出场的Osmo,已经开始应用相关的研究,并朝着商业化方向努力。



Osmo推出的气味传送技术,可以在世界的任何地方捕捉气味,并在另一个地方释放出来。


作为一种新的沟通方式,有朝一日,这将赋予数字世界新的感知,——在新的时代,计算机将能够产生气味,就像我们今天生成图像和声音一样。


传送气味


这项技术能给我们带来什么?想象一下:


你可以在世界任何地方,闻到生长在你家附近的百合花;


参观完西斯廷教堂,将亲人送回家,还能闻到教堂里旧油漆和石膏的气味;


看一部关于大海和水手的电影时,可以在剧院闻到海水的咸味。



——这些听起来像是遥远的东西,但已经在Osmo的实验室中成为技术现实。


对此,有网友表示,“这正是我梦寐以求的”。



甚至有网友也在进行类似的工作:通过传感器捕捉气味数据、向量化后用于RAG,希望能够增强LLM的感知。



当然也有较为煞风景的网友:既然什么气味都能传,那我放个屁岂不是......



如何实现?


我们今天所知道的数字世界,大部分都是教计算机如何看和听的结果。


而传送气味的原理也类似,——使用环保分子记录、分析和再现气味,这项技术被命名为Scent Teleportation。


Scent Teleportation首先利用传感器采集薰衣草田的气味,然后处理器识别所有正在工作的分子,最后使用特殊的打印机找到正确的气味组合来重现它。


——之后,你就可以在纽约的一个实验室,闻到来自加利福尼亚的花香。


Scent Teleportation使用一种称为气相色谱质谱仪(GC/MS)的分子传感器,识别气味中工作的分子,并使用AI模型和气味图谱生成可用于传送的配方。最后,使用一个冰箱大小的打印机来还原气味。



以上的技术流程,以多篇谷歌Brain等机构的研究为基础,比如下面这篇:



而Osmo的创始人兼首席执行官Alex Wiltschko,就是这些搞科研的大佬之一。



Alex Wiltschko毕业于哈佛大学,获得了神经科学博士学位,导师为Sandeep R Datta教授。


Alex Wiltschko的研究方向为嗅觉神经科学,并开发了下一代高通量行为表型技术,该技术已在数十家顶级实验室和制药公司中使用。



2017年,Alex加入Google Research,从事机器学习和生物学的交叉领域工作。


2022年,他创立了Osmo,同时,作为GV的常驻企业家,他还加入了生命科学团队,专注于推进数字嗅觉领域。


Alex Wiltschko曾多次创业,他职业生涯的大部分时间都在探索人工智能的新领域。


在加入谷歌之前,Alex与他人共同创立了Syllable Life Sciences(后被Neumora收购),该公司使用人工智能和计算机视觉来破译肢体语言,以加速临床前开发并构建更好的疾病治疗方法。


Alex还是Whetlab(被Twitter收购)的联合创始人,早期还自己负责coding。



作为业内的大佬,Alex Wiltschko也发表了许多具有影响力的文章。



感官地图


如何测量气味?气味是由在空气中飘荡、进入我们的鼻子并与感觉受体结合的分子产生的。潜在的数十亿个分子可以产生气味,因此很难确定哪些分子会产生哪些气味。


感官地图(Sensory map)可以帮助我们解决这个问题。


不过嗅觉是一个更难破解的问题:分子的变化方式比光子多得多;数据收集需要物理上接近(没有类似的摄像头);相比之下,人眼只有三个颜色感觉感受器,而人的鼻子超过有300个气味感受器。


2019年,Alex Wiltschko参与的谷歌团队开发了一个图神经网络(GNN)模型,用于探索数千个不同分子的例子,每个例子与它们唤起的气味标签配对,例如“牛肉”、“花香”或“薄荷”,以了解分子结构之间的关系,以及此类分子具有每个气味标签的概率。


模型的嵌入空间包含每个分子的表示,作为固定长度的向量,根据气味描述分子,就像根据RGB值描述颜色一样。



传送气味是第一步,Osmo的下一个目标是传送各种气味的组合,比如苹果和薰衣草的混合。


随着未来技术的进步,嗅觉的数字化终将走出实验室,成为我们日常生活的一部分。



当然了,应用于全新领域的AI模型也需要全新的数据集,包括传感器和打印机的改进,都是有趣的技术。



Osmo在去年拿到了850万美元的投资,来自比尔及梅琳达·盖茨基金会(Bill & Melinda Gates Foundation),另外Alex Wiltschko的老东家Jeff Dean也是公司的投资人之一。



将气味数字化意味着重构数字世界的感官,同时将更广泛的真实气味带入物理领域。这让我们对气味世界有了新的掌握,与我们最古老、最能引起情感共鸣的感官建立新的联系。


未来,将有数以百万计的人捕捉和分享气味,或者重新混合来创造自己的气味。这种创作也会成为一种新的公共艺术形式,香水行业或将为之颤抖。


本文来自微信公众号“新智元”











AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI