ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
爆火神经网络架构KAN更新2.0!研究者可专属定制,轻松应对经典物理学研究,作者:和MLP不能互相取代
7769点击    2024-08-21 14:02

爆火神经网络架构KAN,上新了!


KAN2.0


此次与科学问题更深入地融合,可以轻松解出经典物理学研究。


比如发现拉格朗日量(用来描述整个物理系统动力状态的函数)



除此之外,研究者还可以量身定制属于自己的KAN2.0,将专业知识作为辅助变量添加到输入当中去。


此前,KAN横空出世,一夜引爆科技圈。它以200万参数模型架构,直接复现DeepMind用30万参数的MLPs发现数学定理的研究。要知道,后者可是登上Nature封面的研究。


由于KAN性能太好,一度引来关于「能否替代掉Transformer的MLP层」的探讨,大家直呼:Yes We KAN!


MIT博士生刘子鸣再次为论文一作。



业内学者们,纷纷赶来祝贺。




KAN2.0将AI与科学统一起来


AI+科学的一大挑战在于他们之间固有的不兼容性:当前AI主要基于连接主义,科学则依赖于符号主义。


此次新框架KAN2.0就主打将KANs同科学无缝协同,这种协同作用是双向的:科学到 KAN(将科学知识融入 KAN)KAN到科学(从KAN中提取科学见解)



更具体来说,KAN2.0对科学发现主要有三个方面的作用,从简单粗略到逐渐精细复杂:


识别重要特征揭示模块结构发现符号公式


在原始KAN基础上主要引入了这三个新功能。


1、MultKAN:带有乘法节点的 KAN



2、kanpiler:将符号公式编译成 KAN的编译器



3、树转化器,将 KAN2.0架构(或任何神经网络)转换为树状图



跟上一版本相比,KAN2.0的解释性更通用,比如像化学、生物学等这种很难用符号方程表示的,模块化结构和关键特征能够来描述。


比如,用户可以将模块化结构构建到KAN2.0中。



再通过KAN2.0同MLP神经元交换,就可以直接看到模块化结构。



此外,团队探究了如何将先验知识融入KAN2.0。



基于这些更新,团队展示了KAN2.0发现各种经典物理定律的能力。


比如发现二维谐振子的守恒量。



利用MLP和KAN2.0重新发现史瓦西黑洞的隐藏对称性。



还有像通过与KAN2.0交互,发现构造定律。



接下来,团队有两个方向:一是将该框架应用于更大规模的问题;二是将其扩展到物理学以外的其他科学学科。


MIT华人一作


此次研究来自MIT、加州理工学院、MIT CSAIL等机构的五位研究者,共有三位华人。



相比于KAN初始版本,还有不少原班人马,其中MIT刘子鸣依然为一作。



刘子鸣目前是MIT四年级博士生,Max Tegmark是他的导师,其研究兴趣在于人工智能与物理学的交叉领域,具体像AI科学家、物理学启发的深度学习、深度学习科学、机械可解释性等。



由于KAN受到广泛的关注,作为核心作者,他在GitHub页面上特意注明,在设计KAN并编写代码的时候,考虑的是数学和物理示例(规模相当小!)因此没有考虑到效率而可重用性方面的优化。


对于专注机器学习的用户,他坦言,KAN可能还不是个可以开箱即用的简单插件(目前还不是)。


KAN和MLP不能互相取代,他们在某些情况下各有优势,在其他情况下也有局限性。



好了,感兴趣的小伙伴,可戳下方链接了解更多~


文章来源于“量子位”,作者“白交











关键词: 神经网络 , KAN , KAN2.0 , AI框架 , AI物理