AI技术研报-这里有最前沿的人工智能技术解读

Chai Discovery：OpenAI 投资的 AI4Sci 公司，AlphaFold 最快追赶者

AlphaFold 3 获得诺贝尔奖是 AI 智能重要的里程碑，让我们有信心类似 AlphaFold 的模型能为接下来十年的科学和生物结构发现起到关键作用。

来自主题: AI技术研报

11144 点击 2025-02-21 14:56

机器人视觉控制新范式！ByteDance Research新算法实现通过性能SOTA

世界模型（World Model）作为近年来机器学习和强化学习的研究热点，通过建立智能体对其所处环境的一种内部表征和模拟，能够加强智能体对于世界的理解，进而更好地进行规划和决策。

来自主题: AI技术研报

8622 点击 2025-02-21 14:28

世界首个「AI CUDA工程师」诞生！AI自己写代码优化CUDA内核，性能狂飙100倍

Transformer论文八位作者之一Llion Jones创立的Sakana AI发布重磅成果——全球首个「AI CUDA工程师」！它能将PyTorch代码自动转换为高度优化的CUDA内核，速度比PyTorch原生实现快10-100倍。

来自主题: AI技术研报

8546 点击 2025-02-21 10:24

Cell：AI虚拟细胞，生命科学的“终极沙盘”？

AI虚拟细胞，在计算机中代谢的生命体。2024年12月，斯坦福大学、基因泰克制药公司和陈-扎克伯格基金会的研究团队在《Cell》杂志上发表论文[1]，呼吁全球科学界利用AI技术制造这一“数据细胞”。听起来像是科幻电影里的情节，但它正在悄然发生，并即将改变生物医学界的未来。

来自主题: AI技术研报

13043 点击 2025-02-21 10:10

重磅发现！DeepSeek R1方法成功迁移到视觉领域，多模态AI迎来新突破！

嘿，各位开发小伙伴，今天要给大家安利一个全新的开源项目 ——VLM-R1！它将 DeepSeek 的 R1 方法从纯文本领域成功迁移到了视觉语言领域，这意味着打开了对于多模态领域的想象空间！

来自主题: AI技术研报

7954 点击 2025-02-21 09:54

「开源类脑芯片」二代发布！支持反向传播突触学习规则和并行神经元计算

在今年1月《Journal of Supercomputing》上开源的「开源类脑芯片」二代（Polaris 23）完整版本源代码，基于RISC-V架构，支持脉冲神经网络（SNN）和反向传播STDP。该芯片通过并行架构显著提升神经元和突触处理能力，带宽和能效大幅提升，MNIST数据集准确率达91%。

来自主题: AI技术研报

9577 点击 2025-02-21 09:35

10年科学谜团，被谷歌“AI科学家”2天解决了

AI协作科学家在测试中提供了新颖的见解。

来自主题: AI技术研报

7264 点击 2025-02-21 09:04

剧本自动生成3D动画！北航中大等提出新方法，破解多人交互难题 | ICLR 2025

设定一个3D场景，你便可以用文字编织你的剧情。一句话，就能让两个人激烈争吵。来自北京航空航天大学、香港中文大学（深圳）、悉尼科技大学、中山大学等高校的研究者提出Sitcom-Crafter。成果已被ICLR 2025会议接收。

来自主题: AI技术研报

9611 点击 2025-02-21 08:57

基于 LLM 的查询扩展：信息更全，搜索更准

最初，查询扩展是为那些靠关键词匹配来判断相关性的搜索系统设计的，比如 tf-idf 或其他稀疏向量方案。这类方法有些天然的缺陷：词语稍微变个形式，像 "ran" 和 "running"，或者 "optimise" 和 "optimize"，都会影响匹配结果。虽然可以用语言预处理来解决一部分问题，但远远不够。技术术语、同义词和相关词就更难处理了。

来自主题: AI技术研报

9239 点击 2025-02-21 08:50

物理直觉不再是人类专属？LeCun等新研究揭示AI可如何涌现出此能力

在当今的 AI 领域，图灵奖得主 Yann LeCun 算是一个另类。即便眼见着自回归 LLM 的能力越来越强大，能解决的任务也越来越多，他也依然坚持自己的看法：自回归 LLM 没有光明的未来。

来自主题: AI技术研报

8866 点击 2025-02-20 16:55

视频版IC-Light来了！Light-A-Video提出渐进式光照融合，免训练一键视频重打光

数字化时代，视频内容的创作与编辑需求日益增长。从电影制作到社交媒体，高质量的视频编辑技术成为了行业的核心竞争力之一。然而，视频重打光（video relighting）—— 即对视频中的光照条件进行调整和优化，一直是这一领域的技术瓶颈。传统的视频重打光方法面临着高昂的训练成本和数据稀缺的双重挑战，导致其难以广泛应用。

来自主题: AI技术研报

4600 点击 2025-02-20 16:49

手掌大小芯片碾压全球算力！微软量子计算核弹级突破，纳德拉：构建全新物质状态

想象一下，一个放在手掌上的芯片，能解决当今地球上所有计算机加起来都无法解决的问题。

来自主题: AI技术研报

9788 点击 2025-02-20 16:02

小红书等给AI图像检测上难度！数据集均通过人类感知“图灵测试” | ICLR 2025

AI生成内容已深度渗透至生活的方方面面，从艺术创作到设计领域，再到信息传播与版权保护，其影响力无处不在。

来自主题: AI技术研报

10715 点击 2025-02-20 15:46

谷歌豪华阵容打造AI科学家，用测试时间计算加速科学发现，CEO皮猜也来站台了

CEO皮猜亲自站台，谷歌的最新研究狠狠火了——

来自主题: AI技术研报

6867 点击 2025-02-20 15:23

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。

来自主题: AI技术研报

7355 点击 2025-02-20 14:25

2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台

随着金融机构和专业人士越来越多地将大语言模型（LLMs）纳入其工作流程中，金融领域与人工智能社区之间依然存在显著障碍，包括专有数据和专业知识的壁垒。本文提出了 FinRobot，一种支持多个金融专业化人工智能智能体的新型开源 AI 智能体平台，每个代理均由 LLM 提供动力。

来自主题: AI技术研报

10430 点击 2025-02-20 11:33

DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，一手教程在此

DeepSeek爆火甚至引发API低价内卷……

来自主题: AI技术研报

10511 点击 2025-02-20 11:03

Llama都在用的RoPE有了视频版，复旦上海AI Lab等提出长视频理解/检索绝佳拍档

Llama都在用的RoPE（旋转位置嵌入）被扩展到视频领域，长视频理解和检索更强了。

来自主题: AI技术研报

5693 点击 2025-02-20 10:29

AI游戏设计师问世，自学成才，无需任何先前知识

游戏开发不仅需要生成新颖的内容，更需要在保持游戏世界一致性、多样性和用户修改持续性方面达到高度平衡。近日，一篇发表在Nature上的研究论文World and Human Action Models towards Gameplay Ideation揭示了如何利用生成式AI模型推动游戏玩法创意的生成。

来自主题: AI技术研报

9805 点击 2025-02-20 10:20