AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AutoBA:一个用于生信多组学分析的完全自动化AI代理

AutoBA:一个用于生信多组学分析的完全自动化AI代理

AutoBA:一个用于生信多组学分析的完全自动化AI代理

分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《Advanced Science》上。

来自主题: AI技术研报
5484 点击    2024-10-29 09:53
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner

突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner

突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner

TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上,相较于现有方法具有显著的性能优势。

来自主题: AI技术研报
6249 点击    2024-10-28 18:30
一张显卡看遍天下电影!智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录

一张显卡看遍天下电影!智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录

一张显卡看遍天下电影!智源联合高校开源Video-XL打破长视频理解极限,95%准确率刷爆纪录

长视频理解迎来新纪元!智源联手国内多所顶尖高校,推出了超长视频理解大模型Video-XL。仅用一张80G显卡处理小时级视频,未来AI看懂电影再也不是难事。

来自主题: AI技术研报
7350 点击    2024-10-28 17:38
陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数

陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数

陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数

Transformer解决了三体问题?Meta研究者发现,132年前的数学难题——发现全局李雅普诺夫函数,可以被Transformer解决了。「我们不认为Transformer是在推理,它可能是出于对数学问题的深刻理解,产生了超级直觉。」AI可以搞基础数学研究了,陶哲轩预言再成真。

来自主题: AI技术研报
10350 点击    2024-10-28 17:29
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化,不限于推理任务

OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化,不限于推理任务

OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化,不限于推理任务

OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。 不限于推理性的逻辑或数学任务,一般问答也能思考的那种。 最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。

来自主题: AI技术研报
4315 点击    2024-10-28 17:02
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

仅需1块80G显卡,大模型理解小时级超长视频。 智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。

来自主题: AI技术研报
4909 点击    2024-10-28 16:52
整合长期记忆,AI实现自我进化,探索大模型这一可能性

整合长期记忆,AI实现自我进化,探索大模型这一可能性

整合长期记忆,AI实现自我进化,探索大模型这一可能性

近日,天桥脑科学研究院和普林斯顿大学等多所研究机构发布了一篇研究论文,详细阐述了长期记忆对 AI 自我进化的重要性,并且他们还提出了自己的实现框架 —— 基于多智能体的 Omne,其在 GAIA 基准上取得了第一名的成绩。

来自主题: AI技术研报
5733 点击    2024-10-28 15:03
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。

来自主题: AI技术研报
4917 点击    2024-10-28 15:00
NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED

NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED

NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED

视频内容的快速增长给视频检索技术,特别是细粒度视频片段检索(VCMR),带来了巨大挑战。VCMR 要求系统根据文本查询从视频库中精准定位视频中的匹配片段,需具备跨模态理解和细粒度视频理解能力。

来自主题: AI技术研报
4739 点击    2024-10-28 14:46
AI Agent奇点临近

AI Agent奇点临近

AI Agent奇点临近

近日,智谱在公众号陆续放出电脑版本与手机版本的AI Agent实操视频:

来自主题: AI技术研报
9307 点击    2024-10-28 12:41
惊雷又来了,用含义类型化提示MTP:更高效地提示LLM结构化输出,支持图片视频

惊雷又来了,用含义类型化提示MTP:更高效地提示LLM结构化输出,支持图片视频

惊雷又来了,用含义类型化提示MTP:更高效地提示LLM结构化输出,支持图片视频

在人工智能技术快速发展的今天,大语言模型(LLM)已经展现出惊人的能力。然而,让这些模型生成规范的结构化输出仍然是一个难以攻克的技术难题。不论是在开发自动化工具、构建特定领域的解决方案,还是在进行开发工具集成时,都迫切需要LLM能够产生格式严格、内容可靠的输出。

来自主题: AI技术研报
8412 点击    2024-10-28 11:55
NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

扩散模型(Diffusion Models, DMs)已经成为文本到图像生成领域的核心技术之一。凭借其卓越的性能,这些模型可以生成高质量的图像,广泛应用于各类创作场景,如艺术设计、广告生成等。

来自主题: AI技术研报
8478 点击    2024-10-27 16:39
斯坦福开源学术研究神器STORM再进化,AI智能体像人一样进行圆桌讨论

斯坦福开源学术研究神器STORM再进化,AI智能体像人一样进行圆桌讨论

斯坦福开源学术研究神器STORM再进化,AI智能体像人一样进行圆桌讨论

今年 4 月,斯坦福大学推出了一款利用大语言模型(LLM)辅助编写类维基百科文章的神器。它就是开源的 STORM,可以在三分钟左右将你输入的主题转换为长篇文章或者研究论文,并能够以 PDF 格式直接下载。

来自主题: AI技术研报
5916 点击    2024-10-27 15:43
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%

田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%

田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%

AI评估AI可靠吗?来自Meta、KAUST团队的最新研究中,提出了Agent-as-a-Judge框架,证实了智能体系统能够以类人的方式评估。它不仅减少97%成本和时间,还提供丰富的中间反馈。

来自主题: AI技术研报
3976 点击    2024-10-27 15:35
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临

谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临

谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临

科幻中的贾维斯,已经离我们不远了。Claude 3.5接管人类电脑掀起了人机交互全新范式,爆料称谷歌同类Project Jarvis预计年底亮相。AI操控电脑已成为微软、苹果等巨头,下一个发力的战场。

来自主题: AI技术研报
4721 点击    2024-10-27 15:28
本科经典算法Dijkstra,被证明是普遍最优了:最坏情况性能也最优!

本科经典算法Dijkstra,被证明是普遍最优了:最坏情况性能也最优!

本科经典算法Dijkstra,被证明是普遍最优了:最坏情况性能也最优!

时隔近70年,那个用来解决最短路径问题的经典算法——Dijkstra,现在有了新突破:被证明具有普遍最优性(Universal Optimality)。

来自主题: AI技术研报
4106 点击    2024-10-27 14:56
无需训练即可创建数字人,字节PersonaTalk视频口型编辑超SOTA

无需训练即可创建数字人,字节PersonaTalk视频口型编辑超SOTA

无需训练即可创建数字人,字节PersonaTalk视频口型编辑超SOTA

在 AIGC 的热潮下,基于语音驱动的视频口型编辑技术成为了视频内容个性化与智能化的重要手段之一。

来自主题: AI技术研报
10876 点击    2024-10-26 20:54
控制电脑手机的智能体人人都能造,微软开源OmniParser

控制电脑手机的智能体人人都能造,微软开源OmniParser

控制电脑手机的智能体人人都能造,微软开源OmniParser

最近这几天,让大模型具备控制计算机(包括电脑和手机)的相关研究和应用如雨后春笋般不断涌现。

来自主题: AI技术研报
11597 点击    2024-10-26 20:18
真·开放式游戏,谷歌造出首个无限人生模拟游戏Unbounded

真·开放式游戏,谷歌造出首个无限人生模拟游戏Unbounded

真·开放式游戏,谷歌造出首个无限人生模拟游戏Unbounded

如果你是一位开放世界或角色扮演游戏的玩家,你一定梦想过一款无限自由的游戏。没有空气墙,没有剧情杀,也没有任何交互限制。

来自主题: AI技术研报
10385 点击    2024-10-26 19:54
诺贝尔奖是AI发展的里程碑时刻!DeepMind联创Hassabis获奖后最新专访

诺贝尔奖是AI发展的里程碑时刻!DeepMind联创Hassabis获奖后最新专访

诺贝尔奖是AI发展的里程碑时刻!DeepMind联创Hassabis获奖后最新专访

今年的诺奖将物理和化学两个领域的奖项都颁给了AI成果,这究竟代表着怎样的含义,又会产生怎样的影响?Demis Hassabis在本次专访中提出了自己的见解。

来自主题: AI技术研报
10535 点击    2024-10-26 19:42
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题

与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题

与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题

OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程,o1 基于现有大语言模型的强大推理能力,生成合理的推理过程,并将这些推理融入到其强化学习训练过程中。

来自主题: AI技术研报
10335 点击    2024-10-26 17:01
在Claude 3.5 Sonnet之前,这些AI Agent已能像人类一样操作电脑

在Claude 3.5 Sonnet之前,这些AI Agent已能像人类一样操作电脑

在Claude 3.5 Sonnet之前,这些AI Agent已能像人类一样操作电脑

这两天,Claude 3.5 Sonnet升级版刷爆了朋友圈,满屏都是:它能像人一样操作电脑。 大语言模型(Large Language Model,LLM)能够像人一样操作电脑这件事,看起来蛮炸裂的,但在AI Agent圈子里早已经见多不怪了。

来自主题: AI技术研报
6031 点击    2024-10-25 16:40
开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品

开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品

开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品

原生多模态大模型性能瓶颈,迎来新突破! 上海AI Lab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。 与非原生模型相比,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准。

来自主题: AI技术研报
5577 点击    2024-10-25 15:37
RNN回归!Bengio新作大道至简与Transformer一较高下

RNN回归!Bengio新作大道至简与Transformer一较高下

RNN回归!Bengio新作大道至简与Transformer一较高下

近日,深度学习三巨头之一的Yoshua Bengio,带领团队推出了全新的RNN架构,以大道至简的思想与Transformer一较高下。

来自主题: AI技术研报
3907 点击    2024-10-25 14:42
arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集

arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集

arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集

「这才是开放研究该有的样子。」 经常刷 arXiv 的同学,你有没有发现页面上多了个新功能?这个新功能(图中的「Hugging Face」按钮)隐藏在「Code, Data, Media」选项卡下,选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。

来自主题: AI技术研报
3999 点击    2024-10-25 14:22