AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

近日,腾讯 PCG 社交线的研究团队针对这一问题,采用强化学习(RL)训练方法,通过分组相对策略优化(Group Relative Policy Optimization, GRPO)算法,结合基于奖励的课程采样策略(Reward-based Curriculum Sampling, RCS),将其创新性地应用在意图识别任务上,

来自主题: AI技术研报
5719 点击    2025-05-16 15:25
一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致

最近,Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。 它让用户能够从单张图像实现对光源的细粒度参数化控制, 可以改变可见光源的强度和颜色、环境光的强度,并且能够将虚拟光源插入场景中。

来自主题: AI技术研报
7613 点击    2025-05-16 15:14
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此,在AI竞赛进入“下半场”之际(由最近的OpenAI研究员姚顺雨所引发的共识观点),设计科学的评估机制俨然成为决定胜负的核心关键。

来自主题: AI技术研报
6804 点击    2025-05-16 15:06
ChatGPT的记忆机制被公开了

ChatGPT的记忆机制被公开了

ChatGPT的记忆机制被公开了

ChatGPT新版记忆功能居然被民间大佬逆向工程了!

来自主题: AI技术研报
8954 点击    2025-05-16 13:07
「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元!

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元!

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元!

大型推理模型(如 OpenAI-o1、DeepSeek-R1)展现了强大的推理能力,但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战,深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报
5722 点击    2025-05-16 11:04
表格RAG语义割裂,用Pneuma+SAT增强检索准确性和效率 |最新

表格RAG语义割裂,用Pneuma+SAT增强检索准确性和效率 |最新

表格RAG语义割裂,用Pneuma+SAT增强检索准确性和效率 |最新

在上一篇文章中,我为大家介绍了SAT如何通过神经网络驱动的智能分段技术,解决传统文本处理中的语义割裂问题。今天,我将继续与您探讨SAT如何与Pneuma系统融合,开创表格数据检索与表示的新范式。

来自主题: AI技术研报
5671 点击    2025-05-16 10:43
全球头部AI应用公司,现状如何?

全球头部AI应用公司,现状如何?

全球头部AI应用公司,现状如何?

随着DeepSeek的横空出世,行业竞争加剧,无论是AI原生企业还是转型中的互联网巨头,都面临战略路径的重新校准。这一现象引发了行业的连锁反应:一方面,头部企业加速产品迭代和推广;另一方面,部分企业由于战略失误和反应缓慢开始面临用户流失风险。在这样的竞争环境下,企业的战略选择显得尤为关键。成功的AI公司通常具备三大核心能力:精准的战略定位、快速的调整能力以及高效的执行落地。

来自主题: AI技术研报
7934 点击    2025-05-16 10:06
如何理解AI资产重估?

如何理解AI资产重估?

如何理解AI资产重估?

2025年国内AI技术突破推动资产重估,资源向头部企业高度集中,形成“赢家通吃”格局。高端制造受政策与资本驱动,龙头优势扩大,但就业市场与科创投资错位,加剧通缩压力。政策转向结构性调控,聚焦科技与安全资产,投资者需关注确定性强的核心资产及防御性配置。

来自主题: AI技术研报
6836 点击    2025-05-16 09:59
超越OpenAI、ElevenLabs,MiniMax新一代语音模型屠榜!人格化语音时代来了

超越OpenAI、ElevenLabs,MiniMax新一代语音模型屠榜!人格化语音时代来了

超越OpenAI、ElevenLabs,MiniMax新一代语音模型屠榜!人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」国外大模型。

来自主题: AI技术研报
7710 点击    2025-05-16 09:59
突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

谷歌DeepMind重磅推出AlphaEvolve,最强通用AI智能体横扫数学难题!它不仅推动了300年「接吻数难题」,一举颠覆了56年前Strassen算法神话。而且,还在AI训推、TPU设计、数据中心领域,展现出了极强的实力。

来自主题: AI技术研报
8772 点击    2025-05-15 19:58
“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了

“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了

“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了

Vibe coding正火得一塌糊涂,但谁能想到,刚刚一位大佬已经把当红的AI编程神器Cursor和Windsurf背后的核心算法机制研究出来了!

来自主题: AI技术研报
6819 点击    2025-05-15 19:41
刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程,揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈,实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验,还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报
7167 点击    2025-05-15 17:12
讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token

讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token

讨厌RAG生成幻觉?试一下SAT重构文本分块,按语义而不是Token

搞RAG开发,一个被普遍忽视却又至关重要的痛点是:如何避免Token分块带来的语义割裂问题。SAT模型通过神经网络驱动的智能分段技术,巧妙解决了这一难题。它不是RAG的替代,而是RAG的强力前置增强层,通过确保每个文本块的语义完整性,显著降低下游生成的幻觉风险。

来自主题: AI技术研报
6792 点击    2025-05-15 12:02
DanceGRPO:首个统一视觉生成的强化学习框架

DanceGRPO:首个统一视觉生成的强化学习框架

DanceGRPO:首个统一视觉生成的强化学习框架

R1 横空出世,带火了 GRPO 算法,RL 也随之成为 2025 年的热门技术探索方向,近期,字节 Seed 团队就在图像生成方向进行了相关探索。

来自主题: AI技术研报
6804 点击    2025-05-15 10:47
红杉资本的AI应用焦虑:AI必须要赚钱了

红杉资本的AI应用焦虑:AI必须要赚钱了

红杉资本的AI应用焦虑:AI必须要赚钱了

红杉资本连续三年关注AI应用的盈利压力,指出当前AI市场规模已达万亿美元但面临挑战:智能体技术受限于串行任务瓶颈,行业渗透率差异显著,初创企业需深耕垂直领域或整合人工环节。大模型厂商向下游扩张挤压初创空间,部分企业通过收购强化竞争力,AI应用需从工具转向交付结果以突破盈利困境。

来自主题: AI技术研报
7613 点击    2025-05-15 10:29
为什么AI视频工具长得越来越像?

为什么AI视频工具长得越来越像?

为什么AI视频工具长得越来越像?

比起此前对生成时长、模型参数的强调,大半年来,不提Sora的AI视频玩家将这场“军备竞赛”的重点放在了三个维度上——卷一致性、卷可用性、卷可玩性。所谓的“一致性”指的是视频生成过程中帧与帧之间的过渡性、动作的连续性和场景的真实性等。

来自主题: AI技术研报
7642 点击    2025-05-15 10:27
全网爆火的AI原生浏览器Dia最全系统提示词,建议AI产品经理都看看

全网爆火的AI原生浏览器Dia最全系统提示词,建议AI产品经理都看看

全网爆火的AI原生浏览器Dia最全系统提示词,建议AI产品经理都看看

看了Dia的系统提示词,真的是细节狂魔啊!(提示词放文末了)每个细节都在优化用户的使用体验,这就是产品级AI和玩具级AI的区别。提示词整体结构遵循了"总-分-总"的结构,开头设定整体角色身份的基本认知,然后分项设定规则,最终设定总体的安全策略。

来自主题: AI技术研报
8761 点击    2025-05-14 20:12
精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

精准提取数据太折磨人,试下pip install -U contextgem,自动生成提示 | 痛快

最近ContextGem很火。它既不是RAG也不是Agent,而是专注于"结构化提取"的框架,它像一个"文档理解层",通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数据。它可作为RAG的前置处理器、Agent的感知模块,也可独立使用。

来自主题: AI技术研报
6877 点击    2025-05-14 15:12
首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025

MICAS是一种专为3D点云上下文学习设计的多粒度采样方法,通过任务自适应点采样和查询特定提示采样,提升模型在点云重建、去噪、配准和分割等任务中的稳健性和适应性,显著优于现有技术。

来自主题: AI技术研报
7818 点击    2025-05-14 14:28