AI资讯新闻榜单内容搜索-算法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 算法
ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步

ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步

ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步

在可验证强化学习(RLVR)的推动下,大语言模型在单轮推理任务中已展现出不俗表现。然而在真实推理场景中,LLM 往往需要结合外部工具进行多轮交互,现有 RL 算法在平衡模型的长程推理与多轮工具交互能力方面仍存在不足。

来自主题: AI技术研报
5591 点击    2025-08-10 13:29
独家|前首富陈天桥新创公司欲对标DeepSeek 国内AI大牛代季峰加盟

独家|前首富陈天桥新创公司欲对标DeepSeek 国内AI大牛代季峰加盟

独家|前首富陈天桥新创公司欲对标DeepSeek 国内AI大牛代季峰加盟

国内著名AI青年科学家,清华大学电子工程系副教授代季峰,近日加盟陈天桥旗下盛大网络,正筹备一家新的AI创业公司。《科创板日报》独家获悉,盛大创始人陈天桥对代季峰领衔的这家新AI创业公司寄予厚望,并明确公司的三大研发重点:AI商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。

来自主题: AI资讯
6827 点击    2025-08-07 11:24
南大周志华团队最新力作:一个算法通吃所有,在线学习迎来新范式?

南大周志华团队最新力作:一个算法通吃所有,在线学习迎来新范式?

南大周志华团队最新力作:一个算法通吃所有,在线学习迎来新范式?

世界是动态变化的。为了理解这个动态变化的世界并在其中运行,AI 模型必须具备在线学习能力。为此,该领域提出了一种新的性能指标 —— 适应性遗憾值(adaptive regret),其定义为任意区间内的最大静态遗憾值。

来自主题: AI技术研报
5766 点击    2025-08-05 16:29
Meta华人新秀毕树超,重磅爆料下一代LLM路线!RL+预训练直通AGI

Meta华人新秀毕树超,重磅爆料下一代LLM路线!RL+预训练直通AGI

Meta华人新秀毕树超,重磅爆料下一代LLM路线!RL+预训练直通AGI

OpenAI前研究员、Meta「AI梦之队员」毕书超在哥大指出:AGI就在眼前,突破需高质数据、好奇驱动探索与高效算法;Scaling Law依旧有效,规模决定智能,终身学习才是重点。

来自主题: AI资讯
6009 点击    2025-08-05 12:58
“开箱即用”的AI长什么样?我们在WAIC找到了样本|甲子光年

“开箱即用”的AI长什么样?我们在WAIC找到了样本|甲子光年

“开箱即用”的AI长什么样?我们在WAIC找到了样本|甲子光年

在AI飞速发展、智能硬件遍地开花的2025年,对普通用户来说,真正的门槛其实只有两个:我能不能即开即用?我能不能放心交互? 这一点,在2025世界人工智能大会(WAIC)7万平方米的展厅里格外清晰——人们对技术本身的好奇正在消退,新的侧重点是寻找值得托付的系统:用得起、连得通、不泄露隐私,也不被算法摆布。

来自主题: AI资讯
6198 点击    2025-08-05 12:10
ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法

ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法

ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法

近年来,扩散模型(Diffusion Models)凭借出色的生成质量,迅速成为图像、视频、语音、3D 内容等生成任务中的主流技术。从文本生成图像(如 Stable Diffusion),到高质量人脸合成、音频生成,再到三维形状建模,扩散模型正在广泛应用于游戏、虚拟现实、数字内容创作、广告设计、医学影像以及新兴的 AI 原生生产工具中。

来自主题: AI技术研报
6146 点击    2025-08-03 13:04
抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨

抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨

抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨

你刷的每一条短视频,背后都隐藏着推荐算法的迭代与革新。 作为最新成果,字节跳动的算法团队提出的全新推荐排序模型架构RankMixer,在兼顾算力利用率的同时,实现了模型效果的可扩展性。

来自主题: AI资讯
7132 点击    2025-08-02 13:45
当提示词优化器学会进化,竟能胜过强化学习

当提示词优化器学会进化,竟能胜过强化学习

当提示词优化器学会进化,竟能胜过强化学习

仅靠提示词优化就能超越 DeepSeek 开发的 GRPO 强化学习算法? 是的,你没有看错。近日上线 arXiv 的一篇论文正是凭此吸引了无数眼球。

来自主题: AI技术研报
6065 点击    2025-08-01 11:42