AI资讯新闻榜单内容搜索-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 
均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事

均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事

均值至上假繁荣!北大新作专挑难题,逼出AI模型真本事

大模型后训练的痛点:均值优化忽略低概率高信息路径,导致推理能力停滞。RiskPO双管齐下,MVaR目标函数推导梯度估计,多问题捆绑转化反馈,实验中Geo3K准确率54.5%,LiveCodeBench Pass@1提升1%,泛化能力强悍。

来自主题: AI技术研报
6158 点击    2025-10-25 14:32
Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段,图像编辑(Image Editing)正逐渐取代一次性生成,成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型?

来自主题: AI技术研报
5954 点击    2025-10-25 14:26
最新Agentic Search综述,RL让Agent自主检索,RAG逐渐成为过去式

最新Agentic Search综述,RL让Agent自主检索,RAG逐渐成为过去式

最新Agentic Search综述,RL让Agent自主检索,RAG逐渐成为过去式

大型语言模型(LLM)本身很强大,但知识是静态的,有时会“胡说八道”。为了解决这个问题,我们可以让它去外部知识库(比如维基百科、搜索引擎)里“检索”信息,这就是所谓的“检索增强生成”(RAG)。

来自主题: AI资讯
5799 点击    2025-10-25 14:09
AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o

AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o

AI在线强化学习“边做边学”,斯坦福团队让7B小模型性能飙升,甚至超越GPT-4o

斯坦福等新框架,用在线强化学习让智能体系统“以小搏大”,领先GPT-4o—— AgentFlow,是一种能够在线优化智能体系统的新范式,可以持续提升智能体系统对于复杂问题的推理能力。

来自主题: AI技术研报
5228 点击    2025-10-25 14:03
一封来自Transformer之父的分手信:8年了!世界需要新的AI架构

一封来自Transformer之父的分手信:8年了!世界需要新的AI架构

一封来自Transformer之父的分手信:8年了!世界需要新的AI架构

Transformer之父「叛逃」?8年前掀起AI革命的男人,如今嫌「自己孩子」太吵太卷!当资本狂飙、论文堆积如山,他却高喊:是时候放弃Transformer,重新找回好奇心了。

来自主题: AI资讯
8958 点击    2025-10-25 13:22
验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路

验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路

验证者定律,智能的锯齿边缘和商品化,CoT之父Jason Wei2025AI进展的三个思路

在这片喧嚣和迷雾之中,我们迫切需要一个清晰的导航图。而Jason Wei正是提供这份地图的最佳人选之一。他现任Meta超级智能实验室(Meta Super Intelligence Labs)的研究科学家,此前在OpenAI工作了两年,o1研发的主导者,更早之前是Google Brain的科学家。

来自主题: AI技术研报
7419 点击    2025-10-25 13:09
干家务一小时挣1000元,具身智能时代人类新岗位

干家务一小时挣1000元,具身智能时代人类新岗位

干家务一小时挣1000元,具身智能时代人类新岗位

注意看,眼前这个男人暂且叫他小帅。 你可能想不到,他只是在厨房里优雅地煎牛排做做家务,每小时最高能赚进1000多块(150美元)。 怪不得小帅天天上班喜笑颜开。

来自主题: AI资讯
8044 点击    2025-10-25 10:56
又一明星创始人入局AI播客、红杉中国押注,这次能翻出水花吗?

又一明星创始人入局AI播客、红杉中国押注,这次能翻出水花吗?

又一明星创始人入局AI播客、红杉中国押注,这次能翻出水花吗?

最近,曾任字节智慧教育业务线 CEO 的李可佳(Ethan KJ Li)也入局了“AI 播客”,只不过它的思路与前两位并不相同。李可佳的产品名为 Aibrary,于今年 4 月 23 日上线美区 App Store 进行测试,9 月 23 日正式上线。从官网上的介绍来看,Aibrary 的核心功能是把书籍转化/重塑为个性化播客,并通过定制学习路径、互动式辅导,服务于个人学习场景。

来自主题: AI资讯
7815 点击    2025-10-25 10:54
这个技能转换 Agent 平台,想帮你积累「睡后收入」|AI 上新

这个技能转换 Agent 平台,想帮你积累「睡后收入」|AI 上新

这个技能转换 Agent 平台,想帮你积累「睡后收入」|AI 上新

在 AI 时代,最赚钱的可能不是那些会写代码的人,而是那些能把专业经验「产品化」的人。大量专业人士手里握着宝贵的行业 know-how,却找不到一个合适的方式把它变成持续收入。直到我看到 MuleRun,才发现有人正在尝试打破这个困局——让不懂代码的专业人士,也能把自己的工作流变成可交易的「商品」。

来自主题: AI资讯
8385 点击    2025-10-25 10:44
超越Runway!Adobe发布新神器:P视频比P图还简单

超越Runway!Adobe发布新神器:P视频比P图还简单

超越Runway!Adobe发布新神器:P视频比P图还简单

全新AI工具EditVerse将图片和视频编辑整合到一个框架中,让你像P图一样轻松P视频。通过统一的通用视觉语言和上下文学习能力,EditVerse解决了传统视频编辑复杂、数据稀缺的问题,还能实现罕见的「涌现能力」。在效果上,它甚至超越了商业工具Runway,预示着一个创作新纪元的到来。

来自主题: AI技术研报
7506 点击    2025-10-25 10:42