AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
大模型也会想太多?清华等提出TaH:跳过93%无效迭代,准确率反而提升

大模型也会想太多?清华等提出TaH:跳过93%无效迭代,准确率反而提升

大模型也会想太多?清华等提出TaH:跳过93%无效迭代,准确率反而提升

随着 o1/R1 等推理模型的发展 [1][2],「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理,都在用更多计算换取更可靠的答案。

来自主题: AI技术研报
7956 点击    2026-05-22 08:44
Agent 的下半场,是账单|对话 OpenClacky 李亚飞

Agent 的下半场,是账单|对话 OpenClacky 李亚飞

Agent 的下半场,是账单|对话 OpenClacky 李亚飞

让 AI 来管理代码的话,每次读 500 行反而比读 1000 行更费 Token,而且人工编排流程真不如让大模型自己定,「很多的事儿,还是很反直觉的」

来自主题: AI资讯
8887 点击    2026-05-21 10:14
520,遇见国产「新模王」Qwen3.7-Max!

520,遇见国产「新模王」Qwen3.7-Max!

520,遇见国产「新模王」Qwen3.7-Max!

仅仅一个月后,阿里又带着最强旗舰模型杀回来了!今天上午,在 2026 阿里云峰会上,阿里全新一代千问旗舰模型 Qwen3.7-Max 登场了!在 Arena 公布的最新一期全球大模型盲测总榜中,Qwen3.7-Max 总成绩位列国产模型第一:傲视一众国产大模型

来自主题: AI资讯
9632 点击    2026-05-20 16:26
高潮从第几秒开始?GaMMA 让多模态大模型真正「听懂」音乐时间线

高潮从第几秒开始?GaMMA 让多模态大模型真正「听懂」音乐时间线

高潮从第几秒开始?GaMMA 让多模态大模型真正「听懂」音乐时间线

大模型的能力边界正在不断拓展,从文字到视觉,再到音频,全模态理解已渐成现实。然而,当你问一个多模态大模型「这首歌的高潮从第几秒开始?」或者「第 30 秒之后乐器编配发生了什么变化?」,得到的往往是一个模糊甚至错误的回答。

来自主题: AI技术研报
6391 点击    2026-05-20 09:51
LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

过去一段时间,很多人对大模型都有一个明显感受:token 总是不够用。

来自主题: AI技术研报
7196 点击    2026-05-19 15:32
伯克利神作背刺OpenAI:持续学习才是真神!

伯克利神作背刺OpenAI:持续学习才是真神!

伯克利神作背刺OpenAI:持续学习才是真神!

伯克利等发布FST框架:通过快慢分层解决大模型持续学习死局。

来自主题: AI技术研报
8146 点击    2026-05-19 15:31
ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

近年来,Chain-of-Thought(CoT)推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报
6810 点击    2026-05-19 10:01