AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

思维链太长拖慢推理?把它「画」进隐空间!新框架RoT探索大模型隐空间推理新范式

在 LLM 时代,思维链( CoT)已成为解锁模型复杂推理能力的关键钥匙。然而,CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用,严重制约了模型的推理效率。

来自主题: AI技术研报
7410 点击    2026-01-27 16:17
谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现

谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现

谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现

在达沃斯论坛之后,谷歌Deepmind CEO Demis Hassabis又连续上了两个播客,放出了不少谷歌的新动向!

来自主题: AI资讯
7766 点击    2026-01-27 16:16
憋了4个月,阿里最大最强模型Qwen3-Max-Thinking正式版发布!附一手实测

憋了4个月,阿里最大最强模型Qwen3-Max-Thinking正式版发布!附一手实测

憋了4个月,阿里最大最强模型Qwen3-Max-Thinking正式版发布!附一手实测

阿里巴巴推出了Qwen3-Max-Thinking,这是阿里千问系列目前能力最强的旗舰级推理模型,在19项权威基准测试中,Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回,搭配测试时扩展(TTS)能力后,能在不少基准测试上达到SOTA。

来自主题: AI资讯
10003 点击    2026-01-27 11:21
美联储杀人,AI埋尸?牛津曝光L型死局:10亿打工人再无归路

美联储杀人,AI埋尸?牛津曝光L型死局:10亿打工人再无归路

美联储杀人,AI埋尸?牛津曝光L型死局:10亿打工人再无归路

这是一份迟到三年的行业复盘。牛津大学最新的实证研究撕开了那层遮羞布:2022年全球科技大裁员爆发时,ChatGPT甚至尚未发布。周期性缩编被伪装成技术性迭代,AI替资本背了三年的锅,直到今天真相才被彻底复位。

来自主题: AI资讯
10091 点击    2026-01-27 09:41
让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

让Agent画思维导图稳固长期记忆:新框架实现稳定长期学习,准确率提升38%

思维导图曾被证明可以帮助学习障碍者快速提升成绩,那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢?有研究团队做出了探索性尝试。

来自主题: AI技术研报
6075 点击    2026-01-27 09:40
北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

北大AI研究颠覆认知:我们看到的不是真实,而是被语言润色过的现实

近日,北京大学朱毅鑫教授课题组、北京大学毕彦超教授课题组和山西医科大学第一医院王效春团队通过结合 AI 模型和大脑损伤患者的数据,发现语言其实是一副无形的智能眼镜,时刻在悄悄修饰着我们看到的世界。我们可能以为视觉就是眼睛看到什么就是什么,但是这项成果说明了视觉从来都不是孤立的。事实上,当我们在看图片的时候,其实不只是在看,而是在进行被语言调制过的看。

来自主题: AI技术研报
8130 点击    2026-01-27 09:27
DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

DeepSeek-R1推理智能从哪儿来?谷歌新研究:模型内心多个角色吵翻了

过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指令微调模型的差距。直观来看,它们似乎只是思考得更久了:更长的 Chain-of-Thought、更高的 test-time compute,成为最常被引用的解释。

来自主题: AI技术研报
6511 点击    2026-01-26 15:02