AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
一年后,DeepSeek-R1的每token成本降到了原来的1/32

一年后,DeepSeek-R1的每token成本降到了原来的1/32

一年后,DeepSeek-R1的每token成本降到了原来的1/32

几天前,DeepSeek 毫无预兆地更新了 R1 论文,将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容,包括首次公开训练全路径,即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline,以及「Aha Moment」的数据化验证等等。

来自主题: AI技术研报
7425 点击    2026-01-10 17:02
AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠

AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠

AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠

近年来,大语言模型在算术、逻辑、多模态理解等任务上之所以取得显著进展,很大程度上依赖于思维链(CoT)技术。所谓 CoT,就是让模型在给出最终答案前,先生成一系列类似「解题步骤」的中间推理。 这种方式

来自主题: AI技术研报
5623 点击    2026-01-10 17:00
Anthropic突然封禁第三方工具调用Claude,Cursor、OpenCode、xAI 集体“中枪”!项目做到一半突遭中断,官方解释是“误伤”?

Anthropic突然封禁第三方工具调用Claude,Cursor、OpenCode、xAI 集体“中枪”!项目做到一半突遭中断,官方解释是“误伤”?

Anthropic突然封禁第三方工具调用Claude,Cursor、OpenCode、xAI 集体“中枪”!项目做到一半突遭中断,官方解释是“误伤”?

昨晚,Anthropic 宣布已经部署了更严格的技术保障措施,用以防止第三方工具“伪装”为官方 Claude Code 客户端,从而绕过速率限制和计费机制,低成本调用底层 Claude 模型,此外,Anthropic 也被曝出切断了包括 xAI 在内的部分竞争对手对 Claude 模型的访问权限,其中 Cursor IDE 成为了关键的“触发点”。

来自主题: AI资讯
9316 点击    2026-01-10 12:28
DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危

DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危

DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危

Information爆料称,DeepSeek将计划在2月中旬,也正是春节前后,正式发布下一代V4模型。据称,DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。

来自主题: AI资讯
8740 点击    2026-01-10 11:23
「liko.ai」完成首轮融资,打造以 AI Home Center 为核心的智能家居解决方案|光源孵化

「liko.ai」完成首轮融资,打造以 AI Home Center 为核心的智能家居解决方案|光源孵化

「liko.ai」完成首轮融资,打造以 AI Home Center 为核心的智能家居解决方案|光源孵化

近日,liko.ai 宣布完成首轮融资,由商汤国香资本、东方富海、讯飞创投、洪泰基金、正轩投资、面壁智能等多家产业及财务投资机构联合投资,光源资本担任孵化方及独家财务顾问。本轮融资将用于端侧视觉语言模型、AI 原生硬件以及家庭多模态通用终端研发。

来自主题: AI资讯
7924 点击    2026-01-10 11:06
做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛

做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛

做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛

2026年1月5日,由陈天桥和清华AI学者代季峰联合发起的MiroMind团队,正式发布了自研旗舰搜索智能体模型MiroThinker 1.5。这个消息本身并不算特别,毕竟最近几个月几乎每周都有新模型发布。但当我深入了解后发现,这个模型背后代表的思路,可能会彻底改变我们对AI能力边界的认知。

来自主题: AI资讯
7830 点击    2026-01-10 10:51
大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水

来自主题: AI技术研报
8200 点击    2026-01-10 10:16
MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步

MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步

MIT天才博士刚毕业,就被前OpenAI CTO抢走!年薪或300万起步

MIT天才博士一毕业,火速加盟OpenAI前CTO初创!最近,肖光烜(Guangxuan Xiao)在社交媒体官宣,刚刚完成了MIT博士学位。下一步,他将加入Thinking Machines,专注于大模型预训练的工作。

来自主题: AI资讯
8278 点击    2026-01-09 14:42
一口气集齐老黄苏妈英特尔,还得是AI,还得是联想

一口气集齐老黄苏妈英特尔,还得是AI,还得是联想

一口气集齐老黄苏妈英特尔,还得是AI,还得是联想

联想给出的公式是,混合AI=个人智能+企业智能+公共智能。这种模式下,AI智能体应用不再依赖于单一的云端模型,而是云端大模型与本地定制化小模型的深度融合。

来自主题: AI资讯
8358 点击    2026-01-09 14:41
Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

百炼升级了其提出的「1+2+N」的蓝图:其中最底层的 1 是模型与云服务,中间层的 2 是高代码、低代码的开发范式,在最上层的 N 则是面向不同任务的开发组件。这套能力覆盖了生产级智能体构建的全生命周期。

来自主题: AI资讯
8726 点击    2026-01-09 14:39