AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
登顶SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力跃升

登顶SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力跃升

登顶SuperCLUE DeepSearch,openPangu-R-72B深度搜索能力跃升

近日,第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告,国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现,在模型榜单中名列第一,体现了基于国产昇腾算力的大模型研发实力。

来自主题: AI资讯
7744 点击    2025-12-06 11:23
谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵

谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵

谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵

奥特曼又得拉响红色警报了。刚刚,谷歌再次扔出重磅炸弹——Gemini 3 Deep Think正式上线!轻松把草图变成逼真3D场景,不仅结构还原到位,就连镂空花纹与光影都处理得明明白白。

来自主题: AI资讯
8082 点击    2025-12-06 11:19
谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?

谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?

谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?

两项关于大模型新架构的研究一口气在NeurIPS 2025上发布,通过“测试时训练”机制,能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是:Titans:兼具RNN速度和Transformer性能的全新架构;MIRAS:Titans背后的核心理论框架。

来自主题: AI技术研报
6965 点击    2025-12-06 11:10
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死

全球首个可大规模落地的开源原生多模态架构(Native VLM),名曰NEO。要知道,此前主流的多模态大模型,例如我们熟悉的GPT-4V、Claude 3.5等,它们的底层逻辑本质上其实玩的就是拼接。

来自主题: AI技术研报
8121 点击    2025-12-05 14:46
Nature重磅:智能的尽头是算力!谷歌大佬承认「预测下一个词即智能」

Nature重磅:智能的尽头是算力!谷歌大佬承认「预测下一个词即智能」

Nature重磅:智能的尽头是算力!谷歌大佬承认「预测下一个词即智能」

芯片速度触顶,AI却在疯狂跃迁。摩尔定律不管用了!Nature最新文章给出一个颠覆直觉的解释:智能的增长不靠芯片,而是结构被重新组织,更多单元被接入同一套协作网络。

来自主题: AI资讯
9681 点击    2025-12-05 10:09
Code LLM全景综述,从LLM到Agent,全文长303页,北航阿里字节等12家机构联合撰写|最新

Code LLM全景综述,从LLM到Agent,全文长303页,北航阿里字节等12家机构联合撰写|最新

Code LLM全景综述,从LLM到Agent,全文长303页,北航阿里字节等12家机构联合撰写|最新

这篇论文由北京航空航天大学、阿里巴巴、字节跳动、上海人工智能实验室等几十家顶尖机构联合撰写,全文长达303页,是对当前“代码大模型(Code LLMs)”领域最详尽的百科全书式指南。

来自主题: AI技术研报
10740 点击    2025-12-05 09:24
首个英文原生「弱智吧」!逻辑谬误数据集与生成框架来了 | AAAI'26

首个英文原生「弱智吧」!逻辑谬误数据集与生成框架来了 | AAAI'26

首个英文原生「弱智吧」!逻辑谬误数据集与生成框架来了 | AAAI'26

最近研究发现,大模型在判断逻辑谬误时容易「想太多」,误报正常句子,但在确定有谬误后,其分类能力较强。研究人员构建了首个高质量英文逻辑谬误基准SMARTYPAT-BENCH,并开发了基于Prolog的逻辑谬误自动生成框架SMARTYPAT,为大模型逻辑能力评估提供新思路,可用于谬误识别、辩论教育等领域。

来自主题: AI技术研报
9090 点击    2025-12-05 09:19
从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

昨日,有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报
8861 点击    2025-12-04 16:25
句子级溯源+生成式归因,C²-Cite重塑大模型可信度

句子级溯源+生成式归因,C²-Cite重塑大模型可信度

句子级溯源+生成式归因,C²-Cite重塑大模型可信度

在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可追溯, 一直是学术界和工业界关注的焦点问题。想象一下,当你向ChatGPT提问时,它不仅给出答案,还能像学术论文一样标注每句话的信息来源——这就是"溯源大语言模型"要解决的核心问题。

来自主题: AI技术研报
5632 点击    2025-12-03 10:44