AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
一些大模型,高分低能,为何?

一些大模型,高分低能,为何?

一些大模型,高分低能,为何?

这篇文章的思路来自 Philipp Schmid,由 minghao 推荐 https://www.philschmid.de/agent-harness-2026

来自主题: AI资讯
8792 点击    2026-01-07 16:01
OpenAI前CTO首个创业产品Tinker,这里全量升级开放了,还有羊毛可薅

OpenAI前CTO首个创业产品Tinker,这里全量升级开放了,还有羊毛可薅

OpenAI前CTO首个创业产品Tinker,这里全量升级开放了,还有羊毛可薅

当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward,optimizer step 等⼀系列基本原语,分离了算法设计等部分与分布式训练基础设施关联,

来自主题: AI技术研报
7851 点击    2026-01-07 15:30
Claude Code 实战一下午:它到底比普通大模型多做了什么?

Claude Code 实战一下午:它到底比普通大模型多做了什么?

Claude Code 实战一下午:它到底比普通大模型多做了什么?

这两年一直在关注 AI,Claude Code 给我带来的震撼,和当初 Nano Banana 在画图领域的革命,几乎是一个级别。

来自主题: AI技术研报
6191 点击    2026-01-07 10:12
别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

2025 年,随着李飞飞等学者将 “空间智能”(Spatial Intelligence)推向聚光灯下,这一领域迅速成为了大模型竞逐的新高地。通用大模型和各类专家模型纷纷在诸多室内空间推理基准上刷新 SOTA,似乎 AI 在训练中已经更好地读懂了三维空间。

来自主题: AI技术研报
8005 点击    2026-01-07 09:36
奥运百年来首次「开源」!阿里云 AI 让 80 亿人有了「参赛外卡」

奥运百年来首次「开源」!阿里云 AI 让 80 亿人有了「参赛外卡」

奥运百年来首次「开源」!阿里云 AI 让 80 亿人有了「参赛外卡」

最近我还真看到一个有点不一样的的 AI 创作比赛,国际奥委会联合阿里云搞了一场「米兰冬奥会 AIGC 全球大赛」,用万相大模型输入一句话,生成 5 到 15 秒冬奥视频即可参赛。不需要专业设备、不需要懂技术、甚至不需要会滑雪,只需要有个脑洞。

来自主题: AI资讯
8921 点击    2026-01-06 20:39
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

新年刚至,陈天桥携手代季峰率先打响开源大模型的第一枪。

来自主题: AI技术研报
8556 点击    2026-01-06 16:50
真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

文本领域的大模型满分选手,换成语音就集体挂科?大模型引以为傲的多轮对话逻辑,在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge,直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示,强如Gemini 3 Pro在真实场景下的通过率也仅过半数,而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报
9157 点击    2026-01-06 16:46
为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

您可能已经感受到了,从2025年开始到如今,全世界都在谈论Agentic AI或Agent(代理式AI)。从董事会到咨询公司,从更高级别的战略到街头巷尾,仿佛只要接入了大模型(LLM),所有的业务流程就能自动运转,效率就能翻倍。

来自主题: AI技术研报
10194 点击    2026-01-06 16:18
蚂蚁·安诊儿医疗大模型:正式开源并登顶权威医疗榜单

蚂蚁·安诊儿医疗大模型:正式开源并登顶权威医疗榜单

蚂蚁·安诊儿医疗大模型:正式开源并登顶权威医疗榜单

医疗健康领域的AI应用迎来「最强大脑」!蚂蚁·安诊儿医疗大模型正式开源,专业能力登顶全球权威榜单。从复杂病例解读到日常健康科普,它能为大众提供专业医生般的解答,也能助力医生更高效精准做临床判断。AI 技术如何让健康守护更简单?快来看看这个最大规模开源医疗模型背后的故事!

来自主题: AI资讯
8476 点击    2026-01-06 10:15