AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?

谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?

谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?

当整个科技圈都在为「谷歌黑魔法」集体高潮时,真相恐给了所有人一记耳光。那套被捧上神坛的「并行验证循环」,不过是社交网络上AI生成的「赛博跳大神」。

来自主题: AI技术研报
9258 点击    2026-01-08 08:44
prompt比拖拉拽更适合新手做复杂agent!LangSmith+Milvus教程

prompt比拖拉拽更适合新手做复杂agent!LangSmith+Milvus教程

prompt比拖拉拽更适合新手做复杂agent!LangSmith+Milvus教程

过去一段时间,我们介绍了很多小白入门级的agent框架,也介绍了包括langchain在内的很多专业级agent搭建框架。

来自主题: AI技术研报
8347 点击    2026-01-07 17:23
一些大模型,高分低能,为何?

一些大模型,高分低能,为何?

一些大模型,高分低能,为何?

这篇文章的思路来自 Philipp Schmid,由 minghao 推荐 https://www.philschmid.de/agent-harness-2026

来自主题: AI资讯
9075 点击    2026-01-07 16:01
别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

别被室内基准高分骗了:大模型是在推理空间,还是在「背答案」?

2025 年,随着李飞飞等学者将 “空间智能”(Spatial Intelligence)推向聚光灯下,这一领域迅速成为了大模型竞逐的新高地。通用大模型和各类专家模型纷纷在诸多室内空间推理基准上刷新 SOTA,似乎 AI 在训练中已经更好地读懂了三维空间。

来自主题: AI技术研报
8128 点击    2026-01-07 09:36
真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

真实音频场景,大模型集体挂科!首个原生语音基准MultiChallenge

文本领域的大模型满分选手,换成语音就集体挂科?大模型引以为傲的多轮对话逻辑,在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge,直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示,强如Gemini 3 Pro在真实场景下的通过率也仅过半数,而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报
9273 点击    2026-01-06 16:46
两次拿到陆奇投资,张浩然这次想用 Agencize AI 干掉所有工作流 Agent

两次拿到陆奇投资,张浩然这次想用 Agencize AI 干掉所有工作流 Agent

两次拿到陆奇投资,张浩然这次想用 Agencize AI 干掉所有工作流 Agent

「我们想解决的不是 『做 AI 工作流』,是『根本不需要有工作流』。所有要求用户『预先构建工作流』的 Agent 都是错的。」在 Agencize AI 产品发布之前,我们和张浩然聊了聊他对于生产力工具和工作流的看法,以及 Agencize AI 的真正竞争力。

来自主题: AI资讯
9167 点击    2026-01-06 16:26
为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

您可能已经感受到了,从2025年开始到如今,全世界都在谈论Agentic AI或Agent(代理式AI)。从董事会到咨询公司,从更高级别的战略到街头巷尾,仿佛只要接入了大模型(LLM),所有的业务流程就能自动运转,效率就能翻倍。

来自主题: AI技术研报
10303 点击    2026-01-06 16:18
Claude Code 一小时「复刻」谷歌一年成果,那一年能读完五年半的博士吗?

Claude Code 一小时「复刻」谷歌一年成果,那一年能读完五年半的博士吗?

Claude Code 一小时「复刻」谷歌一年成果,那一年能读完五年半的博士吗?

近日,X 知名博主、Hyperbolic 联创 & CEO Yuchen Jin 发帖称,如果在他读博士的时候就有 Claude Code、Gemini 和 ChatGPT 等各类 AI 工具出现,那么也许只要一年就能毕业,而不是用了 5.5 年。

来自主题: AI资讯
7648 点击    2026-01-06 10:16
蚂蚁·安诊儿医疗大模型:正式开源并登顶权威医疗榜单

蚂蚁·安诊儿医疗大模型:正式开源并登顶权威医疗榜单

蚂蚁·安诊儿医疗大模型:正式开源并登顶权威医疗榜单

医疗健康领域的AI应用迎来「最强大脑」!蚂蚁·安诊儿医疗大模型正式开源,专业能力登顶全球权威榜单。从复杂病例解读到日常健康科普,它能为大众提供专业医生般的解答,也能助力医生更高效精准做临床判断。AI 技术如何让健康守护更简单?快来看看这个最大规模开源医疗模型背后的故事!

来自主题: AI资讯
8757 点击    2026-01-06 10:15