AI资讯新闻榜单内容搜索-io

DeepSeek V4爆春节登场！四大杀招突袭全球编程王座，Claude危

Information爆料称，DeepSeek将计划在2月中旬，也正是春节前后，正式发布下一代V4模型。据称，DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。

来自主题: AI资讯

8998 点击 2026-01-10 11:23

CaveAgent让LLM学会了“跑代码”，你能把Agent变成Jupyter里的“老司机”

CaveAgent的核心思想很简单：与其让LLM费力地去“读”数据的文本快照，不如给它一个如果不手动重启、变量就永远“活着”的 Jupyter Kernel。这项由香港科技大学（HKUST）领衔的研究，为我们展示了一种“Code as Action, State as Memory”的全新可能性。它解决了所有开发过复杂Agent的工程师最头疼的多轮对话中的“失忆”与“漂移”问题。

来自主题: AI技术研报

8352 点击 2026-01-09 14:34

“先抖音后剪映” 不再成立，OiiOii 闹闹聊 AI 时代的创作工具和内容社区丨100 个 AI 创业者

Agent 的工具可以 “以终为始”。

来自主题: AI资讯

6014 点击 2026-01-08 09:25

注意力机制大变革？Bengio团队找到了一种超越Transformer的硬件对齐方案

Transformer 已经改变了世界，但也并非完美，依然还是有竞争者，比如线性递归（Linear Recurrences）或状态空间模型（SSM）。这些新方法希望能够在保持模型质量的同时显著提升计算性能和效率。

来自主题: AI技术研报

8733 点击 2026-01-07 17:22

推理之父走了！OpenAI七年元老离职：有些研究这里没法做

新年第一弹，OpenAI研发副总裁Jerry Tworek官宣离职，这位七年老兵给出的理由让人细思恐极：想做在OpenAI做不了的研究。从Dario Amodei出走创立Anthropic，到Ilya政变后离开，再到安全团队负责人摔门而出——OpenAI的核心大脑们正在以惊人的速度流失。

来自主题: AI资讯

9628 点击 2026-01-06 16:49

真实音频场景，大模型集体挂科！首个原生语音基准MultiChallenge

文本领域的大模型满分选手，换成语音就集体挂科？大模型引以为傲的多轮对话逻辑，在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge，直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示，强如Gemini 3 Pro在真实场景下的通过率也仅过半数，而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报

9367 点击 2026-01-06 16:46

8亿部Gemini设备在路上！三星AI“全家桶”来了：冰箱AI管吃喝，电视AI教你做饭

今日，三星在CES 2026“First Look”活动上发布了AI家居“全家桶”，三星将其比喻为“AI生活伴侣”，分为娱乐伴侣、家庭伴侣、健康伴侣三部分。娱乐伴侣方面，三星发布了130英寸Micro RGB电视、电视AI技术Vision AI Companion（VAC）、wifi音响Music Studio 5和Music Studio 7

来自主题: AI资讯

10137 点击 2026-01-05 16:48