AI资讯新闻榜单内容搜索-7

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2，他们第一个原生多模态向量模型。文本、图像、视频、音频、文档，全部映射到同一个 3072 维向量空间。这是 Omni Embedding（全模态向量模型）的大趋势：一个架构吃下所有模态，从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5，大家都在往这个方向收敛。

来自主题: AI技术研报

5431 点击 2026-03-16 15:06

AI读不懂文档结构？计算所重构Agentic RAG文档推理能力

DeepRead让AI像人一样阅读文档：利用OCR识别章节结构，先精准定位相关段落，再完整读取上下文，避免碎片化检索。实验显示，其长文档问答准确率提升17%，能自动跳过冗余信息，精准提取财报、论文等复杂内容，无需额外知识图谱，轻量高效。

来自主题: AI资讯

8258 点击 2026-03-16 14:26

OpenAI开除内鬼！拿着改变世界的机密去赌博，一夜狂赚几十万

OpenAI刚刚开除了一名员工，原因令人瞠目：此人利用公司核心机密，在Polymarket等预测市场上疯狂下注牟利。更炸裂的是，调查发现这绝非个例——过去一年多，60个神秘钱包做出了77次精准到离谱的「内幕押注」。

来自主题: AI资讯

8087 点击 2026-03-16 10:41

劝视频博主别拿龙虾起号，7×24小时全自动，碳基生物真卷不过

起猛了，现在龙虾也能做视频了？？？

来自主题: AI资讯

8671 点击 2026-03-12 14:13

腾讯上线桌面端龙虾WorkBuddy：一款免费用的桌面Agent办公助手

就在前两天，腾讯一下发布了WorkBuddy以及Qclaw两款龙虾产品，市值直接暴涨7%。目前，WorkBuddy现在已经可以下载使用了，而Qclaw还在内测当中，暂时还没有对外开放。

来自主题: AI资讯

9366 点击 2026-03-12 09:33

视频生成太慢？英伟达、谢赛宁等发布TMD框架，实现70倍加速

近年来，大规模视频扩散模型在视频生成领域取得了显著进展。然而，采样效率低下仍然是这类模型的核心瓶颈。

来自主题: AI技术研报

8919 点击 2026-03-11 15:05

20亿砸向00后创业机器人公司！估值一年暴涨7倍，国家级资本重仓

具身智能的胜负手，可能并不在机器人本身。

来自主题: AI资讯

9326 点击 2026-03-11 15:05

我用Claude code开发了一个微信小程序：实测78个skills，这5个组合最香

朋友们，先问你们个问题：你们的 Claude Code 里装了多少个 skills？

来自主题: AI技术研报

7490 点击 2026-03-11 10:03

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出「ThinkMorph」，主张让文字与图像在统一架构里「原生协作」、「共同演化」，而不是像当下大多数多模态模型那样，看完图像就闭上眼睛，后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型，视觉推理平均提升 34.74%，多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报

6593 点击 2026-03-11 09:22

突发！Anthropic起诉美国政府，指控特朗普“越权封杀”

37位来自OpenAI、谷歌的AI科学家发文声援。

来自主题: AI资讯

8812 点击 2026-03-10 16:17