AI资讯新闻榜单内容搜索-模型

微软BitDistill将LLM压缩到1.58比特：10倍内存节省、2.65倍CPU推理加速

大语言模型（LLM）不仅在推动通用自然语言处理方面发挥了关键作用，更重要的是，它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。尽管 LLM 具有广泛的适用性，但在下游任务中高效部署仍面临重大挑战。

来自主题: AI技术研报

6088 点击 2025-10-21 11:43

解读IDC《中国AI翻译技术评估》报告：大模型带来“技术平权”，新的分水岭在哪？

2025 年 10 月，国际数据公司（International Data Corporation，IDC）发布了《中国 AI 翻译技术评估》报告。这份以“大模型驱动 AI 翻译能力全面换新”为主题的报告指出，大模型技术的全面渗透正在深刻重塑 AI 翻译市场。

来自主题: AI资讯

7286 点击 2025-10-21 10:45

LLM记忆管理终于不用“手把手教”了，新框架让智能体自主管理记忆系统

不再依赖人工设计，让模型真正学会管理记忆。

来自主题: AI技术研报

7771 点击 2025-10-21 10:25

有效的 Context 工程（精读、万字梳理）｜见知录 004

近日刚好得了空闲，在研读 Anthropic 官方技术博客和一些相关论文，主题是「Agent 与 Context 工程」。2025 年 6 月以来，原名为「Prompt Engineering」的提示词工程，在 AI Agent 概念日趋火热的应用潮中，

来自主题: AI技术研报

7267 点击 2025-10-21 10:21

告别「偏科」，UniVid实现视频理解与生成一体化

在视频生成与理解的赛道上，常常见到分头发力的模型：有的专注做视频生成，有的专注做视频理解（如问答、分类、检索等）。而最近，一个开源项目 UniVid，提出了一个「融合」方向：把理解 + 生成融为一体 —— 他们希望用一个统一的模型，兼顾「看懂视频」+「生成视频」的能力。

来自主题: AI技术研报

7701 点击 2025-10-21 10:17

大模型中毒记

那个叫大模型的高手，被下毒了

来自主题: AI资讯

7173 点击 2025-10-21 10:09

RL新思路！复旦用游戏增强VLM通用推理，性能匹敌几何数据

复旦大学NLP实验室研发Game-RL，利用游戏丰富视觉元素和明确规则生成多模态可验证推理数据，通过强化训练提升视觉语言模型的推理能力。创新性地提出Code2Logic方法，系统化合成游戏任务数据，构建GameQA数据集，验证了游戏数据在复杂推理训练中的优势。

来自主题: AI技术研报

8365 点击 2025-10-21 10:05

ICCV 2025 | 扩散模型生成手写体文本行的首次实战，效果惊艳还开源

AI 会写字吗？在写字机器人衍生换代的今天，你或许并不觉得 AI 写字有多么困难。

来自主题: AI技术研报

7057 点击 2025-10-21 09:58

DeepSeek 再开源：发布 3B MoE OCR 模型，视觉压缩高达20倍

刚刚，DeepSeek 推出了全新的视觉文本压缩模型 DeepSeek-OCR。该模型最大的突破在于极高的压缩效率： 20 个节点每天可处理 3300 万页数据，硬件要求仅为 A100-40G。

来自主题: AI资讯

11043 点击 2025-10-20 16:30

MIT成果登Nature正刊：90天，「AI科学家」完成3500次电化学测试

美国麻省理工学院李巨团队在国际顶尖学术期刊Nature上发表了一篇研究论文，展示了一种多模态机器人平台CRESt（Copilot for Real-world Experimental Scientists），通过将多模态模型（融合文本知识、化学成分以及微观结构信息）驱动的材料设计与高通量自动化实验相结合，大幅提升催化剂的研发速度和质量。

来自主题: AI技术研报

7408 点击 2025-10-20 15:36