AI资讯新闻榜单内容搜索-模型训练

Transformer作者初创公司最新成果：开源新框架突破进化计算瓶颈，样本效率暴涨数十倍

Transformer作者Llion Jones带着自己的初创公司Sakana AI，又来搞事情了。（doge）最新推出的开源框架——ShinkaEvolve，可以让LLM在自己写代码优化自己的同时，还能同时兼顾效率，be like为进化计算装上一个“加速引擎”。

来自主题: AI技术研报

8648 点击 2025-09-29 11:01

普通人也能「炼丹」了？我拿小红书文案喂给openPangu-Embedded-1B的模型，几步就把它变成了专属文案大师！

我想聊个反向操作：咱们普通人，如何用有限的资源，轻松驯服一个 AI 模型，让它变成我们专属的垂直领域小能手？主角，就是最近华为刚刚开源的一个大小仅为 1B 的模型 openPangu-Embedded-1B，它不仅全面领先同规格模型，甚至与更大规模的 Qwen3-1.7B 也难分伯仲。

来自主题: AI资讯

9517 点击 2025-09-29 10:57

攻克大模型「表格盲区」！ST-Raptor框架发布，实现复杂半结构化表格的精准理解与信息抽取

来自上海交通大学计算机学院、西蒙菲莎大学、清华大学、中国人民大学的合作团队，带来基于树形框架的智能表格问答系统（ST-Raptor），其不仅能精准捕捉表格中的复杂布局，还能自动生成表格操作指令，并一步步执行这些操作流程，最终准确回答用户提出的问题 —— 就像给 Excel 装上了一个会思考的 “AI 大脑”。

来自主题: AI技术研报

7953 点击 2025-09-29 10:36

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局（包括车道线和 3D 框），就可以生成逼真的图像和点云视频。

来自主题: AI技术研报

6998 点击 2025-09-29 10:28

陈丹琦新作：大模型强化学习的第三条路，8B小模型超越GPT-4o

结合RLHF+RLVR，8B小模型就能超越GPT-4o、媲美Claude-3.7-Sonnet。陈丹琦新作来了。他们提出了一个结合RLHF和RLVR优点的方法，RLMT（Reinforcement Learning with Model-rewarded Thinking，基于模型奖励思维的强化学习）。

来自主题: AI技术研报

9637 点击 2025-09-28 23:03

Shopee OnePiece：业内首个融合上下文工程、隐式推理和多目标训练策略的生成式搜推建模框架

2025 年，生成式推荐（Generative Recommender，GR）的发展如火如荼，其背后主要的驱动力源自大语言模型（LLM）那诱人的 scaling law 和通用建模能力（general-purpose modeling），将这种能力迁移至搜推广工业级系统大概是这两年每一个从业者孜孜不倦的追求。

来自主题: AI资讯

7223 点击 2025-09-28 18:14

DeepMind率先提出CoF：视频模型有自己的思维链

CoT思维链的下一步是什么？ DeepMind提出帧链CoF（chain-of-frames）。

来自主题: AI技术研报

6748 点击 2025-09-28 18:04

让大模型合成检查器：UIUC团队挖出Linux内核90余个长期潜伏漏洞

最近的报道指出，OpenAI 的 o3 模型已经在 Linux 内核中发现了一个零日漏洞；而本文的 KNighter 更进一步，通过自动生成静态分析检查器，把模型的洞察沉淀为工程可用、用户可见的逻辑规则，实现了规模化的软件漏铜、缺陷挖掘。

来自主题: AI技术研报

7587 点击 2025-09-28 16:59

RLHF与RLVR全都要，陈丹琦团队最新力作将推理能力拓展到通用智能

一个月前，我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab 的消息。有些爆料认为她在休假一年后，会离开普林斯顿，全职加入 Thinking Machines Lab。

来自主题: AI技术研报

7407 点击 2025-09-28 16:46

翁荔陈丹琦加盟的840亿AI公司，公开第二篇论文

明星创业公司Thinking Machines，第二篇研究论文热乎出炉！公司创始人、OpenAI前CTO Mira Murati依旧亲自站台，翁荔等一众大佬也纷纷转发支持：论文主题为“Modular Manifolds”，通过让整个网络的不同层/模块在统一框架下进行约束和优化，来提升训练的稳定性和效率。

来自主题: AI技术研报

9686 点击 2025-09-28 09:54