AI资讯新闻榜单内容搜索-框架

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

LMM在人类反馈下表现如何？新加坡国立大学华人团队提出InterFeedback框架，结果显示，最先进的LMM通过人类反馈纠正结果的比例不到50%！

来自主题: AI技术研报

8353 点击 2025-03-17 09:32

CVPR 2025：无需物理引擎，一个模型搞定图像渲染与分解

无需物理引擎，单个模型也能实现“渲染+逆渲染”了！

来自主题: AI技术研报

6459 点击 2025-03-17 08:53

港大90后开源，OpenAI 2万刀博士级AI智能体平替！自主研究媲美顶会论文

AI-Researcher是一个开源的科研智能体框架，它能从文献搜集一路包办至论文撰写，彻底改变了科研方式，让科研自动化触手可及。

来自主题: AI技术研报

9465 点击 2025-03-16 15:46

何恺明LeCun联手改造Transformer！9行代码替代归一化层，性能不减还加速

何恺明LeCun联手：Transformer不要归一化了，论文已入选CVPR2025。

来自主题: AI技术研报

11454 点击 2025-03-15 17:12

提出机器人自主学习新范式，深大团队最新顶会论文，刷新6大复杂任务SOTA

让机器人轻松学习复杂技能有新框架了！

来自主题: AI技术研报

7265 点击 2025-03-15 16:05

何恺明LeCun暴击Transformer命门，9行代码砍掉归一化层！性能反而更强了？

Transformer架构迎来历史性突破！刚刚，何恺明LeCun、清华姚班刘壮联手，用9行代码砍掉了Transformer「标配」归一化层，创造了性能不减反增的奇迹。

来自主题: AI技术研报

8407 点击 2025-03-15 14:11

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

8919 点击 2025-03-12 14:53

多步推理碾压GPT-4o，无需训练性能提升10%！斯坦福开源通用框架OctoTools

OctoTools通过标准化工具卡和规划器，帮助LLMs高效完成复杂任务，无需额外训练。在16个任务中表现优异，比其他方法平均准确率高出9.3%，尤其在多步推理和工具使用方面优势明显。

来自主题: AI技术研报

7895 点击 2025-03-12 14:47

90分钟生成10万Token，新框架实现3倍无损加速超长文本生成，支持DeepSeek-R1和QwQ！

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

10234 点击 2025-03-12 13:52

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

12701 点击 2025-03-11 23:53