AI技术研报-这里有最前沿的人工智能技术解读

清华耶鲁推理模型新范式：动态推理实现高效测试时扩展，大大节省Token消耗

推理性能提升的同时，还大大减少Token消耗！

来自主题: AI技术研报

6964 点击 2025-04-08 09:25

首个个性化对齐大模型问世！可精准识别用户内在动机和偏好，还有百万用户画像开源数据集 | 蚂蚁&人大

如何让大模型更懂「人」？

来自主题: AI技术研报

5939 点击 2025-04-08 09:07

用思维干预直接干预LRM内部推理，三种方式实现DeepSeek-R1有效控制。 | 最新

推理增强型大语言模型LRM（如OpenAI的o1、DeepSeek R1和Google的Flash Thinking）通过在生成最终答案前显式生成中间推理步骤，在复杂问题解决方面展现了卓越性能。然而，对这类模型的控制仍主要依赖于传统的输入级操作，如提示工程（Prompt Engineering）等方法，而你可能已经发现这些方法存在局限性。

来自主题: AI技术研报

1854 点击 2025-04-08 08:50

万字长文！From 2015：AI 革命---通往超级智能之路 (上）

想象一下，你坐着时光机回到1750年——那个时代没有电，远程通信就意味着要么大声呼喊，要么朝天鸣炮，所有的交通工具都靠消耗饲料来运行。你到了那里，找一个1750年的人

来自主题: AI技术研报

8928 点击 2025-04-08 08:44

如何0代码将存量 API 适配 MCP 协议？

Nacos 可以帮助应用快速把业务已有的 API 接口，转换成 MCP 协议接口，结合 Higress AI 网关，实现 MCP 协议和存量协议的转换。其中，Nacos 提供存量的服务管理和动态的服务信息定义，帮助业务在存量接口不改动的情况下，通过 Nacos 的服务管理动态生效 Higress 网关所生成的 MCP Server 协议。

来自主题: AI技术研报

7966 点击 2025-04-07 21:15

AI菩萨OpenRouter连发两大招，免费Quasar+全模型联网！

AI菩萨OpenRouter连发两大招宣布推出两项重大更新。

来自主题: AI技术研报

9501 点击 2025-04-07 17:27

反向传播、前向传播都不要，这种无梯度学习方法是Hinton想要的吗？

Noprop：没有反向传播或前向传播，也能训练神经网络。

来自主题: AI技术研报

9406 点击 2025-04-07 16:40

为给博客改版，花3小时写了段Prompt，不仅结构内容可控，且效果出众。附实战经验分享和完整提示词

最近计划用AI编程重写自己的网站，后台功能已开发差不多。

来自主题: AI技术研报

4923 点击 2025-04-07 16:32

中科大ICLR2025：特定领域仅用5%训练数据，知识准确率提升14%

让大语言模型更懂特定领域知识，有新招了！

来自主题: AI技术研报

8416 点击 2025-04-07 15:26

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

LeCun谢赛宁等研究人员通过新模型Web-SSL验证了SSL在多模态任务中的潜力，证明其在扩展模型和数据规模后，能媲美甚至超越CLIP。这项研究为无语言监督的视觉预训练开辟新方向，并计划开源模型以推动社区探索。

来自主题: AI技术研报

6973 点击 2025-04-07 15:09

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

基于当前观察，预测铰链物体的的运动，尤其是 part-level 级别的运动，是实现世界模型的关键一步。

来自主题: AI技术研报

8298 点击 2025-04-07 15:03

LLM幻觉，竟因知识「以大欺小」！华人团队祭出对数线性定律与CoDA策略

来自UIUC等大学的华人团队，从LLM的基础机制出发，揭示、预测并减少幻觉！通过实验，研究人员揭示了LLM的知识如何相互影响，总结了幻觉的对数线性定律。更可预测、更可控的语言模型正在成为现实。

来自主题: AI技术研报

7023 点击 2025-04-07 14:55

MoCha：开启自动化多轮对话电影生成新时代

近年来，视频生成技术在动作真实性方面取得了显著进展，但在角色驱动的叙事生成这一关键任务上仍存在不足，限制了其在自动化影视制作与动画创作中的应用潜力。

来自主题: AI技术研报

6359 点击 2025-04-07 14:48

全网都在猜，这些视频是不是字节AI生成的：该跟动捕说再见了？

动作捕捉，刚刚发生了革命。

来自主题: AI技术研报

8179 点击 2025-04-07 09:18

GPU 维修那些事： H100 哪里容易坏？以 Llama3 训练大模型为例

根据去年2024年7月28日Meta公司在训练大模型（Llama 3）时使用“16384 个英伟达H100 GPU 集群”的经验，该显卡在高负载、大规模集群运行环境下容易出现以下故障点：

来自主题: AI技术研报

9156 点击 2025-04-07 09:17

开源深度搜索ODS：释放推理Agent的力量，比GPT-4o Search Preview的准确率提高9.7%

当前搜索AI市场面临着一个显著的断层：Perplexity的Sonar Reasoning Pro和OpenAI的GPT-4o Search Preview等专有解决方案与开源替代品之间存在巨大差距。这些封闭式系统虽然表现优异，但却限制了透明度、创新和创业自由。作为一名正在开发Agent产品的工程师，你是否曾经渴望拥有一个功能强大且完全开放的搜索框架？

来自主题: AI技术研报

7002 点击 2025-04-07 09:06