AI资讯新闻榜单内容搜索-A

ICLR 2025 | 机器人安灯泡、切东西都能拿捏，可操控轨迹跟踪的DexTrack来了

现实世界的机器人距离科幻小说里的机器人世界还有多远？通用灵巧操控何时才能实现？朝着这一伟大的目标，研究通用灵巧操控轨迹跟踪的 DexTrack 便应用而生。

来自主题: AI技术研报

9730 点击 2025-03-02 15:29

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

10245 点击 2025-03-02 15:14

a16z：从Prompt到Product，AI驱动的网页应用搭建工具正在兴起

从本质上讲，LLM会根据用户从UI的输入生成代码示例。然后，生成的代码会通过中间件逻辑进行处理，根据逻辑跟踪文件、代码更改和第三方API调用。

来自主题: AI技术研报

10000 点击 2025-03-02 14:16

微软原WizardLM团队：代码大模型WarriorCoder，性能新SOTA

近年来，大型语言模型（LLMs）在代码相关的任务上展现了惊人的表现，各种代码大模型层出不穷。这些成功的案例表明，在大规模代码数据上进行预训练可以显著提升模型的核心编程能力。

来自主题: AI技术研报

10548 点击 2025-03-02 14:13

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。

来自主题: AI技术研报

8546 点击 2025-03-02 14:04

a16z：原生AI产品与业务外包模式存在根本性冲突

BPO服务商往往处理周期漫长；因缺乏相关背景信息和权限，某些任务难以保质完成——终端客户的体验低效且充满挫败感。

来自主题: AI资讯

8804 点击 2025-03-02 13:44

深度｜谁正在AI视频上，超越OpenAI 和Google？

这家初创公司希望让大公司争夺大众市场,而自己专注于吸引行业专业人士,并与 Lionsgate 达成一笔里程碑式的交易。

来自主题: AI资讯

9225 点击 2025-03-02 13:32

MIT三人团队：用Transformer解决经验贝叶斯问题，比经典方法快100倍

Transformer 很成功，更一般而言，我们甚至可以将（仅编码器）Transformer 视为学习可交换数据的通用引擎。由于大多数经典的统计学任务都是基于独立同分布（iid）采用假设构建的，因此很自然可以尝试将 Transformer 用于它们。

来自主题: AI技术研报

7269 点击 2025-03-02 13:22

Claude 3.7 sonnet系统提示词的哲学

这份提示词有很多哲学性思考，很多表达让我看到背后的设计者把claude当成一个人去设计。　我猜，应该是Amanda Askell（Anthropic负责alignment和character design，是学哲学的一位女生，也是我的榜样) 主要设计的。　

来自主题: AI技术研报

9467 点击 2025-03-02 10:22

周末吃瓜！硅基流动和潞晨科技两家创始人公开互怼：你长期黑我，你抄袭

大概从三四个小时前开始，两家大模型公司潞晨科技创始人尤洋和硅基流动创始人袁进辉，在社交平台公开互怼。先是尤洋在知乎对袁进辉发难，发文《坑人的硅基流动》，尤洋称本来不想发这些东西，但是硅基流动的袁进辉老师频繁在朋友圈里阴阳他。"这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我，他也在那里煽风点火。"

来自主题: AI资讯

9982 点击 2025-03-02 09:44