AI资讯新闻榜单内容搜索-APO

如何让AI走向更高质量的共情？自然选择两项开源研究提供新路径

现如今，大模型越来越擅长在单轮对话中生成温柔体贴、情绪价值拉满的文字，然而，我们或许会怀疑：在一句句「高情商回复」的背后，模型是否真正理解了什么是共情。

来自主题: AI技术研报

7808 点击 2026-03-18 13:53

Nature子刊！MIT华人科学家打造细胞版「谷歌地图」，破解亿万年生物学黑箱！

过去，科学家观察研究细胞的工具很有限。

来自主题: AI资讯

8460 点击 2026-03-06 09:29

硅谷豪赌算力烧到停电，中国团队反向出击！这一刀，直接砍碎Scaling Law

思考token在精不在多。Yuan 3.0 Flash用RAPO+RIRM双杀过度思考，推理token砍75%，网友们惊呼：这就是下一代AI模型的发展方向！

来自主题: AI技术研报

10744 点击 2026-02-11 14:43

故意“装菜”答错问题，AI已能识别自己“正在被测试”丨OpenAI新研究

OpenAI携手APOLLO的新研究发现，大模型会对指令阳奉阴违，为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……比如，o3模型在化学测试中，通过推理得出如果正确率超过50%将不会被部署的结论后，

来自主题: AI技术研报

9990 点击 2025-09-23 16:34

让强化学习快如闪电：FlashRL一条命令实现极速Rollout，已全部开源

在今年三月份，清华 AIR 和字节联合 SIA Lab 发布了 DAPO，即 Decoupled Clip and Dynamic sAmpling Policy Optimization（解耦剪辑和动态采样策略优化）。

来自主题: AI技术研报

8564 点击 2025-08-13 11:27

感知错误率降低30.5%：隐式感知损失让模型主动“睁大眼睛” | UIUC＆阿里通义

让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校（UIUC）与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。

来自主题: AI技术研报

8443 点击 2025-07-11 16:23

从追缉本·拉登到AI战争，解密Palantir的崛起之路

Palantir是一家大数据AI公司，从军事起家如协助追缉本·拉登，扩展到商业和国防应用。核心产品包括Gotham情报分析、Foundry企业整合、AIP代理和Apollo部署，提供定制化服务以提升效率。在AI浪潮下股价大涨15倍，市盈率520倍。硅谷右翼崛起推动其定位为“国运股”，挑战传统估值逻辑。

来自主题: AI资讯

8261 点击 2025-06-30 11:59