AI资讯新闻榜单内容搜索-模型

浅谈一下RLVR&SFT分别对模型显性知识学习和隐参数空间结构扰动背后的一些猜想

最近不论是在学术圈还是产业实践中，对于RLVR和传统SFT之间的区别与联系，以及RL本身基于奖励建模反馈机制并结合不同的策略优化算法过程中对模型显性知识的学习和隐参数空间的变化的讨论热度一直很高。

来自主题: AI技术研报

6762 点击 2025-11-26 09:12

UIUC将人类和LLM的思维差异总结为28个认知要素，这条元Prompt让LLM性能暴涨60%。

如果告诉你，仅仅改变提示词（Prompt）的结构，就能让大模型在复杂推理任务上的表现暴涨 60%，你相信吗？

来自主题: AI技术研报

9969 点击 2025-11-26 09:11

从推荐算法优化到AI4S、Pico和大模型，杨震原长文揭秘字节跳动的技术探索

大家好，很高兴在字节技术奖学金，这样一个场合见到大家。我自己是一个技术爱好者，2014年我加入字节跳动。从最初负责搭建新的推荐系统开始，到现在已经有快12年了。这些年来，也一路参与了字节很多的技术探索。

来自主题: AI资讯

8424 点击 2025-11-26 09:05

与Banana Pro过过招，国产Libcom图像合成工作台开启Labubu漫游记

2025 年，AIGC 热度再冲新高：从社交头像、电商海报到影视分镜，AI 生成内容已全面渗透日常创作。在这股浪潮中，Nano Banana、Qwen Edit 等通用图像编辑大模型功能强大，涵盖了广泛的图像编辑场景。特别是最新爆火的 Nano Banana Pro 能将文字指令转化为高精度图像，精准呈现复杂场景。但是上述图像编辑大模型在一些细分领域的表现仍有不足，并且用于简单任务性价比不高。

来自主题: AI资讯

8534 点击 2025-11-25 17:18

别装了，AI巨头们！谁在卡脖子，谁在割韭菜？这张图一目了然

卡内基梅隆揭秘美国AI产业链：谁能扼住AI的喉咙？OpenAI和迪士尼如何捆绑，AMD、软银和英伟达究竟在下哪盘棋？卡内基梅隆大学刚刚抛出一颗「产业核弹」：首个系统刻画数据、算力、模型、资本乃至人才流向的AI供应链数据集。

来自主题: AI技术研报

9014 点击 2025-11-25 16:35

念首诗，就能让AI教你造核弹！Gemini 100%中招

最新研究发现，只要把恶意指令写成一首诗，就能让Gemini和DeepSeek等顶尖模型突破安全限制。这项针对25个主流模型的测试显示，面对「诗歌攻击」，百亿美金堆出来的安全护栏瞬间失效，部分模型的防御成功率直接归零。最讽刺的是，由于小模型「读不懂」诗里的隐喻反而幸免于难，而「有文化」的大模型却因为过度解读而全线破防。

来自主题: AI资讯

8832 点击 2025-11-25 15:31