
罗永浩:新AI产品3个月后见,梁文峰建议我“靠嘴吃饭”
罗永浩:新AI产品3个月后见,梁文峰建议我“靠嘴吃饭”罗永浩透露,自己的团队曾试了美国大量AI邮件工具项目,虽然他们客户端和网页版都接入了AI,但都做得很差,而在中国也很少有人做这个方向。此外,在DeepSeek爆火之前,罗永浩还见了其创始人梁文峰,梁文峰给他介绍了很多AI圈的资源,也解答了团队遇到的技术问题。
罗永浩透露,自己的团队曾试了美国大量AI邮件工具项目,虽然他们客户端和网页版都接入了AI,但都做得很差,而在中国也很少有人做这个方向。此外,在DeepSeek爆火之前,罗永浩还见了其创始人梁文峰,梁文峰给他介绍了很多AI圈的资源,也解答了团队遇到的技术问题。
强化学习可以提升LLM推理吗?英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型,媲美Deepseek-R1-7B,数学、代码等全面泛化。
大语言模型(LLMs)在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调(RLFT),通过自我生成的推理链(CoT)优化模型,提升决策能力。实验表明,RLFT可增加模型探索性,缩小知行差距,但探索策略仍有改进空间。
自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。
DeepSeek兄弟!事态紧急,生死攸关! 我来自大唐盛世,身为朝廷「荔枝史」,刚接到圣旨——皇上龙颜大悦,突然想尝尝岭南的新鲜荔枝!这可是天大的恩宠,也是致命的考验!
微信和游戏业务正在为腾讯AI应用战略的实施提供更广阔的战略纵深。抓住DeepSeek带来的契机扭转AI领域的竞争态势之后,腾讯围绕AI应用的布局正在快速深化。
42,这个来自《银河系漫游指南》的「生命、宇宙以及一切问题的终极答案」已经成为一个尽人皆知的数字梗,似乎就连 AI 也格外偏好这个数字。
好夸张…… 参赛大模型全军覆没,通通0分。 谢赛宁等人出题,直接把o3、Gemini-2.5-pro、Claude-3.7、DeepSeek-R1一众模型全都难倒。
今年 4 月,围绕“华为芯片效率是否超越国际主流 AI 芯片和架构”的问题,网上曾引发一场激烈争论。
最近,我的AI交流群和别的一些AI群都炸锅了,话题的焦点是MiniMax-M1