字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。
近日,一项由北京大学、字节跳动 Seed 团队及香港大学联合进行的研究,提出了一种名为「SWE-Swiss」的完整「配方」,旨在高效训练用于解决软件工程问题的 AI 模型。研究团队推出的 32B 参数模型 SWE-Swiss-32B,在权威基准 SWE-bench Verified 上取得了 60.2% 的准确率,在同尺寸级别中达到了新的 SOTA。
2025年初在硅谷创立 Ouraca Inc.,专注打造新一代“AI native” 的终身学习产品线。首款产品 Aibrary正式版即将上线:是全球首个专为个人成长打造的 Agentic AI,它不仅帮助你获取知识,更陪你思考,激发动机,引导行动,让成长真正发生。通过个性化播客、认知引导与行动建议,Aibrary 将书籍与专家洞见转化为你专属的学习旅程。
4月底我们曾经在《融了3个亿的张月光,就做出了个“AI播客播放器”?》选题中观察过由前妙鸭相机产品负责人张月光开发的AI播客产品ChatPods,当时我们认为,想用AI做成一个泛播客工具/平台比较困难。而最近,又有AI领域的知名从业者离职创业,选择的方向恰恰也是AI播客。
AI社交产品在全球市场表现下滑,如百度月匣被减少投入,字节猫箱等下载量暴跌。日本孤独经济本应推动增长,但Character.AI等产品水土不服;原因包括大模型情感连接缺陷、角色同质化、缺乏创新。行业融资降温、商业变现困难、监管风险凸显;情感需求真实,但产品无法满足,需待技术变革。
MiniMax副总裁、战略投资负责人魏瀚曈已离职,据消息人士透露,魏瀚曈将入职一家投资机构。公开资料显示,魏瀚曈曾在平安、字节跳动、小红书等公司从事战略投资方面工作,2024年5月从小红书离职后,入职MiniMax,并出任战略投资负责人,对外用的是MiniMax副总裁的称谓。其个人实名认证的社交平台显示,在MiniMax最后离开的时间是今年7月。
不仅能达IMO银牌水准,更能解决普特南数学竞赛难题,甚至超越顶尖模型o4-mini! 字节发布全新复杂数学解决模型——Seed-Prover。
创业,认知要领先,拼命地执行。 过去两年,字节跳动有不少业务高管离职,选择在AI领域创业。据IT桔子数据,仅2023年,就有超过18位字节高管选择出走创业,此外,字节高管在2020年之后创立或联合创立的公司,有40家之多。
你刷的每一条短视频,背后都隐藏着推荐算法的迭代与革新。 作为最新成果,字节跳动的算法团队提出的全新推荐排序模型架构RankMixer,在兼顾算力利用率的同时,实现了模型效果的可扩展性。
用扩散模型写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。