重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练
重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练过去几年,随着基于人类偏好的强化学习(Reinforcement Learning from Human Feedback,RLHF)的兴起,强化学习(Reinforcement Learning,RL)已成为大语言模型(Large Language Model,LLM)后训练阶段的关键技术。
过去几年,随着基于人类偏好的强化学习(Reinforcement Learning from Human Feedback,RLHF)的兴起,强化学习(Reinforcement Learning,RL)已成为大语言模型(Large Language Model,LLM)后训练阶段的关键技术。
TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能,为用户带来逼真的虚拟交互体验。
近日,一款名为Rosebud的AI日记应用获得了600万美元的种子轮融资,由Bessemer Venture Partners领投,Fuel Captial、Initialized Capital、766、Avenir 及知名投资人 Tim Ferriss 等跟投。据官方透露,Rosebud自推出以来已经累计了5亿字书写、8000+用户,使用时长超过3000万分钟。
你有没有想过,网站开发这件事可能彻底变了?不再需要花几周时间学习复杂工具,不用写代码,甚至不需要任何设计经验。只要一句话描述,几分钟后你就能得到一个专业级网站。这听起来像科幻,但 Readdy.ai 已经让它成为现实。更让人震惊的是,这个产品发布4个月已接近500万美元ARR。
本文根据极客公园创始人&总裁张鹏在 Founder Park AGI Playground 2025 上的演讲整理而成。
法律工作自动化初创公司Harvey AI 向《财富》透露,已在 E 轮融资中筹集 3 亿美元,估值达到 50 亿美元。
如果你有一个想法,你现在不缺程序员了。
想搞一门副业,却卡在想法一团浆糊?全网首个交互版Deep Research悄然上线,化身AI最强辅助,让零散灵感秒变超硬核行动方案。
由数据分析领域资深人士联合创立的初创公司 Typedef, 今日结束隐匿运营状态 ,宣布获得由 Pear VC 领投的 550 万美元种子轮融资。
6月20日-22日,华为开发者大会2025(HDC 2025)于东莞举办,正式发布鸿蒙HarmonyOS 6操作系统及多项创新技术,来自全球各地的开发者、行业专家和合作伙伴齐聚现场,其中不乏AI+生物、医疗领域企业。