港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」
港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」论文第一作者何浩然是香港科技大学博士生,研究方向包括强化学习和基础模型等,研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计
论文第一作者何浩然是香港科技大学博士生,研究方向包括强化学习和基础模型等,研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计
还在忍受方言听不懂、跨省业务推进难?联通直接放出「云+AI」大招,把这些通信顽疾一锅端!本文为你揭秘,运营商如何用科技智慧破局,打开信息「黑匣子」,让效率飙升!
具身智能赛道的想象力,远比眼前的机器人要辽阔。
生数科技前产品副总裁廖谦创业了。在此之前,他还先后担任过字节剪映与火山引擎前AIGC产品负责人。8月底从老东家离职后,公司成立仅半个月,就已经拿下了硅谷美元基金HT Investment与BV百度风投的数百万美元投资。
“AI 将彻底改变游戏开发。”——类似的宣言,这几年几乎天天都能在社交媒体上看到。但最近,一位科技投资人用亲身示范告诉我们:AI 生成游戏的“未来”,可能还离“惊艳”很远,甚至更接近“恐怖谷”。
今天要讲的On-Policy Distillation(同策略/在线策略蒸馏)。这是一个Thinking Machines整的新活,这个新策略既有强化学习等在线策略方法的相关性和可靠性;又具备离线策略(Off-policy)方法的数据效率。
2025西岸国际科技消费嘉年华(WTCC)模速路演日,九方智投控股旗下科技公司九方智擎作为金融科技代表亮相,分享AI+投顾从工具到“有温度的投资伙伴”的产业升级。
彭超曾在华为印度、阿里任消费硬件业务1号位;联合创始人齐炜祯为Multi-token架构开创学者,被Deepseek、Qwen引入预训练方法。
出品 / 新浪科技(ID:techsina) 作者 / 郑峻 Meta AI业务大地震!新主管上任三个月后,挥起裁员大刀,基础研究部门遭受重创,连明星大牛研究员都不幸失业。扎克伯格这是急功近利,自毁长
近两三年,在技术演进下,“AI虚拟细胞”成为备受关注的热门赛道。AI虚拟细胞平台公司「百曜科技」近日完成数千万元天使轮融资,由峰瑞资本领投,顺禧资本跟投,明德资本担任独家财务顾问。