AI资讯新闻榜单内容搜索-上海AI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 上海AI
过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

随着 OpenAI o1 和 DeepSeek R1 的爆火,大语言模型(LLM)的推理能力增强和测试时扩展(TTS)受到广泛关注。然而,在复杂推理问题中,如何精准评估模型每一步回答的质量,仍然是一个亟待解决的难题。传统的过程奖励模型(PRM)虽能验证推理步骤,但受限于标量评分机制,难以捕捉深层逻辑错误,且其判别式建模方式限制了测试时的拓展能力。

来自主题: AI技术研报
7131 点击    2025-04-14 14:39
250多篇论文,上海AI Lab综述推理大模型高效思考

250多篇论文,上海AI Lab综述推理大模型高效思考

250多篇论文,上海AI Lab综述推理大模型高效思考

最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。

来自主题: AI技术研报
7426 点击    2025-04-05 14:45
微软关闭上海AI实验室!硅谷巨头们“投奔”印度

微软关闭上海AI实验室!硅谷巨头们“投奔”印度

微软关闭上海AI实验室!硅谷巨头们“投奔”印度

据报道,微软已关闭了位于上海张江高科技园区的人工智能和物联网实验室,这标志着这家美国科技巨头进一步撤离中国市场。有媒体近日探访时发现,该实验室已无人使用,内部一片漆黑,logo 被拆除,办公设备也已清空。附近的工作人员表示,该实验室可能是在 1 月或 2 月关闭的。

来自主题: AI资讯
8165 点击    2025-04-01 16:39
上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了

回顾 AGI 的爆发,从最初的 pre-training (model/data) scaling,到 post-training (SFT/RLHF) scaling,再到 reasoning (RL) scaling,找到正确的 scaling 维度始终是问题的本质。

来自主题: AI技术研报
4198 点击    2025-03-06 09:46