
刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4
刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4在开源模型领域,DeepSeek 又带来了惊喜。
在开源模型领域,DeepSeek 又带来了惊喜。
AI迈入经验时代,2025 年 6 月 6 日,第七届北京智源大会在北京正式开幕,强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以“欢迎来到经验时代”为题发表主旨演讲
推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了benchmark上限
未中顶会,没有发表arXiv,一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至,它可能被用于训练下一代超级模型GPT-5。
arp 成立于 2021 年,旨在通过其技术赋能的托运商、承运商和仓库网络,帮助企业优化货运供应链并降低成本。
在人工智能领域,ChatGPT 作为 OpenAI 推出的聊天机器人一直以其强大的文字生成能力受到关注。然而近期一项独特的实验显示,当 ChatGPT 与一款诞生于 1977 年(48 年前)的经典游戏机雅达利 2600(Atari 2600)对弈国际象棋时,却遭遇了意想不到的失败。
圈粉无数的Arc浏览器,在AI加持下华丽丽“变身”了——
在计算机科学领域,有一句英文谚语——「Garbage in, Garbage out」。
随着生成式人工智能技术的快速发展,大语言模型 (LLM) 正逐步成为推动智能设备升级的核心力量。乐鑫科技携手火山引擎扣子大模型团队,共同推出智能 AI 开发套件 —— EchoEar(喵伴)。该套件以端到端开发为核心理念,构建起从硬件接入、智能体构建到生态联动的一站式开发流程,为开发者提供了一条高效、开放、具备可复制性的落地路径。
您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤清单——它更像是AI能否在工业环境中真正"上岗"的终极考验。