告别专家依赖,让机器人学会自我参考,仅需200步性能飙升至99.2%
告别专家依赖,让机器人学会自我参考,仅需200步性能飙升至99.2%你是否想过,机器人也能像人一样,从失败中学习,不断自我提升?
你是否想过,机器人也能像人一样,从失败中学习,不断自我提升?
刚刚,Linux 基金会正式宣布推出智能体 AI 基金会(Agentic AI Foundation,简称 AAIF)。据公告披露,AAIF 定位为 AI 智能体(AI agents)相关开源项目的中立托管平台,全球几乎所有科技巨头均已签约成为该基金会成员。Anthropic、OpenAI 与 Block 三家公司作为联合创始成员,将贡献三大开源项目,构成基金会启动初期的支柱。
我一直觉得自己写东西挺随性的,没什么固定套路。 直到被一个 AI 工具打脸。 它让我上传几篇旧稿,几十秒后出来一份报告,告诉我: 你的逗号句号比是 0.778。 你的中位句长是 26 字。 你爱用对比结构。
最近,Prime Intellect正式发布了INTELLECT-3。这是一款拥有106B参数的混合专家(Mixture-of-Experts)模型,基于Prime Intellect的强化学习(RL)技术栈训练。在数学、代码、科学与推理的各类基准测试上,它达成了同规模中最强的成绩,甚至超越了不少更大的前沿模型。
外卖大战压力之下,美团正在打一场AI基建的硬仗。 文|邓咏仪 编辑|苏建勋 杨轩 《智能涌现》从多个信息源独家获悉,前闪极AI合伙人、前字节视觉大模型AI平台负责人潘欣,近期已经加入美团。 潘欣曾任谷
种子轮拿到数百万美元融资、估值近千万,朱啸虎的金沙江创投、高瓴创投和 Classin 共同投资。 Refly.AI 给自己的定位是更适合大众的 Vibe Workflow 产品。 为什么要做 Vibe
宾夕法尼亚大学沃顿商学院(The Wharton School)今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型(如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等),在极高难度的博士级基准测试(GPQA Diamond)上进行了数万次的严谨测试。
刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列:Devstral 2。该系列开源模型包含两个尺寸:Devstral 2 (123B) 和 Devstral Small 2 (24B)。用户目前也可通过官方的 API 免费使用它们。
人工智能初创公司Fal 获得红杉资本和英伟达等投资方的新一轮融资,据知情人士透露,公司估值达到 45 亿美元,较数月前增长两倍。该公司表示,本轮由红杉资本领投的融资规模达1.4亿美元,标志着其年内第三次募资。如此快速的融资节奏反映出投资者对人工智能工具在开发者和企业端日益增长的应用需求充满信心。
具体来说,Open-AutoGLM 由一个手机端智能助手框架 Phone Agent 和一个 9B 大小的模型 AutoGLM-Phone-9B 共同组成。这次开源对行业的影响力,核心来自这次智谱开源的不是一个普通的 GUI agent 模型,而可能是行业最好的模型。