
机器人的「物理图灵测试」,英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law
机器人的「物理图灵测试」,英伟达Jim Fan 17分钟演讲揭秘具身Scaling LawJim Fan,英伟达机器人部门主管和杰出科学家、GEAR 实验室联合领导人、OpenAI 的首位实习生,最近在红杉资本主办的 AI Ascent 上做了一场 17 分钟的演讲
Jim Fan,英伟达机器人部门主管和杰出科学家、GEAR 实验室联合领导人、OpenAI 的首位实习生,最近在红杉资本主办的 AI Ascent 上做了一场 17 分钟的演讲
谷歌Gemini原生图像生成功能又双叒升级了!
在上一篇研究图谱中,我们指出医疗领域很可能是 Vertical Agent 最先落地的领域,其中最有代表性的公司之一是 OpenEvidence,一款专为医生设计的 AI 专业诊断 Copilot。
在人工智能领域,推理能力的进化已成为通向通用智能的核心挑战。近期,Reinforcement Learning with Verifiable Rewards(RLVR)范式下涌现出一批「Zero」类推理模型,摆脱了对人类显式推理示范的依赖,通过强化学习过程自我学习推理轨迹,显著减少了监督训练所需的人力成本。
用1/8成本比肩Claude 3.7,刚刚,“欧洲OpenAI”Mistral AI发布多模态新模型。
周三美股盘中,谷歌母公司Alphabet股价跳水,跌幅迅速扩大,一度跌超9%。苹果股价日内转跌,盘中跌幅超过2%。谷歌和苹果的下挫,令美股大盘走低,纳指100盘中转跌,上日美股盘后纳指100一度涨1%。
Healthcare 是美国最大的行业之一,支出占 GDP 的 17%,雇佣 1/10 的美国劳动力。它也极其低效,美国每年 4.5 万亿美元的医疗支出中,有高达 25%,也就是 1.1 万亿美元被视为无效或可避免的浪费。在某些情况下,healthcare 从业者用于保险账单处理的时间成本可能占账单收入的 1/7。
当前大模型研究正逐步从依赖扩展定律(Scaling Law)的预训练,转向聚焦推理能力的后训练。鉴于符号逻辑推理的有效性与普遍性,提升大模型的逻辑推理能力成为解决幻觉问题的关键途径。
最强AI模型面对5560道数学难题,成功率仅16.46%?背后真相大揭秘。
法国初创Mistral,刚刚推出定价碾压DeepSeek V3的模型,而模型性能,却超过Claude Sonnet 3.7的90%。不过在网友们的实测中,它却翻车了?有人建议:不必下载浪费流量和硬盘空间。