AI资讯新闻榜单内容搜索-AR

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: AR

谷歌新版Gemini马甲被扒! LMArena实测：唯一能看懂表的AI, GPT-5乱答

谷歌新版Gemini马甲被扒! LMArena实测：唯一能看懂表的AI, GPT-5乱答

谷歌新版Gemini马甲被扒! LMArena实测：唯一能看懂表的AI, GPT-5乱答

谷歌的Gemini 3.0疑似上线LMArena！众多实测提前曝光，但效果嘛，很难评。Gemini 3.0传了这么久，终于还是露出「马脚」了。依然还是LMAreana竞技场，Gemini 3.0的两个「马甲」被扒了出来。

来自主题: AI资讯

9299 点击 2025-10-20 12:40

无奖励也能把Agent练硬，Meta发布早期经验学习，隐式建模+反思（附提示词）

无奖励也能把Agent练硬，Meta发布早期经验学习，隐式建模+反思（附提示词）

无奖励也能把Agent练硬，Meta发布早期经验学习，隐式建模+反思（附提示词）

Meta提出早期经验（Early Experience）让代理在无奖励下从自身经验中学习：在专家状态上采样替代动作、执行并收集未来状态，将这些真实后果当作监督信号。核心是把“自己造成的未来状态”转为可规模化的监督。

来自主题: AI技术研报

9364 点击 2025-10-20 11:54

AI点外卖哪家强，美团LongCat团队做了个全面评测

AI点外卖哪家强，美团LongCat团队做了个全面评测

AI点外卖哪家强，美团LongCat团队做了个全面评测

美团LongCat团队发布了当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench（Versatile Interactive Tasks Benchmark）。VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频生活场景为典型载体，构建了一个包含66个工具的交互式评测环境，并设计了跨场景综合任务。

来自主题: AI技术研报

8143 点击 2025-10-20 10:13

人类皮肤细胞变身AI处理器？瑞士公司用生物计算将AI能耗降低百万数量级

人类皮肤细胞变身AI处理器？瑞士公司用生物计算将AI能耗降低百万数量级

人类皮肤细胞变身AI处理器？瑞士公司用生物计算将AI能耗降低百万数量级

利用人类皮肤细胞也能造出 AI 处理器？一家名为 FinalSpark 的瑞士公司，认为生物计算是 AI 的下一次进化飞跃。该公司开发了一款生物处理器，这些处理器利用人体神经元来代替传统的硅基芯片，使用由人类皮肤细胞培育出的类脑器官作为计算单元。

来自主题: AI资讯

7639 点击 2025-10-19 12:52

Karpathy泼冷水：AGI要等10年！根本没有「智能体元年」

Karpathy泼冷水：AGI要等10年！根本没有「智能体元年」

Karpathy泼冷水：AGI要等10年！根本没有「智能体元年」

在近日的一次访谈中，Andrej Karpathy深入探讨了AGI、智能体与AI未来十年的走向。他认为当前的「智能体」仍处早期阶段，强化学习虽不完美，却是目前的最优解。他预测未来10年的AI架构仍然可能是类似Transformer的巨大神经网络。

来自主题: AI资讯

8467 点击 2025-10-19 12:48

400元遥操95%机械臂！上海交大推出开源项目U-Arm，打造通用、低成本的人机遥操作接口

400元遥操95%机械臂！上海交大推出开源项目U-Arm，打造通用、低成本的人机遥操作接口

400元遥操95%机械臂！上海交大推出开源项目U-Arm，打造通用、低成本的人机遥操作接口

400元遥操95%机械臂，上海交大推出开源项目U-Arm！目前它已在XArm6、Dobot CR5、ARX R5等多种机械臂真机上进行了遥操作的验证。

来自主题: AI技术研报

6868 点击 2025-10-19 12:43

Agent长程搜索的两大痛点被打通了！中科院 DeepMiner用32k跑近百轮，开源领先逼近闭源

Agent长程搜索的两大痛点被打通了！中科院 DeepMiner用32k跑近百轮，开源领先逼近闭源

Agent长程搜索的两大痛点被打通了！中科院 DeepMiner用32k跑近百轮，开源领先逼近闭源

中科院的这篇工作解决了“深度搜索智能体”（deep search agents），两个实打实的工程痛点，一个是问题本身不够难导致模型不必真正思考，另一个是上下文被工具长文本迅速挤爆导致过程提前夭折，研究者直面挑战，从数据和系统两端同时重塑训练与推理流程，让复杂推理既有用又能跑得起来。

来自主题: AI资讯

8509 点击 2025-10-19 12:21

多轮Agent训练遇到级联失效？熵控制强化学习来破局

多轮Agent训练遇到级联失效？熵控制强化学习来破局

多轮Agent训练遇到级联失效？熵控制强化学习来破局

在训练多轮 LLM Agent 时（如需要 30 + 步交互才能完成单个任务的场景），研究者遇到了一个严重的训练不稳定问题：标准的强化学习方法（PPO/GRPO）在稀疏奖励环境下表现出剧烈的熵值震荡，导致训练曲线几乎不收敛。

来自主题: AI技术研报

7314 点击 2025-10-19 12:06

「重要性采样」并不「重要」？快手清华ASPO攻克重要性采样权重错配

「重要性采样」并不「重要」？快手清华ASPO攻克重要性采样权重错配

「重要性采样」并不「重要」？快手清华ASPO攻克重要性采样权重错配

从ChatGPT到DeepSeek，强化学习（Reinforcement Learning, RL）已成为大语言模型（LLM）后训练的关键一环。

来自主题: AI技术研报

8113 点击 2025-10-18 11:41

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

英伟达桌面超算，邪修玩法来了！两台DGX Spark串联一台苹果Mac Studio，就能让大模型推理速度提升至2.77倍。

来自主题: AI资讯

7467 点击 2025-10-17 16:16

上一页当前第71页,共238页下一页