AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

给全球六大LLM各发1万美金,丢进同一真实市场实盘厮杀,会发生什么?这场大战从18日开始,截止目前,DeepSeek V3.1盈利超3500美元,Grok 4实力次之。不堪一提的是,Gemini 2.5 Pro成为赔得最惨的模型。

来自主题: AI资讯
9245 点击    2025-10-20 14:04
谷歌新版Gemini马甲被扒! LMArena实测:唯一能看懂表的AI, GPT-5乱答

谷歌新版Gemini马甲被扒! LMArena实测:唯一能看懂表的AI, GPT-5乱答

谷歌新版Gemini马甲被扒! LMArena实测:唯一能看懂表的AI, GPT-5乱答

谷歌的Gemini 3.0疑似上线LMArena!众多实测提前曝光,但效果嘛,很难评。Gemini 3.0传了这么久,终于还是露出「马脚」了。依然还是LMAreana竞技场,Gemini 3.0的两个「马甲」被扒了出来。

来自主题: AI资讯
8564 点击    2025-10-20 12:40
深度|a16z合伙人:Agent 接管流量后,支撑大厂数万亿美元市值的广告商业模式正在崩坏,Costco的会员信任逻辑才是未来

深度|a16z合伙人:Agent 接管流量后,支撑大厂数万亿美元市值的广告商业模式正在崩坏,Costco的会员信任逻辑才是未来

深度|a16z合伙人:Agent 接管流量后,支撑大厂数万亿美元市值的广告商业模式正在崩坏,Costco的会员信任逻辑才是未来

搜索在变,交易在变,归因在变——AI 正在重写电商的底层逻辑。从“人找货”到“智能体替你理解、推荐、比价、下单”,消费者与平台之间的关系被彻底改写。过去二十年,互联网商业的三大支柱是:广告、订阅与电商。

来自主题: AI资讯
9440 点击    2025-10-20 12:26
无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

Meta提出早期经验(Early Experience)让代理在无奖励下从自身经验中学习:在专家状态上采样替代动作、执行并收集未来状态,将这些真实后果当作监督信号。核心是把“自己造成的未来状态”转为可规模化的监督。

来自主题: AI技术研报
8754 点击    2025-10-20 11:54
英伟达4段简短提示词,IOI夺金!开源模型也能征服最难编程竞赛

英伟达4段简短提示词,IOI夺金!开源模型也能征服最难编程竞赛

英伟达4段简短提示词,IOI夺金!开源模型也能征服最难编程竞赛

OpenAI的封闭模型在IOI 2025竞赛夺金的同时,英伟达团队交出了一份同样令人振奋的答卷——他们利用完全开源的大模型和全新的GenCluster策略,在IOI 2025竞赛中跑出了媲美金牌选手的成绩!开源模型首次达到了IOI金牌水准。这究竟是怎样实现的?

来自主题: AI技术研报
8129 点击    2025-10-20 10:13
我在 iPhone 17 Pro Max 上跑 AI 模型,体验了一把十年前「越狱」的快乐

我在 iPhone 17 Pro Max 上跑 AI 模型,体验了一把十年前「越狱」的快乐

我在 iPhone 17 Pro Max 上跑 AI 模型,体验了一把十年前「越狱」的快乐

在 iPhone 上部署端侧 AI 模型,成了互联网的新显学。在 iPhone 上体验端侧模型,门槛其实不算高。打开 App Store,搜索 PocketPal AI,下载安装。如果不习惯英文界面,可以在设置 (Setting) 里找到语言 (Language) 选项,切换成中文。

来自主题: AI资讯
8357 点击    2025-10-19 22:11
Agent长程搜索的两大痛点被打通了!中科院 DeepMiner用32k跑近百轮,开源领先逼近闭源

Agent长程搜索的两大痛点被打通了!中科院 DeepMiner用32k跑近百轮,开源领先逼近闭源

Agent长程搜索的两大痛点被打通了!中科院 DeepMiner用32k跑近百轮,开源领先逼近闭源

中科院的这篇工作解决了“深度搜索智能体”(deep search agents),两个实打实的工程痛点,一个是问题本身不够难导致模型不必真正思考,另一个是上下文被工具长文本迅速挤爆导致过程提前夭折,研究者直面挑战,从数据和系统两端同时重塑训练与推理流程,让复杂推理既有用又能跑得起来。

来自主题: AI资讯
7706 点击    2025-10-19 12:21
多轮Agent训练遇到级联失效?熵控制强化学习来破局

多轮Agent训练遇到级联失效?熵控制强化学习来破局

多轮Agent训练遇到级联失效?熵控制强化学习来破局

在训练多轮 LLM Agent 时(如需要 30 + 步交互才能完成单个任务的场景),研究者遇到了一个严重的训练不稳定问题:标准的强化学习方法(PPO/GRPO)在稀疏奖励环境下表现出剧烈的熵值震荡,导致训练曲线几乎不收敛。

来自主题: AI技术研报
6500 点击    2025-10-19 12:06