国内首次!8.9毫秒推理速度破纪录,1元打穿百万token
国内首次!8.9毫秒推理速度破纪录,1元打穿百万token当所有人还在为参数内卷时,智能体真正的决胜点已经转向了速度与成本。浪潮信息用两款AI服务器直接给出了答案:一个将token生成速度干到10毫秒以内,一个把每百万token成本打到1元时代。
当所有人还在为参数内卷时,智能体真正的决胜点已经转向了速度与成本。浪潮信息用两款AI服务器直接给出了答案:一个将token生成速度干到10毫秒以内,一个把每百万token成本打到1元时代。
2025 年,生成式推荐(Generative Recommender,GR)的发展如火如荼,其背后主要的驱动力源自大语言模型(LLM)那诱人的 scaling law 和通用建模能力(general-purpose modeling),将这种能力迁移至搜推广工业级系统大概是这两年每一个从业者孜孜不倦的追求。
机器之心报道 编辑:+0 自动驾驶有 L1-L5 的分级路径,现在教育 AI 也有了自己的版本。 如今,「AI 下半场」已成共识,应用落地正成为决定未来的关键。教育,作为关乎人类发展的根本基石,已然成
在AI 技术迅猛发展的当下,全球正迎来一场关乎经济主导权的“竞赛”。波士顿咨询集团(BCG )与印度工商联合会(FICCI)于 2025 年 9 月联合发布的白皮书《Global AI Race》(全球AI 竞赛)深入剖析了这一现象。
9 月 26 日,Flowith 再次迎来了大更新,这一次,它的核心所指,正是「上下文腐烂」以及更加「自由的创作」。接下来,我们分享全面实测体验。从我的实际体验来看,这次的 Flowith 更新,终于让上下文「活」起来了。
打破思维惯性,「小模型」也能安全又强大!北大-360联合实验室发布TinyR1-32B模型,以仅20k数据的微调,实现了安全性能的里程碑式突破,并兼顾出色的推理与通用能力。
Louis Amira,Stripe 前加密货币与 AI 合作伙伴关系负责人,和 David Noël-Romas,Stripe 前加密货币工程负责人,刚刚为他们的新创公司 Circuit & Chisel 筹集了 1920 万美元。他们的第一个产品是 ATXP 协议,Louis 将其描述为"AI agent 支付领域的 HTTP"。
据 9to5Mac 报道,iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 开发者测试版隐藏的代码显示,苹果正在为 App Intents 引入 MCP 支持打基础。这也意味着未来,我们能让 ChatGPT、Claude 或其他任何兼容 MCP 的 AI 模型直接与 Mac、iPhone 和 iPad 应用交互。
奥特曼投下震撼弹:五年后AI将全面超越人类,到2030年诞生的「超级智能」甚至能攻克「量子引力」难题。人类智力的霸权时代,已进入倒计时。他在接受德国《世界报》采访时表示:我可以肯定地说,到2030年底之前,如果我们没能开发出能够完成人类自身无法企及任务的超级智能模型,我会感到非常意外。
云栖大会上,阿里宣布AI平台将把完整的英伟达Physical AI(物理AI)软件栈纳入其开发者选项菜单。这个看似技术性的宣布,实际上标志着人工智能发展的一个重要转折点。英伟达CEO黄仁勋在2025年CES大会上明确表示:AI下一个前沿就是物理AI,蕴藏着巨大的潜力和机遇。