谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行
谷歌开源全栈平台Coral NPU,能让大模型在手表上全天候运行他们又推出了 Coral NPU,可用于构建在低功率设备上持续运行的 AI。具体来说,其可在可穿戴设备上运行小型 Transformer 模型和 LLM,并可通过 IREE 和 TFLM 编译器支持 TensorFlow、JAX 和 PyTorch。
他们又推出了 Coral NPU,可用于构建在低功率设备上持续运行的 AI。具体来说,其可在可穿戴设备上运行小型 Transformer 模型和 LLM,并可通过 IREE 和 TFLM 编译器支持 TensorFlow、JAX 和 PyTorch。
新加坡时间 10 月 9 日,Zenlayer 于新加坡科技周——云与 AI 基础设施展正式发布 Zenlayer 分布式推理平台(Zenlayer Distributed Inference)。该平台作为一站式 AI 即时部署解决方案,专注于在全球范围内为大规模 AI 推理提供高性能支持。
刚刚完成1300万美元种子轮融资的Runware,正在用一种完全不同的方式重新定义AI基础设施。他们不依赖现成的云服务提供商,而是从零开始构建了自己的硬件和软件栈,创造出了所谓的"Sonic推理引擎"。这种垂直整合的方法让他们能够将AI推理成本降低高达90%,同时通过单一API提供对超过40万个AI模型的访问。
如果说云计算市场的上半场比的是谁胆子大、折扣狠,那么下半场则要拼的是谁口袋深、生态牢,任何战略摇摆都可能被直接踢出牌桌。
2025 年 9 月 19 日,亚马逊云科技官宣:Qwen3 和 DeepSeek v3.1,首次上线 Amazon Bedrock ,正式对外提供服务,再一次引起了全球生成式 AI 市场对 Amazon Bedrock 这一产品的关注。
真是谁也没想到……
从 AI 教育、AI 游戏,到具身智能、AI玩具,甚至是生命科学等行业,各行各业都在寻求 AI 工具落地的可能性。
Fireworks AI 作为新兴云服务商的一员,向开发者出租搭载 NVIDIA 芯片的服务器以运行人工智能模型。据两位知情人士透露,该公司正以 40 亿美元估值进行融资谈判,这一数字较一年前估值增长逾七倍。
GMI Cloud亮相WAIC 2025,展示AI云服务及NVIDIA合作技术成果
2025 年 6 月 23 日,由 GMI Cloud 联合 InfoQ 举办的 “2025 AI 应用出海年中洞察暨 GMI Cloud 新品发布会” 在线上举行。