AI资讯新闻榜单内容搜索-AI部署

AI应用开发商怨声载道：部署成本水涨船高

在本周MIT报告揭露“绝大多数企业投资AI尚未盈利”引发市场哗然之际，另一项出乎意料的现象也浮出水面：企业部署先进人工智能成本下降的趋势在2025年突然停滞。

来自主题: AI资讯

6637 点击 2025-08-23 12:07

今天，OpenAI 开源了俩模型：120B/20B 117B 的 gpt-oss-120b 对标 o4-min，按官方说法至少需要 80G 内存，推荐使用单卡 H100 GPU 而刚买的的游戏本，刚好满足gpt-oss-120b 的部署条件

来自主题: AI资讯

7518 点击 2025-08-07 15:27

vivo AI研究院联合港中文以及上交团队为了攻克这些难题，从训练数据和模型结构两方面，系统性地分析了如何在MLLM训练中维持纯语言能力，并基于此提出了GenieBlue——专为移动端手机NPU设计的高效MLLM结构方案。

来自主题: AI技术研报

6241 点击 2025-07-05 13:12

AI非上云不可、非集群不能？万字实测告诉你，32B卡不卡？70B是不是智商税？要几张卡才能撑住业务？全网最全指南教你如何用最合适的配置，跑出最强性能。

来自主题: AI技术研报

6336 点击 2025-07-03 18:53

众所周知，大语言模型（LLM）往往对硬件要求很高。

来自主题: AI资讯

2855 点击 2025-04-09 08:51

还在为部署RAG系统的庞大体积和高性能门槛困扰吗？港大黄超教授团队最新推出的轻量级MiniRAG框架很好地解决了这一问题。通过优化架构设计，MiniRAG使得1.5B级别的小模型也能高效完成RAG任务，为端侧AI部署提供了更多可能性。

来自主题: AI资讯

7628 点击 2025-01-16 16:14

随着2024年生成式AI大爆发，推理端成本呈指数级激增，推动了泛智能硬件端持续增长，“端云混合AI部署”模式正走向主流，端侧智能则加速了终端“换机热潮”：AI PC、AI手机、AIoT设备、智能座舱。

来自主题: AI技术研报

4965 点击 2024-10-29 14:06

基于公司私有组件生成代码，这个问题的本质是：由于大模型的训练数据集不包含你公司的私有组件数据，因此不能够生成符合公司私有组件库的代码。

来自主题: AI技术研报

9787 点击 2024-09-02 12:42

2024年，落地，无疑是大模型最重要的主题。

来自主题: AI资讯

10466 点击 2024-08-20 16:31

最近一份美国市场研究机构发布的报告火了。报告详细分析了OpenAI部署Sora所需的硬件资源，计算得出，在峰值时期Sora需要高达72万张英伟达H100 来支持，对应成本是1561亿人民币。

来自主题: AI资讯

6529 点击 2024-03-30 14:19