AI资讯新闻榜单内容搜索-AI推理

AI 推理竞赛正在升温

虽然英伟达的GPU在AI训练领域的主导地位仍然难以撼动，但似乎有迹象表明，在AI推理方面，竞争对手正在迎头赶上这家科技巨头，尤其是在能效方面。

来自主题: AI资讯

6974 点击 2024-09-03 10:08

比GPU性价比高百倍，Cerebras推出新AI推理服务，号称“全球最快”

智东西8月28日消息，AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference，号称“全球最快”。该服务已经在云端上线。

来自主题: AI资讯

4396 点击 2024-08-29 10:21

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

8041 点击 2024-08-10 11:45

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星

不用H100，三台苹果电脑就能带动400B大模型。背后的功臣，是GitHub上的一个开源分布式AI推理框架，已经斩获了2.5k星标。

来自主题: AI技术研报

9553 点击 2024-07-23 00:26

最火AI角色扮演流量已达谷歌搜索20%！每秒处理2万推理请求，Transformer作者公开优化秘诀

什么AI应用每秒处理20000个AI推理请求，达到2024年谷歌搜索流量的1/5？

来自主题: AI资讯

10611 点击 2024-06-21 20:12

「专业智能体指导」让小模型学会数学推理！微调Mistral-7B实现86.81%准确率

对于小型语言模型（SLM）来说，数学应用题求解是一项很复杂的任务。

来自主题: AI技术研报

9914 点击 2024-04-29 20:35

拿CPU搞AI推理，谁给你的底气？

大模型的训练阶段我们选择GPU，但到了推理阶段，我们果断把CPU加到了菜单上。

来自主题: AI资讯

10435 点击 2024-03-27 17:27

英伟达的挑战者Groq ，在LPU上押对了什么？

在英伟达市值超过2万亿位居全球第三之后，谁能挑战它赖以生存的GPU芯片？

来自主题: AI资讯

7101 点击 2024-03-11 17:00

英伟达的挑战者Groq ，在LPU上押对了什么？

2月19日以来，这款LPU持续成为热点，担当起英伟达GPU挑战者的角色。英伟达的主力芯片H100一卡难求，这给Groq公司带来了机会。

来自主题: AI资讯

5900 点击 2024-03-11 10:35

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

这两天，Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片，实现每秒500tokens大模型生成，感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff，让不少人直呼：英伟达要被碾压了……

来自主题: AI资讯

4950 点击 2024-02-21 16:39

AI资讯新闻榜单内容搜索-AI推理

AI 推理竞赛正在升温

比GPU性价比高百倍，Cerebras推出新AI推理服务，号称“全球最快”

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星​

最火AI角色扮演流量已达谷歌搜索20%！每秒处理2万推理请求，Transformer作者公开优化秘诀

「专业智能体指导」让小模型学会数学推理！微调Mistral-7B实现86.81%准确率

拿CPU搞AI推理，谁给你的底气？

英伟达的挑战者Groq ，在LPU上押对了什么？

英伟达的挑战者Groq ，在LPU上押对了什么？

运行LIama2得8400万元！最快AI推理芯片成本推算引热议

电脑平板组AI集群，在家就能跑400B大模型，GitHub狂揽2.5K星