AI资讯新闻榜单内容搜索-AI推理

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI推理
AI 推理竞赛正在升温

AI 推理竞赛正在升温

AI 推理竞赛正在升温

虽然英伟达的GPU在AI训练领域的主导地位仍然难以撼动,但似乎有迹象表明,在AI推理方面,竞争对手正在迎头赶上这家科技巨头,尤其是在能效方面。

来自主题: AI资讯
5578 点击    2024-09-03 10:08
比GPU性价比高百倍,Cerebras推出新AI推理服务,号称“全球最快”

比GPU性价比高百倍,Cerebras推出新AI推理服务,号称“全球最快”

比GPU性价比高百倍,Cerebras推出新AI推理服务,号称“全球最快”

智东西8月28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。

来自主题: AI资讯
2308 点击    2024-08-29 10:21
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。

来自主题: AI技术研报
6443 点击    2024-08-10 11:45
电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​

电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​

电脑平板组AI集群,在家就能跑400B大模型,GitHub狂揽2.5K星​

不用H100,三台苹果电脑就能带动400B大模型。 背后的功臣,是GitHub上的一个开源分布式AI推理框架,已经斩获了2.5k星标。

来自主题: AI技术研报
7550 点击    2024-07-23 00:26
拿CPU搞AI推理,谁给你的底气?

拿CPU搞AI推理,谁给你的底气?

拿CPU搞AI推理,谁给你的底气?

大模型的训练阶段我们选择GPU,但到了推理阶段,我们果断把CPU加到了菜单上。

来自主题: AI资讯
9307 点击    2024-03-27 17:27
英伟达的挑战者Groq ,在LPU上押对了什么?

英伟达的挑战者Groq ,在LPU上押对了什么?

英伟达的挑战者Groq ,在LPU上押对了什么?

在英伟达市值超过2万亿位居全球第三之后,谁能挑战它赖以生存的GPU芯片?

来自主题: AI资讯
5086 点击    2024-03-11 17:00
英伟达的挑战者Groq ,在LPU上押对了什么?

英伟达的挑战者Groq ,在LPU上押对了什么?

英伟达的挑战者Groq ,在LPU上押对了什么?

2月19日以来,这款LPU持续成为热点,担当起英伟达GPU挑战者的角色。英伟达的主力芯片H100一卡难求,这给Groq公司带来了机会。

来自主题: AI资讯
3948 点击    2024-03-11 10:35
运行LIama2得8400万元!最快AI推理芯片成本推算引热议

运行LIama2得8400万元!最快AI推理芯片成本推算引热议

运行LIama2得8400万元!最快AI推理芯片成本推算引热议

这两天,Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片,实现每秒500tokens大模型生成,感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff,让不少人直呼:英伟达要被碾压了……

来自主题: AI资讯
3173 点击    2024-02-21 16:39