围攻英伟达
来自主题: AI资讯
6867 点击 2024-08-30 10:13
围攻英伟达
LLM若以每秒1000+token高速推理,当前最先进的GPU根本无法实现!Cerebras Inference一出世,推理速度赶超英伟达GPU,背靠自研的世界最大芯片加持。而且,还将推理价格打了下来。
马斯克xAI建超算集群,以太网助AI云迅猛发展。
AI市场迎来又一位新玩家。
AI芯片的竞争,又多了几分看点。
大模型进入推理阶段,性价比压过算力。
2024年上海的7月是一个沉闷的雨季,但对国产AI 行业来说,却迎来了堪比摇滚乐集会的WAIC(世界人工智能大会)。
在一平方毫米的硅片上建立数百万个连接。
跨GPU的注意力并行,最高提速8倍,支持512万序列长度推理。
一场未完成的投资改变了什么?