
加速分化:关于大模型走势的十个判断
加速分化:关于大模型走势的十个判断本文探讨了大模型的发展趋势和影响,预测中国基础大模型的数量会逐渐收敛,算力需求将成为关键因素,开源大模型可能难以超过闭源模型,大模型在手机端侧的应用将引发入口之争。
本文探讨了大模型的发展趋势和影响,预测中国基础大模型的数量会逐渐收敛,算力需求将成为关键因素,开源大模型可能难以超过闭源模型,大模型在手机端侧的应用将引发入口之争。
今天,芯片初创公司Cerebras Systems推出了全新的Wafer Scale Engine 3,并将其现有的最快 AI 芯片世界纪录加倍。
一家大模型初创公司从创立到训练出大模型,要克服怎样的难题?前谷歌科学家离职后创业一年,发文自述算力是训练大模型的难点。
随着对Sora技术分析的展开,AI基础设施的重要性愈发凸显。
自曝996作息的OpenAI研究员Jason Wei表示,Sora代表着视频生成的GPT-2时刻。竞争的关键,就是算力和数据了。国内有可能成功「复刻」Sora吗?华人团队的这份37页技术报告,或许能给我们一些启发。
近期,DiT(Diffusion Transformer)论文的作者谢赛宁在朋友圈分享了他对 Sora 的看法,其中核心资源的排序是——人才第一、数据第二、算力第三,其他都没有什么是不可替代的。
Google DeepMind首席执行官Hassabis最近在接受WIRED采访时表示,AI技术现在还有很大的改进空间,还远没有到只能拼算力的时候。谷歌的优势在于科研能力,未来智能体将改变AI的格局。
刚刚公布业绩的meta,业绩和指引均超预期,还破天荒地发股息,把回购金额上调到500亿美元,盘后股价上涨15%。财报会上,公司高管表示,Meta的总体预期是,未来几年需要投资更多来支持人工智能业务,今年的情况就会有所反映。
Meta的第二代自研芯片正式投产!小扎计划今年部署Artemis AI芯片为AI提供算力,以减少对英伟达GPU的依赖。
AI大模型在业界备受关注,但对于一些公司来说,采用小模型可能是一种更好的选择。微软已经开始研发小规模、低算力需求的模型,并组建新团队进行对话式AI的开发。而对于工业、金融和汽车等领域而言,小模型更易于落地,并且具有省电、省钱、省时间的优势。