AI资讯新闻榜单内容搜索-A

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: A
妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」,将Llama-1B模型前向传播完整融合进单一GPU内核,实现推理时间低于1毫秒。在B200上每次推理仅需680微秒,比vLLM快3.5倍。

来自主题: AI技术研报
8026 点击    2025-05-30 12:36
Google和百度再度踏入同一条河流

Google和百度再度踏入同一条河流

Google和百度再度踏入同一条河流

AI领域的竞争,远未到鸣金收兵的时刻。

来自主题: AI资讯
8172 点击    2025-05-30 12:24
扣子加多维表格,可以干死80%的AI创业公司

扣子加多维表格,可以干死80%的AI创业公司

扣子加多维表格,可以干死80%的AI创业公司

3月时候GPT迎来了一波更新,在文生图、图生图领域带来了巨大更新,而紧接而至的却是一些创业公司的哀嚎:

来自主题: AI资讯
9078 点击    2025-05-30 12:18
对话傅盛:Agent杀死了传统图形界面

对话傅盛:Agent杀死了传统图形界面

对话傅盛:Agent杀死了传统图形界面

“创业没有静态壁垒,只有动态壁垒。”

来自主题: AI资讯
7137 点击    2025-05-30 12:10
谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

近日,NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM,以无需训练的即插即用加速方案,实现了推理速度的突破!通过创新的技术组合,在不依赖重新训练模型的前提下,该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据,解析其核心优势。

来自主题: AI技术研报
7537 点击    2025-05-30 12:08
自进化零监督多Agent框架: MAS-ZERO,让AI因地制宜动态适应

自进化零监督多Agent框架: MAS-ZERO,让AI因地制宜动态适应

自进化零监督多Agent框架: MAS-ZERO,让AI因地制宜动态适应

主席在《矛盾论》中强调"具体问题具体分析,是Marxism的活的灵魂"。而在AI领域,我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO,帮我们构建能够因地制宜、因时制宜的智能系统。

来自主题: AI技术研报
6217 点击    2025-05-30 12:03
Linear-MoE:线性注意力遇上混合专家的开源实践

Linear-MoE:线性注意力遇上混合专家的开源实践

Linear-MoE:线性注意力遇上混合专家的开源实践

来自上海人工智能实验室团队的最新成果 Linear-MoE,首次系统性地实现了线性序列建模与 MoE 的高效结合,并开源了完整的技术框架,包括 Modeling 和 Training 两大部分,并支持层间混合架构。为下一代基础模型架构的研发提供了有价值的工具和经验。

来自主题: AI技术研报
7476 点击    2025-05-30 12:03
轮到AI来写《人类简史》

轮到AI来写《人类简史》

轮到AI来写《人类简史》

七万年前,智能人凭借虚构故事的能力完成了第一次认知革命。 一万年前,农业革命让我们从狩猎采集者变成了农民。 三百年前,科学革命让我们成为了地球的主宰。 而今天,我们正站在第三次认知革命的门槛上——这次,讲故事的不再只是人类。

来自主题: AI资讯
7044 点击    2025-05-30 11:54