AI资讯新闻榜单内容搜索-CMU

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CMU
告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?

告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?

告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?

近日,来自 CMU 的 Catalyst Group 团队发布了一款 PyTorch 算子编译器 Mirage,用户无需编写任何 CUDA 和 Triton 代码就可以自动生成 GPU 内核,并取得更佳的性能。

来自主题: AI资讯
5376 点击    2024-10-06 16:08
软银、亚马逊、红杉15亿美金押注的具身智能大脑,是泡沫还是希望?

软银、亚马逊、红杉15亿美金押注的具身智能大脑,是泡沫还是希望?

软银、亚马逊、红杉15亿美金押注的具身智能大脑,是泡沫还是希望?

Skild AI 是一家位于匹兹堡的初创公司,由两位前 CMU 教授创立,旨在打造具身智能的通用大脑。Skild 宣称其模型展示了无与伦比的泛化和涌现能力,并且有多于竞争对手 1000 倍的训练数据。

来自主题: AI资讯
7620 点击    2024-09-25 20:28
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。

来自主题: AI技术研报
7323 点击    2024-08-10 11:45
CMU教授、机器学习系主任空降OpenAI董事会,曾用一句话攻破ChatGPT

CMU教授、机器学习系主任空降OpenAI董事会,曾用一句话攻破ChatGPT

CMU教授、机器学习系主任空降OpenAI董事会,曾用一句话攻破ChatGPT

就在刚刚,CMU教授Zico Kolter正式宣布加入OpenAI董事会,并成为安全与安保委员会成员。OpenAI这是终于要在安全上下功夫了?

来自主题: AI资讯
8888 点击    2024-08-10 10:58
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升

为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。

来自主题: AI技术研报
7112 点击    2024-08-01 15:55
FBI-LLM低比特基础大语言模型来了,首个完全从头训练的二值化语言模型

FBI-LLM低比特基础大语言模型来了,首个完全从头训练的二值化语言模型

FBI-LLM低比特基础大语言模型来了,首个完全从头训练的二值化语言模型

自回归训练方式已经成为了大语言模型(LLMs)训练的标准模式, 今天介绍一篇来自阿联酋世界第一所人工智能大学MBZUAI的VILA实验室和CMU计算机系合作的论文,题为《FBI-LLM: Scaling Up Fully Binarized LLMs from Scratch via Autoregressive Distillation》

来自主题: AI技术研报
7883 点击    2024-07-28 23:25
Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解

Mamba模型由于匹敌Transformer的巨大潜力,在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下,这两个架构还未有「一较高低」的机会。最近,英伟达、CMU、普林斯顿等机构联合发表的实证研究论文填补了这个空白。

来自主题: AI技术研报
4948 点击    2024-07-13 19:32
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

在开源社区引起「海啸」的Mamba架构,再次卷土重来!这次,Mamba-2顺利拿下ICML。通过统一SSM和注意力机制,Transformer和SSM直接成了「一家亲」,Mamba-2这是要一统江湖了?

来自主题: AI技术研报
8530 点击    2024-06-04 15:20
CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦,其团队在 ICCV 2021 会议上发表过一项类似的研究:仅仅使用一个或数个手绘草图,即可以自定义一个现成的 GAN 模型,进而输出与草图匹配的图像。

来自主题: AI资讯
6973 点击    2024-03-21 18:32