AI资讯新闻榜单内容搜索-训练

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、近零开销

不管是编写和调试代码，还是通过函数调用来使用外部工具，又或是控制机器人，都免不了需要 LLM 生成结构化数据，也就是遵循某个特定格式（如 JSON、SQL 等）的数据。但使用上下文无关语法（CFG）来进行约束解码的方法并不高效。针对这个困难，陈天奇团队提出了一种新的解决方案：XGrammar。

来自主题: AI资讯

8905 点击 2024-11-26 14:18

自回归方法，在图像生成中观察到了 Scaling Law。「Scaling Law 撞墙了？」这恐怕是 AI 社区最近讨论热度最高的话题。

来自主题: AI技术研报

6789 点击 2024-11-26 13:48

北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式，相比传统模型在多项任务中表现出色，同时降低了参数量和计算量，增强了对周期性特征的建模能力，应用潜力广泛。

来自主题: AI技术研报

6871 点击 2024-11-26 13:43

在人工智能领域，大语言模型（LLM）的向量嵌入能力一直被视为处理文本数据的利器。然而，斯坦福大学和Google DeepMind的研究团队带来了一个颠覆性发现：LLM的向量嵌入能力可以有效应用于回归任务。

来自主题: AI技术研报

7214 点击 2024-11-26 09:04

Scaling Law撞墙了吗？OpenAI高级研究副总裁Mark Chen正式驳斥了这一观点。他表示，OpenAI已经有o系列和GPT系列两个模型，来让模型继续保持Scaling。

来自主题: AI资讯

6441 点击 2024-11-25 15:03

11 月 23 日，香港科技大学举行了今年度的学位颁授典礼。英伟达创始人和 CEO 黄仁勋又新增一个荣誉工程学博士头衔，与他一同获得荣誉博士学位的还有著名影星梁朝伟、2013 年诺贝尔化学奖得主 Michael Levitt、菲尔兹奖得主 David Mumford。

来自主题: AI资讯

7754 点击 2024-11-25 14:58

Hugging Face 上的模型数量已经超过了 100 万。但是几乎每个模型都是孤立的，难以与其它模型沟通。尽管有些研究者甚至娱乐播主试过让 LLM 互相交流，但所用的方法大都比较简单。

来自主题: AI技术研报

6612 点击 2024-11-25 14:46

在当今人工智能迅猛发展的时代，大语言模型（LLMs）已成为众多AI应用的核心引擎。然而，来自ETH Zurich和Google DeepMind的一项最新研究揭示了一个令人深思的现象：这些看似强大的模型存在着严重的“盲从效应”。

来自主题: AI技术研报

6893 点击 2024-11-25 09:44

扩散模型的本质竟是进化算法！生物学大佬从数学的角度证实了这个结论，并结合扩散模型创建了全新的进化算法。

来自主题: AI技术研报

7044 点击 2024-11-24 20:26

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报

7731 点击 2024-11-24 20:02