AI资讯新闻榜单内容搜索-模型

扩散模型=流匹配？谷歌DeepMind博客深度详解这种惊人的等价性

因为流匹配的公式很简单，并且生成样本的路径很直接，最近越来越受研究者们的欢迎，于是很多人都在问：「到底是扩散模型好呢？还是流匹配好？」

来自主题: AI技术研报

7580 点击 2024-12-13 15:00

大语言模型（LLMs）通过更多的推理展现出了更强的能力和可靠性，从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报

7096 点击 2024-12-13 14:40

Transformer模型自2017年问世以来，已成为AI领域的核心技术，尤其在自然语言处理中占据主导地位。然而，关于其核心机制“注意力”的起源，学界存在争议，一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。

来自主题: AI技术研报

8170 点击 2024-12-13 14:24

最近，Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现：当前主流的前沿AI模型已经具备了基本的"策划"（Scheming）能力。

来自主题: AI技术研报

6902 点击 2024-12-13 13:42

人工评估是指让人类评价模型输出回答的好坏。本文讨论的都是后验评估，即模型已经完成训练，给定一个任务让人类进行评估。

来自主题: AI技术研报

4619 点击 2024-12-13 13:32

长文本向量模型能够将十页长的文本编码为单个向量，听起来很强大，但真的实用吗？很多人觉得... 未必。直接用行不行？该不该分块？怎么分才最高效？本文将带你深入探讨长文本向量模型的不同分块策略，分析利弊，帮你避坑。

来自主题: AI技术研报

10167 点击 2024-12-13 11:33

大模型“套壳”事件防不胜防，有没有方法可以检测套壳行为呢？来自上海AI实验室、中科院、人大和上交大的学者们，提出了一种大模型的“指纹识别”方法——REEF（Representation Encoding Fingerprints）。

来自主题: AI技术研报

7923 点击 2024-12-13 11:24

谷歌Gemini 2.0昨晚鲨疯了！仅过去不到24小时，一大波网友试玩已新鲜出炉~

来自主题: AI资讯

8203 点击 2024-12-13 11:18

服务1600+企业、200+业务场景直接落地。这位大模型应用的隐形冠军不藏了。

来自主题: AI资讯

7464 点击 2024-12-13 11:01

最近忙着追更OpenAI，总想着给奥特曼做些梗图，

来自主题: AI资讯

13969 点击 2024-12-13 10:46