AI资讯新闻榜单内容搜索-LLM

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

随着大语言模型（LLMs）在处理复杂任务中的广泛应用，高质量数据的获取变得尤为关键。为了确保模型能够准确理解并执行用户指令，模型必须依赖大量真实且多样化的数据进行后训练。然而，获取此类数据往往伴随着高昂的成本和数据稀缺性。因此，如何有效生成能够反映现实需求的高质量合成数据，成为了当前亟需解决的核心挑战。

来自主题: AI技术研报

6394 点击 2024-11-14 14:07

Nature：AI也许可以拥有常识，但不是现在

LLM未实现机器常识，挑战常识推理。

来自主题: AI资讯

3032 点击 2024-11-14 10:30

一个有意思的Prompt演员框架，LLMs被当成演员；提示被当成剧本；LLM输出被当成表演，o1从76%提高到87%

如何更好地设计提示词（Prompt）一直是大家关注的焦点。最近，一个独特的研究视角引起了广泛关注：将LLMs视为“演员”，将提示词视为“剧本”，将模型输出视为“表演”。

来自主题: AI技术研报

3301 点击 2024-11-13 14:19

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

小米大模型第二代来了！相比第一代，训练数据规模更大、品质更高，训练策略与微调机制上也进行了深入打磨。

来自主题: AI技术研报

4694 点击 2024-11-13 09:12

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

研究人员通过案例研究，利用大型语言模型（LLMs）如GPT-4、Claude 3和Llama 3.1，探索了思维链（CoT）提示在解码移位密码任务中的表现；CoT提示虽然提升了模型的推理能力，但这种能力并非纯粹的符号推理，而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报

3398 点击 2024-11-13 09:07

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

第8届CoRL于2024年11月6日至9日在德国慕尼黑举行，展示了机器人学习领域的前沿研究和发展，尤其是在自主系统、机器人控制和多模态人工智能领域。

来自主题: AI技术研报

6458 点击 2024-11-12 17:33

Qwen2.5-Coder全系列来咯！强大、多样、实用

今天，我们很高兴开源“强大”、“多样”、“实用”的Qwen2.5-Coder全系列模型，致力于持续推动Open CodeLLMs的发展。

来自主题: AI技术研报

3621 点击 2024-11-12 10:26

用LLM一键生成百万级领域知识图谱！中科大新框架入选ACL 2024

现在，用LLM一键就能生成百万级领域知识图谱了？！来自中科大MIRA实验室研究人员提出一种通用的自动化知识图谱构建新框架SAC-KG

来自主题: AI技术研报

3148 点击 2024-11-11 21:21

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

大型语言模型（LLM）最近在各种数学benchmark上疯狂刷分，动辄90%以上的正确率，搞得好像要统治数学界一样。然而，Epoch AI看不下去了，联手60多位顶尖数学家，憋了个大招——FrontierMath，一个专治LLM各种不服的全新数学推理测试！结果惨不忍睹，LLM集体“翻车”，正确率竟然不到2%！

来自主题: AI技术研报

3978 点击 2024-11-11 14:36

你是天才竟然比白痴得分低？卡梅隆和斯坦福最新，你是Assistant会让LLM降低性能，Roleplay究竟该怎么用

在Prompt工程领域，角色扮演提示是否能够有效提高大型语言模型（LLM）的性能一直是一个备受关注的话题。

来自主题: AI资讯

3142 点击 2024-11-11 14:32