AI资讯新闻榜单内容搜索-LLM

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用，而以ChatGPT、GPT-4等为代表的通用大语言模型（LLM）虽然能够生成流畅文本，但经常出现“引用幻觉”（Citation Hallucination），即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。

来自主题: AI技术研报

7160 点击 2025-04-11 10:20

统一多模态大模型（U-MLLMs）逐渐成为研究热点，近期GPT-4o，Gemini-2.0-flash都展现出了非凡的理解和生成能力，而且还能实现跨模态输入输出，比如图像+文本输入，生成图像或文本。

来自主题: AI技术研报

7180 点击 2025-04-10 10:20

LLM Agent 火了两年了，但业界仍然存在许多非共识。智能体数量卷上去了，概念炒上去了，但质量参差不齐，娱乐向的不好玩，提效向的不好用，具体企业落地更是各种大小问题不断。

来自主题: AI资讯

5071 点击 2025-04-10 09:41

论如何在技术圈争论中一句话噎到对方：

来自主题: AI资讯

6013 点击 2025-04-09 11:34

刚刚，一位AI公司CEO细细扒皮了关于Llama 4的五大疑点。甚至有圈内人表示，Llama 4证明Scaling已经结束了，LLM并不能可靠推理。但更可怕的事，就是全球的AI进步恐将彻底停滞。

来自主题: AI技术研报

7199 点击 2025-04-09 09:49

众所周知，大语言模型（LLM）往往对硬件要求很高。

来自主题: AI资讯

2654 点击 2025-04-09 08:51

路由LLM是指一种通过router动态分配请求到若干候选LLM的机制。论文提出且开源了针对router设计的全面RouterEval基准，通过整合8500+个LLM在12个主流Benchmark上的2亿条性能记录。将大模型路由问题转化为标准的分类任务，使研究者可在单卡甚至笔记本电脑上开展前沿研究。

来自主题: AI技术研报

4967 点击 2025-04-08 14:26

来自UIUC等大学的华人团队，从LLM的基础机制出发，揭示、预测并减少幻觉！通过实验，研究人员揭示了LLM的知识如何相互影响，总结了幻觉的对数线性定律。更可预测、更可控的语言模型正在成为现实。

来自主题: AI技术研报

7123 点击 2025-04-07 14:55

近年来，大语言模型（LLM）的性能提升逐渐从训练时规模扩展转向推理阶段的优化，这一趋势催生了「测试时扩展（test-time scaling）」的研究热潮。

来自主题: AI技术研报

8430 点击 2025-04-06 16:55

语言是离散的，所以适合用自回归模型来生成；而图像是连续的，所以适合用扩散模型来生成。在生成模型发展早期，这种刻板印象广泛存在于很多研究者的脑海中。

来自主题: AI技术研报

6021 点击 2025-04-06 16:48