AI资讯新闻榜单内容搜索-语言模型

苹果多模态模型大升级！文本密集、多图理解，全能小钢炮

多模态大语言模型（MLLM）如今已是大势所趋。过去的一年中，闭源阵营的GPT-4o、GPT-4V、Gemini-1.5和Claude-3.5等模型引领了时代。

来自主题: AI资讯

4816 点击 2024-10-14 09:50

苹果发文质疑：大语言模型根本无法进行逻辑推理

5 大证据显示，LLM 在推理复杂问题时非常脆弱。

来自主题: AI资讯

4080 点击 2024-10-14 09:16

NeurIPS 2024 | 大模型的词表大小，同样适用于Scaling Law

本文是一篇发表在 NeurIPS 2024 上的论文，单位是香港大学、Sea AI Lab、Contextual AI 和俄亥俄州立大学。论文主要探讨了大型语言模型（LLMs）的词表大小对模型性能的影响。

来自主题: AI技术研报

7132 点击 2024-10-11 13:55

RAG测评关键指标

RAG（Retrieval-Augmented Generation）是一种结合信息检索与文本生成的技术，旨在提高大型语言模型（LLM）在回答复杂查询时的表现。它通过检索相关的上下文信息来增强生成答案的质量和准确性。解读RAG测评：关键指标与应用分析

来自主题: AI资讯

5115 点击 2024-10-11 10:06

NeurIPS 2024｜SparseLLM：突破性全局剪枝技术，大语言模型稀疏化革命

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

5447 点击 2024-10-10 17:17

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出，常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题，学术界和工业界提出了一系列对齐（Alignment）技术，旨在优化模型的输出，使其更加符合人类的价值观和期望。

来自主题: AI技术研报

8900 点击 2024-10-10 12:21

这篇论文非常火！差分Transformer竟能消除注意力噪声，犹如降噪耳机

Transformer 的强大实力已经在诸多大型语言模型（LLM）上得到了证明，但该架构远非完美，也有很多研究者致力于改进这一架构，比如机器之心曾报道过的 Reformer 和 Infini-Transformer。

来自主题: AI技术研报

6861 点击 2024-10-10 12:15

深度｜No Priors谈大模型未来市场趋势：小模型，高性能

大语言模型市场的整合与差异：大语言模型市场存在整合的趋势。一方面，人工智能发展的基础产业是资本密集型的，市场整合对于大语言模型市场的资本支撑是必要的。另一方面，为尽可能提高算法的泛化能力，单个大语言模型也需要集成多种创新功能。市场集中度的提高使得企业需要进一步考虑大语言模型的差异化。

来自主题: AI资讯

8986 点击 2024-10-08 18:43

整合海量公共数据，谷歌开源AI统计学专家DataGemma

准确的统计数据、时效性强的信息，一直是大语言模型产生幻觉的重灾区。谷歌在近日推出了自己筹划已久的大型数据库Data Commons，以及在此基础上诞生的大模型DataGemma。

来自主题: AI资讯

5387 点击 2024-10-03 13:25

Anaconda将LLMs能力赋能到笔记本电脑，推出新型桌面应用程序AI Navigator

知名开源数据科学平台提供商Anaconda 今天宣布推出AI Navigator，这是一款新型桌面应用程序，允许用户在笔记本电脑或个人电脑上本地运行一系列人工智能应用的大型语言模型（LLMs），而无需将任何数据发送到云服务器。

来自主题: AI资讯

3754 点击 2024-10-02 11:28