AI资讯新闻榜单内容搜索-大语言模型

万字长文，深度解析大模型备案全流程

算法备案是所有AI从业者不得不迈过的门槛。这篇内容深入解读了中国《生成式人工智能服务安全基本要求》以及“生成式人工智能（大语言模型）上线备案”流程。

来自主题: AI技术研报

10653 点击 2024-11-12 10:00

Infactory.ai作为一款专注于事实审查的AI搜索引擎，旨在通过使用大语言模型理解搜索意图，而非直接生成搜索结果，以此来提供准确、透明的搜索结果，从根本上避免了搜索结果的幻觉问题，同时依然能提高用户使用搜索工具的效率。

来自主题: AI资讯

5750 点击 2024-11-11 10:28

随着大语言模型在长文本场景下的需求不断涌现，其核心的注意力机制（Attention Mechanism）也获得了非常多的关注。

来自主题: AI技术研报

5297 点击 2024-11-08 19:19

在Prompt工程领域，规划任务一直以来都是一个巨大的挑战，因为这要求大语言模型（LLMs）不仅能够理解自然语言，还能有效执行复杂推理和应对长时间跨度的操作。

来自主题: AI资讯

4745 点击 2024-11-08 10:16

消除激活值(outliers)，大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 2024（Oral Presentation），他们针对LLM权重激活量化提出了两种正交变换，有效降低了outliers现象，达到了4-bit的新SOTA。

来自主题: AI技术研报

5497 点击 2024-11-07 20:51

近日，伊利诺伊大学香槟分校的研究团队发布了一篇开创性论文，首次从理论层面证明了大语言模型(LLM)中的prompt机制具有图灵完备性。这意味着，通过合适的prompt设计，一个固定大小的Transformer模型理论上可以计算任何可计算函数。这一突破性发现为prompt工程提供了坚实的理论基础。

来自主题: AI技术研报

5868 点击 2024-11-07 09:39

网络智能体旨在让一切基于网络功能的任务自动发生。比如你告诉智能体你的预算，它可以帮你预订酒店。既拥有海量常识，又能做长期规划的大语言模型（LLM），自然成为了智能体常用的基础模块。

来自主题: AI技术研报

5156 点击 2024-11-06 15:34

算法设计（AD）对于各个领域的问题求解至关重要。大语言模型（LLMs）的出现显著增强了算法设计的自动化和创新，提供了新的视角和有效的解决方案。

来自主题: AI技术研报

4728 点击 2024-11-06 15:29

家人们，苹果一直在悄悄进步！近期，据小鹿观察，各大科技巨头不仅在提升模型解决复杂问题的能力上竞争激烈，而且还在大语言模型应用于用户界面（UI）交互方面上暗暗发力！

来自主题: AI技术研报

5933 点击 2024-11-05 19:33

近年来，大语言模型（Large Language Models, LLMs）的研究取得了重大进展，并对各个领域产生了深远影响。然而，LLMs的卓越性能来源于海量数据的大规模训练，这导致LLMs的训练成本明显高于传统模型。

来自主题: AI技术研报

5447 点击 2024-11-01 10:15