AI资讯新闻榜单内容搜索-长文本

智谱，闷声不响发了个「100w 长文本模型」

最近各家模型发的都挺勤，一会一个 SOTA，一会一个遥遥领先。

来自主题: AI资讯

6441 点击 2024-08-15 10:48

大模型长文本阅读能力如何评估？

长文本处理能力对LLM的重要性是显而易见的。在2023年初，即便是当时最先进的GPT-3.5，其上下文长度也仅限于2k，然而今日，128k的上下文长度已经成为衡量模型技术先进性的重要标志之一。那你知道LLMs的长文本阅读能力如何评估吗？

来自主题: AI资讯

7520 点击 2024-08-14 11:25

月之暗面对谈 Zilliz：长文本和 RAG 如何选择？

关于长文本和 RAG 到底如何选择，一直有争论，从基模公司到应用开发者。今天这篇文章，是来自基模公司月之暗面和中间层 Zilliz 的技术对话，值得一看。

来自主题: AI资讯

8911 点击 2024-08-13 13:42

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

9058 点击 2024-08-12 13:50

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成

在长文本理解能力这块，竟然没有一个大模型及格！

来自主题: AI技术研报

10184 点击 2024-08-07 14:58

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

8428 点击 2024-04-29 20:31

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

4 月 26 日，科大讯飞发布讯飞星火大模型 V3.5 的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习，还能够结合各种行业场景知识给出专业、准确回答。

来自主题: AI技术研报

8023 点击 2024-04-28 12:23

你的超级知识助手来了！讯飞星火支持长文本长图文长语音，生产力直线UP

这一次，大模型真的可以让人类解放双手了。

来自主题: AI技术研报

9468 点击 2024-04-27 12:12

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

4 月 26 日，科大讯飞发布讯飞星火大模型 V3.5 的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习，还能够结合各种行业场景知识给出专业、准确回答。

来自主题: AI技术研报

6885 点击 2024-04-26 17:15

AI企业疯狂“卷”文本

2024年AI（人工智能）大模型行业的第一场竞争热潮，从长文本开始。

来自主题: AI资讯

9966 点击 2024-04-22 10:51

AI资讯新闻榜单内容搜索-长文本

智谱，闷声不响发了个「100w 长文本模型」

大模型长文本阅读能力如何评估？

月之暗面对谈 Zilliz：长文本和 RAG 如何选择？

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

无一大模型及格！ 北大/通研院提出超难基准，专门评估长文本理解生成

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

你的超级知识助手来了！讯飞星火支持长文本长图文长语音，生产力直线UP

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

AI企业疯狂“卷”文本

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成