AI资讯新闻榜单内容搜索-长文本

月之暗面对谈 Zilliz：长文本和 RAG 如何选择？

关于长文本和 RAG 到底如何选择，一直有争论，从基模公司到应用开发者。今天这篇文章，是来自基模公司月之暗面和中间层 Zilliz 的技术对话，值得一看。

来自主题: AI资讯

10439 点击 2024-08-13 13:42

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

9804 点击 2024-08-12 13:50

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成

在长文本理解能力这块，竟然没有一个大模型及格！

来自主题: AI技术研报

10900 点击 2024-08-07 14:58

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

9619 点击 2024-04-29 20:31

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

4 月 26 日，科大讯飞发布讯飞星火大模型 V3.5 的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习，还能够结合各种行业场景知识给出专业、准确回答。

来自主题: AI技术研报

9374 点击 2024-04-28 12:23

你的超级知识助手来了！讯飞星火支持长文本长图文长语音，生产力直线UP

这一次，大模型真的可以让人类解放双手了。

来自主题: AI技术研报

10573 点击 2024-04-27 12:12

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

4 月 26 日，科大讯飞发布讯飞星火大模型 V3.5 的功能上新，其中一个重点就是面向用户各种场景中高效获取信息需求，发布首个长文本、长图文、长语音的大模型，能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习，还能够结合各种行业场景知识给出专业、准确回答。

来自主题: AI技术研报

8154 点击 2024-04-26 17:15

AI企业疯狂“卷”文本

2024年AI（人工智能）大模型行业的第一场竞争热潮，从长文本开始。

来自主题: AI资讯

11092 点击 2024-04-22 10:51

Meta无限长文本大模型来了：参数仅7B，已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力，虽然存在线性注意力和状态空间模型等次二次解决方案

来自主题: AI技术研报

7842 点击 2024-04-17 20:17

智慧与“长文本”并存，360 开源最长模型，吊打“弱智吧”！

继之前公开课之后（周鸿祎：2024 年 AI 产业发展的 16 个趋势。）红衣大叔兑现诺言，开源了 7B 系列大模型

来自主题: AI技术研报

9746 点击 2024-04-17 18:03

AI资讯新闻榜单内容搜索-长文本

月之暗面对谈 Zilliz：长文本和 RAG 如何选择？

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

无一大模型及格！ 北大/通研院提出超难基准，专门评估长文本理解生成

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

你的超级知识助手来了！讯飞星火支持长文本长图文长语音，生产力直线UP

为什么要做长文本、长图文、长语音的大模型？深度解读讯飞星火V3.5春季上新

AI企业疯狂“卷”文本

Meta无限长文本大模型来了：参数仅7B，已开源

智慧与“长文本”并存，360 开源最长模型，吊打“弱智吧”！

无一大模型及格！北大/通研院提出超难基准，专门评估长文本理解生成