AI资讯新闻榜单内容搜索-上下文

最强代码模型刷新：Mistral新品上线即登顶，上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral，又上新了！而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐，共同位列 Copilot 竞技场第一名。

来自主题: AI资讯

7111 点击 2025-01-14 15:42

谷歌推出的FACTS Grounding基准测试，能评估AI模型在特定上下文中生成准确文本的能力，有助于提升模型的可靠性；通过去除不满足用户需求的回复，确保了评分的准确性和模型排名的公正性。

来自主题: AI技术研报

8640 点击 2025-01-13 13:47

时隔6年，一度被认为濒死的“BERT”杀回来了——

来自主题: AI技术研报

5007 点击 2024-12-25 10:21

IBM 正式发布了其新一代开源大语言模型 Granite 3.1，这是一组轻量级、先进的开源基础模型，支持多语言、代码生成、推理和工具使用，能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

来自主题: AI资讯

8499 点击 2024-12-25 09:57

每一次，当基础模型能力变强，总会有人预言：RAG（检索增强生成）或许要过时了。

来自主题: AI资讯

5083 点击 2024-12-23 13:52

OpenAI的实时API支持低延迟、双向音频流，使得多模态AI应用（如语音对话Agent）得以实现。它通过WebSocket连接管理对话状态，并提供短语结束检测和语音活动检测（VAD）功能，大大简化了实时语音应用的开发。

来自主题: AI资讯

7854 点击 2024-12-13 17:05

微软研究院最新研究揭示：一种悄然兴起的AI交互模式，正在改变我们与AI对话的方式。这项突破性研究不仅让AI更懂你，还能帮你更好地表达你的需求。

来自主题: AI技术研报

7454 点击 2024-12-09 10:51

大模型如今已具有越来越长的上下文，而与之相伴的是推理成本的上升。英伟达最新提出的Star Attention，能够在不损失精度的同时，显著减少推理计算量，从而助力边缘计算。

来自主题: AI技术研报

6698 点击 2024-12-05 11:27

在人工智能领域，与AI进行无缝的实时交互一直是开发者和研究者面临的一大挑战。特别是将文本、图片、音频等多模态信息整合成一个连贯的对话系统，更是难上加难。尽管像GPT-4这样的语言模型在对话流畅性和上下文理解上取得了长足进步，但在实际应用中，这些模型仍然存在不足之处：

来自主题: AI技术研报

8632 点击 2024-11-28 09:53

RNN模型在长上下文中表现不佳？近日，来自清华的研究团队对此进行了深入的实验分析，结果表明：不是RNN的锅。

来自主题: AI技术研报

8497 点击 2024-11-27 17:10