AI资讯新闻榜单内容搜索-eLLM

提升大模型内在透明度：无需外部模块实现高效监控与自发安全增强｜上海AI Lab & 上交

大语言模型（LLM）能力提升引发对潜在风险的担忧，洞察其内部“思维过程”、识别危险信号成AI安全核心挑战。

来自主题: AI技术研报

7433 点击 2025-06-23 14:58

今天，我们很高兴开源“强大”、“多样”、“实用”的Qwen2.5-Coder全系列模型，致力于持续推动Open CodeLLMs的发展。

来自主题: AI技术研报

3601 点击 2024-11-12 10:26

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

4802 点击 2024-10-10 17:17

Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B以下，两个版本分别只有125M和350M参数，但却实现了比更大规模模型更优的性能。

来自主题: AI技术研报

9870 点击 2024-07-22 15:25

第一个能听懂你说话的语气、有“情商”的AI火了！

来自主题: AI技术研报

5889 点击 2024-04-08 14:47

在视频理解这一领域，尽管多模态模型在短视频分析上取得了突破性进展，展现出了较强的理解能力，但当它们面对电影级别的长视频时，却显得力不从心。因而，长视频的分析与理解，特别是对于长达数小时电影内容的理解，成为了当前的一个巨大挑战。

来自主题: AI技术研报

9215 点击 2024-03-10 16:19

基于大模型的Agent会玩宝可梦了，人类水平的那种！名为PokéLLMon，现在它正在天梯对战中与人类玩家一较高下：

来自主题: AI资讯

4970 点击 2024-02-12 13:34

融合多个异构大语言模型，中山大学、腾讯 AI Lab 推出 FuseLLM

来自主题: AI技术研报

4236 点击 2024-01-27 13:51

目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述，在像素级理解方面的能力（例如物体分割）相对有限。

来自主题: AI技术研报

9338 点击 2023-12-28 17:37