AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

LLM的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模型逐位一致!更惊艳的是,通过针对GPU的定制化解压缩内核,DFloat11使推理吞吐量提升最高38.8倍。

来自主题: AI技术研报
8533 点击    2025-04-28 09:05
阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA

阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA

阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA

阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。该模型总参数量为 19B (7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。

来自主题: AI资讯
9111 点击    2025-04-27 15:29
ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

近年来,大语言模型(LLMs)在自然语言理解、代码生成与通用推理等任务上取得了显著进展,逐步成为通用人工智能的核心基石。

来自主题: AI技术研报
6933 点击    2025-04-26 14:36
校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

随着大型语言模型(LLMs)日益融入关键决策场景,其元认知能力——即识别、评估和表达自身知识边界的能力——变得尤为重要。

来自主题: AI技术研报
6429 点击    2025-04-26 13:57
Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%

Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%

Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%

AI是否能像人类一样感受世界?Anthropic最新研究揭示AI幸福感的可能性,科学家们却为此吵翻天。Anthropic专家大胆预测:Claude可能已有15%概率具有意识,五年后或将突飞猛进!

来自主题: AI资讯
7596 点击    2025-04-25 16:13
AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

AI下半场,聊一聊 Agent 本质与变革 | 大白话技术科普系列@Jomy

上一篇文章聊了聊 Tool、MCP 和 Agent 三者之间的关系。简单来说就是 Agent = LLM + Tools,而 MCP 统一了 Tools 开发和使用的过程。

来自主题: AI技术研报
7550 点击    2025-04-24 20:44
o3攻陷病毒学,超越94%博士级专家!生物武器门槛彻底崩塌?

o3攻陷病毒学,超越94%博士级专家!生物武器门槛彻底崩塌?

o3攻陷病毒学,超越94%博士级专家!生物武器门槛彻底崩塌?

o3病毒学能力击败了94%博士级专家,准确率高达43.8%。多家研究机构联手,通过VCT测试揭示,顶尖LLM不仅能解决复杂实验难题,直接拉低了生物武器制造门槛。

来自主题: AI资讯
8645 点击    2025-04-24 08:40
业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报
7601 点击    2025-04-23 14:04