AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿

DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿

DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿

因为 V3 版本开源模型的发布,DeepSeek 又火了一把,而且这一次,是外网刷屏。 训练成本估计只有 Llama 3.1 405B 模型的 11 分之一,后者的效果还不如它。

来自主题: AI资讯
8636 点击    2025-01-09 09:31
英伟达「世界基础模型」诞生,引爆物理AI革命!75页报告出炉,GitHub狂飙2k星

英伟达「世界基础模型」诞生,引爆物理AI革命!75页报告出炉,GitHub狂飙2k星

英伟达「世界基础模型」诞生,引爆物理AI革命!75页报告出炉,GitHub狂飙2k星

昨天,英伟达官宣了首个「世界基础模型」Cosmos。从此,物理AI数据不够的问题将有望解决!而就在刚刚,75页技术报告火热出炉,GitHub项目更是冲破了2k星。

来自主题: AI技术研报
9804 点击    2025-01-08 15:27
「小模型」有更多机会点

「小模型」有更多机会点

「小模型」有更多机会点

大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。

来自主题: AI资讯
7049 点击    2025-01-08 14:50
AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3

AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3

AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3

Falcon 方法是一种增强半自回归投机解码框架,旨在增强 draft model 的并行性和输出质量,以有效提升大模型的推理速度。Falcon 可以实现约 2.91-3.51 倍的加速比,在多种数据集上获得了很好的结果,并已应用到翼支付多个实际业务中。

来自主题: AI技术研报
8348 点击    2025-01-08 14:38
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据激发高级推理能力!近日,来自清华的研究者提出了PRIME,通过隐式奖励来进行过程强化,提高了语言模型的推理能力,超越了SFT以及蒸馏等方法。

来自主题: AI技术研报
4452 点击    2025-01-08 11:12
老黄亮出全球最小超算,大模型在家跑!5090惊天问世,惊爆价16499

老黄亮出全球最小超算,大模型在家跑!5090惊天问世,惊爆价16499

老黄亮出全球最小超算,大模型在家跑!5090惊天问世,惊爆价16499

就在刚刚,RTX 5090震撼发布,国行版定价16499元!同时震撼亮相的,还有全球最小AI超算Project Digits,在办公桌上就能跑出数据中心级算力!这一刻老黄摆出别致pose,吸引了全球目光。

来自主题: AI资讯
10105 点击    2025-01-08 10:28
用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率

用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率

用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率

现在,大模型可以帮你梳理新闻时间线了,以后吃瓜就更方便了! AI Agent的风,咱们赛博乐子人也得吹吹。 这就是来自阿里巴巴通义实验室与上海交通大学的新研究,他们提出了一种基于Agent的新闻时间线摘要新框架——CHRONOS。

来自主题: AI资讯
9510 点击    2025-01-08 10:18
陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减

陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减

陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减

陈丹琦团队又带着他们的降本大法来了—— 数据砍掉三分之一,大模型性能却完全不减。 他们引入了元数据,加速了大模型预训练的同时,也不增加单独的计算开销。

来自主题: AI资讯
8693 点击    2025-01-08 09:56