AI资讯新闻榜单内容搜索-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。

来自主题: AI技术研报
9915 点击    2025-02-24 14:40
开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器

省一半算力跑出2倍效果,月之暗面开源优化器Muon,同预算下全面领先。

来自主题: AI技术研报
8577 点击    2025-02-24 13:56
避开DeepSeek 官网崩溃,最近在支付宝里发现了隐藏玩法

避开DeepSeek 官网崩溃,最近在支付宝里发现了隐藏玩法

避开DeepSeek 官网崩溃,最近在支付宝里发现了隐藏玩法

DeepSeek 懂的都懂,从爆火那天起,官方就常年“服务器繁忙“,想问个问题,比春运抢票还难。

来自主题: AI资讯
9687 点击    2025-02-24 13:30
扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体

最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。然而,尽管扩散模型在图像生成任务中表现优异,但在图像目标移除任务中仍然面临诸多挑战。现有方法在移除前景目标后,可能会留下残影或伪影,难以实现与背景的自然融合。

来自主题: AI技术研报
8194 点击    2025-02-24 13:20
一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”

一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”

一文详解DeepSeek开源的FlashMLA,他们才是真正的“源神”

刚刚,万众瞩目的DeepSeek,开源了他们第一天的项目。FlashMLA是一款面向Hopper GPU的高效MLA解码内核,并针对可变长度序列的服务场景进行了优化。

来自主题: AI资讯
10312 点击    2025-02-24 11:28
阿里砸3800亿豪赌AI

阿里砸3800亿豪赌AI

阿里砸3800亿豪赌AI

本周一,阿里巴巴集团CEO吴泳铭抛出了炸弹——未来三年将投入超3800亿元建设云和AI硬件基础设施。这个金额,不仅创下了中国民营企业在该领域有史以来最大规模的投资纪录,更像一枚投入湖面的巨石,在中国科技产业激起层层涟漪。

来自主题: AI资讯
9242 点击    2025-02-24 11:17
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达Hopper GPU打造MLA解码内核。注意,DeepSeek训练成本极低的两大关键,一个是MoE,另一个就是MLA。

来自主题: AI资讯
11063 点击    2025-02-24 10:57