AI资讯新闻榜单内容搜索-数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map,提高学生模型的准确性。迁移学习则通常通过预训练和微调,将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。

来自主题: AI技术研报
4995 点击    2025-01-28 11:57
百度文库,一脚踢开AI「十亿营收俱乐部」大门

百度文库,一脚踢开AI「十亿营收俱乐部」大门

百度文库,一脚踢开AI「十亿营收俱乐部」大门

最近,科技圈都在传一个数据:百度旗下的文库业务,AI功能月活用户突破9000万,超过字节旗下豆包的7000万。最近,科技圈都在传一个数据:百度旗下的文库业务,AI功能月活用户突破9000万,超过字节旗下豆包的7000万。

来自主题: AI资讯
7360 点击    2025-01-27 14:55
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

2028年,预计高质量数据将要耗尽,数据Scaling走向尽头。2025年,测试时计算将开始成为主导AI通向通用人工智能(AGI)的新一代Scaling Law。近日,CMU机器学习系博客发表新的技术文章,从元强化学习(meta RL)角度,详细解释了如何优化LLM测试时计算。

来自主题: AI技术研报
6977 点击    2025-01-27 14:03
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。

来自主题: AI技术研报
6864 点击    2025-01-25 09:38
奥特曼晒「星际之门」首期工厂,全美狂建20座超算!70万块GPU老黄爆赚375亿

奥特曼晒「星际之门」首期工厂,全美狂建20座超算!70万块GPU老黄爆赚375亿

奥特曼晒「星际之门」首期工厂,全美狂建20座超算!70万块GPU老黄爆赚375亿

「星际之门」更多内幕被曝光了!据称,首期投入1000亿美金,将在德州阿比林建设10座数据中心,未来要在全美打造20个超算。与此同时,奥特曼秀出了首期工厂的全景,无比震撼。

来自主题: AI资讯
8828 点击    2025-01-24 15:52
刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖

刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖

刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖

由无问芯穹与上海交通大学联合研究团队提出的视频生成软硬一体加速器,首次实现通过差分近似和自适应数据流解决 VDiT 生成速度缓慢瓶颈,推理速度相比 A100 提升高达 16.44 倍。

来自主题: AI资讯
9882 点击    2025-01-24 13:44
刚刚,豆包1.5模型家族硬核登场!「深度思考」秘笈曝光,多模态冲爆榜单

刚刚,豆包1.5模型家族硬核登场!「深度思考」秘笈曝光,多模态冲爆榜单

刚刚,豆包1.5模型家族硬核登场!「深度思考」秘笈曝光,多模态冲爆榜单

刚刚发布的豆包大模型1.5,不仅多模态能力全面提升,霸榜多个基准;更难得的是,它在训练过程中从未使用过任何其他模型生成的数据,坚决不走蒸馏「捷径」。

来自主题: AI资讯
9995 点击    2025-01-23 13:44
李飞飞:语言之外,另一半的智能还有待实现

李飞飞:语言之外,另一半的智能还有待实现

李飞飞:语言之外,另一半的智能还有待实现

最近,斯坦福大学教授李飞飞接受了硅谷著名投资人 Reid Hoffman 和 Aria Finger 的联合播客专访。在这场对话中,李飞飞主要探讨了以下主题: ImageNet 的灵感源于难以避开模型的过拟合问题,李飞飞意识到与其苦心改进模型,不如用数据驱动。

来自主题: AI资讯
7083 点击    2025-01-22 18:36