超越KL!大连理工发布Wasserstein距离知识蒸馏新方法|NeurIPS 2024
超越KL!大连理工发布Wasserstein距离知识蒸馏新方法|NeurIPS 2024大连理工大学的研究人员提出了一种基于Wasserstein距离的知识蒸馏方法,克服了传统KL散度在Logit和Feature知识迁移中的局限性,在图像分类和目标检测任务上表现更好。
大连理工大学的研究人员提出了一种基于Wasserstein距离的知识蒸馏方法,克服了传统KL散度在Logit和Feature知识迁移中的局限性,在图像分类和目标检测任务上表现更好。
小模型也能击败o1?微软全华人团队提出rStar-Math算法,三大革命性技术突破,不仅让SLM在数学推理能力上刷新SOTA,更是挤进了全美20%顶尖高中生榜单。
这届CES,国内厂商刷爆存在感。
10个AI领域,50篇精品论文,每周看一篇,到2026就能成「AI工程」专家!
今天,银河通用机器人发布了端到端具身抓取基础大模型「GraspVLA」,全球第一个预训练完全基于仿真合成大数据的具身大模型,展现出了比OpenVLA、π0、RT-2、RDT等模型更全面强大的泛化性和真实场景实用潜力。
发表于昨天的论文《Agent Laboratory: Using LLM Agents as Research Assistants》对于科研界具有划时代意义,过去几周才能完成的科研任务现在仅需20分钟到一两个小时左右(不同LLM),花费2-13个美金的Token即可完成!
最近,我们团队的一位工程师在研究类 ColPali 模型时,受到启发,用新近发布的 jina-clip-v2 模型做了个颇具洞察力的可视化实验。
2025年开年,硅谷巨头新一轮裁员已开启。AI智能体掀起的风暴,让Salesforce老板豪言今年停招软件工程师。不仅如此,微软等16家科技公司纷纷加入了这波裁员大军。
2025 CES上最具话题性的两家公司,都谈到了AI PC的核心话题。 在通过新一代Blackwell 架构的英伟达 RTX 5090 显卡炸场后,黄仁勋彻底点燃了CES开场情绪。但其后,他依然不得不在会后交流中回应关于AI PC“销量没能起飞”的尖锐话题。
2000万美元AI初创CTO、CS博士Yuchen Jin,公开了绿卡申请被拒理由:美国移民局认为他缺乏「超越苹果公司」的影响力。发帖分享后,引来Jeff Dean、马斯克等大佬回复。