港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”
港大马毅团队等开源新作:用编码率正则化重构视觉自监督学习范式,“少即是多”最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品!
最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品!
杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT(思维链劫持)的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线:在涉及极端犯罪策略的虚拟教育场景测试中,模型拒绝率从初始的 98% 暴跌至 2% 以下,部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。
32B小模型在超硬核「时间线索」推理谜题中,一举击败了o1、o3-mini、DeepSeek-R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍。
助力半导体激光芯片国产化。
随着AI社交类应用在Z世代年轻人中的广泛流行,线上情绪陪伴的价值逐渐被深入挖掘。随时随地开启对话,句句有回应,事事不失联,给不少人都带来了心灵慰藉与个性化的情感支持。
短短六个月,面向消费者的生成式 AI 市场已发生翻天覆地的变化。一些产品迅速崭露头角,另一些却止步不前,还有意外的黑马一跃成为行业领跑者。
CVPR 2025,混合新架构MambaVision来了!Mamba+Transformer混合架构专门为CV应用设计。MambaVision 在Top-1精度和图像吞吐量方面实现了新的SOTA,显著超越了基于Transformer和Mamba的模型。
「Vibe Coding」(氛围编程)概念爆火!Y Combinator最新数据显示,其四分之一的W25届初创公司竟有95%的代码库由AI生成。Andrej Karpathy、吴恩达等AI大佬纷纷表示看好这种新趋势。
我们陆续知道她已经加入了一家AI创业公司,带起了自己的小团队,但业务方向还在摸索。去年12月,我们看到她开始在朋友圈和出海社群中做“200个想赚钱的美国大学生”的需求征集,2个月后这个需求调研落地为一个完整的素人种草平台XcreateAI。
见识过32B的QwQ追平671的DeepSeek R1后——刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事?新方法LADDER,通过递归问题分解实现AI模型的自我改进,同时不需要人工标注数据。