清华系团队出手!一张 4090 即可「爆改」,1.3B小钢炮震撼开源
清华系团队出手!一张 4090 即可「爆改」,1.3B小钢炮震撼开源端侧多模态,卷出新天花板。仅1.3B,性能反超,效率翻倍,一张4090就能「爆改」。刚刚,清华系团队面壁智能开源了新一代「小钢炮」MiniCPM-V 4.6,再次证明了在端侧AI领域,中国团队已然站在世界前沿。
搜索
端侧多模态,卷出新天花板。仅1.3B,性能反超,效率翻倍,一张4090就能「爆改」。刚刚,清华系团队面壁智能开源了新一代「小钢炮」MiniCPM-V 4.6,再次证明了在端侧AI领域,中国团队已然站在世界前沿。
这是主流出版集团首次发起针对AI企业的诉讼,Meta明目张胆侵犯版权,出版商们将还原全部事实。
AI版权大战,再度升级了。
Voice Agent终于能打实战了!这家中国公司靠一套Model + Harness的方法论,正在重新定义金融级Agent的标杆,也撬动了黄仁勋所预言的百万亿美元市场。
如果把AI丢进一个没有标准答案的工程现场,它还能活下来吗?
趁马斯克跨洋出差,首次出庭“OpenAI果实窃取诉讼案”的奥特曼,在加州法庭上说出了一句震惊四座的话: 马斯克曾经认为,未来OpenAI的控制权,可以传给自己的孩子。
随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。
家用电器是家庭服务机器人最难啃的一类任务对象。与桌面物体操作相比,家电操作不仅涉及按钮、旋钮、门体等多种异构部件,还受到模式切换、状态约束和程序逻辑的共同支配。真正完成一次家电任务,机器人往往既要「看得见」,也要「读得懂」,还要「按说明书做对」。
当前VLA模型常依赖视觉线索而非语言指令,导致在新场景下表现不佳。论文提出LangForce方法,通过引入对数似然比损失,强化模型对语言的依赖,提升其在分布外环境中的泛化能力,并保留语言核心功能。
买对东西,是个有门槛的技术活儿。