AI资讯新闻榜单内容搜索-模型训练

代码自己改自己？我用1000万DeepSeek跑通了赫胥黎-歌德尔机HGM（附避坑指南）

读者，您好！今天想跟您聊一个硬核又极具启发性的项目——HGM（Huxley-Gödel Machine）。我刚刚一起花了几个小时，从环境配置的坑，一路“打怪升级”到让它最终跑完，相信您可能已经从别的公众号上看到了这篇文章。

来自主题: AI技术研报

9530 点击 2025-10-30 11:24

高效训练新标杆！华人团队开源原生VLM-NEO，以少数据追平顶级模型

当下主流的视觉语言模型（Vision-Language Models, VLM），通常都采用这样一种设计思路：将预训练的视觉编码器与大语言模型通过投影层拼接起来。这种模块化架构成就了当前 VLM 的辉煌，但也带来了一系列新的问题——多阶段训练复杂、组件间语义对齐成本高，不同模块的扩展规律难以协调。

来自主题: AI技术研报

8761 点击 2025-10-30 10:55

牛津VGG、港大、上交发布ELIP：超越CLIP等，多模态图片检索的增强视觉语言大模型预训练

多模态图片检索是计算机视觉和多模态机器学习领域很重要的一个任务。现在大家做多模态图片检索一般会用 CLIP/SigLIP 这种视觉语言大模型，因为他们经过了大规模的预训练，所以 zero-shot 的能力比较强。

来自主题: AI技术研报

7762 点击 2025-10-30 10:42

单条演示即可抓取一切：北大团队突破通用抓取，适配所有灵巧手本体

在灵巧手通用抓取的研究中，由于动作空间维度高、任务具有长程探索特征且涉及多样化物体，传统强化学习（RL）面临探索效率低、奖励函数及训练过程设计复杂等挑战。

来自主题: AI技术研报

7233 点击 2025-10-30 10:26

刚刚，最佳VLA模型GigaBrain-0开源：世界模型驱动10倍数据，真机碾压SOTA

国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0重磅发布。

来自主题: AI技术研报

6618 点击 2025-10-29 18:14

让你的Mac用上DeepSeek-OCR：一个从0到1的开源适配之旅

DeepSeek-OCR这段时间非常火，但官方开源的文件是“按 NVIDIA/CUDA 习惯写的 Linux 版推理脚本+模型权重”，而不是“跨设备跨后端”的通吃实现，因此无法直接在苹果设备上运行，对于Mac用户来说，在许多新模型诞生的第一时间，往往只能望“模”兴叹。

来自主题: AI技术研报

9826 点击 2025-10-29 17:10

双管齐下：联邦学习防投毒攻击与梯度泄露，华南理工深北莫研究成果登上TMC与IoT

AI风起云涌，数据隐私如履薄冰。华南理工大学联手深圳北理莫斯科大学，推出FedMSBA与FedMAR，筑成联邦学习的安全堡垒，守护个人隐私！

来自主题: AI技术研报

6757 点击 2025-10-29 16:51

AlphaGo之父找到创造强化学习算法新方法：让AI自己设计

强化学习是近来 AI 领域最热门的话题之一，新算法也在不断涌现。

来自主题: AI技术研报

7479 点击 2025-10-29 16:37

VAE再被补刀！清华快手SVG扩散模型亮相，训练提效6200%，生成提速3500%

前脚谢赛宁刚宣告VAE在图像生成领域退役，后脚清华与快手可灵团队也带着无VAE潜在扩散模型SVG来了。

来自主题: AI技术研报

7586 点击 2025-10-29 16:28

TPAMI 2025 | AI对抗迁移性评估的「拨乱反正」：那些年效果虚高的攻防算法们

对抗样本（adversarial examples）的迁移性（transferability）—— 在某个模型上生成的对抗样本能够同样误导其他未知模型 —— 被认为是威胁现实黑盒深度学习系统安全的核心因素。尽管现有研究已提出复杂多样的迁移攻击方法，却仍缺乏系统且公平的方法对比分析：（1）针对攻击迁移性，未采用公平超参设置的同类攻击对比分析；（2）针对攻击隐蔽性，缺乏多样指标。

来自主题: AI技术研报

7832 点击 2025-10-29 16:05