AI资讯新闻榜单内容搜索-训练模型

ICLR 2026 | PIL：基于线性代理的不可学习样本生成方法

不可学习样本（Unlearnable Examples）是一类用于数据保护的技术，其核心思想是在原始数据中注入人类难以察觉的微小扰动，使得未经授权的第三方在使用这些数据训练模型时，模型的泛化性能显著下降，甚至接近随机猜测，从而达到阻止数据被滥用的目的。

来自主题: AI技术研报

8793 点击 2026-02-18 13:27

香港中文大学提出了一个全新的算法框架RankSEG，用于提升语义分割任务的性能。传统方法在预测阶段使用threshold或argmax生成掩码，但这种方法并非最优。RankSEG无需重新训练模型，仅需在推理阶段增加三行代码，即可显著提高Dice或IoU等分割指标。

来自主题: AI技术研报

9492 点击 2026-01-05 14:27

压缩即智能，又有新进展！

来自主题: AI技术研报

9125 点击 2025-12-16 09:56

近日，北京大学团队提出一个直接基于已有预训练模型进行极低比特量化的通用框架——Fairy2i。该框架通过广泛线性表示将实数模型无损转换为复数形式，再结合相位感知量化与递归残差量化，实现了在仅2比特的情况下，性能接近全精度模型的突破性进展。

来自主题: AI技术研报

7774 点击 2025-12-10 14:28

AI训练背后，正在上演一场新的「华尔街迁徙」！前银行家纷纷化身AI导师，用自己的专业知识帮助OpenAI、xAI、Scale AI等AI公司训练模型，华尔街精英正在成为AI重塑华尔街的幕后推手。

来自主题: AI资讯

8910 点击 2025-11-26 13:47

数据集蒸馏是一种用少量合成数据替代全量数据训练模型的技术，能让模型高效又节能。WMDD和GUARD两项研究分别解决了如何保留原始数据特性并提升模型对抗扰动能力的问题，使模型在少量数据上训练时既准确又可靠。

来自主题: AI技术研报

9761 点击 2025-10-27 17:16

为破解机器人产业「一机一调」的开发困境，智源研究院开源了通用「小脑基座」RoboBrain-X0。它创新地学习任务「做什么」而非「怎么动」，让一个预训练模型无需微调，即可驱动多种不同构造的真实机器人，真正实现了零样本跨本体泛化。

来自主题: AI资讯

8893 点击 2025-09-30 11:01

很多人认为，Scaling Law 正在面临收益递减，因此继续扩大计算规模训练模型的做法正在被质疑。最近的观察给出了不一样的结论。研究发现，哪怕模型在「单步任务」上的准确率提升越来越慢，这些小小的进步叠加起来，也能让模型完成的任务长度实现「指数级增长」，而这一点可能在现实中更有经济价值。

来自主题: AI技术研报

7338 点击 2025-09-16 15:15

近期，AI营销公司橙果视界（PhotoG母公司）宣布完成数千万元新一轮融资，由云天使基金领投，力合创投和金沙江联合资本跟投。本轮融资将用于进一步扩大行业数据规模，推进垂直行业后训练模型迭代，进一步加快全链路营销智能体在多行业的业务落地，持续探索能感知、决策、创造并执行的商业大脑。

来自主题: AI资讯

9284 点击 2025-09-01 15:06

近日，Anthropic更新了它的消费者条款，没想竟把网友惹怒了，有的还把以往的「旧账」都翻了出来。这次网友的反应为啥这么激烈？大家可能还记得在Claude上线之初，Anthropic就坚决表示不会拿用户数据来训练模型。这次变化不仅自己打脸，还把以往一些「背刺」用户的往事都抖搂出来了。

来自主题: AI资讯

9809 点击 2025-08-31 13:31