AI资讯新闻榜单内容搜索-io

向量模型的词序感知缺陷与优化策略

最近，LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现，他指出，文本向量模型似乎存在一个问题：即使句子词序被打乱，模型输出的向量与原句仍然高度相似。

来自主题: AI技术研报

8909 点击 2024-12-29 11:16

把RLHF带给VLA模型！通过偏好对齐来优化机器人策略，代码已开源

近年来，视觉-语言-动作模型（Vision-Language-Action, VLA）在诸多机器人任务上取得了显著的进展，但它们仍面临一些关键问题，例如由于仅依赖从成功的执行轨迹中进行行为克隆，导致对新任务的泛化能力较差。

来自主题: AI技术研报

8309 点击 2024-12-28 11:41

协议曝光！微软给openai定义-赚够1000亿就算实现AGI

AGI的定义，微软和OpenAI早就悄悄谋定了。主要评判维度不看技术，而是收益。 The Information爆料，2023年双方达成秘密协定——OpenAI需要研发出能够带来1000亿美元收益的AI系统，才能被视为实现AGI。

来自主题: AI资讯

8097 点击 2024-12-27 15:20

4比特量化三倍加速不掉点！清华即插即用的SageAttention迎来升级

大模型中，线性层的低比特量化已经逐步落地。然而，对于注意力模块，目前几乎各个模型都还在用高精度（例如 FP16 或 FP32）的注意力运算进行训练和推理。并且，随着大型模型需要处理的序列长度不断增加，Attention（注意力运算）的时间开销逐渐成为主要开销。

来自主题: AI技术研报

8428 点击 2024-12-27 09:44

终于等来能塞进手机的文生图模型！十分之一体量，SnapGen实现百分百的效果

近些年来，以 Stable Diffusion 为代表的扩散模型为文生图（T2I）任务树立了新的标准，PixArt，LUMINA，Hunyuan-DiT 以及 Sana 等工作进一步提高了图像生成的质量和效率。然而，目前的这些文生图（T2I）扩散模型受限于模型尺寸和运行时间，仍然很难直接部署到移动设备上。

来自主题: AI技术研报

8365 点击 2024-12-25 14:02