AI资讯新闻榜单内容搜索-训练

450美元训练一个「o1-preview」？UC伯克利开源32B推理模型Sky-T1，AI社区沸腾了

450 美元的价格，乍一听起来不算「小数目」。但如果，这是一个 32B 推理模型的全部训练成本呢？

来自主题: AI资讯

6669 点击 2025-01-12 17:08

AI的飞跃可能会开辟我们理解古代世界的新方法。想象一下，如果ChatGPT可以在「上古卷轴」的文本洪流上接受训练，我们将有机会直接与历史对话。

来自主题: AI资讯

6718 点击 2025-01-12 16:43

基于深度神经网络对人脸图像进行编辑和篡改，深度伪造的发展为人们的生活带来了便利，但对其错误的应用也同时危害着人们的隐私和信息安全。

来自主题: AI技术研报

7162 点击 2025-01-12 16:38

GAN已死？不，它卷土重来了！布朗大学和康奈尔大学的研究者刚刚提出了R3GAN，充分利用现代架构设计，彻底摒弃临时技巧，一半参数就能碾压扩散模型。网友惊呼：游戏规则要改变了！

来自主题: AI技术研报

5711 点击 2025-01-12 11:04

AI 的编程能力已经得到了证明，但还并不完美。近日，BuzzFeed 的资深数据科学家 Max Woolf 发现，如果通过提示词不断要求模型写更好的代码（write better code），AI 模型还真能写出更好的代码！

来自主题: AI资讯

7671 点击 2025-01-12 10:51

将扩散模型量化到1比特极限，又有新SOTA了！来自北航、ETH等机构的研究人员提出了一种名为BiDM的新方法，首次将扩散模型（DMs）的权重和激活完全二值化。

来自主题: AI技术研报

7591 点击 2025-01-12 10:42

在多模态大语言模型（MLLMs）的发展中，视觉 - 语言连接器作为将视觉特征映射到 LLM 语言空间的关键组件，起到了桥梁作用。

来自主题: AI技术研报

6907 点击 2025-01-12 10:22

LLM会把编程淘汰吗？近日，哥本哈根大学的计算机教授，通过分析计算理论中的定理所施加的基本限制，得出结论：距离编程的终结还远得很。

来自主题: AI资讯

5941 点击 2025-01-12 10:17

Meta-CoT 通过显式建模生成特定思维链（CoT）所需的底层推理过程，扩展了传统的思维链方法。

来自主题: AI资讯

6593 点击 2025-01-12 10:08

大模型长序列的处理能力已越来越重要，像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式，需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报

7439 点击 2025-01-11 13:45