AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

香港大学联合上海人工智能实验室，华为诺亚方舟实验室提出高效扩散模型 LiT：探索了扩散模型中极简线性注意力的架构设计和训练策略。LiT-0.6B 可以在断网状态，离线部署在 Windows 笔记本电脑上，遵循用户指令快速生成 1K 分辨率逼真图片。

来自主题: AI技术研报

7875 点击 2025-02-01 18:37

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27 页综述，354 篇参考文献！史上最详尽的视觉定位综述，内容覆盖过去十年的视觉定位发展总结，尤其对最近 5 年的视觉定位论文系统性回顾，内容既涵盖传统基于检测器的视觉定位，基于 VLP 的视觉定位，基于 MLLM 的视觉定位，也涵盖从全监督、无监督、弱监督、半监督、零样本、广义定位等新型设置下的视觉定位。

来自主题: AI技术研报

7402 点击 2025-02-01 18:11

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

外媒SemiAnalysis的一篇深度长文，全面分析了DeepSeek背后的秘密——不是「副业」项目、实际投入的训练成本远超600万美金、150多位高校人才千万年薪，攻克MLA直接让推理成本暴降......

来自主题: AI资讯

9198 点击 2025-02-01 13:49

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

现在，豆包大模型团队联合北京交通大学、中国科学技术大学提出了VideoWorld。

来自主题: AI技术研报

8048 点击 2025-01-31 13:53

ModernBERT 为我们带来了哪些启示？

ModernBERT 为我们带来了哪些启示？

ModernBERT 为我们带来了哪些启示？

当谷歌在 2018 年推出 BERT 模型时，恐怕没有料到这个 3.4 亿参数的模型会成为自然语言处理领域的奠基之作。

来自主题: AI技术研报

9316 点击 2025-01-31 12:34

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

8703 点击 2025-01-30 15:11

最新研究揭示AI数据之殇：科技巨头垄断权力，「西方中心」数据加剧模型偏见

最新研究揭示AI数据之殇：科技巨头垄断权力，「西方中心」数据加剧模型偏见

最新研究揭示AI数据之殇：科技巨头垄断权力，「西方中心」数据加剧模型偏见

相比LLM和Agent领域日新月异、高度成熟的进展相比，数据收集方面的规范有明显滞后。由超过50名研究人员组成的「数据溯源计划」（DPI）旨在回答这样一个问题：AI训练所需的数据究竟来自何处？

来自主题: AI技术研报

7370 点击 2025-01-30 13:00

UC伯克利等最新实锤：LLM就是比人类啰嗦，「提问的艺术」仍难参透

UC伯克利等最新实锤：LLM就是比人类啰嗦，「提问的艺术」仍难参透

UC伯克利等最新实锤：LLM就是比人类啰嗦，「提问的艺术」仍难参透

基于一段文本提问时，人类和大模型会基于截然不同的思维模式给出问题。大模型喜欢那些需要详细解释才能回答的问题，而人类倾向于提出更直接、基于事实的问题。

来自主题: AI技术研报

5376 点击 2025-01-29 13:32

原来，这些顶级大模型都是蒸馏的

原来，这些顶级大模型都是蒸馏的

原来，这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。

来自主题: AI技术研报

9335 点击 2025-01-29 13:26

新范式，自回归大一统！北大提出VARGPT：单一框架实现视觉「理解」与「生成」

新范式，自回归大一统！北大提出VARGPT：单一框架实现视觉「理解」与「生成」

新范式，自回归大一统！北大提出VARGPT：单一框架实现视觉「理解」与「生成」

VARGPT是一种新型多模态大模型，能够在单一框架内实现视觉理解和生成任务。通过预测下一个token完成视觉理解，预测下一个scale完成视觉生成，展现出强大的混合模态输入输出能力。

来自主题: AI技术研报

7809 点击 2025-01-28 12:07

上一页当前第238页,共353页下一页