AI资讯新闻榜单内容搜索-Hugging

里程碑时刻！首个100B扩散语言模型来了，技术报告揭秘背后细节

前段时间，我们在 HuggingFace 页面发现了两个新模型：LLaDA2.0-mini 和 LLaDA2.0-flash。它们来自蚂蚁集团与人大、浙大、西湖大学组成的联合团队，都采用了 MoE 架构。前者总参数量为 16B，后者总参数量则高达 100B—— 在「扩散语言模型」这个领域，这是从未见过的规模。

来自主题: AI资讯

10773 点击 2025-12-12 16:08

深度｜Hugging Face联创：中国模型成初创公司首选，开源将决定下一轮AI技术主导权

在美国也出现了一种“开源重新兴起”的现象，某种意义上是对中国发展的反应。所以美国开始重新推动大量开源。

来自主题: AI资讯

11172 点击 2025-12-02 15:12

6B文生图模型，上线即登顶抱抱脸

6B小模型，首日下载量高达50万次，上线不到两天直接把HuggingFace两个榜单都冲了个第一。

来自主题: AI技术研报

8170 点击 2025-12-01 15:13

混元OCR模型核心技术揭秘：统一框架、真端到端

腾讯混元大模型团队正式发布并开源HunyuanOCR模型！这是一款商业级、开源且轻量（1B参数）的OCR专用视觉语言模型，模型采用原生ViT和轻量LLM结合的架构。目前，该模型在抱抱脸（Hugging Face）趋势榜排名前四，GitHub标星超过700，并在Day 0被vllm官方团队接入。

来自主题: AI技术研报

8911 点击 2025-11-29 13:43

DeepSeek强势回归，开源IMO金牌级数学模型

就在刚刚，DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型：DeepSeek-Math-V2。顾名思义，这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时，这个模型只用 7B 参数量，就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO，显著提升了数学推理能力。

来自主题: AI资讯

10043 点击 2025-11-27 22:47

HuggingFace发布超200页「实战指南」，从决策到落地「手把手」教你训练大模型

近期，HuggingFace 发布的超过 200 页的超长技术博客，系统性地分享训练先进 LLM 的端到端经验。

来自主题: AI技术研报

8533 点击 2025-11-10 09:57

世界模型可单GPU秒级生成了？厦大、腾讯开源FlashWorld，效果惊艳、免费体验

厦门大学和腾讯合作的最新论文《FlashWorld: High-quality 3D Scene Generation within Seconds》获得了海内外的广泛关注，在当日 Huggingface Daily Paper 榜单位列第一，并在 X 上获得 AK、Midjourney 创始人、SuperSplat 创始人等 AI 大佬点赞转发。

来自主题: AI技术研报

7966 点击 2025-10-31 10:27

手把手带你入门机器人学习，HuggingFace联合牛津大学新教程开源SOTA资源库

HuggingFace 与牛津大学的研究者们为想要进入现代机器人学习领域的新人们提供了了一份极其全面易懂的技术教程。这份教程将带领读者探索现代机器人学习的全景，从强化学习和模仿学习的基础原理出发，逐步走向能够在多种任务甚至不同机器人形态下运行的通用型、语言条件模型。

来自主题: AI技术研报

10811 点击 2025-10-26 16:28

只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

整个Hugging Face的趋势版里，前4有3个OCR，甚至Qwen3-VL-8B也能干OCR的活，说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里，有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比，也有很多人都在问，能不能再解读一下百度那个OCR模型（也就是PaddleOCR-VL）。

来自主题: AI资讯

11665 点击 2025-10-23 10:58

开源对机器人的价值，远超大模型时代的想象丨唐文斌深度对谈抱抱脸创始人

“很多模型在模拟器里完美运行，但一到现实就彻底失灵。” 在最新一次线上对谈中，Dexmal联合创始人唐文斌与Hugging Face联合创始人Thomas Wolf指出了当前机器人研究的最大痛点。

来自主题: AI资讯

7911 点击 2025-10-20 15:08