AI资讯新闻榜单内容搜索-训练

DeepSeek、GPT-5都在尝试的快慢思考切换，有了更智能版本，还是多模态

当前，业界顶尖的大模型正竞相挑战“过度思考”的难题，即无论问题简单与否，它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换，还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。

来自主题: AI技术研报

7924 点击 2025-09-02 12:27

Nano Banana为什么能秒杀GPT-4o成为新晋AI图像王者？创始人下场解答

GPT-4o发布才过去半年，Nano Banana这种「下一代」的生图模型就出来了。这难道是AI界的摩尔定律？不敢想再过半年后，会是什么样的「魔鬼级」生图模型来屠Nano Banana

来自主题: AI资讯

9500 点击 2025-09-02 12:10

深度｜a16z对谈SemiAnalysis创始人：AI真正的天花板不是芯片，而是电网，美国缺电，而中国缺效率

这期对话把火力对准了一个不体面的真相：更聪明的“路由”和更苛刻的“成本”正重写 AI 商业化的脚本。

来自主题: AI资讯

9282 点击 2025-09-02 11:50

刚刚，DeepSeek最新发文，V3/R1训练细节全公开，信息量巨大

不止贴「AI生成」标签

来自主题: AI资讯

8602 点击 2025-09-02 11:36

苹果最新模型，5年前的iPhone能跑

智东西9月1日消息，苹果又公布了大模型研发新进展！ 8月28日，苹果在arXiv发布新论文，介绍新一代多模态基础模型MobileCLIP2及其背后的多模态强化训练机制，同天在GitHub、Hugging Face上开源了模型的预训练权重和数据生成代码。

来自主题: AI技术研报

8420 点击 2025-09-02 11:04

Nano-Banana 核心团队首次揭秘，全球最火的 AI 生图工具是怎么打造的

在图像生成上，Google 其实已经有 Imagen 4 这样的文生图模型，为什么 nano banana 最后还是由 Google 带来的？但这确实不是偶然或者瞎猜的，nano banana 是结合了 Google 多个团队的项目成果。首先就是 Gemini 强大的世界知识与指令遵循能力，其次就是 Google 内部顶尖文生图模型 Imagen，所提供的极致图像美学与自然度追求。

来自主题: AI技术研报

11909 点击 2025-09-02 09:24