AI资讯新闻榜单内容搜索-SOTA

只要科学任务能打分，AI就能实现SOTA结果 | 谷歌最新论文

只要科学任务可以评分，AI就能找到超越人类专家的方法，实现SOTA结果？这是谷歌一篇最新论文里的内容：使用大模型+树搜索，让AI大海捞针就行。

来自主题: AI技术研报

8914 点击 2025-09-17 09:29

多模态BUG修复新SOTA：慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一

自动化修复真实世界的软件缺陷问题是自动化程序修复研究社区的长期目标。然而，如何自动化解决视觉软件缺陷仍然是一个尚未充分探索的领域。最近，随着 SWE-bench 团队发布最新的多模态 Issue 修复

来自主题: AI技术研报

8563 点击 2025-09-16 10:01

大模型破译甲骨文创下新SOTA！复旦团队推出新框架

让大模型破译从未见过的甲骨文，准确率拿下新SOTA！

来自主题: AI技术研报

10395 点击 2025-09-08 09:54

刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1

阿里迄今为止，参数最大的模型诞生了！昨夜，Qwen3-Max-Preview（Instruct）官宣上线，超1万亿参数性能爆表。在全球主流权威基准测试中，Qwen3-Max-Preview狂揽非推理模型「C」位，直接碾压Claude-Opus 4（Non-Thinking）、Kimi-K2、DeepSeek-V3.1。

来自主题: AI资讯

12246 点击 2025-09-06 10:16

偶然刷到的一个逆天ElevenLabs开源平替！

订阅了 ElevenLabs 的小伙伴看过来，它的开源平替来了！Chatterbox 是全球首个支持强烈情绪控制的开源TTS 模型，更是号称开源 TTS 中的 SOTA ，由 Resemble AI 推出。

来自主题: AI资讯

8932 点击 2025-09-05 11:35

字节开源图像生成“六边形战士”，一个模型搞定人物/主体/风格保持

图像生成中的多指标一致性问题，被字节团队解决了！字节UXO团队设计并开源了统一框架USO，让看上去不关联的任务相互促进，实现风格迁移和主体保持单任务和组合任务的SOTA。

来自主题: AI技术研报

9828 点击 2025-09-05 11:26

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

覆盖桌面、移动和 Web，7B 模型超越同类开源选手，32B 模型挑战 GPT-4o 与 Claude 3.7，通义实验室全新 Mobile-Agent-v3 现已开源。

来自主题: AI技术研报

9242 点击 2025-09-03 10:47

王兴一鸣惊人！美团首个开源大模型追平DeepSeek-V3.1

没想到啊，最新SOTA的开源大模型…… 来自一个送外卖（Waimai）的——有两个AI，确实不一样。这个最新开源模型叫：Longcat-Flash-Chat，美团第一个开源大模型，发布即开源，已经在海内外的技术圈子里火爆热议了。

来自主题: AI资讯

10466 点击 2025-09-01 15:12

清华崔鹏团队开源LimiX：首个结构化数据通用大模型，性能超越SOTA专用模型

2025 年 8 月 29 日，由清华大学计算机系崔鹏教授团队联合稳准智能共同研发的结构化数据通用大模型「极数」（LimiX）正式宣布开源。

来自主题: AI技术研报

8265 点击 2025-08-30 11:25

元石科技正式发布问小白5，性能直追GPT-5

本月初，AI 圈翘首以盼的 GPT-5 终于问世，在数学、实际编程、多模态理解、推理等多个领域实现了新的 SOTA。今日，国产 AI 厂商元石科技重磅推出「All in One」旗舰模型 —— 问小白 5，成为其迄今为止最智能、最快捷、最实用的 AI 系统。尤其值得强调的是：问小白 5 的各项基准测试榜单成绩最接近 GPT-5，这使其成为当前国产大模型中最具代表性的对标者。

来自主题: AI资讯

8280 点击 2025-08-29 14:14