美国模型长期霸榜的LMArena,出现了一个国产模型
美国模型长期霸榜的LMArena,出现了一个国产模型时间过得太快了,一转眼就来到了 2025 年的年底。我们距离 2026 年只剩下了 8 天。回看 AI 模型和产品突飞猛进这一年,中美两家 AI 阵营的行业发展路径有了挺大的区分,大家的关注度不再是单一模型、单一能力,而是“模型+工程+场景”的复合能力。这个变化在年底愈发明显。
时间过得太快了,一转眼就来到了 2025 年的年底。我们距离 2026 年只剩下了 8 天。回看 AI 模型和产品突飞猛进这一年,中美两家 AI 阵营的行业发展路径有了挺大的区分,大家的关注度不再是单一模型、单一能力,而是“模型+工程+场景”的复合能力。这个变化在年底愈发明显。
首发 9988 元创始权益价,2026 年 1 月启动公测。
新一代科学发现智能引擎与科研基础设施正在由中国团队打造。
目前,传统广电行业正面临一场深刻的生存危机。外部竞争压力持续加剧,不断挤压行业原有的发展空间:家庭智能语音设备渗透率已经突破 68%,短视频平台日均占用用户时长已经高达 2.8 小时,用户注意力的结构性转移趋势已然形成。
宇树科技和智元机器人争夺春晚门票时,有人却在默默刷新行业融资纪录。银河通用宣布,完成超过3亿美元(约合人民币21亿元)C轮融资。3亿美元,刷新了通用智能机器人领域的单轮融资纪录。至此,银河通用累计融资接近8亿美元,最新估值升至30亿美元,成为国内估值最高的通用智能机器人初创公司。
今天,我又要来得罪人了。 甚至可以说,这篇文章发出来,可能会直接断了很多人的财路。
为什么大模型厂商给了 128K 的上下文窗口,却在计费上让长文本显著更贵?
最近这段时间,谷歌DeepMind的官方纪录片《The Thinking Game》在AI圈传播挺广。
倒反天罡! Gemini 3 Flash的表现在SWE-Bench Verified测试中获得了78%的分数,比超大杯Pro还略胜一筹。
AI不仅会做PPT,写代码,它还能理解更深层次的问题。在美国的一项偏重于文化领域的新基准测试中,中国开源模型Qwen3夺冠,DeepSeek的R1跻身前六,力压多家全球顶级的明星模型。