
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文编程Agent王座,国产开源模型拿下了!就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。
编程Agent王座,国产开源模型拿下了!就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。
火到不能再火的Agent,零一万物也下场了。
现有Mobile/APP Agent的工作可以适应实时环境,并执行动作,但由于它们大部分都仅依赖于动作级奖励(SFT或RL)。
近日,月之暗面(Moonshot AI)正式发布了其万亿参数开源大模型Kimi K2,这一具有里程碑意义的AI模型凭借其创新的MoE架构和强大的Agentic能力迅速获得全球开发者关注。然而,随着用户量激增,部分开发者开始反映其API服务响应速度不尽如人意。面对这一情况,月之暗面于7月15日迅速作出官方回应,坦诚当前服务延迟问题,并详细说明了优化方案。
Kimi 又火了,在 DeepSeek 的热闹中沉寂大半年后,Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中,夺过了全球开源第一的宝座。
上周五,ChatGPT Agent mode上线了。
最近测Agent测的非常上头, 而且越来越发现AI在各种专门的领域的垂直能力发展的越来越好了。
OpenAI推出ChatGPT agent引发国产Agent竞品(如Manus、Genspark)公开对比,声称自身更优。实测退休计划任务显示,ChatGPT输出简陋,仅20分钟完成简易PPT;而Kimi报告详尽并互动提问,Minimax多格式输出,Manus快速设计美观。ChatGPT仅功能整合,非革命性升级,但标志AI从问答向任务执行协作转型。
MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会,邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾,就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。
这应该是上线以来案例最少的 Agent 了,OpenAI GPT Agent奥特曼你不给我用,就别怪我用 Manus 跟你硬碰硬了。