
SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了丨上海AI Lab等联合研究
SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了丨上海AI Lab等联合研究大语言模型遇上加密数据,即使是最新Qwen3也直冒冷汗!
大语言模型遇上加密数据,即使是最新Qwen3也直冒冷汗!
进入2025年以来, AI Agent的发展明显提速。5月6日,OpenAI宣布以30亿美元收购 Windsurf;编程工具Cursor的母公司Anysphere也获得了9亿美元的融资,估值高达90亿美元;号称中国第一个通用AI Agent的Manus在五月也获得了硅谷老牌风险投资公司Benchmark领投的7500万美元的融资;
Manus在agent领域可谓「炙手可热」,但受限于网络以及少得可怜的积分,很多人还是无法用得上。AI Agent的处理逻辑:无非就是用AI根据用户需求,规划好要做的事后,不断的调用不同的工具来实现。
5月20日消息,在中国台北Computex 2025电脑展上发表主题演讲后,英伟达首席执行官黄仁勋接受了科技博客Stratechery博主本·汤普森(Ben Thompson)的专访。
5 月 14 日凌晨,X 平台的用户发现,Grok 在回应各种无关问题时,会固执地转向一个敏感话题:南非的“白人种族灭绝”。比如,用户询问棒球运动员 Max Scherzer 的薪水,“MaxScherzer 今年不打球真的能赚 7200 万美元吗?”
25岁天才Michael Truell率团队打造AI编程工具Cursor,仅用两年实现年收入2亿美元、估值达90亿美金,并未投入任何市场推广费用。Cursor重塑了软件开发范式,或将成为下一个科技巨头的雏形。
Anysphere对中国创业公司有哪些启示?
你信任的AI排行榜,可能只是一场精心策划的骗局!震惊业界的Cohere Labs最新研究彻底撕破了Chatbot Arena这一所谓"黄金标准"的华丽面纱,揭露了科技巨头们如何肆无忌惮地操控评估系统、掠夺社区资源、扼杀开源创新。
今天,微软重磅官宣:「AI同事时代」正式来临!Microsoft 365 Copilot今天又迎来一波重大更新,Researcher、Analyst等智能体强势登场。同时发布的2025工作趋势报告预言:2025将成人机混合的「前沿公司」年。
近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,