 
MetaGPT 用户智能体发布,开启端到端自主软件测试新范式!
MetaGPT 用户智能体发布,开启端到端自主软件测试新范式!当你刚用 AI 生成了一个精美的电商网站,却在演示时购物车结账功能存在隐藏 Bug?
 
当你刚用 AI 生成了一个精美的电商网站,却在演示时购物车结账功能存在隐藏 Bug?
 
小扎的玩法,奥特曼现在也(部分)学会了。
 
一年前,Google 在 AI 赛道上还是「追赶者」的形象。ChatGPT 席卷硅谷时,它显得迟缓。 但短短几个月后,情况突变。 Gemini 2.5 Pro 横扫各大榜单,「香蕉」模型 Nano Banana 让生图、修图成了轻松事;视频模型 Veo 3 展示了物理世界的理解力;Genie 3 甚至能一句话生成一个虚拟世界。
 
对比2022年11月底,ChatGPT横空出世时,头部科技公司市值变化:前两名未变,第三至十位座次更替。腾讯稳居第一,市值上涨约90%至5万亿元;阿里重回2万亿元大关;小米受汽车等新业务带动,市值暴涨439%,跃升至第三,跻身“两万亿俱乐部”。
 
OpenAI近期动作频频。首先斥巨资收购实验平台Statsig,并任命创始人Vijaye Raji为应用部门新CTO。同时还启动了「OpenAI for Science」项目,致力于打造AI驱动的科学发现平台,以加速基础科学突破。
 
AI医疗领域,冲出一匹年度黑马! 据外媒报道,美国AI医疗初创公司OpenEvidence正在寻求新一轮融资,估值约60亿美元(约合人民币427亿元)。
 
覆盖桌面、移动和 Web,7B 模型超越同类开源选手,32B 模型挑战 GPT-4o 与 Claude 3.7,通义实验室全新 Mobile-Agent-v3 现已开源。
 
一群AI玩狼人杀,GPT-5断崖式领先,胜率达到了惊人的96.7%。 OpenAI的总裁格雷格·布罗克曼转发了这样的一个基准测试:让7个强大的LLMs,包括开源和闭源,玩了210场完整的狼人杀。
 
当前,业界顶尖的大模型正竞相挑战“过度思考”的难题,即无论问题简单与否,它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换,还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。
 
GPT-4o发布才过去半年,Nano Banana这种「下一代」的生图模型就出来了。 这难道是AI界的摩尔定律?不敢想再过半年后,会是什么样的「魔鬼级」生图模型来屠Nano Banana