GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。
疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。
今天 ,OpenAI 开源了俩模型:120B/20B 117B 的 gpt-oss-120b 对标 o4-min,按官方说法至少需要 80G 内存,推荐使用单卡 H100 GPU 而刚买的的游戏本,刚好满足gpt-oss-120b 的部署条件
AI行业对数据的渴求程度,质量大于数量。
第二轮首届大模型对抗赛结果出炉了!o3轻而易举击败o4-mini,拿下100%胜率。Grok 4和Gemini 2.5 Pro激烈对决,最终在加赛中Grok 4成功晋级。明日,Grok 4和o3将迎来终局之战。
全网开扒GPT-oss,惊喜发现…… 奥特曼还是谦虚了,这性能岂止是o4-mini的水平,直接SOTA击穿一众开源模型。
三天不开源,Qwen团队手就痒。 昨天深夜再次放出两个端侧模型: Qwen3-4B-Instruct-2507:非推理模型,大幅提升通用能力 Qwen3-4B-Thinking-2507:高级推理模型,专为专家级任务设计
AI国际象棋对抗?这次玩真的!谷歌Kaggle推出首届全球AI象棋争霸赛,八款顶级语言模型正面对抗,胜负只在一步之间!
4月底我们曾经在《融了3个亿的张月光,就做出了个“AI播客播放器”?》选题中观察过由前妙鸭相机产品负责人张月光开发的AI播客产品ChatPods,当时我们认为,想用AI做成一个泛播客工具/平台比较困难。而最近,又有AI领域的知名从业者离职创业,选择的方向恰恰也是AI播客。
宇树机器狗,又双叒叕炫出天际——后空翻连甩,落地爆稳,台阶照翻不误!
上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。