
网友晒 21 页 PDF 质疑 Grok 3 套壳 Claude,Grok 3 自己承认了!xAI 工程师被喷无能
网友晒 21 页 PDF 质疑 Grok 3 套壳 Claude,Grok 3 自己承认了!xAI 工程师被喷无能近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。
近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。
AI陪伴应用的Top 1——Character.ai(c.ai),也开始做起视频生成了。
之前我们探讨过公司AI能力的评判方式:
LLM根本不会思考!LeCun团队新作直接戳破了大模型神话。最新实验揭示了,AI仅在粗糙分类任务表现优秀,却在精细任务中彻底失灵。
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一!
大二学生许柠第一次在AI身上感受到了“纵欲过度”。
一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超!
不用换模型、不用堆参数,靠 SUGAR 模型性能大增!
昨天YC一个访谈《State-Of-The-Art Prompting For AI Agents》,专门讲他们投资的一家客服公司,公开了他们提示词的写法,这应该也属于第一家吧。
想象一下,你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊,需要记住每个房间里的物品特征、位置关系,并根据反馈调整行动。