一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!
一手实测GLM4.5满血版Claude Code,可算有将推理/代码/Agent融为一体的大模型了!又一家支持Claude Code的模型登场! GLM-4.5 在推理、代码、Agent(智能体)综合能力都达到了开源模型Top1水准,在单个模型中实现了推理、代码、Agentic等能力原生融合。
又一家支持Claude Code的模型登场! GLM-4.5 在推理、代码、Agent(智能体)综合能力都达到了开源模型Top1水准,在单个模型中实现了推理、代码、Agentic等能力原生融合。
人生第一次的全AI诊疗
ShellAgent 2.0, 没有选择卷复杂华丽的前端页面,而是闷头把后台交互卷到极致。 也就是说,我们写生成应用提示语的难度降到了有嘴就会的级别。
Dogfooding(内部试用) 应该被 AI 创业公司重视起来了。
OpenAI GPT Agent以为只比Manus们差了一步, 但7月份带着一堆更新回归的MiniMax Agent告诉它其实已经慢一圈了。
你有没有想过,我们正在见证软件史上最深刻的一次变革?不是什么渐进式的改进,而是一场颠覆性的革命。
兄弟们,是不是也感觉最近被Cursor“背刺”了?这位曾经的AI编程王者,开启 AI 编程大航海时代的白月光,现在是又卡又慢,关键的Claude模型还不给中国区用、改变计费方式,用户的体验简直一言难尽。
在过去很长一段时间里,科技圈似乎人均都成了“提示词工程师”,大家都在琢磨怎么用最精妙的语言驯服AI。但包括Andrej Karpathy在内的很多行业大佬已经开始反思了,他们认为,决定AI效果的关键,可能早就不是怎么问,而是你给AI喂了什么料。这个思路,就是最近越来越火的上下文工程(Context Engineering)。
最近看了前Tinder首席产品官Ravi Mehta的一个讲座分享视频,他在讲座中提出了一个让所有产品人都应该深思的问题:你的产品是否正面临AI颠覆的风险?看完这个讲座后,我深受震撼。不是因为AI技术有多先进,而是因为我突然意识到,我们可能正处在一个史无前例的时代——那些曾经稳固的Product Market Fit正在大规模失效。
Kimi 又火了,在 DeepSeek 的热闹中沉寂大半年后,Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中,夺过了全球开源第一的宝座。