刚刚,Anthropic王炸Claude泄露!全面碾压Opus 4.6引爆全网
刚刚,Anthropic王炸Claude泄露!全面碾压Opus 4.6引爆全网刚刚,《财富》独家爆出——由于一次罕见的「人为配置」错误,最强大模型「Claude Mythos」绝密细节公之于众。Claude Mythos代号「Capybara」,代表最高「层级」,是一款具有划时代意义的全新模型。
刚刚,《财富》独家爆出——由于一次罕见的「人为配置」错误,最强大模型「Claude Mythos」绝密细节公之于众。Claude Mythos代号「Capybara」,代表最高「层级」,是一款具有划时代意义的全新模型。
硅心科技(aiXcoder)发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型 aiX-apply-4B。基准测试结果显示,在 20 多种主流编程语言及 Markdown 等多类型文件格式的测试中,aiX-apply-4B 的平均准确率达到 93.8%,超越 Qwen3-4B 基座模型 62.6% 的准确度
就在昨天,ARC-AGI-3刚把全球顶尖大模型按在地上摩擦,结果一家名不见经传的公司却给出惊天消息:他们的AI在首日就取得了36.08%的成绩!这匹黑马究竟靠什么撕开全球最难AI考试的铁幕?是真突破,还是另有玄机?
昨日凌晨,谷歌正式推出其最高质量的音频和语音模型——实时语音模型Gemini 3.1 Flash Live,并在Gemini App、Search Live以及Google AI Studio中同步开放,其中后者以预览版本向开发者提供。
今夜,整个AI圈震动了。全球最难AGI测试ARC-AGI-3一上线,就把全球顶尖AI打到集体失声,人类满分通关,最强模型Opus 4.6得分仅0.2%,还不到1%。AI这是一夜被打回「原始人」了。
一次只持续了不到1小时的投毒事件,撕开了AI基础设施「信任链」的致命裂缝。更魔幻的是,全行业逃过一劫,居然靠黑客自己写出bug。
最近一直在聊Agent、聊Vibe Coding。
天使轮拿下2.42亿美元后,它石智航到底干啥去了?然而接下来的一年里,它石智航选择了一条截然不同的路:没有参加各种行业大会,没有频繁对外发声,没有出现在春晚或各类展示活动中,一直踏实干活。
这是一件极其严肃的软件安全事件。
养了这么久的虾,你应该能发现,skills有多重要了。