
DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化
DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化近日,DeepMind 最新推出了一种全新的用于代码安全的 AI Agent—CodeMender,它使用 Gemini Deep Think 自动修补关键软件漏洞。它会检查补丁是否正确、是否能够修复根本原因,并且不会引起其他任何破坏。这确保只有高质量的解决方案才会被发送给人工审核。
近日,DeepMind 最新推出了一种全新的用于代码安全的 AI Agent—CodeMender,它使用 Gemini Deep Think 自动修补关键软件漏洞。它会检查补丁是否正确、是否能够修复根本原因,并且不会引起其他任何破坏。这确保只有高质量的解决方案才会被发送给人工审核。
十月AI战场,热闹得不像话。Sora 2刚刚亮相,Gemini 3.0就已蓄势待发。网友内测demo流出,前端和web编码强到离谱。坊间传闻,Gemini 3.0最晚下周上线。今天,谷歌内部研究人员在X上,频频发文暗示——BIG THINGS!
终于,Nano Banana正式开放API了! 现在大家不仅可以直接在Google AI Studio里基于Nano Banana,手动搓出属于自己的App,还可以通过Gemini API接入任意发挥了。
蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组(后简称“团队”)推出PromptCoT 2.0,要在大模型下半场押注任务合成。实验表明,通过“强起点、强反馈”的自博弈式训练,PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果,达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。
如今,几乎转个身的功夫就会听到又有公司创建了新的 MCP 服务器。几乎每天都有新的 MCP 服务器发布,该如何判断哪一个最适合自己?通过大量的研究和 Gemini 的一点帮助,我们识别出了十个可以支持和简化前端开发工作的 MCP 服务器(加上一个实验性 MCP 服务器)。
上海人工智能实验室发布新一代文档解析大模型——MinerU2.5。作为MinerU系列最新成果,该模型仅以1.2B参数规模,就在OmniDocBench、olmOCR-bench、Ocean-OCR等权威评测上,全面超越Gemini2.5-Pro、GPT-4o、Qwen2.5-VL-72B等主流通用大模型,以及dots.ocr、MonkeyOCR、PP-StructureV3等专业文档解析工具。
我用ChatGPT越来越少了,即使他有记忆的情况下,我还是非常非常的不喜欢GPT-5。 因为在很多话题的质量上,现在跟Gemini 2.5 Pro相比,几乎就是一坨。 但是作为一个自媒体博主,为了有时
谷歌最新发布的Gemini Robotics 1.5系列模型,让机器人真正学会了「思考」,还能跨不同具身形态学习技能。这意味着,未来的机器人将成为和人类协作、主动完成复杂任务的智能伙伴。
Scale AI的新软件工程基准SWE-BENCH PRO,出现反转!表面上看,“御三家”集体翻车,没一家的解决率超过25%: GPT-5、Claude Opus 4.1、Gemini 2.5分别以23.3%、22.7%、13.5%的解决率“荣”登前三。
在AI热潮中,大模型最「渴求」的究竟是什么?是算力、是存储,还是复杂的网络互联?在Hot Chips 2025 上,Transformer发明者之一、谷歌Gemini联合负责人Noam Shazeer给出了答案。