国产多模态Agent拿下医学分割SOTA!不用改模型、不加token | 浙大&上海AI Lab
国产多模态Agent拿下医学分割SOTA!不用改模型、不加token | 浙大&上海AI Lab这个生物医学视觉推理框架,被CVPR 2026接收了!
这个生物医学视觉推理框架,被CVPR 2026接收了!
如果你在网络安全圈混,最近一定被“Mythos”刷过屏——Anthropic 搞出了一个能挖 Bug 的 AI 模型,但因为怕被坏人滥用,愣是没敢公开发布。
真的没人管管GitHub刷星吗……
北京时间凌晨 3 点,直播准时开始,OpenAI 发布了 ChatGPT Images 2.0。据介绍,「ChatGPT Images 2.0 是下一步进化:一个最先进的模型,能够处理复杂的视觉任务,并生成精确、可直接使用的视觉内容。」
一款名为 MotuBrain 的神秘世界模型,悄无声息地登上两个国际 benchmark 的榜首,没有任何公司署名。如果只是单榜第一,这件事或许并不稀奇。但问题在于,它同时拿下的,是两个几乎代表行业「两个极点」的榜单:一个是衡量世界模型「是否真正理解和预测现实世界」的 WorldArena
使用 GPT Image 2 甚至不太需要过于复杂的提示词,我们的测试都是一两句简单的画面描述,或者再加上图片尺寸要求,如 21:9、16:9、9:16 等。 例如让它生成广州市小学数学试卷。
4月21日,OpenAI正式上线Chronicle研究预览版。Chronicle藏在Codex平台里,但它干的事跟写代码没半毛钱关系。它在后台默默运行,持续读取你的屏幕内容、你打开的文件、你浏览的网页、你写到一半的文档。
Kimi 刚刚发布了 K2.6,Agent 模式也同步大升级。
SLAM教父罕见公开点赞!中国队开源的LingBot-Map,仅靠普通摄像头实现万帧流式3D重建,在全网引爆120万人围观。
Google 已组建了一支由研究人员和工程师组成的特别小组来改进其 AI 编码模型,据三位了解情况的人士透露,此举旨在实现更多自身编码的自动化,并最终实现 AI 研究的自动化。