AI资讯新闻榜单内容搜索-AI视觉

20岁斯坦福辍学生2天搞定500万美元融资：AI直接"偷窥"用户屏幕，重新定义产品分析

当我了解到一群平均年龄只有21岁的年轻创业者，在短短几天内就从Y Combinator、General Catalyst等顶级投资机构手中拿到500万美元融资时，我意识到他们可能找到了一个真正的痛点。这家叫Human Behavior的公司，正试图用AI彻底改变企业理解用户行为的方式。他们的方法听起来简单得令人怀疑：让AI直接"观看"用户使用产品的录像，然后自动分析出用户的真实意图和行为模式。

来自主题: AI资讯

9404 点击 2025-09-09 17:59

2025年了，AI还看不懂时钟！90%人都能答对，顶尖AI全军覆没

一般人准确率89.1%，AI最好只有13.3%。在新视觉基准ClockBench上，读模拟时钟这道「小学题」，把11个大模型难住了。为什么AI还是读不准表？是测试有问题还是AI真不行？

来自主题: AI资讯

8224 点击 2025-09-09 17:24

主观评测五大AI助手识图能力，奇葩卫生间标识识别大PK

作者测试了智谱GLM-4.5V（开启/关闭推理）、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景，按识别正确性评分。结果智谱普通模式得分最高（86分），ChatGPT-5和智谱推理模式次之（78分），豆包和元宝70分，Kimi垫底（38分），揭示了各AI视觉能力的差异及局限性。

来自主题: AI产品测评

10621 点击 2025-08-18 10:44

豆包悄悄上线的这个新功能，也能用眼睛推理全世界了。

上周我写过一篇AI产品自用分享，当时我说，AI知识问答方面，我会选择openai o3和豆包。

来自主题: AI资讯

10614 点击 2025-08-07 11:39

告别评估乱象！首个视觉解释综合性基准发布，附人类真值 | KDD'25

埃默里大学团队推出首个覆盖8个真实任务、带有人类解释真值的视觉解释基准Saliency-Bench，统一评估流程与开源工具让显著性方法可公平比较，获KDD’25接收，为可解释AI奠定透明、可靠的基石。

来自主题: AI技术研报

10112 点击 2025-07-21 15:59

完全免费开放，美图上线AI视觉Agent

本来以为美图可能会在 8 月份推出新产品，给中期财报壮声势，但没想到，公告发布 20 天不到，这款名为 RoboNeo 的 AI Agent 就上线了，而且是直接面向所有用户免费开放。

来自主题: AI资讯

11275 点击 2025-07-14 22:16

AI们数不清六根手指，这事没那么简单。

昨天Grok4发布完以后，我随手刷了一下X。

来自主题: AI资讯

11022 点击 2025-07-14 11:27

突破AI视觉“选择性失明”，哈工大首次实现指令驱动的全景式感知

对于AI视觉多模态大模型只关注显著信息这一根本性缺陷，哈工大GiVE实现突破！

来自主题: AI技术研报

8029 点击 2025-04-18 15:13

以人文本的 AI 品牌设计

传统科技公司、尤其是 2B 的公司，其信息、视觉传达都是以公司、产品、技术创新为中心的。但是，处在现代最前沿技术之一的 AI 公司，似乎想做一些不一样的传达。我们将近距离看一下 OpenAI，Cohere，Anthropic 这三家 AI 模型公司的信息、视觉传达，看看他们怎么是从传统科技公司的风格中，做出一些不一样的、以人为本的品牌设计的。

来自主题: AI资讯

10113 点击 2025-04-15 22:09

IC-Light的视频版本来了，RelightVid：强光动态环境下的视频光照编辑神器

大家还记得那个 ICLR 2025 首次满分接收、彻底颠覆静态图像光照编辑的工作 IC-Light 吗？

来自主题: AI技术研报

8620 点击 2025-04-11 14:51