倒反天罡,AI开始给人类打分!Claude评分标准曝光: 优秀人类得7.5分
倒反天罡,AI开始给人类打分!Claude评分标准曝光: 优秀人类得7.5分反转了反转了,过去我们给AI跑分,今天Claude开始反手给人类打分!它会通过11个指标来分析你和它的历史对话,判断你使用AI的水平高低。在AI眼里,你是高手还是萌新?
搜索
反转了反转了,过去我们给AI跑分,今天Claude开始反手给人类打分!它会通过11个指标来分析你和它的历史对话,判断你使用AI的水平高低。在AI眼里,你是高手还是萌新?
他叫Yi Tay,是Google DeepMind的研究科学家。去年带着Gemini Deep Think,拿下了IMO国际数学奥林匹克金牌,今年2月Gemini 3 Deep Think的发布,他也是核心贡献者。
博尔赫斯笔下有个记住一切的人,21 岁被记忆压到窒息而死。尼采说没有遗忘就不可能活下去。现在,数亿人每天使用的 AI 助手正在获得完美记忆,而这个能力的真正代价,可能是人类翻篇的自由。
同一周,ClickUp 裁员 22%,同时宣布开出 100 万美元年薪的薪酬区间,专门用来吸引「AI 原生」人才。Wix、Webflow、Meta 随后也做了类似的举动。原文:How to become the AI-native hire every company wants, @anitakirkovska,May 2026
大模型从“回答问题”走向“完成任务”,正在面临以下瓶颈:面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题,中国人民大学、至知研究院等最新提出ClawGym——
来自 ETH Zurich 的 Florian Tramèr 团队在最新论文中抛出了一个出乎意料的问题:如果 AI"看到" 的图,根本不是你肉眼看到的那张,会发生什么样的后果呢?他们把这种现象称作 AI 权威清洗(AI Authority Laundering)。
本次2026中国AIGC产业峰会上,MiniMax ToB中国区商业化负责人胡维琦,分享了自己在AI创业公司中的实践与思考。与其焦虑AI,不如加入AI。大家不用看营销号,更多的还是自己动手试试。
今天,阿里Qoder上线Cloud Agents,这是全托管的AI Agent运行平台,可提供Agent底座、模型服务及运行环境等全栈Agent能力,企业可通过API的方式直接调用,让应用和业务系统快速长出“大脑”和“双手”,Agent 上线时间从1个月缩短至1天。
清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验:从视频传递的价值观的角度,去理解观看视频后用户的行为和心理变化。
今天,阿里云百炼核心能力已CLI化 ,仅需一行命令,即可让Agent自动接入阿里云百炼的150多款模型、十多款应用,以及知识库、记忆、联网搜索等全套能力。百炼CLI专为Agent设计,原生支持Clau