80亿美元的法律AI,每6个回答就有1个在瞎编
80亿美元的法律AI,每6个回答就有1个在瞎编AI能帮你写法律文书,但它也可能帮你编造6个根本不存在的判例。
搜索
AI能帮你写法律文书,但它也可能帮你编造6个根本不存在的判例。
过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到跨层电路。但在很多场景里,研究者真正关心的不只是 “模型为什么这么答”,还包括 “能不能更稳、更准、更省,更安全”。
深夜,OpenAI正式祭出新一代科研利器——Prism,由GPT-5.2加持,专为写作和协作而生。它是一个基于云的「AI原生」LaTeX工作区,不限项目和协作的人数。
大模型能写代码、聊八卦,但敢不敢让它直接接管网络运维?一项最新评测显示,面对真实网络故障,头部模型平均准确率竟不足50%!为此,GSMA联手全球巨头开启「地狱级」难度挑战赛,通往MWC 2026的门票已备好,3.5万欧元大奖等你来拿!
你的下一个视频团队,不一定非得是人。
过去一年,几乎所有 AI 产品都在谈一个词:记忆。
大家是真敢问,奥特曼也是真敢说!
天下苦机器人看不清透明和反光物体久矣。
随着大模型能力的跃迁,业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性(effectiveness):如何让它更聪明、更稳、更会用工具、更能完成复杂任务。
在达沃斯论坛之后,谷歌Deepmind CEO Demis Hassabis又连续上了两个播客,放出了不少谷歌的新动向!