
当AI开始"执业",谁来为它的错误买单?(图片由安涛在 Nano Banana 生成)
2023年,纽约律师Steven Schwartz用ChatGPT帮忙写了一份法律文书。AI很贴心,不仅写了论点,还附上了6个支持案例的引用。
问题是,这6个案例全是AI编的。
"Varghese诉中国南方航空案""Martinez诉达美航空案"……听起来有模有样,但法官在任何数据库里都查不到。更荒唐的是,当Schwartz问ChatGPT"这些案例真的存在吗",AI信誓旦旦地回答:"当然存在,你可以在LexisNexis和Westlaw上找到。"
法官认定这是"主观恶意",罚了他5000美元。
这个案子成了法律AI的"黑历史"。现在全球已经记录了851起类似事件,连年收入7.59亿美元的顶级律所Gordon Rees也栽过跟头。

AI编造的判例,在真实法庭里无处可查(图片由安涛在 Nano Banana 生成)
你可能会想:那是通用AI的问题,专业的法律AI应该好很多吧?
斯坦福做过一个测试。结果让人冒冷汗:

换句话说,即使是最专业的法律AI,每6个回答里也有1个在胡说八道。
幻觉有两种。一种是直接说错法律,另一种更隐蔽:法律说对了,但引用的来源根本不支持这个结论。比如AI会说某条破产法规则具有"管辖权效力",但那一条压根没这么写。
Harvey AI的联合创始人Gabriel Pereyra说过一句话:"法律AI不需要做到零幻觉才有用。"
这话在技术圈可能成立。但在法律行业,一个错误的引用就可能毁掉一个案子。
即便如此,投资人还是疯狂下注。
Harvey AI三年融了将近10亿美元,估值从零飙到80亿。投资人名单像科技圈的名人堂:红杉、Kleiner Perkins、a16z、谷歌风投、OpenAI……

现在Harvey服务超过700家客户,覆盖63个国家,包括美国前十大律所中的大多数。

估值火箭升空,但落地点在哪?(图片由安涛在 Nano Banana 生成)
但问题来了。
按照Harvey目前约1.5亿到1.95亿美元的年收入估算,80亿估值意味着40到53倍的市销率。作为对比,2023年Thomson Reuters收购法律AI公司Casetext,只花了6.5亿美元。
彭博做过一个测算:如果Harvey今天上市,合理估值可能在4.5亿到9亿美元之间。比现在的估值低80%到85%。
Harvey的困境不只是估值。
全球最大律所之一A&O Shearman是Harvey的旗舰客户,他们的反馈很真实:"你必须验证系统输出的每一样东西。你得检查所有内容。"
有个合伙人说得更直白:团队花了将近18个月测试Harvey,但始终没有拿出"硬指标"。因为核查AI输出太费劲了,"这让效率提升变得很难衡量"。
斯坦福的测试人员也有同感:"核查每一条引用太耗时间了。AI给你一个长答案,附带13个引用,你得逐个去原文核实。"
这就是验证悖论:AI帮你省下写文书的时间,但你又得花同样多的时间去核查它有没有瞎编。
最后谁赚了?可能只有AI公司。
Harvey还面临一个更大的挑战:怎么走出美国。
法律AI的核心能力是分析判例、找先例、做类比推理。这在美国这样的普通法系国家很好用。但世界上大部分地方用的是大陆法系:法律主要靠成文法典,判例的权重很低。
换句话说,Harvey的看家本领在欧洲大陆、拉丁美洲和大部分亚洲国家都不太适用。
以中国市场为例。除了法系差异,还有三道门槛:
第一,监管复杂。AI服务需要安全评估和算法备案,内容要符合国内政策标准,AI生成的内容必须标注。
第二,数据主权。数据必须本地化存储,跨境传输需要安全评估,涉及敏感行业的法律事务限制更多。
第三,底层模型受限。OpenAI、Anthropic这些主流AI提供商在部分地区限制API访问。合规的法律AI服务必须基于国内批准的基础模型。
而且中国市场不是一片空白。政府已经在推"智慧法院"系统,科大讯飞的语音识别覆盖了4200多个法庭,无讼、法狗狗这些本土玩家都有几千万级的案例数据库。
对Harvey来说,国际化可能意味着要么找本地合作伙伴授权技术,要么只进入英国、澳大利亚、新加坡这些同样用普通法的市场。

美国之外,法律AI的扩张之路并不平坦(图片由安涛在 Nano Banana 生成)
美国律师协会去年发布了第一份AI伦理指南,把AI定义为"需要监督的非律师助手"。指南警告说:依赖AI做法律工作的风险,和依赖"缺乏经验或过度自信的非律师助手"一样大。
这句话点出了法律AI的本质困境:
它足够聪明,能写出看起来很专业的文书。但它还不够聪明,不知道自己什么时候在瞎编。
而在法律这个行业,"看起来对"和"真的对"之间的差距,可能就是5000美元罚款和职业生涯的距离。
80亿美元的估值,赌的是这个差距能被技术填平。
能不能填平,可能要等到下一轮融资才知道答案。
我是安涛,做政务AI落地的。之前给几个省市的政务系统做过大模型项目,踩过的坑比写过的代码还多。有类似场景想聊的,可以通过公众号找到我:)
[1] TechCrunch. "Legal AI startup Harvey confirms $8B valuation." 2025.
[2] Dahl, M., et al. "Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools." Journal of Empirical Legal Studies, 2025.
[3] Wikipedia. "Mata v. Avianca, Inc."
[4] ABA Standing Committee on Ethics & Professional Responsibility. "Formal Opinion 512: Generative Artificial Intelligence Tools." 2024.
[5] Sacra. "Harvey revenue, valuation & funding."
文章来自于“悟智派”,作者 “安涛”。