80亿美元的法律AI，每6个回答就有1个在瞎编

7224点击 2026-01-28 10:16

当AI开始"执业"，谁来为它的错误买单？（图片由安涛在 Nano Banana 生成）

Part.01

一个律师的噩梦

2023年，纽约律师Steven Schwartz用ChatGPT帮忙写了一份法律文书。AI很贴心，不仅写了论点，还附上了6个支持案例的引用。

问题是，这6个案例全是AI编的。

"Varghese诉中国南方航空案""Martinez诉达美航空案"……听起来有模有样，但法官在任何数据库里都查不到。更荒唐的是，当Schwartz问ChatGPT"这些案例真的存在吗"，AI信誓旦旦地回答："当然存在，你可以在LexisNexis和Westlaw上找到。"

法官认定这是"主观恶意"，罚了他5000美元。

这个案子成了法律AI的"黑历史"。现在全球已经记录了851起类似事件，连年收入7.59亿美元的顶级律所Gordon Rees也栽过跟头。

80亿美元的法律AI，每6个回答就有1个在瞎编

AI编造的判例，在真实法庭里无处可查（图片由安涛在 Nano Banana 生成）

Part.02

专业工具也不靠谱

你可能会想：那是通用AI的问题，专业的法律AI应该好很多吧？

斯坦福做过一个测试。结果让人冒冷汗：

80亿美元的法律AI，每6个回答就有1个在瞎编

换句话说，即使是最专业的法律AI，每6个回答里也有1个在胡说八道。

幻觉有两种。一种是直接说错法律，另一种更隐蔽：法律说对了，但引用的来源根本不支持这个结论。比如AI会说某条破产法规则具有"管辖权效力"，但那一条压根没这么写。

Harvey AI的联合创始人Gabriel Pereyra说过一句话："法律AI不需要做到零幻觉才有用。"

这话在技术圈可能成立。但在法律行业，一个错误的引用就可能毁掉一个案子。

Part.03

80亿美元的赌注

即便如此，投资人还是疯狂下注。

Harvey AI三年融了将近10亿美元，估值从零飙到80亿。投资人名单像科技圈的名人堂：红杉、Kleiner Perkins、a16z、谷歌风投、OpenAI……

80亿美元的法律AI，每6个回答就有1个在瞎编

现在Harvey服务超过700家客户，覆盖63个国家，包括美国前十大律所中的大多数。

80亿美元的法律AI，每6个回答就有1个在瞎编

估值火箭升空，但落地点在哪？（图片由安涛在 Nano Banana 生成）

但问题来了。

按照Harvey目前约1.5亿到1.95亿美元的年收入估算，80亿估值意味着40到53倍的市销率。作为对比，2023年Thomson Reuters收购法律AI公司Casetext，只花了6.5亿美元。

彭博做过一个测算：如果Harvey今天上市，合理估值可能在4.5亿到9亿美元之间。比现在的估值低80%到85%。

Part.04

验证悖论

Harvey的困境不只是估值。

全球最大律所之一A&O Shearman是Harvey的旗舰客户，他们的反馈很真实："你必须验证系统输出的每一样东西。你得检查所有内容。"

有个合伙人说得更直白：团队花了将近18个月测试Harvey，但始终没有拿出"硬指标"。因为核查AI输出太费劲了，"这让效率提升变得很难衡量"。

斯坦福的测试人员也有同感："核查每一条引用太耗时间了。AI给你一个长答案，附带13个引用，你得逐个去原文核实。"

这就是验证悖论：AI帮你省下写文书的时间，但你又得花同样多的时间去核查它有没有瞎编。

最后谁赚了？可能只有AI公司。

Part.05

出海的坎

Harvey还面临一个更大的挑战：怎么走出美国。

法律AI的核心能力是分析判例、找先例、做类比推理。这在美国这样的普通法系国家很好用。但世界上大部分地方用的是大陆法系：法律主要靠成文法典，判例的权重很低。

换句话说，Harvey的看家本领在欧洲大陆、拉丁美洲和大部分亚洲国家都不太适用。

以中国市场为例。除了法系差异，还有三道门槛：

第一，监管复杂。AI服务需要安全评估和算法备案，内容要符合国内政策标准，AI生成的内容必须标注。

第二，数据主权。数据必须本地化存储，跨境传输需要安全评估，涉及敏感行业的法律事务限制更多。

第三，底层模型受限。OpenAI、Anthropic这些主流AI提供商在部分地区限制API访问。合规的法律AI服务必须基于国内批准的基础模型。

而且中国市场不是一片空白。政府已经在推"智慧法院"系统，科大讯飞的语音识别覆盖了4200多个法庭，无讼、法狗狗这些本土玩家都有几千万级的案例数据库。

对Harvey来说，国际化可能意味着要么找本地合作伙伴授权技术，要么只进入英国、澳大利亚、新加坡这些同样用普通法的市场。

80亿美元的法律AI，每6个回答就有1个在瞎编

美国之外，法律AI的扩张之路并不平坦（图片由安涛在 Nano Banana 生成）

Part.06

法律AI的真正问题

美国律师协会去年发布了第一份AI伦理指南，把AI定义为"需要监督的非律师助手"。指南警告说：依赖AI做法律工作的风险，和依赖"缺乏经验或过度自信的非律师助手"一样大。

这句话点出了法律AI的本质困境：

它足够聪明，能写出看起来很专业的文书。但它还不够聪明，不知道自己什么时候在瞎编。

而在法律这个行业，"看起来对"和"真的对"之间的差距，可能就是5000美元罚款和职业生涯的距离。

80亿美元的估值，赌的是这个差距能被技术填平。

能不能填平，可能要等到下一轮融资才知道答案。

Part.07

关于作者

我是安涛，做政务AI落地的。之前给几个省市的政务系统做过大模型项目，踩过的坑比写过的代码还多。有类似场景想聊的，可以通过公众号找到我：）

Part.08

参考文献

[1] TechCrunch. "Legal AI startup Harvey confirms $8B valuation." 2025.

[2] Dahl, M., et al. "Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools." Journal of Empirical Legal Studies, 2025.

[3] Wikipedia. "Mata v. Avianca, Inc."

[4] ABA Standing Committee on Ethics & Professional Responsibility. "Formal Opinion 512: Generative Artificial Intelligence Tools." 2024.

[5] Sacra. "Harvey revenue, valuation & funding."

文章来自于“悟智派”，作者 “安涛”。

关键词: AI新闻 , AI法律 , AI律师 , Harvey AI