80亿美元的法律AI,每6个回答就有1个在瞎编

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
80亿美元的法律AI,每6个回答就有1个在瞎编
5619点击    2026-01-28 10:16

80亿美元的法律AI,每6个回答就有1个在瞎编

当AI开始"执业",谁来为它的错误买单?(图片由安涛在 Nano Banana 生成)


Part.01

一个律师的噩梦


2023年,纽约律师Steven Schwartz用ChatGPT帮忙写了一份法律文书。AI很贴心,不仅写了论点,还附上了6个支持案例的引用。


问题是,这6个案例全是AI编的。


"Varghese诉中国南方航空案""Martinez诉达美航空案"……听起来有模有样,但法官在任何数据库里都查不到。更荒唐的是,当Schwartz问ChatGPT"这些案例真的存在吗",AI信誓旦旦地回答:"当然存在,你可以在LexisNexis和Westlaw上找到。"


法官认定这是"主观恶意",罚了他5000美元。


这个案子成了法律AI的"黑历史"。现在全球已经记录了851起类似事件,连年收入7.59亿美元的顶级律所Gordon Rees也栽过跟头。


80亿美元的法律AI,每6个回答就有1个在瞎编

AI编造的判例,在真实法庭里无处可查(图片由安涛在 Nano Banana 生成)


Part.02

专业工具也不靠谱


你可能会想:那是通用AI的问题,专业的法律AI应该好很多吧?


斯坦福做过一个测试。结果让人冒冷汗:


80亿美元的法律AI,每6个回答就有1个在瞎编


换句话说,即使是最专业的法律AI,每6个回答里也有1个在胡说八道


幻觉有两种。一种是直接说错法律,另一种更隐蔽:法律说对了,但引用的来源根本不支持这个结论。比如AI会说某条破产法规则具有"管辖权效力",但那一条压根没这么写。


Harvey AI的联合创始人Gabriel Pereyra说过一句话:"法律AI不需要做到零幻觉才有用。"


这话在技术圈可能成立。但在法律行业,一个错误的引用就可能毁掉一个案子。


Part.03

80亿美元的赌注


即便如此,投资人还是疯狂下注。


Harvey AI三年融了将近10亿美元,估值从零飙到80亿。投资人名单像科技圈的名人堂:红杉、Kleiner Perkins、a16z、谷歌风投、OpenAI……


80亿美元的法律AI,每6个回答就有1个在瞎编


现在Harvey服务超过700家客户,覆盖63个国家,包括美国前十大律所中的大多数。


80亿美元的法律AI,每6个回答就有1个在瞎编

估值火箭升空,但落地点在哪?(图片由安涛在 Nano Banana 生成)


但问题来了。


按照Harvey目前约1.5亿到1.95亿美元的年收入估算,80亿估值意味着40到53倍的市销率。作为对比,2023年Thomson Reuters收购法律AI公司Casetext,只花了6.5亿美元。


彭博做过一个测算:如果Harvey今天上市,合理估值可能在4.5亿到9亿美元之间。比现在的估值低80%到85%。


Part.04

验证悖论


Harvey的困境不只是估值。


全球最大律所之一A&O Shearman是Harvey的旗舰客户,他们的反馈很真实:"你必须验证系统输出的每一样东西。你得检查所有内容。"


有个合伙人说得更直白:团队花了将近18个月测试Harvey,但始终没有拿出"硬指标"。因为核查AI输出太费劲了,"这让效率提升变得很难衡量"。


斯坦福的测试人员也有同感:"核查每一条引用太耗时间了。AI给你一个长答案,附带13个引用,你得逐个去原文核实。"


这就是验证悖论:AI帮你省下写文书的时间,但你又得花同样多的时间去核查它有没有瞎编。


最后谁赚了?可能只有AI公司。


Part.05

出海的坎


Harvey还面临一个更大的挑战:怎么走出美国。


法律AI的核心能力是分析判例、找先例、做类比推理。这在美国这样的普通法系国家很好用。但世界上大部分地方用的是大陆法系:法律主要靠成文法典,判例的权重很低。


换句话说,Harvey的看家本领在欧洲大陆、拉丁美洲和大部分亚洲国家都不太适用。


以中国市场为例。除了法系差异,还有三道门槛:


第一,监管复杂。AI服务需要安全评估和算法备案,内容要符合国内政策标准,AI生成的内容必须标注。


第二,数据主权。数据必须本地化存储,跨境传输需要安全评估,涉及敏感行业的法律事务限制更多。


第三,底层模型受限。OpenAI、Anthropic这些主流AI提供商在部分地区限制API访问。合规的法律AI服务必须基于国内批准的基础模型。


而且中国市场不是一片空白。政府已经在推"智慧法院"系统,科大讯飞的语音识别覆盖了4200多个法庭,无讼、法狗狗这些本土玩家都有几千万级的案例数据库。


对Harvey来说,国际化可能意味着要么找本地合作伙伴授权技术,要么只进入英国、澳大利亚、新加坡这些同样用普通法的市场。


80亿美元的法律AI,每6个回答就有1个在瞎编

美国之外,法律AI的扩张之路并不平坦(图片由安涛在 Nano Banana 生成)


Part.06

法律AI的真正问题


美国律师协会去年发布了第一份AI伦理指南,把AI定义为"需要监督的非律师助手"。指南警告说:依赖AI做法律工作的风险,和依赖"缺乏经验或过度自信的非律师助手"一样大。


这句话点出了法律AI的本质困境:


它足够聪明,能写出看起来很专业的文书。但它还不够聪明,不知道自己什么时候在瞎编。


而在法律这个行业,"看起来对"和"真的对"之间的差距,可能就是5000美元罚款和职业生涯的距离。


80亿美元的估值,赌的是这个差距能被技术填平。


能不能填平,可能要等到下一轮融资才知道答案。


Part.07

关于作者


我是安涛,做政务AI落地的。之前给几个省市的政务系统做过大模型项目,踩过的坑比写过的代码还多。有类似场景想聊的,可以通过公众号找到我:)


Part.08

参考文献


[1] TechCrunch. "Legal AI startup Harvey confirms $8B valuation." 2025.

[2] Dahl, M., et al. "Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools." Journal of Empirical Legal Studies, 2025.

[3] Wikipedia. "Mata v. Avianca, Inc."

[4] ABA Standing Committee on Ethics & Professional Responsibility. "Formal Opinion 512: Generative Artificial Intelligence Tools." 2024.

[5] Sacra. "Harvey revenue, valuation & funding."


文章来自于“悟智派”,作者 “安涛”。

关键词: AI新闻 , AI法律 , AI律师 , Harvey AI
AITNT-国内领先的一站式人工智能新闻资讯网站