图片来源:DeepJudge
近年来,AI+法律方向的科技公司层出不穷。iManage和NetDocuments等DMS先驱已经开发了大量功能来支持改进知识管理搜索。与此同时,Henchman率先使用语义聚类来帮助律师查找DMS中的相关条款。由Kira的Noah Waisberg创建的Zuva也在利用人工智能帮助内部团队发现合同中的关键信息方面做了大量工作。DeepJudge也是这个赛道中一个有独特亮点的公司。
DeepJudge是一家由前谷歌研究员创立的法律科技公司,目前正在为律师事务所和法律部门的知识搜索带来变革。公司成立于2021年,总部位于瑞士。据报道,该公司专有的Colinear技术结合了语义搜索和关键词搜索功能,使法律专业人士能够使用自然语言查询有效地访问和利用其公司的集体知识。
DeepJudge为法律行业提供了核心功能:知识搜索和知识助手。知识搜索使用语义融合搜索和关键词搜索,帮助法律专业人士利用自然语言高效检索信息,自动分类文档,并丰富现有元数据,从而重复使用以前的工作成果。知识助手利用检索增强生成(RAG)技术提供相关且高质量的信息,保证答案的准确性。这两个功能共同致力于将法律专业人士利用集体知识连接起来,转化为强大的竞争优势。
DeepJudg 会优先考虑和优化那些用户最常使用的服务或文档类型,以提高工作效率。其基本原理为,帮助公司配置其系统以标签公司内部的文档存储库。标签的目的是为了让这些文档能够被DeepJudge的搜索功能检索到,从而使得法律行业的专业人员能够快速、准确地找到他们工作中需要的信息。同时,多样化基本组件的提供,能够最大化满足用户公司的需求。
图片来源:DeepJudge
配置DeepJudge: DeepJudge组件可以托管在任何公共云或私有云中,甚至可以托管在本地。比如,可以将 DeepJudge系统与公司的文档管理系统(DMS)集成;对于DeepJudge Assistant,用户可以选择自己的GenAI基础模型,例如Azure OpenAI服务、DeepJudge提供的本地大模型,甚至用户公司自己定制的大模型。
图片来源:DeepJudge
标签化文档存储库: DeepJudge会扫描这些存储库中的文档并创建标签,这样就能快速检索文档内容和元数据。这种AI生成的标签和用户导入的标签的组合可用于丰富和提供有关于用户文档的结构化信息。
图片来源:DeepJudge
检索准确搜索结果: DeepJudge的搜索功能通过辨别查询背后的意图,可以根据用户的查询提供相关的搜索结果。这些结果会考虑到文档的内容和上下文,而不仅仅是关键词匹配。
图片来源:DeepJudge
总的来说,DeepJudge的产品特色包括如下几点:
从技术上,公司发现RAG受限于底层检索(即搜索)系统的能力。在生成式 AI 中,总会有“幻觉”。因此,为生成式AI工具提供公司自有数据是一大关键点,这需要一个优秀的检索系统。
另一个关键点是human-in-the-loop:机器擅长处理大量信息,而人类擅长基于这些信息进行推理和决策。结合双方的优势,可以采用更有效的方法,使用户能够在每个步骤中快速、轻松地验证答案,而不是依赖于完全端到端的自动化过程。
在法律行业实施人工智能需要可扩展且安全的连接,以连接LLMs和公司数据,反映公司内的全面知识,同时遵守各种访问权限和道德墙。
DeepJudge由一支由谷歌前研究员和苏黎世联邦理工学院人工智能博士组成的团队创立,其中包括首席执行官 Paulina Grnarova、首席运营官Kevin Roth和首席技术官Yannic Kilcher。他们在人工智能和机器学习方面经验丰富,专注于帮助法律专业人士利用自然语言处理和深度学习技术有效地利用和运用其公司的集体知识。
图片来源:DeepJudge
Paulina Grnarova是DeepJudge的联合创始人兼首席执行官,她拥有苏黎世联邦理工学院的人工智能博士学位。在创立DeepJudge之前,Paulina在Google工作了数年,专注于构建能够理解问题并形成自然回答的人工智能系统。她对技术的热爱和对法律科技的兴趣促使她离开Google,投身于创业,以期将人工智能的最新研究与客户需求相结合。
图片来源:LinkedIn
Kevin Roth是DeepJudge的联合创始人兼首席运营官,拥有苏黎世联邦理工学院(ETH Zürich)机器学习博士学位。他的职业生涯与学术研究紧密相连,曾在微软研究院获得奖学金,并荣获ETH物理系奖章。在DeepJudge,Kevin负责监督公司的日常运营和产品开发,致力于将人工智能的最新研究成果应用于法律科技领域,以提高法律专业人士的工作效率。
图片来源:LinkedIn
Yannic Kilcher是DeepJudge的联合创始人兼首席技术官,同时也是一位机器学习研究者和工程师。他在苏黎世联邦理工学院(ETH Zürich)的数据分析实验室完成了博士学位。Yannic 还运营着一个专注于AI研究的YouTube频道,制作关于机器学习研究最新进展的视频,包括论文分析、有趣的项目以及著名的《ML News》。
图片来源:LinkedIn
目前,被Litera收购的Kira Systems公司的前高级领导Steve Obenski已加入该公司,担任临时首席战略官,帮助公司在美国拓展业务。
图片来源:LinkedIn
根据Crunchbase的数据,DeepJudge截至目前共筹集了1110万美元。公司最近一次融资是在2024年6月完成的种子轮,融资金额1070万美元,由Coatue领投,参与者包括Gokul Rajaram、Michele Catasta等知名天使投资人。
“DeepJudge是首批旨在赋能法律团队利用内部数据做出战略决策的产品之一。从技术角度来看,我们对 DeepJudge解决数据检索的方法印象深刻,我们认为这对于实现高质量生成结果至关重要。随着DeepJudge在法律行业中寻求发展并扩大客户群,我们很高兴能支持他们。”本轮领投方Coatue表示。
作者: Walter Wei
References:
https://www.deepjudge.ai/
https://www.deepjudge.ai/press-release/deepjudge-raises-10-7m-seed-round-led-by-coatue-and-announces-knowledge-assistant
https://www.youtube.com/watch?v=eeHq7UEbZCg
https://www.crunchbase.com/organization/deepjudge
https://www.artificiallawyer.com/2024/06/18/deepjudge-km-focused-ai-startup-bags-10-7m-hires-ex-kiras-obenski/
https://www.legalpracticeintelligence.com/blogs/technology-intelligence/deepjudge-lands-10-7m-to-transform-legal-data-use?srsltid=AfmBOoqA7Uo78MchOkDqwvkK8pSrb6d5OR1OchAnlQICG8QEsVpye5FJ
文章来自于“Z Potentials”,作者“Walter Wei”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI