图片来源:Datumo
根据麦肯锡最新报告显示,大多数企业表示尚未做好充分准备以安全负责任的方式使用生成式AI。其中一个关键问题是可解释性——即理解 AI 如何及为何做出特定决策。该报告指出,虽然 40%的受访者认为这是重大风险,但仅有 17%的企业正在积极应对。
总部位于首尔的 Datumo 最初是一家 AI 数据标注公司,如今致力于通过提供工具和数据来帮助企业构建更安全的 AI 系统。
这些工具支持对模型进行测试、监控和优化,且无需专业技术背景。本周一这家初创公司获得 1550 万美元融资,投资方包括 Salesforce Ventures、KB Investment、ACVC Partners 和 SBI Investment 等机构,使其总融资额达到约 2800 万美元。
Datumo 首席执行官 David Kim 曾是韩国国防发展署的 AI 研究员,他对数据标注耗时耗力的现状感到沮丧,于是萌生了一个新想法:开发一款基于奖励机制的应用程序,让人们可以利用空闲时间标注数据并赚取报酬。这家初创公司在韩国科学技术院(KAIST)的创业竞赛中验证了这个概念。2018 年,Kim 与五位 KAIST 校友共同创立了 Datumo(前身为 SelectStar)。
在该应用程序尚未完全开发完成时,Datumo 就在竞赛的客户发现阶段获得了数万美元的预售合同,主要客户来自 KAIST 校友创办的企业和初创公司。
成立第一年,这家初创公司就实现了超过100 万美元的收入,并拿下了多个关键合同。如今,其客户名单包括三星、三星 SDS、LG 电子、LG CNS、现代汽车、Naver 以及总部位于首尔的电信巨头 SK Telecom 等韩国主要企业。不过几年前,客户开始要求公司提供超越简单数据标注的服务。这家成立 7 年的初创公司目前在韩国拥有 300 多家客户,2024 年营收约为 600 万美元。
Datumo 联合创始人 Michael Hwang 告诉 TechCrunch:"他们希望我们对其 AI 模型输出进行评分或与其他输出进行比较。那时我们意识到:我们已经在做 AI 模型评估了——甚至自己都没意识到。" Hwang 补充说,Datumo 随即全力投入这一领域,并发布了韩国首个专注于 AI 信任与安全的基准数据集。
"我们最初从事数据标注业务,随着 LLM 生态系统逐渐成熟,又扩展到预训练数据集和模型评估领域,"Kim 向 TechCrunch 表示。
DATUMO 联合创始人
图片来源:Datumo
Meta 近期以 143 亿美元收购式投资数据标注公司 Scale AI,凸显了这一市场的重要性。
该交易达成后不久,AI 模型制造商兼 Meta 竞争对手 OpenAI 便停止使用 Scale AI 的服务 。Meta 这笔交易也预示着 AI 训练数据的竞争正在加剧。
Datumo 在预训练数据集供应方面与 Scale AI 等公司有相似之处,在 AI 评估与监控领域则与 Galileo 和 Arize AI 存在共性。但据 CEO 金先生介绍,该公司通过其授权数据集实现了差异化优势,特别是从已出版书籍中爬取的数据——这些数据虽包含丰富结构化的人类推理内容,但众所周知清理难度极大。
金先生补充道,与同行不同,Datumo 还提供名为 Datumo Eval 的全栈评估平台,可自动生成测试数据与评估报告,无需手动编写脚本即可检测不安全、存在偏见或错误的响应。其标志性产品是一款面向非开发人员的无代码评估工具,尤其适合政策、信任与安全以及合规团队的成员使用。
在被问及如何吸引到Salesforce Ventures 等投资者时,Kim 解释道,这家初创公司此前在韩国举办的一场活动中,曾与 DeepLearning.AI 创始人吴恩达进行过炉边谈话。活动结束后,Kim 在 LinkedIn 上分享了这次对话,引起了 Salesforce Ventures 的关注。经过多次会面和 Zoom 视频会议后,投资方给出了初步投资意向。Hwang 表示,整个融资过程历时约八个月。
新融资将用于加速研发工作,特别是开发企业级AI 自动化评估工具,并扩大在韩国、日本和美国市场的全球化业务布局。
这家拥有 150 名首尔员工的初创公司还于今年三月在硅谷设立了分支机构。
参考资料
https://techcrunch.com/2025/08/11/seoul-based-datumo-raises-15-5m-to-expand-llm-evaluation-challenging-scale-ai/
文章来自于微信公众号“Z Potentials”。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT