
深度|AI独角兽95后华裔创始人:AI战争在于中美技术栈谁将成为全球标准,美国必须赢得这场战争
深度|AI独角兽95后华裔创始人:AI战争在于中美技术栈谁将成为全球标准,美国必须赢得这场战争如果把人工智能的发展趋势向前推演,几乎每个国家、每个公司最终都可能基于美国技术栈或中国技术栈,去构建人工智能技术。
如果把人工智能的发展趋势向前推演,几乎每个国家、每个公司最终都可能基于美国技术栈或中国技术栈,去构建人工智能技术。
Mistral AI,这家法国公司是 AI 助手 Le Chat 和多个基础模型背后的力量组成,被官方视为法国最有前途的科技初创企业之一,且可以说是能与 OpenAI 竞争的欧洲公司。然而,与其 60 亿美元的估值相比,其全球市场份额仍相对较低。
随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景,形式化推理与验证(formal reasoning and verification),也获得持续关注。
法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。一出手就是号称「世界上最好的 OCR 模型」!新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。
我们的使命是确保AGI(通用人工智能)能够惠及全人类。能够初步实现AGI的系统已经崭露头角,因此理解当下所处的时代至关重要。AGI是一个定义相对宽泛的术语,但通常我们指的是一种能够在多个领域达到人类水平、处理日益复杂问题的系统。
今天,他们自称发布了世界上最好的 OCR API,它能够将复杂的 PDF 文件转换为文本文件,以便 AI 模型处理。现在,所有大模型的输入端格式都是文本,或者规整的、容易识别的文本文件,但这个世界上,还有很多文件是粗糙的,不规整的,难以识别的,它需要依赖强大的 OCR 功能才能转换为文本。
当涉及到空间推理任务时,LLMs 的表现却显得力不从心。空间推理不仅要求模型理解复杂的空间关系,还需要结合地理数据和语义信息,生成准确的回答。为了突破这一瓶颈,研究人员推出了 Spatial Retrieval-Augmented Generation (Spatial-RAG)—— 一个革命性的框架,旨在增强 LLMs 在空间推理任务中的能力。
与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。
o1/DeepSeek-R1背后秘诀也能扩展到多模态了!
通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!