近日,杭州联汇科技股份有限公司(以下简称 “联汇科技”)宣布完成新一轮数亿元战略融资,投资方由中国移动产业链发展基金中移和创投资、前海方舟(前海母基金管理机构)旗下中原前海基金和齐鲁前海基金等多家头部国资与市场化机构组成。领投方中国移动产业链发展基金中移和创投资是贯彻落实中央企业现代产业链链长工作要求,由中国移动与北京市政府、上海市政府发起成立,服务于数字经济、移动信息现代产业链发展、战略新兴产业等国家战略。
据悉,本轮融资将主要用于多模态大模型及自主智能体的技术研发、产品创新及市场拓展,扩大其在运营商、能源电力、媒体等国家基础行业与重点细分市场的领先优势。
历经千模大战,为何唯有联汇科技能赢得 “国家队” 青睐?这家坐落在杭州钱塘江畔的 AI 大模型准独角兽企业有哪些过人之处?
脱颖而出,不是偶然,更非一日之功。2019 年,看准智能化大潮拍岸的联汇科技乘势而上,开启了在多模态大模型、向量数据库等技术领域的研究与沉淀,成为了国内最早自主研发大规模预训练算法模型的公司之一。放眼全球组建核心技术团队,吸引了卡耐基梅隆大学、微软研究院、加州大学、纽约大学等全球顶尖高校与机构的博士、博士后等技术大牛加盟,以极强的技术研发实力成为全球预训练大模型研究的一颗闪亮明星,连续多年在 ACL、ECCV、CVPR、AAAI 等人工智能国际顶会中取得各项竞赛单元的多个冠军。
一个优秀的公司,背后必定有一个优秀的理念和团队。联汇科技 CEO 兼首席科学家赵天成博士,博士毕业于卡耐基梅隆大学(CMU)计算机系语言技术所(LTI),仅用 4 年半时间拿下了 CMU 六年起步的博士学位,早在 2017 年就提出了学术界最早的生成式对话模型,深耕多模态机器学习与人机交互技术领域的理论与技术研究,主持多项国家、省、市重大科研项目,带领团队在攻克非结构化数据直接使用、跨模态数据融合分析等行业难题上率先取得突破,是国际多模态交互 AI 领域的领军人物。
在谈及多模态大模型技术的价值时,他说:“在回国之前,我们很早就已经认识到用小模型的方式去服务中长尾场景,投入产出根本不合理,从而更加坚定了走大模型技术方向的决心,我们要做的事情不是 follow 谁,而是 lead 新的技术革新。”
联汇科技 CEO 兼首席科学家赵天成
眼耳鼻舌身意,色声香味触法,人类用不同的感官来感知物理世界的美妙。相较于单一模态,赵天成博士团队认为多模态大模型在应用上的价值优势更加显著,融合处理文本、图像等跨模态数据,可以使得大模型在复杂情境理解和多样化内容生成方面的表现更为出色,在多模态协作生成、跨领域检索等实际应用场景中的适应性更强。不同模态的数据组成更广泛、多元的数据集,反向促进预训练效率提升,更有助于增强模型泛化能力和整体性能。
自 2020 年起,联汇科技陆续推出多个版本的自研多模态大模型,其中 1.0 版本是业界最早的视觉语言大模型,具备视频、图片、文本等跨模态数据的融合分析、认知理解能力;2.0 版本一路过关斩将,不负众望成为全国第一个高分通过工信部信通院评测认证的预训练大模型;3.0 版本在开放识别、视觉问答、认知推理和高效微调四大核心能力实现质变飞跃,同期发布了 OmBot 大模型驱动的自主智能体与视频小欧、文档小欧和创作小欧等首批典型场景应用,为不同行业提供定制化的智能助手。
在产品研发和市场服务方面,客户覆盖中国移动、中国电信、全国人大、国家电网、央广总台等头部企业,通过提供以多模态大模型为核心的产品与服务,赋能各行各业智能化转型,助力国家 AI 普惠加速实现。
在核心技术创新方面,联汇科技发表多篇国际顶会论文,发明专利丰硕,坚持 “以用促研、研用结合”,结合行业用户服务经验获中国电力科学技术进步奖、中国电力科技创新奖、中国广播电视科技进步奖、国家科技部颠覆性科技成果创新等科技奖项。入选 IDC 等国际咨询机构 “中国多模态 AI 大模型领域代表厂商”、“全球向量数据库代表企业”、“2023 年度最佳大模型” 等。一路艰辛跋涉、一路鲜花掌声,如今的联汇科技以不俗的业绩表现成长为人工智能领军企业、中国 AI 基础大模型创新企业。
加快推动人工智能发展、培育新质生产力,不仅是国家高质量发展的必然要求,也是联汇科技矢志不渝的追求。对于多模态大模型技术服务的市场坐标,赵天成博士的目标非常清晰:“我们希望 AI 技术是能够真正服务国家、社会,创造出真正的价值,这是我们团队中的很多人结束留洋、归国扎根的初心和目标。我们的客户有很多是服务国家战略的央企、国企和头部企业,他们代表着国家经济发展的大方向。帮助不同行业的企业与客户降本增效,带去看得见、摸得着的收益,是我们专注大模型技术商业落地的动力所在。”
本次中国移动产业链发展基金中移和创投资领投联汇科技,双方携手共同推进行业级人工智能技术发展、支撑壮大 “战新” 产业,主动把握 “AI+” 时代潮流。中移和创投资表示:“联汇科技在视觉领域具备海量高质量图文对和独有数据积累,在行业级多模态大模型和自主智能体技术的研究和创新方面取得了令人瞩目的成绩单,多领域快速实现了商业化落地,相信未来联汇科技持续攻坚多模态大模型技术在视觉领域的应用,赋能千行百业加速提质增效。”
联汇科技与 “国家队” 的强强联合,将推动自身从智能平台服务向提供全套解决方案服务的大模型产业生态转型,降低多模态大模型技术的落地赋能的技术门槛与成本,进一步加速产业焕新、夯实基础底座、加快重点行业赋能,与千行百业一道迎接 AI 技术红利真正爆发。
联汇科技本轮融资主要用于扩充人才队伍、组织架构升级,更好的提供多模态大模型相关的产品与服务,推动更多的行业规模化应用。欢迎有识之士选择联汇、加入联汇,让我们一起携手共创、加快 AI 普惠,让所有人都能享受到一流的大模型应用服务,让美好发生。招聘通道持续开放中!
文章来自于微信公众号 “机器之心”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner