# 热门搜索 #
搜索
AI成都 | “事实核查算法”迎击“幻觉”痛点,「索贝」明眸大模型铺平“持证”上线之路
7949点击    2024-08-30 10:04

“发挥全球视角与专业经验,为国内产业的长足发展贡献力量。”


近日,“网信四川”发布消息,根据《生成式人工智能服务管理暂行办法》,四川省新增两款已备案大模型,成都索贝数码科技股份有限公司(以下简称为“索贝”)的“明眸大模型”就是其中之一。


36氪了解到,「索贝」的明眸大模型是面向媒体、文旅、教育等行业的领域大模型,应用框架的核心包含语义检索(Retrieving)、理解生成(Reading)和推理调度(Reasoning)三大引擎模块,搭载了原生的事实核查算法,可实现领域知识高效注入,并且具备自我评估及调度能力,可适用于AI数字人交互、专业系统智能辅助、新闻稿件生成和视频节目脚本创作等多种形式的内容。



成都索贝数码科技股份有限公司


克服“模型幻觉”难题


「索贝」媒体智能实验室主任杨瀚介绍,明眸大模型的亮点之一在于“原生的事实核查算法”。目前,常见的通用大模型能够高效生成内容,但“模型幻觉”问题仍然是一个挑战。


模型幻觉,大致分为事实性幻觉和忠实性幻觉,其中事实性幻觉是模型生成的内容与可验证的现实世界事实不一致,忠实性幻觉是模型生成的内容与用户的指令或上下文不一致。据介绍,明眸大模型搭载的原生的事实核查算法,实现了一套基于一致性判别的输出软约束方法,能确保内容生成过程中的真实性和准确性,保证大模型在内容生产领域可靠可用。


在专业领域能力方面,用户可以利用自己的知识库,实现明眸大模型对专业领域知识的高效注入,并利用领域知识数据集训练模型,提升其在垂直领域的知识覆盖范围和深度,使模型掌握了更强的知识理解和学习能力,显著提升了模型在特定应用场景中的表现。值得注意的是,明眸大模型支持私有化部署方案,并拥有7B/15B/34B(“B”代表“十亿”)三个版本,不仅能解决数据安全与隐私问题,还可在契合场景需求的基础上使模型得到充分利用。



「索贝」明眸大模型应用示意图-容器云Copilot


在调度能力方面,明眸大模型内置能力评估模块,对模型能力进行充分性评估,可依据判别结果自适应调整多种检索内容的采信度,并可根据需求调用插件,完成模型任务。


杨瀚告诉36氪,为帮助用户构建基于明眸大模型的领域智能能力,「索贝」近日推出的视听智能云可为用户提供例如数据准备、数据标注、模型训练等涉及AI模型生产、模型管理及优化、智能应用构建等全链条服务能力。此外,结合领域知识嵌入与领域应用场景的特性,视听智能云还提供相应的配套开发工具,预置多样化的智能辅助套件,降低领域模型构建门槛、提升领域模型开发效率,这些都为大模型研发及应用提供关键助力。



「索贝」明眸大模型应用示意图-智能编辑


“大模型的发展目前已从文字跨越到多模态,并率先在视听领域得到应用,我们将围绕行业需求和新质生产力发展现状,不断对模型能力与基于模型构建的多个应用进行迭代更新,使其更智能、更安全可靠、更实用。”杨瀚表示。


深厚积淀贡献AI力量


「索贝」创立于1997年,是一家成都企业,曾成功在国庆70周年阅兵、多项国际国内体育赛事、春晚、两会等重大场景中实现AI技术的全面落地,深刻推动了大视听行业的智能化进程。截止目前,「索贝」已拥有202项发明专利和596项计算机软件著作权,在超高清视频技术和数字化领域取得众多技术成果,曾获“国家科技进步一等奖”“国际广播联合会(IABM)Peter Wayne全球大奖”“王选新闻科学技术一等奖”以及多个部级一等奖奖项,主导或参与制定多个行业标准,并牵头成立了“国家超高清视频创新中心”,同时是科技部等五部委设立的“国家文化和科技融合示范基地”。公开信息显示,「索贝」新三板挂牌申请已经被受理。


“全球人工智能产业正在快速发展,国内在数据资源、市场规模以及政策支持方面具有明显优势,但在基础研究、核心技术突破、产业应用等方面仍需进一步加强。我们将继续发挥全球视角与专业经验,基于索贝媒体智能实验的长期沉淀与积累,为国内产业的长足发展贡献力量。”杨瀚说:“公司目前已和近20家广电机构、高校、文旅等领域用户达成深度合作,通过深入了解用户的应用场景和业务需求,部分合作已完成领域语料的收集、整理和扩充,并进行了模型的训练和微调,正在与用户进行下阶段沟通及深入测试,为模型正式上线应用打好基础。”



「索贝」明眸大模型应用示意图-文稿创作


今年,成都市发布《成都市人工智能产业高质量发展三年行动计划(2024—2026年)》《成都市进一步促进人工智能产业高质量发展的若干政策措施》及其实施细则等文件,将建成创新活跃、能级领先、应用广泛、要素集聚的全国人工智能产业发展高地。


「索贝」方面表示,公司高度认同成都“人工智能技术创新与产业发展综合实力进入全国第一方阵”的目标,并计划通过「索贝」的技术优势与创新能力,为成都的AI产业发展贡献力量。


在人才培养层面,「索贝」将进一步与行业用户、高校、产业研究机构等展开深度合作,与行业实践相结合持续引入领域尖端人才,培养理解行业、理解用户、理解发展的综合人才。在技术研发与产业规模化应用层面,「索贝」将基于设立的媒体智能实验室,聚焦原理研究、工程落地和领域实践,在自然语言处理、计算机视觉、机器学习等AI领域展开深入研究,并将研究成果应用于多个平台级产品的开发中,推动行业实现生成式AI规模化应用。


文章来源“王晓鑫”,作者“王晓鑫”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner