健康搜索，大模型产品“实用性”的试金石？

2185点击 2023-12-29 18:39

智能搜索AI创新健康领域，减低大模型幻觉率，提供更专业、准确的健康信息

GPT的语音化、Gemini的横空出世，让大众更早地将大模型的关键指标投向了多模态的想象力。殊不知，在技术场景的另一端，一批实用主义的大模型也在冉冉升起。

在垂类的世界，厂商已经开始“卷”幻觉率。幻觉是大模型还没有广泛投入应用的最大致命缺陷，低幻觉率则代表着更高的科学性、真实性。对于专业信息的要求更加严苛的垂类大模型来说，生成正确的内容，远比自然地生成内容重要得多。

由于数据集的庞杂是导致幻觉率的最大因素之一，大模型厂商需要在开发过程中谨慎、严格地使用和过滤数据集，从数据集的质量、更好的模型结构来缓解幻觉问题。

传统健康搜索：高频用户需求，低效信息匹配

日前，在专业测评中，夸克大模型在健康内容上的幻觉率降低到了5%以内，这个数字目前在海外流行的通类大模型中也只有GPT能够达到。由此可见，大模型有望成为大健康领域的“革新者”。

在发布了自研大模型后，夸克首先升级了健康搜索的服务体验，通过此前累积的健康知识图谱和全新的健康大模型应用，似乎在向市场宣告：大模型，就是健康搜索最好的燃料。

事实上，国内的医疗健康领域早在十年前就迈入了“互联网+时代，至今却尚未出现一个标准化的平台，随着健康信息密度的增加，缺乏验证的谣言和营销内容也越来越多，对于患者和用户来说，筛查和判断病因，好像反而“比以前更难了”。

与此相对的，近几年国人对健康的重视程度迎来了显著爆发期。健康焦虑带来了大量的用户线上行为和搜索场景。高频化的求医问诊、健康咨询等需求也造成了各个地区医疗资源的短缺。搜索引擎、社交媒体等线上平台，无疑是对于普通人来说最快速的筛查方式。

然而纵观全球市场，传统的搜索引擎至今也没有能够很好地匹配健康搜索需求，搜索结果饱受质疑。基于第三方平台和文章页面的健康信息、诊断内容等参差不齐，而第三方信息一旦对用户造成误导，对于整个健康搜索领域来说都是不可挽回的损失。

因此，近几年来，社交媒体在健康搜索方面的“公信力”似乎已经超过了搜索引擎。不过，由于社交用户更多地是在分享个人经验，并不具备系统性诊断和科普的能力。因此，无论是大众还是整个大健康产业，其实更加需要的都是搜索引擎的针对性变革。

AI时代的健康搜索：智能筛查，完整的诊断路径

在垂直大模型分数表现出色的基础上，近期，夸克针对健康搜索进行了全面升级，上线“夸克健康助手”，将搜索和AIGC内容进行全面融合，在帮助用户进行健康信息查询的同时，也迈出了大模型应用于垂类搜索的第一步。

近日，Google DeepMind资深工程师卢一峰在采访中表示，大模型目前最有潜力的方向之一是检索增强生成（RAG）。而早在2015年，中国工程院院士、网络信息安全专家方滨兴就在论文中提出，传统搜索引擎并不能满足泛在网络空间中日益变化的搜索需求。同时， “如何将各个行业的数据价值挖掘服务，变成一种通用的、可发布的、服务于广大民众的搜索技术，人们已经不满足于搜索引擎只是给出存在性的结果，而是需要一组智能解决方案。”

健康搜索，大模型产品“实用性”的试金石？

比如，传统搜索体验中的健康查询与用户需求的不适配，问题主要出在两个方面。

其一，是搜索内容的限制。搜索框这一产品形态被设计出来的时候，是为了针对数据库内的已有信息进行检索，因此更适用于关键词的输入和精准匹配，会让用户在描述问题的时候本能地简短化、关键词化，一旦想要进行针对性地详细表述，就会觉得无所适从。然而，对于健康查询来说，短描述和关键词显然是不够的。即使是在线下问诊中，医生也需要通过完整、逻辑清晰的表述，来帮助患者做出正确的判断。

在这一点上，AI所带来的智能匹配能力只是一方面，产品形态和路径也需要更好地重构与打磨，从入口页面提高健康查询的引导性。因此，升级后的夸克健康搜索首先在结果页上改变内容的展现形态，由“夸克健康助手”提供的AIGC内容已经出现在用户眼前。其优点是，将信息海化为精准筛查，让用户接受信息更简单。

同时，还有夸克健康百科、智能筛查等功能，进一步帮助用户了解病症、用药、就业、保养等建议。尤其是智能筛查功能，用户可以根据自身情况，通过勾选症状信息的方式，进一步描述所面临的健康问题，然后系统会生成相关建议，辅助用户决策。

健康搜索，大模型产品“实用性”的试金石？

传统健康搜索的第二个症结，是目前的搜索引擎虽然是“收集问题”的最大数据库之一，但解决问题的链条却远远没有达到标准化的程度。这也就导致了，即使筛查结果已经足够精准，能够帮助用户判断病症，也无法针对具体的症状告诉用户应该怎么做。尤其是在医药分离的时代，同一种病症的不同阶段，在基础护理、买药、去医院进一步检查这些行为的流向下，都会产生截然不同的场景和结果。

此外，从数据本身的角度来说，搜索引擎只有陪伴用户走完更深的查询与解决场景，才能更好地优化大模型的能力，让AI提供的信息保持时效性。

因此，夸克在AIGC内容和智能筛查以外，还上线了“夸克健康助手”的功能页面，让AI像人一样学会“对话”和“追问”，这也是给用户充分放权的同时，降低了信息查询的门槛。

健康搜索，大模型产品“实用性”的试金石？

夸克健康助手所给出的是否需要就医、治疗建议等针对性分析，则能够更好地提高就医准确性。因为，健康搜索虽然是基于当下症状的垂直场景，但真正的诊疗却需要对病患进行综合观察。生成式AI能在对话中提取和主动询问关键信息，从而提供更加深层次的实际指导。

这也就呼应了业界对于大模型应用能力的期望。此前，清华大学新闻学院教授、博士生导师沈阳曾表示，大模型要减少错误率，一个重要的措施就是要跟搜索引擎进行协同。而在海外市场，微软必应与GPT的深度协同、Google在Bard、Gemini上的发力与突破，也验证了这一观点。即使在科技巨头看来，在搜索引擎内的应用也是大模型想象力的根基和着力点。

只不过，在浩荡的技术革新中，海外头部搜索引擎花了更多的精力来锤炼产品的通用解决能力，让AI时代的搜索更加贴近一个全能、多模态的AGI。而在一向擅长将未来技术投入垂直应用的国内市场，由于用户标准化需求的流量和频次更高，厂商更关注如何以产品化探索的方式，让新兴技术与用户体验协同起来。

由此，健康搜索或可成为国内最早获益于大模型应用能力的领域和场景之一，同时也可以作为智能搜索时代的先行军，为搜索引擎补充更多来自来自第一方、可控性更强的内容，从而打破用户对传统健康搜索的偏见，在表达门槛更低、更自由的交互体验中，拉近普通人和正确、专业、权威知识的距离。

大模型产品的未来：一切以用户体验为先

如火如荼的AI化转型阶段，大模型的能力如何融入自身产品形态，夸克健康搜索给出了一个有力的创新示例。

夸克很好地认识到，产品交互的创新和继承是不可或缺的：基于大模型的搜索不能仅仅以生成式对话的形式存在，专业的诊断建议必须和现有的用户查询路径结合起来。

而Google尽管目前还没有像夸克一样，为C端用户上线健康查询的智能搜索版面，但今年十月，谷歌云也曾借助Vertex AI的能力，发布了帮助医生从医疗记录中精确提取临床信息的搜索产品。

诸如此类，为健康行业提供AI解决方案的尝试正在如火如荼地进行。全球范围内，人工智能辅助诊断的案例也变得越来越多。互联网医疗出现以来，通过聊天机器人、在线医生等进行线上对话问诊的病患比重不断提高，这些过去的进程都为如今AI健康搜索的市场打下了认知基础。而相比上一个技术时期，大模型虽然不能完全替代医生的诊断，但其对于疾病和潜在疾病的诊断率已经相当出色。尤其是在夸克等大模型自研厂商将健康能力作为技术标的之后：夸克大模型曾以485的高分通过临床执业医师资格考试。

也许在短期内，AI还不能“成为”医生，但目前AI已经能替医生解决很多辅助性和预判性的工作。根据夸克的技术与资源布局，可以预见到，明年的健康搜索领域还将呈现出两个趋势：

一.行业图谱将会更加垂直和细分。比如根据病症类型、人群、年龄阶段产生不同的垂类查询场景，结构性的智能问答所覆盖的健康需求类型也会更加灵活。同时，在健康搜索所展开的医疗健康解决方案方面，搜索引擎将会作为一个数字平台，更好地连接用户与医院、服务端等，因为用户的在线查询同时也能为医生快速提供诊断方向，Vertex AI在北美医疗保健与部分卫生组织中的测试应用已经为此提供了可行性。

由此，也就引发了第二个趋势：出于对健康诊断实用性、正确性的考虑，来自业界的前沿判断和专业数据将会得到迅速的生态整合。夸克大模型之所以能够在健康领域呈现出较高的专业能力，除了技术和用户数据层面的优势之外，还有来自超过200位权威医学专家的领衔编审、60多家全国公立三甲医院、40多个医学机构的合作。现阶段，人与AI之间并非抗衡，而是协同关系。有限的人才资源，才是“无限”的智慧来源，一个优秀的大模型也不能脱离专业的知识积淀和校正。而在此过程中，一个开放活跃的业界生态尤为重要。

健康搜索，大模型产品“实用性”的试金石？

无论是Google、必应还是国产搜索引擎夸克。从高考报志愿到健康搜索，一直以来，夸克也是为数不多擅长围绕行业图谱进行“场景突破”的平台。而在大模型时代，如何平衡技术变革的感性和实用场景的理性，也让这一类，重新开启了对于用户体验的构想。

如今，传统健康搜索的“顽疾”正在得到技术的摒除。比起，更加值得期待的是越来越多的医学从业者能够拥抱，以AI的形式帮助更多人便利、低成本地获得健康、保持健康。

文章来自于 36氪“时氪分享”

关键词: AI健康 , 医疗AI , 健康大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/