ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI 搜索个人玩家,3 天独立开发上线!
5267点击    2024-04-03 11:49

今天,特工女巫将为大家带来 ThinkAny,这是一款由个人独立开发但小而美的 AI 搜索产品,一起看看它的产品功能设计和技术实现。


ThinkAny 是 idoubi 在 3 月 19 号正式上线的 AI 搜索网站,从开始开发到交付,前后只用了一共 3 天的时间。


官网地址:https://thinkany.ai/



其产品定位是一个新时代的人工智能搜索引擎,利用 RAG 技术检索和聚合高质量的内容,结合人工智能的智能回答功能,高效地回答用户的问题。


它的主要特征包括:


  • 增强的集成:通过 GPT 4、Claude 3 和 Gemini 集成,通过聊天提供更快、更精确的答案。
  • 提升创造力:清晰易懂的大纲和有效的学习和研究思维导图确实有助于改进组织。
  • 社区支持:Twitter、Discord 和 Reddit 都可以发布新问题或发起讨论。





首先,进入 ThinkAny 的首页,页面的上下布局清晰简洁;上方有简洁的标志和 slogan,传达了 AI 搜索的核心价值和功能;搜索框位于页面中央,让用户快速识别、进行搜索;下方列出了一些搜索示例,可为用户提供启发,也显示了可能覆盖的多种主题领域。



在搜索框输入问题后,进入搜索问答的结果页。页面的左侧是 AI 生成的搜索结论内容,而右侧是参考资料的展示区;


搜索加载过程动态之后,首先出现的是包括标题、favicon、网址和相关描述摘要的 sources,每个 source 都有序号,并有对应的文内引用,使学术专业性和指引感更强,有助于用户跟踪和比较不同的参考信息,直观、迅速地判断内容的相关性、来源;


内容总结紧随其后,用户可以一目了然地看到搜索问题的回答总结,以及对应的信息来源,极大地提高了搜索的效率和可信度;


页面底部还设有引导输入框,方便用户提出跟进问题,跟进问题将以用户和 ThinkAny 多轮对话的交互形式展开。


除此之外,更备受海内外用户好评的,是 ThinkAny 在搜索内容总结方面的 outline 和 mindmap 功能,它们为用户提供了清晰的大纲框架和自动生成的思维导图;尤其在工作、学习等专业场景中,能够满足用户对结构化、逻辑性、直观可视信息的需求,帮助用户提高信息处理的效率,带来更好的体验。






在多语言问题上,ThinkAny 支持英文、中文、日语、韩语、俄语、法语、德语、阿拉伯语,加之 ThinkAny 相比 Perplexity 的框架和脑图的差异点,这为其在 X、ProductHunt 等海外社媒平台赢得了良好的自然流量与海外用户好评。






在设计风格上,ThinkAny 整体十分简洁干净,符合搜索产品的调性以及用户人群的特点,操作上的清晰指引让用户使用时能有条理、放心可控;ThinkAny 还支持浅色/深色模式切换,提供了在夜间环境下更舒适的视觉体验。


ThinkAny 通过 GPT 4、Claude 3 和 Gemini 的集成,以及对 RAG 技术的创新利用,通过无缝集成先进的检索和聚合功能,提高搜索信息来源的多样性和生成内容的准确度。具体有 4 步实现方法:


  1. 调用 Google 搜索引擎API或无头浏览器获取 search_n 条搜索结果,返回 URL / title / description;
  2. 根据 is_ranking 参数,对 search_n 条搜索结果进行 reranking,返回 URL / title / description / score,并行 embedding、存储 vector database,用相似度匹配计算 score 和降序排序;
  3. 根据 is_detail 参数,对 reranking 后的 search_n 条搜索结果,并行获取内容详情,返回 URL / title / description / score / content,用 detail_top_k 参数指定只获取 score 排名前 k 条 URL 对应的网页内容详情;
  4. 根据 is_rematch 参数,对有 content 的搜索结果重新向量化,获取 query 匹配的 match_top_k 个数据块,使用数据块的 URL / title / description / content 拼凑 context,并行 embedding 更新 vector database,用相似度匹配的数据块拼凑内容 context。



此外,ThinkAny 运用的RAG 技术结合了检索和生成两种方法的优点


1. 通过检索,能够访问到大量的外部知识,增强模型的知识储备和回答问题的能力;


2. 通过生成,能够产生流畅自然的文本,适应各种不同任务需求。因此十分适用于问答、摘要、文本补全等需要大量背景知识支持的应用场景。


而在前不久,idoubi 单独开源了他一天写完的 RAG-Search API 项目


项目地址:https://github.com/thinkany-ai/rag-search;


这使用了 Google 搜索引擎加上 Zilliz 向量数据库,实现联网数据的召回 retrieval 和重排 reranking,获取搜索结果链接的详细内容,并通过向量相似度匹配过滤内容。


idoubi 认为,在 LLM 的普遍 long text 时代到来之前,RAG 的检索优化有很重要的意义,所以这一 RAG Search API 有助于帮做 AI Search Engine / Chatbot 的开发者们实现更好的 Search / Chat 效果。


而谈及独立开发,idoubi 有全面的前后端开发能力和对 AI 技术熟练的应用能力,以及优秀的产品思维和设计审美,这些素质使得他能以极高的效率快速落地一款高质量产品。


ThinkAny 的产品分析到这里就结束了,如果你好奇 idoubi 更多的产品开发经历,可以点击阅读原文访问他的即刻主页。最后,别忘了关注特工宇宙、欢迎多多点赞在看、转发收藏。



本文来源于公众号 特工宇宙 ,作者特工女巫





AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/