
一文复现Anthropic刚刚发布的ReSearch,原来底层是MCP协议驱动的
一文复现Anthropic刚刚发布的ReSearch,原来底层是MCP协议驱动的Claude于今日凌晨推出新的功能,将ReSearch和 Google Workspace 集成、以及把电子邮件、日历和文档与 Claude 相关联,claude可以在工作环境和联网环境下借助Research快速作出决策和行动。
Claude于今日凌晨推出新的功能,将ReSearch和 Google Workspace 集成、以及把电子邮件、日历和文档与 Claude 相关联,claude可以在工作环境和联网环境下借助Research快速作出决策和行动。
学术写作通常需要花费大量精力查询文献引用,而以ChatGPT、GPT-4等为代表的通用大语言模型(LLM)虽然能够生成流畅文本,但经常出现“引用幻觉”(Citation Hallucination),即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。
谷歌Deep Research重大升级,搭载全球顶尖Gemini 2.5 Pro模型。5分钟生成46页学术论文、复杂报告转为10分钟播客。性能超OpenAI DR 40%,价格仅为其1/10。
Agentic AI 的 3 要素是:tool use,memory 和 context,围绕这三个场景会出现 agent-native Infra 的机会。
众所周知,DeepSeek R1 这种模型在推理任务上很能打,尤其是在数学和编程这些逻辑性强的领域。那么我们能直接把这种强大的推理能力搬到 DeepSearch 这种需要动态规划、多轮交互的深度搜索场景里吗?
说真的,即使玩过了这么多的DeepResearch产品,我也没想到,他们能扔出个这么个有趣的玩意。这个产品叫做,AutoGLM沉思版。
这三篇论文,出自同一AI之手。
今天晚上,就在刚刚,豆包终于上了之前很多人期待的功能,深度思考。我之前用别人的账号体验过这功能,就是推理模型,而今天看到的第一刻,我以为的是,豆包的推理模型终于全量上线了。
AI界「智商大考」ARC-AGI-2重磅出炉了!一个人类用5分钟轻松解开的谜题,却让最顶尖LLM全线崩盘得分挂零,o3更是从曾经76%暴跌至4%。它正式宣告,人类还未实现AGI。
AI智能体迎来新玩家!Grok 3推出的DeeperSearch功能,提升DeepSearch搜索能力,更加深入分析复杂主题。免费放开Deep Research功能后,Gemini 2.0公布研究智能体6大使用技巧。2025年度Agent大战开打!