一件比OpenAI发布deep research更值得关注的事情
一件比OpenAI发布deep research更值得关注的事情北京时间2月3日上午,OpenAI突然发布了一款全新的Agent(智能体)——deep research。Deep research是一款利用推理合成大量在线信息并为用户完成多步骤研究任务的Agent,目前已整合到ChatGPT中。目前,ChatGPT Pro用户已可使用相关功能,接下来deep research也将对Plus和Team用户开放使用。
北京时间2月3日上午,OpenAI突然发布了一款全新的Agent(智能体)——deep research。Deep research是一款利用推理合成大量在线信息并为用户完成多步骤研究任务的Agent,目前已整合到ChatGPT中。目前,ChatGPT Pro用户已可使用相关功能,接下来deep research也将对Plus和Team用户开放使用。
据 TechCrunch 报道,位于迪拜的 Qeen.ai(qeen.ai)初创公司已筹集了 1000 万美元,以扩大其平台,该平台为电子商务企业提供自主 AI Agent。
孙正义与奥特曼联手宣布,在日成立合资企业「SB OpenAI Japan」。软银每年投入30亿美元,利用OpenAI的技术独家为日本企业提供「Cristal intelligence」定制化AI服务。
1月13日Mainframe公司发布了可以离线运行在苹果系统(Mac,iPad,iPhone)的本地大语言模型fullmoon: local intelligence
相比LLM和Agent领域日新月异、高度成熟的进展相比,数据收集方面的规范有明显滞后。由超过50名研究人员组成的「数据溯源计划」(DPI)旨在回答这样一个问题:AI训练所需的数据究竟来自何处?
梁文锋带领着DeepSeek,还在继续搅动大模型行业。继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。
知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map,提高学生模型的准确性。迁移学习则通常通过预训练和微调,将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。
DeepSeek大爆出圈,现在连夜发布新模型——多模态Janus-Pro-7B,发布即开源。在GenEval和DPG-Bench基准测试中击败了DALL-E 3和Stable Diffusion。
智能体究竟能否应对现实世界的复杂性?The Agent Company近日提出了一项评估基准,让多个智能体尝试自主运营一个软件公司。结果表明,即使是当前最先进的智能体,也无法自主完成大多数任务。
在达沃斯世界经济论坛上,OpenAI 首席财务官 Sarah Friar 抛出了这颗重磅炸弹,“它们会像真正的同事一样思考问题,遇到困难会后退一步思考,尝试新的解决方案。这不再是科幻,而是即将在 2025 年实现的现实。”