「拍照问夸克」,从「Know-What」到「Get it Done」的跃迁
「拍照问夸克」,从「Know-What」到「Get it Done」的跃迁作为 2025 年动作最多的 AI 产品之一,夸克近期在发布了「AI 超级框」后,又带来了新的 AI 多模态入口————拍照问夸克。作为手机相比其他 AI 硬件来讲,拍照是让手机自始至终留在 AI 最前线的原因,围绕手机相机这个入口,不断涌现出优秀的 AI 原生应用。
作为 2025 年动作最多的 AI 产品之一,夸克近期在发布了「AI 超级框」后,又带来了新的 AI 多模态入口————拍照问夸克。作为手机相比其他 AI 硬件来讲,拍照是让手机自始至终留在 AI 最前线的原因,围绕手机相机这个入口,不断涌现出优秀的 AI 原生应用。
GPT-4o又双叒更新了。这一次,在智力和个性方面再次进化,STEM解决能力增强,响应更主动。与此同时,有人曝出它的生图质量大不如前。
近期,一款 AI 浏览器产品 Fellou 在各大 AI 用户社群、媒体测评内容中陆续出现,受到热议与关注。Fellou 官方给出的定位是全球首个 Agentic Browser,一款基于 AI 技术的新型浏览器。Fellou 的核心亮点在于,用户只需一句话,Fellou 就能自动解析指令并跨多个网页和系统调度操作,从数据采集、表单填写到报告生成,实现一站式无缝交付。
终于,免费用户也能用上OpenAI的DeepResearch了,量子位也进行了新鲜实测!OpenAI深夜官宣,基于o4-mini某个版本的轻量版DeepResearch正式上线。按照官方说法,轻量版的回答会更短,但智能水平将几乎无异于满血版本。
他们打造的端侧大模型已经可以在树莓派这样的微型设备上流畅运行,首批搭载Yan架构大模型的具身智能机器人也已经面世。当下AI算力竞赛愈演愈烈之际,他们的“低算力”“群体智能”之路正在获得更多关注。本期「大模型创新架构」主题访谈,量子位邀请到RockAI CEO刘凡平,聊聊他们选择非Transformer架构路线背后的故事,以及通过架构及算法创新实现AGI的技术愿景。
这里介绍一下Vidu,Vidu是由生数科技联合清华大学正式发布的中国首个长时长、高一致性、高动态性视频大模型。Vidu在语义理解、推理速度、动态幅度等方面具备领先优势,并上线了全球首个“多主体参考”功能,突破视频模型一致性生成难题,开启了视觉上下文时代。最近上线了 Vidu Q1 的高质量视频大模型,不仅视频效果质感更高,而且性价比很不错。
全球首个去中心化强化学习训练的32B模型——INTELLECT-2震撼发布!无需授权,就能用自家异构计算资源参与其中,让编码、数学与科学领域的推理性能迈向新高度。
这次春季更新,微软带来了 365 Copilot Wave-2 ,系统级的AI助手重大升级版,任何Windows 系统自带。本来凭借得天独厚的资源,应该秒天秒地秒众多AI产品,但是这波时隔一年的更新,微软CEO纳德拉亲自在X上发布,用户却并不买账,批评的潮水淹没了评论区。
Google DeepMind正式发布其最新的音乐生成模型Lyria2,标志着音乐创作领域人工智能又一重大突破。该新模型具备高保真音频生成和专业音质,为音乐家、制作人和创作者提供了更强大的工具。
Deep Research 产品可被理解为一个以大模型能力为基础、集合了检索与报告生成的端到端系统,对信息进行迭代搜索和分析,并生成详细报告作为输出。