PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型
PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型PUMA(emPowering Unified MLLM with Multi-grAnular visual generation)是一项创新的多模态大型语言模型(MLLM),由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示,巧妙地平衡了视觉生成任务中的多样性与可控性。
搜索
PUMA(emPowering Unified MLLM with Multi-grAnular visual generation)是一项创新的多模态大型语言模型(MLLM),由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示,巧妙地平衡了视觉生成任务中的多样性与可控性。
MiniMax的最新消息想必大家都知道了,外媒曝出MiniMax的预计年收入:7000万美金。这也给“大模型公司找不到PMF(产品-市场匹配度)”的论断,一记有力的反驳。
随着2024年生成式AI大爆发,推理端成本呈指数级激增,推动了泛智能硬件端持续增长,“端云混合AI部署”模式正走向主流,端侧智能则加速了终端“换机热潮”:AI PC、AI手机、AIoT设备、智能座舱。
2024 年 10 月 23 日 NVIDIA 创始人兼首席执行官黄仁勋携手丹麦国王启动该国最大 AI 超级计算机,旨在实现量子计算、清洁能源、生物技术等领域的突破,服务丹麦社会乃至全球。
大模型开源的口号,不是随便说说的。
AI造就新的烹饪和生活方式。2024 年,AI 席卷各行各业不仅没有放缓,甚至还愈演愈烈,厨电领域也不例外。
首款M4 Mac、「全世界最好的AI一体机」终于来了!同时,苹果AI也正式上线,iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1用户,已经可以体验首批Apple Intelligence功能了……库克直呼:激动人心的新时代开始了!
把平均成功率从 50% 拉到了 100%。
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。
在当前内卷严重的实时目标检测 (Real-time Object Detection) 领域,性能与效率始终是难以平衡的核心问题。绝大多数现有的 SOTA 方法仅依赖于更先进的模块替换或训练策略,导致性能逐渐趋于饱和。
Grok 大模型终于能看懂图像了。
世界模型,也被称为世界模拟器,正被一些人视为人工智能的下一个重大突破。
现在有这么多初创公司提供可以做从听取会议并转录到记笔记和提取见解的 AI 机器人,行业内的公司被迫通过提供额外的功能集和集成来实现差异化。
Clout Kitchen定位“APP工厂”,四个月前推出首款AI游戏伙伴,主打借助AI浪潮颠覆传统游戏行业,构建与平台游戏主播、职业选手的互动体验,赋予主播等类型创作者时间双线性价值,以及用户更好的游戏体验。
Anthropic CEO Dario Amodei 预测,凭借强大的AI的力量,生物学和医学将加速进步,在未来5-10年内实现原本需要50-100年的成果。他称这一现象为“压缩的21世纪”,即AI能够让人类在几年内取得整整一个世纪的生物医学成就。
伦敦人用AI“夺回”好吃的餐厅。
30000+医生使用的AI工具,翻车了。
别说Prompt压缩不重要,你可以不在乎Token成本,但总要考虑内存和LLM响应时间吧?一个显著的问题逐渐浮出水面:随着任务复杂度增加,提示词(Prompt)往往需要变得更长,以容纳更多详细需求、上下文信息和示例。这不仅降低了推理速度,还会增加内存开销,影响用户体验。
前Neuralink总裁创立的脑机接口公司Science Corporation,正在开发一种名为「Prima」的芯片技术。初步试验结果表明,38名患者中,有81%的患者视力得到了大幅度的改善。几位知名眼科医生都直称:「这是第一个有可能成功恢复AMD患者视力的重大进展!」
最近,在全球人工智能模型竞技场(Artificial Analysis)文生图模型排行榜中,一个名叫Red_panda的新模型突然杀出重围,以9%的胜率超越了原榜一大哥Flux1.1Pro成为新王!
AI 硬件的关键,在于持续深入融入用户生活
做好研发投入和成本控制的平衡,成为智驾比拼输赢的关键。
AI裁判通过反馈生成更公正报告,接近共识。
以生成式AI突破PCBA设计自动生成市场。
36氪获悉,知行机器人科技(苏州)有限公司(以下简称“知行机器人”)于近期完成数千万元B轮融资,本轮融资由诚美资本与中关村智友科学家基金联合领投。融得资金将用于公司核心产品及系统的研发、拓展及推广。
吴恩达老师提出了一种反思翻译的大语言模型 (LLM) AI 翻译工作流程
分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《Advanced Science》上。
当AI开始接管你的手机…… 经过一年多的摇旗呐喊,AI手机终于还是在2024年完成了对智能手机的替代。
AI越使用越懂你,依赖性增强。
2024年还剩不到70天,AI行业已经历多轮大洗牌了。