
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%字节开源图像编辑新方法,比当前SOTA方法提高9.19%的性能,只用了1/30的训练数据和1/13参数规模的模型。
字节开源图像编辑新方法,比当前SOTA方法提高9.19%的性能,只用了1/30的训练数据和1/13参数规模的模型。
扩散模型(Diffusion Models, DMs)如今已成为文本生成图像的核心引擎。凭借惊艳的图像生成能力,它们正悄然改变着艺术创作、广告设计、乃至社交媒体内容的生产方式。
上个月,OpenAI 在 ChatGPT 中引入了图像生成功能,广受欢迎:仅在第一周,全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚,OpenAI 又宣布了一个好消息:他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1,让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。
,清华大学、北京航空航天大学团队推出了全新的架构设计 ——Personalize Anything,它能够在无需训练的情况下,完成概念主体的高度细节还原,支持用户对物体进行细粒度的位置操控,并能够扩展至多个应用中,为个性化图像生成引入了一个新范式。
在 R1 推理模型大火之后,全民接力集成 DeepSeek,有硅基流动这样的大模型云服务平台、有腾讯元宝这样的 Chatbot,甚至微信这样的顶流。但是,AI 图片类产品却鲜少有接入 DeepSeek R1 的新闻,而从 DeepSeek-R1 发布到 Krea 宣布上线新功能仅仅 10 天,这个反应应该是图像产品中最快的。
2025年2月24日,明势早期项目、AI图像生成平台「LiblibAI-哩布哩布AI」宣布在一年内已连续完成四轮融资。继2024年7月披露的数亿元融资后,又成功斩获数亿元资金,发展势头迅猛,创下国内AI应用赛道融资速度纪录。
AI生成内容已深度渗透至生活的方方面面,从艺术创作到设计领域,再到信息传播与版权保护,其影响力无处不在。
埃隆·马斯克 (Elon Musk) 最近将 Grok AI 的可用性扩展至每个 X 用户,几个小时后,Grok 的母公司 xAI 宣布了其最新的图像生成模型 Aurora,可从 X 上的 Grok 助手中访问。然而,在推出后的最初几个小时内,一些用户已经无法访问 Aurora,而原因目前尚不清楚。
今天,LiblibAI与千万用户一起揭幕我们的自研图像大模型。 Star-3 Alpha 图像基座模型来了。Star-3 Alpha大模型,基于业界领先的F.1基础算法架构训练而成。 相较于以往的所有模型,Star-3 Alpha在生图效果上实现了显著的飞跃,在图像精准度、色彩表现力、美学捕捉的细腻表达等方面成为新的业界标杆。
让照片会“唱歌”,让人脸会“跳舞”。近期,一款名为Revive的AI图像应用登上欧洲多地娱乐免费榜Top50。上线两年左右的时间里,积累了近1700万用户,收入量也是高达1162万美元。