AI资讯新闻榜单内容搜索-Stable

放弃国企工作，创办一人企业：我一定能用AI挣到钱

何秋剑离开15年国企影视岗位，自学Stable Diffusion等AI工具创业。从10元图片订单起步，依靠影视基础、创意能力及客户服务，发展为月入数万的AIGC制作总监。

来自主题: AI资讯

8678 点击 2025-06-21 11:23

速递｜破解3D生成取代CAD？SpAItial获1300万美金种子资金，前Synthesia联创集结Meta谷歌豪华技术团队

从OpenAI 的 4o 到 Stable Diffusion，能够根据文本提示生成逼真图像的 AI 基础模型如今已比比皆是。相比之下，能够仅凭文本提示就生成完整、连贯的 3D 在线环境的基础模型才刚刚崭露头角。

来自主题: AI资讯

7966 点击 2025-05-28 15:13

速递｜Stability AI联手Arm推出最快手机端免云模型，8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型，该公司宣称这是市场上速度最快的模型，且效率高到足以在智能手机上运行。

来自主题: AI资讯

10279 点击 2025-05-15 14:14

首次！流匹配模型引入GRPO，GenEval几近满分，组合生图能力远超GPT-4o

流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能，已成为图像生成（Stable Diffusion, Flux）和视频生成（可灵，WanX，Hunyuan）领域最先进模型的训练方法。然而，这些最先进的模型在处理包含多个物体、属性与关系的复杂场景，以及文本渲染任务时仍存在较大困难。

来自主题: AI技术研报

11501 点击 2025-05-14 10:19

CVPR2025｜MCA-Ctrl：多方协同注意力控制助力AIGC时代图像精准定制化

近年来，生成式人工智能（Generative AI）技术的突破性进展，特别是文本到图像 T2I 生成模型的快速发展，已经使 AI 系统能够根据用户输入的文本提示（prompt）生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型，这一领域的技术迭代呈现出加速发展的态势。

来自主题: AI技术研报

12098 点击 2025-05-12 14:59

Stable Diffusion变身3D神器！一个LoRA将2D图像转3D模型

在Stable Diffusion当中，只需加入一个LoRA就能根据图像创建3D模型了？

来自主题: AI技术研报

8139 点击 2025-03-26 14:56

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成，Github Star破千

近年来，扩散模型在图像与视频合成领域展现出强大能力，为图像动画技术的发展带来了新的契机。特别是在人物图像动画方面，该技术能够基于一系列预设姿态驱动参考图像，使其动态化，从而生成高度可控的人体动画视频。

来自主题: AI技术研报

10035 点击 2025-03-20 09:34

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

文本到图像（Text-to-Image, T2I）生成任务近年来取得了飞速进展，其中以扩散模型（如 Stable Diffusion、DiT 等）和自回归（AR）模型为代表的方法取得了显著成果。然而，这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量，导致计算成本高昂、落地困难，难以高效地应用于实际生产环境。

来自主题: AI技术研报

8145 点击 2025-03-20 09:18

速递｜将2D照片转化为3D视频，新模型能否解决Stability AI商业困境

Stability AI 发布了一款新 AI 模型——Stable Virtual Camera，该公司宣称该模型能将 2D 图像转化为，具有真实深度和视角的“沉浸式”视频。

来自主题: AI资讯

8580 点击 2025-03-19 15:08

被Github 上的Stable Diffusion 坑惨了？失业、欠帐、恐慌，工程师怒喷：AI软件毁了我

这位曾用代码构建童话世界的工程师，被困在了由 AI 工具引发的一场噩梦里。

来自主题: AI资讯

7469 点击 2025-02-28 10:27