AI资讯新闻榜单内容搜索-生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生成模型
港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了

港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了

港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了

刚刚,港大字节联手发布最新视频生成模型,让歪果网友直呼疯狂。有人甚至直接RIP市场营销、TikTok用户和YouTube创作者。你敢信,下面这一幕不是来自欧巴电视剧,而是AI生成的!

来自主题: AI资讯
6877 点击    2025-02-11 14:21
图像生成推理大模型,港中文北大等联手破解画质提升难题

图像生成推理大模型,港中文北大等联手破解画质提升难题

图像生成推理大模型,港中文北大等联手破解画质提升难题

图像生成模型,也用上思维链(CoT)了!此外,作者还提出了两种专门针对该任务的新型奖励模型——潜力评估奖励模型。(Potential Assessment Reward Model,PARM)及其增强版本PARM++。

来自主题: AI技术研报
5038 点击    2025-02-10 11:09
全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!

全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!

全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!

当下,视频生成备受关注,有望成为处理物理知识的 “世界模型” (World Model),助力自动驾驶、机器人等下游任务。然而,当前模型在从 “生成” 迈向世界建模的过程中,存在关键短板 —— 对真实世界物理规律的刻画能力不足。

来自主题: AI技术研报
7505 点击    2025-02-02 19:07
CityDreamer4D: 下一个世界模型,何必是视频生成模型?

CityDreamer4D: 下一个世界模型,何必是视频生成模型?

CityDreamer4D: 下一个世界模型,何必是视频生成模型?

在过去的两年里,城市场景生成技术迎来了飞速发展,一个全新的概念 ——世界模型(World Model)也随之崛起。当前的世界模型大多依赖 Video Diffusion Models(视频扩散模型)强大的生成能力,在城市场景合成方面取得了令人瞩目的突破。然而,这些方法始终面临一个关键挑战:如何在视频生成过程中保持多视角一致性?

来自主题: AI技术研报
5182 点击    2025-01-28 11:53
贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

论文一作刘少腾,Adobe Research实习生,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是多模态大模型和生成模型,包含图像视频的生成、理解与编辑。作者Tianyu Wang、Soo Ye Kim等均为Adobe Research Scientist。

来自主题: AI技术研报
4658 点击    2025-01-26 11:39
AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证

在 LLM 落地场景中,医疗领域的应用开始展现出比较高的确定性,尤其是 AI scribe 产品能解决临床文档记录枯燥、耗时这一行业痛点。Abridge 是其中最有代表性的公司,训练了专用于临床文档的 ASR 和文本生成模型,能够替代 90% 左右的人工工作量。

来自主题: AI资讯
2966 点击    2025-01-04 15:54
AGI-Eval团队:AI视频生成模型年度横评,Sora大饼落地,但国产模型仍然领先!

AGI-Eval团队:AI视频生成模型年度横评,Sora大饼落地,但国产模型仍然领先!

AGI-Eval团队:AI视频生成模型年度横评,Sora大饼落地,但国产模型仍然领先!

说到2024年AI圈的热门话题,当然不能错过视频生成模型了! 即使是在12月,国内外视频模型的更新脚步依旧没有放缓。其中以Sora、可灵AI为代表。

来自主题: AI资讯
6856 点击    2025-01-04 14:51
设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成,无需重训练!

设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成,无需重训练!

设计界的「GPT时刻」 | 像人一样利用“分层设计思维”颠覆传统设计生成,无需重训练!

平面设计是一门艺术学科,它们致力于创造一些吸引注意力和有效传达信息的视觉内容。为了减轻人类设计师的负担,各种各样的海报生成模型相继被提出。它们只关注某些子任务,远未实现设计构图任务;它们在生成过程中不考虑图形设计的层次信息。为了解决这些问题,作者将分层设计原理引入多模态模型(LMM),并提出LaDeCo算法。

来自主题: AI技术研报
5250 点击    2024-12-31 13:02
北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。

来自主题: AI技术研报
6429 点击    2024-12-28 11:33
AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅

AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅

AI视频生成平台全球前3,成本暴降50%方案开源!500元GPU算力免费薅

随着Sora震撼发布,视频生成技术成为了AI领域新风口。不过,高昂的开发成本是一大瓶颈。国产平台Video Ocean不仅成功登上全球热榜第三,还将视频生成模型开发成本降低50%。而且,模型构建和性能优化方案现已开源,还能免费获得500元GPU算力。

来自主题: AI技术研报
3917 点击    2024-12-24 17:09