AI资讯新闻榜单内容搜索-DiT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DiT
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节开源图像编辑新方法,比当前SOTA方法提高9.19%的性能,只用了1/30的训练数据和1/13参数规模的模型。

来自主题: AI技术研报
6820 点击    2025-05-08 09:52
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)和1%的训练参数,以极低成本实现了图像的高质量编辑,在一些方面媲美甚至超越商业大模型!

来自主题: AI技术研报
9048 点击    2025-05-07 14:49
刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

你的默认编程模型是什么?或许可以换一换了。刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸

来自主题: AI资讯
9050 点击    2025-05-07 09:22
细思极恐,AI操控舆论达人类6倍!卧底4月无人识破,Reddit集体沦陷

细思极恐,AI操控舆论达人类6倍!卧底4月无人识破,Reddit集体沦陷

细思极恐,AI操控舆论达人类6倍!卧底4月无人识破,Reddit集体沦陷

AI洗脑人类,成功率6倍暴击!苏黎世大学在Reddit秘密实验引爆全网,LLM假扮多种身份,历时4个月发表1700+评论,轻松操控舆论,竟无人识破。

来自主题: AI资讯
7915 点击    2025-04-30 09:04
终于等到开源好用的修图大模型了!阶跃模型三连发,卷疯了多模态赛道

终于等到开源好用的修图大模型了!阶跃模型三连发,卷疯了多模态赛道

终于等到开源好用的修图大模型了!阶跃模型三连发,卷疯了多模态赛道

最近在看 Agent 方向的论文和产品,已经被各种进展看花了眼。但我发现,真正能超越 demo,能在 B 端场景扎实落地的却寥寥无几。

来自主题: AI技术研报
7346 点击    2025-04-28 16:40
阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA

阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA

阶跃星辰开源图像编辑模型Step1X-Edit:一键改图大师,性能达到开源SOTA

阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。该模型总参数量为 19B (7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。

来自主题: AI资讯
8047 点击    2025-04-27 15:29
都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例

都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例

都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例

在这篇文章中,我采用了与去年研究人们如何使用 AI 的相同方法,但搜索了更多数据,并将结果限制在过去 12 个月内。我查看了在线论坛(Reddit、Quora)以及包含明确、具体的技术应用的文章。也许是由于其固有的匿名性,Reddit 再次提供了最丰富的见解。我阅读了这些文章,并将每个相关帖子添加到该类别的统计中。几天后,我统计出了 100 个新的使用案例,并逐一引用。

来自主题: AI资讯
7947 点击    2025-04-13 09:59
CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!

CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!

CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!

当你翻开相册,看到一张平淡无奇的风景照,是否希望它能更温暖、更浪漫,甚至更忧郁?现在,EmoEdit 让这一切成为可能 —— 只需输入一个简单的情感词,EmoEdit 便能巧妙调整画面,使观众感知你想传递的情感。

来自主题: AI技术研报
9074 点击    2025-03-31 09:25