AI资讯新闻榜单内容搜索-DiT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DiT
深度|半年内再融3.3亿美元,Airwallex引爆AI金融智能体投资热潮,ARR首破10亿美元

深度|半年内再融3.3亿美元,Airwallex引爆AI金融智能体投资热潮,ARR首破10亿美元

深度|半年内再融3.3亿美元,Airwallex引爆AI金融智能体投资热潮,ARR首破10亿美元

12月8日,Airwallex空中云汇继今年5月后再次宣布获得新一轮3.3亿美元G轮融资,投后估值达 80 亿美元,较六个月前 F 轮融资时上涨近 30%。本次融资由Addition领投,T. Rowe Price、Activant、Lingotto、Robinhood Ventures和 TIAA Ventures等全球顶级资本参与投资。

来自主题: AI资讯
9627 点击    2025-12-09 11:50
NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速

NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速

NeurIPS 2025 Spotlight | 中国联通以全局优化重塑扩散模型加速

当前,视频生成模型性能正在快速提升,尤其是基于Transformer架构的DiT模型,在视频生成领域的表现已经逐渐接近真实拍摄效果。然而,这些扩散模型也面临一个共同的瓶颈:推理时间长、算力成本高、生成速度难以提升。随着视频生成长度持续增加、分辨率不断提高,这个瓶颈正在成为影响视频创作体验的主要障碍之一。

来自主题: AI技术研报
7527 点击    2025-11-26 13:46
与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记

与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记

与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记

2025 年,AIGC 热度再冲新高:从社交头像、电商海报到影视分镜,AI 生成内容已全面渗透日常创作。在这股浪潮中,Nano Banana、Qwen Edit 等通用图像编辑大模型功能强大,涵盖了广泛的图像编辑场景。特别是最新爆火的 Nano Banana Pro 能将文字指令转化为高精度图像,精准呈现复杂场景。但是上述图像编辑大模型在一些细分领域的表现仍有不足,并且用于简单任务性价比不高。

来自主题: AI资讯
7744 点击    2025-11-25 17:18
月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant

月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant

月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant

业务团队可能说他们想要个负重一吨,时速两百公里的马车…… 现如今,借助向量检索能力,实现基于语义相似度的智能搜索,已经是所有电商、推荐、社区平台技术架构的重要一环。 作为拥有约 1.08 亿日活、 1

来自主题: AI技术研报
9440 点击    2025-11-23 19:38
ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式

ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式

ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式

无需额外训练即可适配预训练生成模型的编辑方法,凭借灵活、高效的特性,已成为视觉生成领域的研究热点。这类方法通过操控 Attention 机制(如 Prompt-to-Prompt、MasaCtrl)实现文本引导编辑,但当前技术存在两大核心痛点,严重限制其在复杂场景的应用

来自主题: AI技术研报
9543 点击    2025-11-19 15:19
与Gemini 3.0一起发布的AI IDE「Antigravity」究竟有多厉害?

与Gemini 3.0一起发布的AI IDE「Antigravity」究竟有多厉害?

与Gemini 3.0一起发布的AI IDE「Antigravity」究竟有多厉害?

就在几小时前,Gemini 3.0重磅发布。随着而来的还有其颠覆性的AI原生IDE产品——Antigravity,这不只是一个新工具那么简单。谷歌的这次发布,将三个核心开发工具,AI代理(Agent)、代码编辑器(Editor)和浏览器(Browser) 集成在了一起,构建了由AI驱动、从编码、研究、测试到验证的完整闭环,一举打通了自家的生态。

来自主题: AI资讯
9107 点击    2025-11-19 12:01
GPT-5.1 Codex 比Claude便宜 55%,代码漏洞更少!全栈开发老鸟警告:Anthropic 需要重新考虑定价了!

GPT-5.1 Codex 比Claude便宜 55%,代码漏洞更少!全栈开发老鸟警告:Anthropic 需要重新考虑定价了!

GPT-5.1 Codex 比Claude便宜 55%,代码漏洞更少!全栈开发老鸟警告:Anthropic 需要重新考虑定价了!

最近,小编注意到一位全栈工程师 Rohith Singh 在Reddit上发表了一篇帖子,介绍他如何对四个模型(Kimi K2 Thinking、Sonnet 4.5、GPT-5 Codex 和 GPT-5.1 Codex)进行了实测。

来自主题: AI资讯
8707 点击    2025-11-18 15:10
何必DiT!字节首次拿着自回归,单GPU一分钟生成5秒720p视频 | NeurIPS'25 Oral

何必DiT!字节首次拿着自回归,单GPU一分钟生成5秒720p视频 | NeurIPS'25 Oral

何必DiT!字节首次拿着自回归,单GPU一分钟生成5秒720p视频 | NeurIPS'25 Oral

一篇入围顶会NeurIPS’25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索更多可能的路径。

来自主题: AI技术研报
8026 点击    2025-11-14 14:25
Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段,图像编辑(Image Editing)正逐渐取代一次性生成,成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型?

来自主题: AI技术研报
6724 点击    2025-10-25 14:26