AI资讯新闻榜单内容搜索-Ava

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ava
夸克、浙大开源OmniAvatar,一张图+一段音,就能生成长视频

夸克、浙大开源OmniAvatar,一张图+一段音,就能生成长视频

夸克、浙大开源OmniAvatar,一张图+一段音,就能生成长视频

近期,夸克技术团队和浙江大学联合开源了OmniAvatar,这是一个创新的音频驱动全身视频生成模型,只需要输入一张图片和一段音频,OmniAvatar即可生成相应视频,且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外,还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。

来自主题: AI资讯
6308 点击    2025-07-25 17:07
上下文工程究竟该怎么用?试下Claude Code+PocketFlow

上下文工程究竟该怎么用?试下Claude Code+PocketFlow

上下文工程究竟该怎么用?试下Claude Code+PocketFlow

最近使用cursor的朋友可能已经遇到了这个问题:打开Cursor,准备使用Claude- sonnet4开始Vibe Coding,却看到了"Model not available"的提示。这不是您的网络问题,而是Cursor对中国地区用户限制了高级模型的访问。对于习惯了AI辅助编程的工程师来说,这简直像是突然失去了得力助手。

来自主题: AI技术研报
6074 点击    2025-07-22 10:14
多模态大模型存在「内心预警」,无需训练,就能识别越狱攻击

多模态大模型存在「内心预警」,无需训练,就能识别越狱攻击

多模态大模型存在「内心预警」,无需训练,就能识别越狱攻击

多模态大模型崛起,安全问题紧随其后 近年来,大语言模型(LLMs)的突破式进展,催生了视觉语言大模型(LVLMs)的快速兴起,代表作如 GPT-4V、LLaVA 等。

来自主题: AI技术研报
8192 点击    2025-07-22 09:55
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。

来自主题: AI技术研报
6074 点击    2025-07-18 11:44
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!

如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!

如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!

TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能,为用户带来逼真的虚拟交互体验。

来自主题: AI技术研报
6891 点击    2025-06-25 16:21
我的第一个AI编程助手,IDEA最新插件“飞算JavaAI”,太爽了

我的第一个AI编程助手,IDEA最新插件“飞算JavaAI”,太爽了

我的第一个AI编程助手,IDEA最新插件“飞算JavaAI”,太爽了

还记得刚入行时,每遇到一个bug都要在CSDN和百度上搜索半天。输入错误信息,翻遍无数帖子,试了一个又一个方案,却往往发现要么版本不对,要么场景不符。最崩溃的是,好不容易找到一个看似相关的解决方案,复制粘贴后却发现引入了更多的问题。

来自主题: AI资讯
6530 点击    2025-06-23 18:33
一张图,一个虚拟偶像,实测HeyGen最新数字人:令人惊叹的AVATAR IV。

一张图,一个虚拟偶像,实测HeyGen最新数字人:令人惊叹的AVATAR IV。

一张图,一个虚拟偶像,实测HeyGen最新数字人:令人惊叹的AVATAR IV。

本来没想写HeyGen,毕竟在国内用起来有点累。 起因是我们受邀和HeyGen第一次做了联名影片,在内测的过程里,这款名为AVATAR IV的数字人产品实在让我有点惊讶,于是突发奇想: 只用一张图,做一段rap歌手的mv。效果如下:

来自主题: AI资讯
6119 点击    2025-06-06 16:52
Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

Java 三十周年重磅发声:James Gosling 怒斥 AI 是“一场骗局”,是科技高管“疯狂压榨”程序员的新工具

“科技行业里骗子和炒作者的数量之多,令人难以置信。”面对当下火热的 AI 浪潮,Java 之父直言不讳地对背后推波助澜的炒作者们发出尖锐批评。

来自主题: AI资讯
3834 点击    2025-05-26 14:48
前OpenAI高管新作力挺模型思考,哈佛却称AI越「想」越笨

前OpenAI高管新作力挺模型思考,哈佛却称AI越「想」越笨

前OpenAI高管新作力挺模型思考,哈佛却称AI越「想」越笨

AI是否真正在「思考」乃至产生意识,正成为科学和哲学交汇的核心议题。前OpenAI负责人翁荔认为,增加模型的「思考时间」有助突破复杂推理瓶颈;哈佛等机构则指出思维链可能导致「降智」;而生物学家Mallavarapu断言数字计算机永不可能拥有意识。

来自主题: AI技术研报
7909 点击    2025-05-26 10:43
ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%

ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%

ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%

多模态大模型(MLLMs)在视觉理解与推理等领域取得了显著成就。然而,随着解码(decoding)阶段不断生成新的 token,推理过程的计算复杂度和 GPU 显存占用逐渐增加,这导致了多模态大模型推理效率的降低。

来自主题: AI技术研报
6041 点击    2025-04-29 14:56