AI资讯新闻榜单内容搜索-ima

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: ima
生图加入CoT,性能提升80%!微软港中文打造天才画手

生图加入CoT,性能提升80%!微软港中文打造天才画手

生图加入CoT,性能提升80%!微软港中文打造天才画手

AI绘画总「翻车」,不是抓不住重点,就是细节崩坏?别愁!微软和港中文学者带来ImageGen-CoT技术,让AI像人一样思考推理,生成超惊艳画作,性能提升高达80%。

来自主题: AI技术研报
2376 点击    2025-04-08 14:52
GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

在ChatGPT上,当你画图的选项变成这个的时候,就说明用的不是Dalle3了,而是4o。目前,有两个渠道可以使用4o Image Generation。一个事ChatGPT,一个是单独的那个Sora的网站。

来自主题: AI资讯
8718 点击    2025-03-26 08:10
AI换脸App爆火:Reface2.5亿下载背后的“病毒式”增长策略

AI换脸App爆火:Reface2.5亿下载背后的“病毒式”增长策略

AI换脸App爆火:Reface2.5亿下载背后的“病毒式”增长策略

Dima Shvets作为天使投资人兼Reface联合创始人,其打造的AI换脸应用下载量突破2.5亿次。该应用的成功源于"实时换脸"技术的先发优势与病毒式传播特性的双重驱动。以下是Dima分享关于如何成功打造Reface的经验分享

来自主题: AI资讯
6457 点击    2025-03-22 12:03
CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千

CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千

近年来,扩散模型在图像与视频合成领域展现出强大能力,为图像动画技术的发展带来了新的契机。特别是在人物图像动画方面,该技术能够基于一系列预设姿态驱动参考图像,使其动态化,从而生成高度可控的人体动画视频。

来自主题: AI技术研报
7900 点击    2025-03-20 09:34
长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?

2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最大的特点是 通过精心设计问题和关键信息,迫使模型进行深层语义理解和推理,才能从长文本中找到答案。

来自主题: AI技术研报
3611 点击    2025-03-12 15:08
速递丨MiniMax副总裁魏伟离职,曾任腾讯云副总裁

速递丨MiniMax副总裁魏伟离职,曾任腾讯云副总裁

速递丨MiniMax副总裁魏伟离职,曾任腾讯云副总裁

2月19日消息,钛媒体AGI独家获悉,中国AI大模型独角兽MiniMax(稀宇科技)合伙人、公司副总裁、开放平台负责人魏伟,已经于近期离职。对上述消息,MiniMax向钛媒体AGI独家回应:消息属实,MiniMax 国内B端业务迎来新的发展阶段,将由其他负责人带领团队。MiniMax将持续提升技术能力,为海内外更多客户带来高质量体验。

来自主题: AI资讯
5793 点击    2025-02-19 23:18
化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

近年来视觉语⾔基础模型(Vision Language Models, VLMs)在多模态理解和⾼层次常识推理上⼤放异彩,如何将其应⽤于机器⼈以实现通⽤操作是具身智能领域的⼀个核⼼问题。这⼀⽬标的实现受两⼤关键挑战制约:

来自主题: AI技术研报
7050 点击    2025-01-23 13:09
智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉

智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉

智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉

2024年,智元机器人与北大成立联合实验室,8月发布“远征”与“灵犀”两大系列共五款商用人形机器人新品,10月旗下灵犀X1人形机器人官宣开源,12月宣布正式开启通用机器人量产,不断拓展应用场景。

来自主题: AI技术研报
5698 点击    2025-01-22 18:34
MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。与传统语音生成技术相比,全新升级的T2A-01系列语音模型不仅具有音质稳定清晰、韵律自然、情绪精准表达、高准确度等特点。

来自主题: AI资讯
7554 点击    2025-01-20 14:38