王者归来!AI视频巨头Runway深夜发布Gen-3,演示暴打Sora惊艳网友
王者归来!AI视频巨头Runway深夜发布Gen-3,演示暴打Sora惊艳网友太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直接到达了电影级画质,再次震惊全体网友。AI视频已经进入了神仙打架阶段。Sora危了?
搜索
太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直接到达了电影级画质,再次震惊全体网友。AI视频已经进入了神仙打架阶段。Sora危了?
拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!
麦当劳宣布其与IBM合作进行的得来速人工智能语音点餐技术测试期结束,该技术已在100多家餐厅部署,这些餐厅将在下个月暂停此项服务。麦当劳表示,将会为自动点赞技术寻求新的合作方,潜在的合作伙伴可能包括OpenAI的Whisper/ChatGPT和谷歌的Gemini。
「AI教父」Geoffrey Hinton在最近的采访中表达了自己对AI智能的理解——LLM并不是简单的统计模型,已经具备了理解能力。与此同时,网友翻出了去年12月的「过期」视频,惊奇地发现Hinton早就「叛变」了,竟然对超级AI取代人类的未来表示支持。
抢先OpenAI一步的「国产Sora」,再给开源社区带来亿点点震撼:权重代码全开源!16秒720p高清画质一键生成,人物渲染逼真到爆,电影级变焦。而美国独角兽基于之前权重打造的数字宇宙,直接让乐高迷嗨翻了。
曾经的视频生成王者Runway,带着大招鲨~回来了——
WWDC上展示的苹果AI能力,在秋季iOS 18推出之后,很难用得上了。最新报道称,集成强大Siri的苹果AI将在今年晚些时候推出,而且苹果正设计一款更轻薄的iPhone,预计在2025年上线。
SAX-NeRF框架,一种专为稀疏视角下X光三维重建设计的新型NeRF方法,通过Lineformer Transformer和MLG采样策略显著提升了新视角合成和CT重建的性能。研究者还建立了X3D数据集,并开源了代码和预训练模型,为X光三维重建领域的研究提供了宝贵的资源和工具。
就在刚刚,英伟达市值超越微软,成为全球市值最高公司!而CEO老黄的净资产也随之增至1170亿美元,成为全球TOP 11富人。随着全世界疯抢英伟达GPU,华尔街对AI的乐观情绪还在狂热飙涨!不过,老黄却担忧起来了……
深耕科技的早期投资机构蓝驰创投近期将AGI投资观迭代至2.0版本。一些比较亮眼的观点有:未来,软件公司或将消失,GenAI将催生出一大波一人十亿美金初创公司。而且,开源模型的优势也将慢慢褪去,模型应用需要两手抓,还有......
本周,CVPR 2024正在美国西雅图拉开序幕。今年CVPR论文投稿数再次创下新纪录,可想而知本届会议的火热。
苹果OpenAI官宣合作,GPT-4o加持Siri,让AI个性化生成赛道热度飙升。
16秒720p高清视频,现在人人可免费一键生成!
排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型!
CVPR正在进行中,中国科研力量再次成为场内外焦点之一。
GTP-4o挑战悬赏八百万的超难数据集,实现SOTA!
图灵奖得主、深度学习之父Geoffrey Hinton,又有新动向。
作为继OpenAI、微软、谷歌后,最后一个万众期待的尖子生,苹果在上周举行的WWDC24全球开发者大会上,终于交出了自己的“AI答卷”。
在各大公司,各个产品都在用 AI 加持的当下,小红书,作为一款上过 2024 年央视春晚的国民级内容社交平台,似乎表现的出人意料的低调。
AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。
潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展,支持无缝产出任意风格的高质量短片,令人惊喜的是,他们选择再给开源社区带来亿点点震撼,继续全部开源。
基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16存储,模型大小约为350GB,而即使是英伟达最新的B200 GPU 内存也只有192GB ,更不用说其他GPU和边缘设备。
通过高保真合成语音与真人语音无异。
本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM。MarkLLM 提供了统⼀的⼤模型⽔印算法实现框架、直观的⽔印算法机制可视化⽅案以及系统性的评估模块,旨在⽀持研究⼈员⽅便地实验、理解和评估最新的⽔印技术进展。通过 MarkLLM,作者期望在给研究者提供便利的同时加深公众对⼤模型⽔印技术的认知,推动该领域的共识形成,进⽽促进相关研究的发展和推⼴应⽤。
本研究评估了先进多模态基础模型在 10 个数据集上的多样本上下文学习,揭示了持续的性能提升。批量查询显著降低了每个示例的延迟和推理成本而不牺牲性能。这些发现表明:利用大量演示示例可以快速适应新任务和新领域,而无需传统的微调。
在现实世界的机器学习应用中,随时间变化的分布偏移是常见的问题。这种情况被构建为时变域泛化(EDG),目标是通过学习跨领域的潜在演变模式,并利用这些模式,使模型能够在时间变化系统中对未见目标域进行良好的泛化。然而,由于 EDG 数据集中时间戳的数量有限,现有方法在捕获演变动态和避免对稀疏时间戳的过拟合方面遇到了挑战,这限制了它们对新任务的泛化和适应性。
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。
只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有超强数学能力的模型。 它以Llama 3为基础,参数量只有8B,却在奥赛级别的题目上取得了比肩GPT-4的准确率。
一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。
一个“技术问题”,导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近100%。 想必很多小伙伴已经感受过了这则铺天盖地的消息,所带来的亿点点震撼。