
AI理解27分钟长视频超越GPT-4o,港理工新国立开源新框架:角色化推理+链式LoRA
AI理解27分钟长视频超越GPT-4o,港理工新国立开源新框架:角色化推理+链式LoRAAI能像人类一样理解长视频。
AI能像人类一样理解长视频。
高通今日宣布收购越南人工智能开发商 MovianAI。MovianAI 是 VinAI Application and Research JSC 的生成式 AI 部门,后者是越南最大企业集团 Vingroup 旗下的机器学习研究实验室。此次收购后,包括前 DeepMind 研究科学家、VinAI 首席执行官 Hung Bui 在内的核心团队将加入高通。
最近GPT-4o确实超级好玩,玩法不要太多,我有很多想法但无奈最近服务器一天到晚崩溃个没完,(建议只为了生图功能准备买会员还没买的再考虑考虑),暂时没法做多玩法汇总的详细教程,今天单讲生成表情包的流程。
0个Web端AI应用类型中,只有1个应用类型(AI导航网站)MAU仍停滞在百万量级,其余19个应用类型MAU均在千万量级以上,整体量级远高于国内AI市场。有3个应用类型MAU超1亿(与1月持平),分别是AI聊天机器人、AI搜索引擎和AI设计工具,ChatGPT、Canva AI和New Bing持续领跑这3个亿级赛道,格局稳定;
OpenAI真的要开源了!奥特曼官宣,即将开源自GPT-2以来的首款推理模型,可在消费级硬件上运行。同时,OpenAI又拿到了最高400亿单轮融资,估值直冲3000亿。
最近,ChatGPT 4o 新上线了多模态绘图功能,‘吉卜力’刷爆了特工们朋友圈的同时,也夹带着艺术设计圈朋友们的哀嚎,最让我们共情的莫过于推上的此段发言:
为了进一步挑战AI系统,大家已经开始研究一些最困难的竞赛中的问题,特别是国际奥林匹克竞赛和算法挑战。
一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。上一次这样开源还是6年前推出GPT-2。
今天凌晨,Runway的新版本Gen-4又试图解决AI视频的一个关键难题,让AI视频更靠近电影级。这一切都只发生在短短的2个多月内,很难想象今年AI会发展到什么程度,或许今年将会是GPT-3.5后真正的AI爆发年。
这周,Midjourney即将带着全新V7强势归来。内部模型已训完,目前开启了评分系统,进入最后微调阶段。网友已放出生图,效果惊艳,画质细腻度拉满。