PPIO CEO姚欣:AI行业或将迎来一次泡沫破灭,但不要悲观
PPIO CEO姚欣:AI行业或将迎来一次泡沫破灭,但不要悲观7月5日,PPTV创始人、PPIO派欧云联合创始人&CEO姚欣,与大家分享了AI世界相对确定的当下和充满想象力的远方,一同用前瞻性的眼光进行长期性规划,积极拥抱新技术。
7月5日,PPTV创始人、PPIO派欧云联合创始人&CEO姚欣,与大家分享了AI世界相对确定的当下和充满想象力的远方,一同用前瞻性的眼光进行长期性规划,积极拥抱新技术。
无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。
当前的视觉语言模型(VLM)主要通过 QA 问答形式进行性能评测,而缺乏对模型基础理解能力的评测,例如 detail image caption 性能的可靠评测手段。
2022年,美图CEO吴欣鸿将年度总结的主题,从“居安思危”改成了“居危思危”。
740 TFLOPS!迄今最强 FlashAttention 来了。
时隔一年,FlashAttention又推出了第三代更新,专门针对H100 GPU的新特性进行优化,在之前的基础上又实现了1.5~2倍的速度提升。
大模型训练推理神作,又更新了!
随着人工智能和大型模型技术的迅猛发展,检索增强生成(Retrieval-Augmented Generation, RAG)已成为大型语言模型生成文本的一种主要范式。
现实中,机器人收据收集可以通过远程操控实现。来自UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身临其境操作机器人,即便相隔3000英里之外。
OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。