工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路
工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路AInno-75B正式亮相,AI在视觉识别和工业设计领域的应用范围进一步拓宽。Chat GPT、Sora、Suno等AI技术的接连问世,让人类社会经历了一场认知的革命。世人开始意识到,AI不仅是单一的工具本身,更是推动人类文明进步的新引擎。在这个数据驱动、智能互联的时代,我们不禁发问:当AI的触角延伸到工业的每一个角落,它将如何重塑工业的未来?
AInno-75B正式亮相,AI在视觉识别和工业设计领域的应用范围进一步拓宽。Chat GPT、Sora、Suno等AI技术的接连问世,让人类社会经历了一场认知的革命。世人开始意识到,AI不仅是单一的工具本身,更是推动人类文明进步的新引擎。在这个数据驱动、智能互联的时代,我们不禁发问:当AI的触角延伸到工业的每一个角落,它将如何重塑工业的未来?
谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。
随着科技的发展,许多盲人正在借助AI提供的感知、理解与交互功能,以另一种方式重新感知世界。日前,我校软件与物联网工程学院创客荟团队研发了一款模拟触感交互控制的助盲系统,该系统通过AI技术,为盲人朋友学习带来了福音。
12月5-6日,主题为“未来AI设计”的美图创造力大会在厦门举行。美图公司发布自研AI视觉大模型MiracleVision(奇想智能)4.0版本,主打AI设计与AI视频。
这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来!
用视觉来做Prompt!沈向洋展示IDEA研究院新模型,无需训练或微调,开箱即用
GPT-4V挑战视觉错误图,结果令人“大跌眼镜”。 像这种判断“哪边颜色更亮”的题,一个没做对
夸克网盘电脑端播放器已经支持视频5倍速播放、4K画质和多音轨播放等能力。在自研的AI视觉大模型技术帮助下,升级后的夸克网盘播放器支持AI字幕和文稿生成,更加方便用户理解和管理内容
最近,智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D,在主流3D视觉能力上取得了全方位的性能突出!