
新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)
新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)自从在一支烟花群里和朋友测试起 Google 这个新工具,一上午就没停下来 WOC 的感叹。Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。
自从在一支烟花群里和朋友测试起 Google 这个新工具,一上午就没停下来 WOC 的感叹。Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。
,最近,Appfigure 通过梳理 1000 款 AI 应用(移动端)总结了一份年度 AI 趋势报告,称AI市场在2024年近20亿美元的规模,重点介绍了AI助理、文生图、AI 陪伴、教育AI等版块。
SANA 1.5是一种高效可扩展的线性扩散Transformer,针对文本生成图像任务进行了三项创新:高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本,还在生成质量上达到了最先进的水平。
就在除夕前的晚上(2025 年 1 月 27 日),Deepseek 发布了多模态模型 Janus-Pro-7B,该模型在图像生成和多模态理解方面都超过了OpenAI的DALL-E 3(虽然也一般般),我相信能文生图功能一定很优秀了,今天搞点特殊的,测试下图像理解能力对专业的医学影像有没有应用的可行性,以下是常见的五种医学影像测试。
对于 LLM,推理时 scaling 是有效的!这一点已经被近期的许多推理大模型证明:o1、o3、DeepSeek R1、QwQ、Step Reasoner mini……
AI工具用得好,能提效还能摸鱼。
自回归文生图,迎来新王者——
2024最火AI爆款可灵,年末又卷了一波: 旗下文生图模型——可图,完成了1.5版本升级,分分钟生成平面大片。 还推出了“AI模特”等全新功能。
这几天,打开社交媒体平台,很多人正在热烈讨论一个叫做「AI 模特」的玩法。 点开几个 Demo,确实惊艳。下方视频是一位海外网友自制的穿搭合辑,你能分得清这是 AI 还是真人吗?
超越ControlNet++,让文生图更可控的新框架来了!