
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。
最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。
ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用Stable Diffusion可以直接生成单个或多个透明图层(PNG)!
Sora一出,让很多人心生恐惧:饭碗彻底被砸了!这位亚马逊工程师却告诉我们:真的不必担心生成式AI会抢人类的饭碗,顶多担心一下你的人类同行吧。
互联网有一条经典的“第 34 号规则”(Rule 34):如果一个东西存在,那么它必然会被用来搞黄色。AI 绘画就很好地说明了这一点——目前最流行的几个 AI 绘画分享网站,都有至少三分之一的内容是各种黄图。
「我向一位女生求婚,ChatGPT 已经和她交流了一年。为了走到这一步,AI 已经尝试了和 5239 名女生进行过沟通……」
今天,穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词(prompt)的研究,让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。
还有谁不知道“假装”给ChatGPT小费可以让它服务更卖力?
大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。
无论是 Google 翻译、DeepL 翻译还是 ChatGPT,翻译大段英文的时候,“机翻感”(机器翻译的感觉)都很强,一看就是机器翻译的,很生硬,但是自己手动润色又太费时间。
随着大型语言模型(LLM)技术日渐成熟,提示工程(Prompt Engineering)变得越来越重要。一些研究机构发布了 LLM 提示工程指南,包括微软、OpenAI 等等。