ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
终于有正经 AI 硬件了,一台能写诗的「拍立得」
7966点击    2024-05-25 11:00


2016 年,由人工智能撰写《电脑写小说的那一天》小说成功通过了日本「星新一文学奖」的初选;Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人,让他们以为这就是巴赫本人的创作。 


如今,人工智能已经能生成真假难辨的视频,极具艺术感的图像。 


人工智能正在挑战着文学、音乐、绘画、影视等等这些原本属于艺术创作的领域。当艺术难以成为人类对抗 AI 的护城河后,许多人认为,诗歌或许是智能时代,人类最后被攻克的堡垒。 


诗歌被认为是人类文学最初的起源,在尚未有文字的人类社会,诗歌就以口语的形式流传在文明里。它在形式上考验节奏和韵律,在表达上考验想象和凝练,它需要表达者把经验、观察、意识结合,毕竟诗歌的创作依托于于人类特有的通感,因此我们可以让 ChatGPT 写一首关于月亮的诗,它只会泛泛而谈,而无法和人类在当时当刻,设身处地看到独一无二的月亮。 


但是,如果 ChatGPT 有了能「看到」月亮的能力,给它思考赋予观察呢? 


基于这个想法,Kelin Carolyn Zhang 和 Ryan Mather 两位设计师和开发者鼓捣出了一台设备:让摄影机去「所见」,让人工智能去「所感」,用技术的手段去实现文学里最难以量化的表达。 


这就是诗歌相机(Poetry Camera)。 


01


相机与诗


诗歌相机内核搭载了树莓派,一个只有信用卡大小的微型电脑,得以成像和调取 GPT-4 的 API,这就打通了设备的「眼睛」和「大脑」。 


举起诗歌相机,随便拍下一张照片,计算机视觉算法会开始分析视觉数据,人工智能模型开始解释图像,识别图像里关键元素、颜色、环境、影调情绪等信息,生成诗,并且以类似超市收银条的方式打印出来,就好像拍立得「洗」出照片一样。 


拍照出诗不出片,这可比拍立得更让人有期待和惊奇感。不看宣传看效果,它能生成怎样的诗歌呢? 



图源:TechCrunch 


有用户拍下了早上自己在家里喝咖啡时玩手机的样子,诗歌相机的创作是: 


镜头后面,一人调整视线, 


在正方范围里的像素空间。 


…… 


日光透过褪色的薄纱, 


他手上,温热的咖啡流转。 


对话传出,跨过虚拟的边界, 


他的倒影镜像,在屏幕上出现。 


书架上,书本倾斜,无声的喋喋不休, 


茂盛的植物,是唯一的生命。 


戴着眼镜,家成了他平静的面糊, 


在这堵墙里,他的世界四散开来。 


在 2024 年 4 月的一个清晨, 


一种新的常态,悄悄地磨损。 


@poetry.camera 


不难看出,哪怕经过简单翻译,它生成的文字依然有诗歌特有的「意象感」。诗歌相机的原文更显用词文法上「刻意地精妙」,比如每一段都在押韵脚,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用词上也会采用诗歌用词,比如把 morning 写成 morn,就像中文里把「早上」写成「晨」一样。 



图片来源:TechCrunch 


另一演示则是对着纽约公共图书馆的天花板拍张照,它会解读并创作出: 


「天花板的影子之舞, 


如同金镶木, 


用春日天空欺骗了眼睛 


石碑和木梁下 


伫足」 


两位开发者表示,由于诗歌相机的开源属性,用户其实可以根据个人喜好更改源代码,重新编程和选择不同的诗歌形式,不局限于现代自由诗,也可以是日本俳句或七言绝句,后续可能会给用户不同大模型去选择,比如从 GPT-4 换到更擅长理解文字和语义的 Claude,或者更擅长写故事的 Dragonfly。 



两位开发者表示「只想享受科技的乐趣」|图源:Poetry Camera 


而且诗歌相机不会以任何数字方式保存,用户既看不到相机拍到了什么,也不能直接复制粘贴文本,如果想留存一份,只能拿起手机拍下来这一张诗条。因为两位开发者认为,除了技术问题(需要服务器和云平台)、隐私问题之外,诗歌的瞬时性给它增添了额外的意义,打印出来的「诗条」是瞬时捕捉,随机生成,独一无二的实体存在。 


在屏幕主宰我们日常生活的当下,诗歌相机这种设计把视觉以诗意用物理的方式呈现,让它在数字之外,增添了一丝模拟化的浪漫气息。 


02


你我都能做


「拍下所看到的景观,让相机生成诗歌」这一想法不仅富有创意,似乎看着还挺难实现的?但实际上,你我都可以做出一台诗歌相机。 


诗歌相机到现在也还停留在一个「艺术项目」的阶段,两位开发者也暂未有大规模商业化的计划。他们只是产生诗歌相机的想法,鼓捣出了一台能实现想法的硬件,他们所用到的软硬件都是开源的,因此两位开发者选择在网站上把详细的制作过程公开,鼓励更多的用户 DIY 自己的诗歌相机。 


诗歌相机的内核是微型卡片计算机树莓派,再附以一些常见配件,再加上树莓派的相机模块、一台迷你热敏打印机、六个电池、一个按钮就够了。 



官方把详细的 DIY 教程发到了 GitHub|图源:Poetry Camera GitHub 


而诗歌的生成则要对接到 ChatGPT-4 的 API 密钥,在按下快门时,会触发脚本,把采集到的图片发送到 GPT-4 上创建一首诗,最后在热敏收据打印机上打印出来。 


两位开发者已经写好了全流程脚本,只要按照他们给的详细步骤逐步设置,不需要会编程和 3D 打印,纸壳里也能造出一台诗歌相机。 



两位开发者的调试用机|图源:flomerboy 


如果说乔布斯所信奉的「技术和人文的十字路口」让他造出了极具美感的数码产品,那诗歌相机则是用一种互动形式上的创新,给予我们另一种技术和现实交互的可能,突破界限,创造新的表达形式,甚至进一步反向激发人类的观察和想象。 


这也是两位开发者秉持的理念:技术应该融入生活,让我们能更好地欣赏日常,而不是挤压人类的生存空间。 


联合创始人 Kelin Carolyn Zhan 坦言道诗歌相机的意义所在「对我来说,这仍然是艺术,它是关于表达的。诗歌相机是一台塑造我们想要看到的世界的工具,这也是一个人们可以把玩新技术的世界:人工智能并不全是厄运和悲观,也不仅仅是用更深、更快、更糟糕的方式模仿人类,而是用新技术创造全新的工具,再让工具再次带出人类内心的孩子。对于这个项目来说,这不是为了赚钱——而是为了让那些天真的奇迹再次成为可能。」 


但在创意之外,我们又不得不产生疑惑:GPT-4 生成的诗已经模有样,那在诗的创作上,超越人类是否只是时间问题? 


03


人工智能写的诗,


能和人比吗?


当我们站在赏鉴的角度再看诗歌相机的成诗,可以感受到人工智能和诗人作诗上的差异所在,人工智能写的诗有更明显地「描述」和「顺序」,用词上更连贯,比如「日光透过褪色的薄纱」「天花板的影子之舞,」,更像是用文雅的词描述一个场景,其中缺少了诗歌难以描述的抽象感和意象美。 


就像诗刊社在《GPT时代,诗歌的意义和价值所在?》里提到的,「GPT 的出现是对文本顺序的改变,它省略了世界与作者的概念,中间加入的是标准化、数字算法,却没法模仿诗歌的意象。」 



诗人夏宇所写的现代诗|图源:夏宇 


诗人欧阳江河也曾在采访里说到「写作背后的广阔性是人的生命、人的世界观。这些包括了生命的感动、生命的升华、生命的伤痛、生命的恐惧、生命的黑暗、生命的爱、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聪明了,它没有疼痛,没有生命的脆弱感和恐惧,而诗歌正是这些的产物。如果没有这样的来源,只剩下漂亮的句子是没有意义的。」 


诗不像围棋或公式,诗没有确定的答案,当我们质疑人工智能写诗的能力,我们更多是在质疑它诗的由来。 


就像在 1982 年的科幻电影《银翼杀手》里,人造人罗伊·巴蒂在死前留下了全片最富有诗歌气息的台词,这意味着人类,至少《银翼杀手》的创作团队相信,在共同经历了对生命的感受之后,人工智能体也能创作出优美且富有人性的诗歌。 



罗伊·巴蒂死前独白|图源:银翼杀手 


回到诗歌相机上,在我们了解这个设备后,并没有感受到一种「被人工智能挑战」的紧迫感,反而是新奇更甚,毕竟当我们触手可及的设备能进行一种艺术的表达时,它也随之解锁了我们看待周遭的一种独特的方式。 


就像诗人夏宇在 2023 年与 ChatGPT 合作完成了一册诗集《验证您是人类》,她和 ChatGPT 探讨诗、评论、语言、机器、笑话……最终她在采访里说道「人类至上的人类又在搞机器人,处处代入人的语法人的意图动机人的情感……与ChatGPT的沟通,透过它习得的人类语言,它也学得很快,我还是希望它保留它的机械性不要轻易进入人性。」 


与其去较真人工智能和人类在写诗上还有多少差距,甚至产生精神危机感。我们更应该关注,用算法和数据喂饱的人工智能是怎样观察被我们忽视的周遭,它又能否激发出人类的诗性。 


*头图来源:Poetry Camera 


文章来源于“极客公园”,作者“Moonshot


关键词: AI , AI拍立得 , AI相机 , AI硬件
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md