“
在信息过载的时代,快速而准确地传达信息显得尤为重要。
Jerome Scholler 和 Pramod Sharma 观察到,高效的视觉呈现能够显著提升沟通的清晰度,捕捉并传达思想的精髓。
然而,要创作出既吸引人又有助于叙事的视觉内容绝非易事。许多人对此感到迷茫,不知道从何开始。
于是,他们着手研究如何将文字信息转化为视觉内容。这一探索催生了 Napkin——一个旨在利用视觉元素来增强沟通的平台。
借助 Napkin,每个人都会成为更有效的故事讲述者。
Sense 思考
我们尝试基于文章内容,提出更多发散性的推演和深思,欢迎交流。
-低门槛的 AIGC 工具产品:目前的AIGC工具普遍存在使用门槛,尤其是如Midjourney、StableDifussion这样的图像生成工具,用户需要一定的prompt知识才能有效使用。相比之下,Napkin AI大幅降低了使用难度,允许用户无需深厚的设计或技术背景,通过点击即可快速生成优质的视觉内容。
本篇正文共 3800 字,仔细阅读约 10 分钟
AI Native 产品分析
Napkin AI
1. 产品:Napkin AI
2. 产品上线时间:2021 年 10 月
3.创始人:
Pramod Sharma,首席执行官/创始人
前谷歌员工。在 Napkin 之前,Pramod Sharma 与 Jerome Scholler 共同创立了 Osmo,这是一个屡获殊荣的趣味学习系统,受到时代杂志和 Fast Company 的认可。后 Osmo 发展成为一家 ARR 达 1 亿美元的公司商业。
Jerome Scholler,首席技术官 / 创始人
前谷歌员工。与 Pramod Sharma 共同创立了 Osmo。
4. 产品简介:
Napkin AI 由前谷歌工程师 Pramod Sharma 和 Jerome Scholler 创立,旨在解决信息过载时代如何有效传达复杂思想的问题。该平台允许用户将文本内容转换为一系列视觉效果,包括流程图、图表和信息图,而无需设计技能。
5. 融资情况:
2024 年 8 月,获得了 Accel 和 CRV 的 1000 万美元种子轮融资。
01.
创立愿景:视觉变革来改变叙事方式
十年前,Jerome Scholler 和 Pramod Sharma 创立了 Osmo,一家专注于儿童教育的游戏公司。他们的目标是让学习变得有趣,但随着时间的推移,他们发现自己的工作流程——充斥着冗长的文档和幻灯片——变得乏味。
他们意识到,有效的视觉表达能够简化沟通,消除误解,并激发灵感。然而,尽管认识到视觉工具的重要性,他们发现创造引人注目的视觉内容并非易事。大多数人对此感到困惑,不知如何着手。
在 Osmo,他们利用先进的人工智能技术,实时追踪游戏棋子,这为他们探索视觉表达提供了技术基础。他们尝试将纸上涂鸦的体验数字化,但很快发现,即使是最先进的技术,对于大多数用户来说,从绘画开始也是一个巨大的挑战。
Osmo游戏产品:将纸上涂鸦的体验数字化
随后,语言大模型(LLM)的出现为他们的努力带来了转机。他们开始探索将文本转换为视觉内容的可能性,这最终催生了 Napkin——一个旨在简化视觉交流的平台。
Napkin 旨在提升人们的沟通能力,使他们能够更直观地解释自己的想法。Sharma 强调,在信息过载的时代,这种能力尤为重要。Napkin 采用了一种新的“视觉生成人工智能”技术,使用户能够通过图像讲述更引人入胜的故事。
Napkin将想法变为视觉效果
Sharma 比喻说,就像 Apple Inc. 让每个人都能通过 iPhone 轻松拍摄出美丽的照片一样,Napkin 也致力于让每个人都能通过图像轻松传达自己的想法。
Napkin 的核心产品服务于营销人员、内容创作者、工程师以及那些需要创意和创作内容的专业人士。他们的目标是将设计流程转变为一种以生成为中心的流程,从而减少设计所需的时间和努力。
Napkin 是众多利用生成 AI 技术的初创公司之一,与 ChatGPT 聊天机器人和 Midjourney 图像生成器等产品一同涌现。它不是数据可视化工具,用户无法上传 Excel 数据库来获得图表,但可以使用 Napkin 为演示文稿、博客文章、报告和学校作业等创建图形。
02.
Napkin:可视化的Google Docs
创始人 Sharma 的职业生涯大部分时间都在 Google 度过,特别是在 Docs 团队,这种背景在 Napkin 的外观和功能上留下了深刻的印记。
Sharma 将 Napkin 描述为“可视化 Google Docs 编辑器”,其目标是让用户体验到“让事情变得有趣和愉悦的艺术”。Napkin 目前提供英文版,并宣布将开始推出对德语、法语、日语和中文的支持。
尽管市场上已有 Adobe 和 Canva 等平面设计巨头,它们也在积极投资 AI 工具,如 Firefly 和 Magic Media 等图像生成器,但 Napkin 在这些竞争对手中仍占有一席之地。Napkin 的易用性和快速创建图形的能力使其特别适合需要迅速增强演示或报告的用户。
Napkin 可以快速创建图形,非常适合快速增强演示文稿或为报告增添额外亮点。学生、小型企业和其他不想花时间(或金钱)使用高级服务的创作者将受益于 Napkin 的简单效率。
Napkin 的使用方法非常简单:
1、粘贴文本:用户直接输入文本,Napkin 根据内容生成视觉效果。
2、生成视觉效果:系统提供与文本最相关的视觉效果供用户选择。
3、个性化编辑:用户可以对视觉效果进行编辑,以符合个人或品牌风格。
4、导出使用:创建的视觉效果可以导出为不同格式,方便在各种场合使用。
Napkin 的应用场景广泛,例如,它可以将商业计划中的收入来源列表转换为直观的图表。此外,Napkin.ai 提供了多种定制工具,用户可以选择推荐的图形并调整其字体、颜色、形状等,以符合品牌风格。
Napkin.ai 还与多个企业内容平台集成,如 Google Slides 和 Docs、Microsoft Word 和 PowerPoint、Substack、Medium、Slack、Notion、LinkedIn、Instagram 等,几乎支持所有需要文档处理和图形创建的场景。
Google Slides 的集成
目前,Napkin.ai 提供了 30 多种图形,包括思维导图、流程图、维恩图、条形图、饼图等,并计划通过定期更新增加更多自定义功能和图形格式。
自主 AI 代理初创公司 SproutsAI Inc. 的首席运营官 Jason Miller 表示,对于一个没有天生设计技能的人来说,他也爱上了 Napkin.ai 超级简单和便捷的功能。
“无论我需要快速绘制博客文章图表还是演示图表,Napkin 都能在几秒钟内生成我想要的内容,”他说。“在使用 Napkin 之前,我们受到图形访问的限制,但现在我们拥有一位随时可用的设计师,提供无限的访问权限,以视觉效果增强我们的商业叙事。”
使用Napkin制作Blog
03.
来自作家 Katelyh 的实际体验
Napkin.ai 的目标是简化图形设计过程,让用户能够轻松地解释他们的想法,而无需花费大量时间来创建补充文档的视觉效果。
作家 Katelyn Chedraoui 在实际使用 Napkin 时,发现了三种最佳使用方式:
1、为演示文稿增添活力
在测试 Napkin 时,Katelyn 利用它来创造图形,以增强演示幻灯片、简化文章的复杂主题,并激发不同的视觉创意。Napkin 在这些任务中表现出色,是优化演示文稿的理想选择。
制作幻灯片时,一个普遍的经验法则是幻灯片上的文字越少越好。Napkin 能够将文本上传后简化并转化为吸引人的图形,然后用户可以轻松地将其复制粘贴到幻灯片中。
Katelyn 用一份大学时期的旧演示文稿来测试 Napkin。她原本的幻灯片内容冗长,包含七个要点。Napkin 生成了独特的图形,包括她特别喜爱的优缺点列表,总结了她在幻灯片中的主要观点。通过新的图形,她重新制作了幻灯片,使得内容更加易于理解,而不是让观看者面对大量文字感到乏味。
新版本(底部)比原始版本(顶部)更容易阅读。
2、分解复杂主题
Napkin 特别适合那些不熟悉图形设计策略的人,作为一个头脑风暴工具。
在测试过程中,Katelyn 发现它极具创意和多功能性,能够根据相同文本探索多种不同的视觉选项。
为了测试其创造力,Katelyn 让 Napkin 设计了四个不同的图形来解释 fediverse 的概念——一组基于 ActivityPub 协议的分散式社交媒体平台。尽管前三张图表在视觉上不错,但对概念的理解存在误导。
这是 Napkin 创作的三幅图,都有所欠缺
经过几次迭代,Katelyn 最终找到了一个准确的图表,正确地提取了相关平台,并将 ActivityPub 协议置于适当的上下文中,突出了 fediverse 的去中心化和开源特性。这个分析图为读者提供了一个清晰的框架,激发了他们进一步阅读的兴趣。
这张图形正确显示了与 fediverse 相关的概念
3、 集思广益图像创意
当用户不确定想要什么样的图形时,Napkin 非常适合用来激发创意。
Katelyn 从她写的关于如何编写最佳 AI 图像提示的指南中提取了一些文本,并将其输入 Napkin。Napkin 提供了许多不同的创意,并通过将元素显示为建筑的石柱,来强化其重要性。
Napkin 的图形语言强化了观点:即这些东西是多么重要。如果没有一个,建筑物就会倒塌。
Napkin 提供的视觉效果非常多样,它们隐含地传达了这些元素的重要性。Katelyn 认为,人类必须参与设计策略和过程,否则结果可能不会与使用者产生共鸣。Napkin 和其他 AIGC平台一样,只是一个辅助工具。
使用 AI 创意工具的一个挑战是用户必须积极参与设计策略和决策。如果用户对受众和文案背景了解不够,无法决定哪个选项最适合传递信息,那么即使生成了数百种不同的 Napkin 图形也无济于事。
总体而言,Katelyn 对 Napkin 这个产品持肯定态度。对于没有大型创意团队或大量时间创作的人来说,Napkin 是一个很好的起点。它对用户友好且充满创意,能够满足业余创作者的需求,同时也为专业创作者在设计过程中提供有用的支持。
04.
局限性与未来发展
Napkin 的愿景是赋予每个人在交流中运用视觉元素的能力。创始人 Jerome Scholler 和 Pramod Sharma 致力于将视觉元素融入尚未充分利用的沟通中,让那些未曾考虑过视觉表达的人也能成为充满力量的视觉叙事者。通过 Napkin,他们希望每个人都能成为更高效的叙事者。
尽管如此,Napkin 在当前阶段仍有一些局限性。
Napkin 擅长处理简单描述、概括性想法和有时间线的故事。简而言之,如果一段文字想法结构清晰、逻辑缜密,Napkin 通常能够满足这一需求。
当小编将介绍文章输入 Napkin 时,它迅速生成了一系列图表。然而,并非所有生成的内容都符合预期,仍需人工筛选以找到最符合意图的视觉图像。
在文本含义不明确时,Napkin 可能会产生误导,有时甚至生成与文本无关的视觉效果。例如,在下图中,尽管原文并未比较 Napkin、Adobe 和 Canva 之间的竞争力,Napkin 却强行创造了一个对比图,甚至为了排版效果虚构了一个“Emerging Tools”。
对于下面这张图,Napkin 无中生有地列出了优点和缺点。仔细观察,可以发现所列的优缺点自相矛盾。此外,原文中也从未提及 Napkin 的学习曲线。
(还可以发现优缺点图和前面 Katelyn 生成的图是同一个模板)
此外,小编在多次尝试后发现,虽然 Napkin 生成的视觉效果优异,但它们通常遵循一种通用、同质化的设计模板。使用不同的文字去生成视觉图像,会发现风格和形式也非常类似。
对于追求高度个性化叙事形式的需求,Napkin 可能并不足以满足。它确实为普通人提供了一个使用视觉语言辅助叙事的便捷途径,但在专业视觉设计领域,Napkin 还未能完全取代专业设计师的角色。
不过,我们已经看到了一个不错的起点。Napkin 还处于早期发展阶段,目前的问题有望在未来得到解决。该平台正计划推出付费服务,但团队规模限制了资源。位于洛斯阿尔托斯的 Napkin 目前有 10 名员工,并计划到年底扩展到 15 名。
早期投资者 Accel 的 Rich Wong 在一份声明中支持了 Napkin:“Jerome 和 Pramod 拥有一种不可思议的能力,他们能够从技术角度解决极具挑战性的问题,并让用户轻松上手。作为他们第一家公司 Osmo 的合作伙伴,我们见证了他们如何通过反思型人工智能将新游戏运动的愿景变为现实。我们很高兴能够支持 Napkin 将视觉人工智能引入商业叙事的新篇章。”
创始人 Sharma 表示:“可视化和设计的方式是无限的。Napkin AI 正在投入资金来构建这种深度并提升人工智能的质量。”
参考材料
https://techcrunch.com/2024/08/07/napkin-turns-text-into-visuals-with-a-bit-of-generative-ai/
https://venturebeat.com/ai/napkin-uses-visual-ai-to-automate-business-storytelling/
https://www.napkin.ai/
文章来源“深思SenseAI”,作者“SenseAI”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0