Hassan El Mghari 应该是一名很成功的 AI 独立开发者了。
4 年时间,陆续开发了 40 多款 AI 应用,其中 roomGPT.io(290 万用户)、restorePhotos.io(110 万用户)等应用达到了百万级别的用户量。而这些应用,都是 Hassan 用一到两周时间,「快速冲刺」出来的。
快速开发、快速上线,而且还都是基于开源模型进行开发。
不做投放,开源,坚持 Build in public。
用最低成本验证 MVP,做的越多,对用户的需求理解得越精准,下一款应用成功的概率自然也就越大。
在 Al Engineer 近期的一场演讲中,Hassan 分享了他如何快速构建应用,从创意构思到产品落地的全流程经验,甚至还分享了他开发应用的详细流程和完整技术栈,很实在了。
其中,有很多有意思的观点:
01
今天开发者的最大问题
是发布速度太慢了
在分享一开始,Hassan El Mghari 就抛出了一个核心观点:我们正处在一个历史性的、最适合构建(Build)应用的黄金时代。
大量应用出现的背后,一方面是 Cursor、Windsurf、Bolt 等工具出现,让代码补全、应用原型构建和构思过程变得极其容易,降低了开发的门槛和效率。另一方面,则是几乎以周频率出现的突破性新模型,能够让开发者构建全新的应用。
构建新应用就像一场数字游戏,而开发者需要做的,就是不断地去尝试。
Hassan El Mghari 开发了 40 多款应用,且仍然在不断地尝试和迭代之中。他认为,应用开发者们常犯的一个典型错误就是应用发布的速度不够快,将问题过度复杂化。
Hassan 推崇极致的快速迭代。在任何一个项目上花费的时间,最多不会超过一到两周,然后立即发布。相比于一个五人团队耗时十个月精心打磨的应用,有时这些快速发布的应用反而能吸引数百万用户体验并获得极高评价。Hassan 将这个过程形容为一次历时一到两周的「快速冲刺」,在发布之后,加入评估机制,根据用户的意见和抱怨,逐步完成后续迭代。
「用极快的速度将产品做到 90%的完成度,然后就推向市场,通过抢先体验(Early Access)或 Beta 测试等形式,去观察真实的市场反应。」
Hassan 观察到的另一个现象是,当下值得构建的好项目层出不穷。「如果你是一名构建者(Builder),现在正是投身其中的最佳时机之一。」他在自己的 Notion 中维护着一个超过 70 个条目的创意清单,其中有 15 个项目是他正努力推进、希望在今年内全部完成并发布的。
「这是一个激动人心的时代,你可以用极少的资源成就极大的事业。」 Hassan 分享,他构建的许多应用非常简单,往往只依赖一到两次 API 调用,最多是由两三个调用构成的一个调用链(chain)。但是能用如此少的 API 调用和简洁的应用架构,构建出功能强大的产品,这一点令人十分着迷。
02
从社交媒体中寻找真实的产品需求
几年前我刚起步开发应用时,常常对开发方向感到迷茫。于是,我的策略是去 X(推特)上发掘灵感,观察人们正在讨论什么、需要什么。当时,我看到 Samina 发了一条推文:「谁能开发一个帮我挑选眼镜的应用?」 我的第一反应是:「没问题,这个需求我能实现。」 随即,我开发了这个小工具:它收集用户的具体需求,转化为查询参数,然后调用亚马逊的 API 来匹配相关产品,用户点击即可完成购买。
另一个应用的开发灵感,则源于我的朋友 Theo 的一条推文:「我想要一个能帮我撰写 Git Commit 信息的 AI 应用。」 当时,我们公司的 CTO 也认为这是个绝佳的主意,于是我开始着手开发。它的工作流程极其简单:当你执行 git add 命令后,它会自动获取代码的变更差异(diff),将其发送给一个 AI 模型,然后将生成的提交信息展示给你,供你选择是否接受。这是我早期开发的应用中相当成功的一个,累计获得了约四万次安装下载。并且由于是开源的,它吸引了大量社区贡献者,形成了一个非常健康的生态。
除此之外,我还构建了很多其他类型的应用,包括:
03
开发框架要尽可能简单,
方便快速迭代
我所构建的大多数应用,底层都遵循着一个高度相似且极简的架构范式。
通常,工作流可以归结为四个步骤:
这是一个极其简洁的架构,在绝大多数情况下,核心逻辑仅是一次 API 调用。用户执行操作,我调用一次 AI 模型的 API,获取响应后直接呈现给用户。我坚信,这种极简性至关重要。它不仅能最大化地提升开发速度,更有助于快速、低成本地验证一个想法。将想法简化的越彻底,你的开发速度就越快。
此外,使用 AI 开发应用的一个好处是,针对 AI 模型更新迭代极快的情况,可以快速且轻松地替换和升级底层的 AI 模型。在绝大多数情况下,在操作上,你只需要修改一行代码,来更新模型的名称,同时甚至能解锁全新的功能。我经常会回头去做这样的维护工作,甚至会用新的 AI 模型重新发布一个已有的应用,或者为它增添一个小功能。
我常用到的技术栈 (Tech Stack)包括:
04
从构思到发布,
只需要七步
我经常被问到的一个问题是:「你的这些创意从哪来的?」 我认为,关键在于将一闪而过的灵感,转化为一个结构化的清单列出来。我们总会在不经意间迸发出好的想法,但大多数人不会记下来,而真正的关键在于将其捕捉和记录下来。
因此,我会将想到的点子全部列出,当我看到有趣的想法或产品时,会思考:「或许我可以用类似的方法论来构建一些别的东西。」 构思阶段非常重要。我的清单里通常会记录前五名的创意,这会让我清楚地知道接下来要开发的五个应用是什么。当然,如果中途有新的、更令人兴奋的想法出现,我也会灵活调整。比如,下周如果有重磅的开源图像模型发布,我很可能会立即投身于利用它开发一款新应用。
这是我开发应用的完整流程:
05
给开发者的建议:
高频实践、低成本、开源
接下来是我给各位开发者的一些建议:
构思一个既让你感兴趣又非常简单的想法。这种简单,应该达到能用五个词向任何人清晰描述的程度。比如「Blink Shot——实时生成图像」,或者「Llama Coder——文本转应用」。许多开发者常犯的错误,是构想过于宏大的蓝图,然后投入漫长的时间去开发,最终却发现想法不可行、难以实现或无人问津。因此,关键在于一个让你本人感到兴奋且极其简单的想法。
确保用户界面是美观的。 在我展示的这些 AI 应用中,我将大约 80%的时间都投入到了用户界面的打磨上。我早期开发过几个界面难看的应用,无一例外地没人用。后来我意识到,即便是最简单的想法,只要你愿意投入时间让界面看起来美观、易用且操作直观,它就能够吸引到大量用户。
保持应用的简洁性。我在前边反复强调过这一点,我的大多数成功应用,核心都只依赖一到两次 API 调用。
尝试使用最新的 AI 模型。 我展示的许多应用都得益于对最新 AI 模型的第一时间采用。例如,实时图像生成应用 Blink Shot,是在 Flux 模型发布仅两天后推出的。成为第一批利用这项新技术的应用之一,能够极大地提升产品的传播度。
尽早发布、持续迭代。 即使我已经开发了 40 个应用,但仍然不知道哪一个会获得成功。降低这种不确定性风险的唯一方法,就是简化你的项目,并尽早发布。如果它没有获得太多关注或使用,你至少只投入了一周而不是六个月的时间,这样可以继续去探索其他想法。
坚持免费与开源。这种策略能让人们从你的代码中学习,更重要的是,人们更有动力去分享你的作品。
将分享机制融入到产品设计中。能让用户轻松分享自己创作内容的应用,表现往往要好得多。所以我会有意识地在去设计产品的传播功能。比如当用户生成一张满意的图片,我会让分享动作极其简单,确保分享出去的链接预览图足够精美、吸引人。最终要达成的目标,就是创造一个「创造-分享-吸引」的自发传播循环,让每一个用户都成为你产品最有效的推广者。
多做、持续做!我的许多 AI 应用表现并不好,说明它是一场数字游戏,你必须不断地开发。开发的越多,就越发现哪些想法能真正引起用户的共鸣,你的开发速度会越来越快,你选择应用想法的眼光也会越来越精准。所以,这在很大程度上取决于你投入的时间和实践的数量,构建大量的应用,然后观察结果。
文章来自公众号“Founder Park”
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0