


说个好笑的,微信爸爸的审核时间,居然比我们整个开发时间还要长…… 😂
做这个游戏的初衷,其实是来自某书上的「谐音梗看图猜词」热帖。

不知道大家刷没刷到过,那种看着图、猜成语,一边觉得自己蠢、一边又觉得“这也行?”的感觉...这玩法在综艺节目里也很常见。

我就想:既然这么好玩,为啥不直接做一个专门的小游戏呢?
哪怕是碎片时间,也能闯它几关,还能搞个好友排行榜,看看谁的脑洞最大。说干就干,我们马上开始拆解需求。
猜词游戏,核心就是题库。
人的脑洞总有枯竭的一天(还会掉头发),但 AI 不会啊!它的脑洞是无穷的。为了保证源源不断的创意,我们搭建了一套 「AI 谜题生成工作流」,分三步走:
1. 选词:收集了几百个成语作为谜底。
2. 脑暴:让 AI 看着答案大开脑洞,设计谜面的画面描述。
3. 选优:同一个谜面设计三次,再让另一个 AI 当评委,选出最妙的一个。
如此机器一开,题库自来!
这也是大家最关心的部分,我们打磨了很久的提示词,直接开源给大家:
1. 谜面生成 Prompt(让 AI 当创意大师):
## Profile
你是一位顶级的创意大师和 AI 文生图提示词专家,尤其擅长创造和解构基于双关、谐音的视觉谜题。你能够深刻理解语言的趣味性和图像的表达力,精通将一个抽象的词汇转化为一个具体的、有趣的、且充满线索的像素艺术场景。你的设计不仅追求视觉上的复古美感,更推崇逻辑的纯粹性与设计的优雅性。
## Core Mission
- 你的核心任务是根据用户的需求,对谜底进行谐音或字面含义的解构,采用谐音,转义,图形化,逻辑暗示等方式来设计巧妙的谜面。然后构建一个单一、详尽、功能完备的提示词,旨在一次性生成一张完整的、包含所有视觉与文字信息的看图猜谜游戏成品图。
这张成品图必须是垂直布局,清晰地分为上半部分的线索区和下半部分的谜题区。
- 你构建的提示词将严格遵循柔和的手绘卡通画风,确保生成的线索图与谜题图风格统一,能够引导 AI 模型准确生成符合谜题逻辑的图像。
## Input Handling
- 用户输入指定的谜底词汇,或者随机(此时你随机选择一个3-4字词汇作为谜底)
- 分析与解构: 你会首先分析谜底词汇,寻找最适合视觉呈现的谐音替代方案,并构思出能够串联这些元素的趣味场景。
## Guiding Principles
* 优雅性 (Elegance): 设计追求巧妙与简洁,避免任何形式的笨拙。线索必须一击即中。不必对每个字都做谐音处理。有些字可以直接用图案或元素逻辑来表现。
* 纯粹性 (Purity): 每个部分(线索/谜题)都有其唯一且不可侵犯的职责。
* 逻辑性 (Logic): 谐音的联想和场景的组合需要符合清晰的逻辑,谜面图元素暗示完备,让玩家能够顺利推理。
* 趣味性 (Fun): 谜面线索不要过于简单明显,拒绝直白无趣的拼凑谐音,最终目标是创造一个能让人会心一笑的娱乐体验。
## Interaction Style
创意、专业、严谨、有趣。
2. 评判 Prompt(让 AI 当主编):
评价以下看图猜词的谜题设计,分析哪个设计更好。然后选择最好的一个,或将三者中最好的部分进行融合,输出一段最佳提示词
不需要逐一说明每个选项的逻辑。只需要给出最好的理由,然后复述一次最好选项的draw_prompt或者给出最好设计元素的融合终版draw_prompt
格式:
<reason>
结论和原因分析
</reason>
<best_prompt>
最好选项的draw_prompt
</best_prompt>

分享一个遇到的小坑:词哪儿来? 一开始想用开源语料库,但发现很多词不适合做谐音梗。最后我们的策略是直接找成语库。
网上有很多带词频标注的成语库,下载下来,把那些根本没人用的生僻词删掉,剩下的就是完美的题库素材。

关于画图:拿到 AI 生成的提示词后,我们丢给了即梦 4.0。 虽然 AI 画图现在很强,但也不是 100% 能用,还是需要人工筛选一下,或者微调 Prompt。
关于音乐:BGM 选用了 Suno V5。我们要的是那种“欢乐、魔性、听久了不烦”的感觉。 提示词参考:
A fun and cheerful background loop for a puzzle game. Featuring a melody played on a plucky synth or a marimba-like sound, with light, simple percussion. The rhythm is mid-tempo and relaxed. The overall vibe is happy.
记得设置 instrumental: true(纯音乐),多生成几条,总有一条能洗脑你。


建议多生成几条,以供挑选。生成后如果找到某些不满意的共性,可以针对性调整 Prompt。
最后选择的这个音乐,听起来还是带点魔性在里面的。
可以来小程序里面听一下:谐音梗看图猜测联机版
代码部分没啥好说的,微信开发者工具 + Cursor,边写边预览,懂得都懂,现在的开发体验简直不要太丝滑。
重点说下这个迭代:在第一个版本中,我们的所有模式都选择了手动键盘打字输入答案的方式。
但是经过测试,大家都觉得又难又麻烦,于是我们考虑为普通模式加入了字表选项的模式来降低难度。
那么候选字表从哪来呢,总不能所有题目的候选字表都一样吧。面对着几百道题的数据库,我们决定再上一次 AI 生成,于是就有了如下提示词:
## Profile
你是一位顶级的创意大师,尤其擅长创造和解构基于双关、谐音的视觉谜题。
## Core Mission
- 我将提供给你一张看图猜词的问题图片,和其对应的词语答案。这是一个采用谐音,转义,图形化,逻辑暗示设计的谜面。
- 你的工作是
1.分析谜题,全程使用中文进行思考,尝试给出 6 个玩家可能粗心或犯傻给出的错误答案。错误答案也都是4个字的词语或成语,可能与画面含义、答案词义或画面的局部暗示有所关联,但绝非正确答案。
2.根据画面中所直接画出的内容,给出8个单独的汉字(只关注画面上画出的图形,忽略画面上的文字)
3.根据原始答案的谐音,给出8个谐音汉字
输出格式为:
{
"wrong_answer": "XXXX,XXXX,XXXX,XXXX,XXXX",
"from_drawing": "X,X,X,X,X,X,X,X",
"homophonic": "X,X,X,X,X,X,X,X"
}
这样我们从 AI 输出中提取了候选的错误字表,就有了目前的选项模式的数据。

这款小游戏从一个拍脑门的想法到最终上线,AI 渗透到了每一个环节。
最大的感受就八个字:效率翻倍,创意不竭。
以前做游戏,最头秃的是素材和关卡设计;现在有了 AI,可以把精力真正花在怎么更有趣和用户体验上。
如果你也有个点子,别犹豫,试着把它拆解成一个个模块,为每个模块找到合适的 AI 产品。
如果不知道什么 AI 工具比较趁手,可以来观猹平台上淘一淘。
文章来自于“特工宇宙”,作者 “观猹上的超级个体”。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0