我是一个重度的 AI产品使用“患者”
说自己是一个患者,是最近发现有几次自己对 AI 生产的“高质量”内容已经没有感觉了,我觉得我深度阅读的能力退化...
我最早接触到 AI 可以追溯到大学时期阅读的赫伯特・西蒙的《人工智能科学》这本书,它对人工智能领域所涉及的脑科学、经济学、心理学、设计科学很多学科都做了有意思的解读。它对我后来从事产品工作产生了重要影响,也让我对复杂系统产生了很浓厚的兴趣。
在那个之后也就读了另外两本与 AI 大模型的复杂系统有关的书,一本是那时候很热门的凯文凯利的《失控》,另一本是侯世达的《哥德尔、艾舍尔、巴赫:集异璧之大成》(《失控》热门貌似是因为微信的张小龙说过他在面试人的时候,阅读过《失控》的人会重点考虑,《集异壁》则要冷门些,难懂看起来就很高级的感觉,内容也很有意思,这个是我现在仍然保留的一点印象)。
从事产品工作后,日常就是零星听到一些 AI 的资讯,但是没有具体使用过具体的产品。 第一款使用的真正能称得上 AI 的产品应该是Apple的Siri,虽然很长时间我对他的评价都是“人工智障”,但是我仍然记得在它刚开始发布的时候,我“调戏”了他很久,使用很多不同的场景与他进行对话,测试它的能力。他在使用苹果生态中的一些应用上的可用,比如添加个闹钟、问个天气,记录个备忘录、打开App这些,但是在与人进行自然对话的时,它就像一个懂得很多高级词汇,但是表达能力仍然是一个三岁的孩子,让人感觉是在对牛弹琴、胡说八道、答非所问,它没有惊艳到我。
后来就是 AlphaGo与李世石对战的新闻,但是那还是一个离我们可使用太远的产品。
直到 2022 年 12 月初,准确来讲12 月 5 号。
OpenAI 的 GPT3.5在2022 年 11 月 30 号发布,发布后一两天内在技术界就产生了巨大的影响,我的信息流上被他刷屏了。刚开始我并没有特别留意,因为那时候更关注是另一个体感更强的问题(比如什么时候可以出门)。被国内外各路大神持续安利洗脑后,我就去注册了个账号。(其中的小插曲:因为短时间大量人注册,很多人反馈注册不了、需要邀请码,而那时候邀请码甚至被炒到了2000 块,碰巧的我用邮箱注册的时候,提示我已经注册过了,但我已经想不起来我是什么时候注册的了。后来想应该是在他们更早2020年发布 GPT3.0 的时候就注册了,只是GPT3.0没给我留下任何印象....)
我已经找不到第一次跟 GPT3.5 对话的内容了,可能是“你是谁”或者“请介绍下你自己”以及“hello world!”这种。但是我清晰的记得,在当时一轮多次往返的对话交流中,我慢慢地将“你”改为了“您”,这是一个潜意识里从脑袋中蹦出的词汇,并不是刻意的行为,让我一度有一种AI是一个“实体”存在的感觉,这个深深惊艳到我了。
这个是我真实的感受,“他”的能力的发展深深地震撼到了我.....
虽然人工智能最早在 1950 年左右就被提出了,但真正达到消费级的产品还是在 OpenAI 推出 GPT3.5 之后,背后最重要的三个能力提升来自于:
1、在移动互联网以及图书信息化之后,人类生产了大量内容以及大量优 质图书被数据化;
2、区别于 CPU 的 GPU 大规模多线并行计算能力的提升;
3、Tranforam 技术架构的注意力机制的算法突破;
分别是数据、算力、算法三样核心要素协调创新、螺旋式上升从量变达到质变的一个过程。
在之后与 AI 对话就成为了我生活中的一部分。通过不断与 AI进行对话沟,学习与 AI 对话的技巧,也同时也看其他各路大神各种奇葩开脑洞的使用AI方法,激发 AI 能力。各种开脑洞当然沟通方式也让我看 AI 强大的能力,让人感觉“他”是一个越来越“无所不能”的产品。
中国的AI 热起来是一直等到来年 23 年的 3 月,那时候百度推出了文心一言,我也在第一时间进行了试用,但是跟我GPT3.5 的感觉差很多。特别是那时候流行的文生图,文心一言是闹了不少笑话的。
对于国内的模型我自己一直使用较少,因为国内模型的结果我并不满意,除了技术本身还有很多其他的原因。比如:语料。语料存在两个问题,一个是内容少、中文语料只占整个互联网内容1.3%,而英文占比高达 59.8%。第二个是整体内容质量不高,即使曾经以高质量内容著称的“知乎”在过度商业化后,内容质量直线下降,作为曾经的深度用户,它早已经从我手机中消失了。
而对于AI 来讲,有一个说法叫“垃圾进垃圾出”。
除了语料的问题,还有两个更深层的原因就是中文这种语言特性以及内容审查的问题。
中文本质上不是一个准确、逻辑性强的语言,同一个词、一句话在不同的场景下可以有很多不同的解释和意思,这对AI 大模型理解起来,大大增加了它的难度,以及结果的不准确性。而英语是一门更加准确、清晰、逻辑性强的语言。庞大的英语词汇让其对很多事物都有唯一的描述与定义,对于AI大模型来讲,降低了其处理起来的复杂性。
(参考资料:《汉语大词典》 是迄今为止规模最大的汉语词典,收录的词汇量是37.5万个。而《牛津英语词典》(Oxford English Dictionary, OED) 是英语世界最权威、最全面的词典之一,其最新版本收录了超过 60万个 词条。而全球语言监测机构(Global Language Monitor)曾宣布英语词汇量已超过 100万。 所以我之前有一个技巧就是让 AI 用英文思考、查找英文资料、用中文输出。)
国内模型真正让我感觉有质的提升的一直要等到去年底 DeepSeek 的 V3,当时很多搞技术的在推荐,是因为其代码能力与 Anthropic的Claude3.5 很接近。我试了下语言能力,确实比国内其他的要好很多,在我使用 V3 之后,没多久 DeepSeek 就爆火了。(虽然我的时间线上Qwen 的曝光量也很多,但是我并没有深度去使用,对于国内模型也有很多人说其实做得很不错,我虽然没有一个一个深入地去试用,但是整体感觉就属于自己给自己打气,需要一点情绪价值,“我行,我上”)
在 OpenAI发布 GPT4 之后,很长一段时间都没有新的模型发布,一度让人说 AI 能力撞墙了,这个观念的改变一直要等到 ChatGPTo1 的发布。
我先是看到别人用 o1 出的结果,已经可以达到专业论文级别的水平,后来自己找了一些渠道使用 o1,对话结果也让我非常满意。o1在推理功能加持后,相较于GPT4的结果,其内容质量有了质的飞跃。
但是 o1 的问题就是太贵了。
使用推理能力出来的文章,其内容深度、逻辑性、语言的准确性、文章长度都有了很大的提升。特别是万维刚经常分享他与 o1 对话的内容,个人感觉是比他的一些专栏内容写得更好的。
我自己虽然一直在使用 AI,但因为那段时候重心在另外一件事上,对于 AI 也并没有深入想去具体做件什么事情,只是作为一个兴趣爱好,一直保留着对新技术的好奇与关注,更多只是作为我辅助生产的一个工具,产生的内容也没有放到网上公开,局限于自己做调研做研究。
除了 OpenAI 的产品,Anthropic、Grok 的产品也是我的备选,常常一个提示词我会同时丢给多个不同的 AI,最后选择最好的那个,长时间筛选下来,很长一段时间OpenAI的GTP系列一直是我的主力模型,知道最近深度使用 Gemini2.5Pro 。
对于 Google的产品,我是一直很喜欢,但是由于一些限制,一直无法使用Gemini,直到今年上半年他们对于教育用户免费使用,以及时间线上Gemini 2.5Pro 的刷屏,所以就找朋友帮忙弄了个账号。
Gemini2.5Pro的结果确实让人满意,不需要过多调试,在清晰地描述定义问题之后,编写提示词,基本上都可以给我一个80~90 分的答案,大大提高了我的生产力。这个也是我最近2个月绝对的主力模型。特别是深度思考,真的非常好用,我认为是可以超出研究生水平的,甚至匹配博士生论文水平的。
伴随着 AI 能力的提升,不断高效解决我的一些实际需求,这个过程让我对 AI 建立了非常强的信任,我自己已经倾向:万事不决,先问问 AI 吧。
最近一直在思考一个问题:其实 AI 在很多方面都已经超过人类的能力了,但很多人都不信 AI。为什么?
对于我自己而言,我知道 AI 的能力边界以及他的局限性,我知道哪些事情可以信他,哪些事情不行,即使信了 AI,最后出错了,我也不会怪 AI,只会怪自己。
AI他给我的结果比我以及我身边的人都要做得好,时间成本极低,原来一周肝出来的方案,在AI 加持下,半天也能做出同等质量的内容,有些工作类型甚至十几二十分钟就可以出很好的结果。
同时 AI也开拓了我很多其他方面的“专业“能力,比如代码能力,对于一些简单的模块内容,让完全不会写代码的我,也可以快速写出可以运行的代码。这以前都是我动过很多次念头都都没有成功过的事情。
而对于哪些不信的人来说,无法建立信任本质上是因为:
他们对 AI 的认识不够,习惯于把AI当作一个搜索引擎或功能按钮,输入一两个词一两句话,就期待完美答案。同时市面上各类搞“知识付费”的过度宣传夸大的AI能力与其真实使用起来体感的落差,让他们产生:为什么你们说的AI 那么强,可是我用起来体感那么差,解决不了我的问题,再慢慢重复的这个过程中,失去了对 AI 的信任。
在 AI 让“智力”不再是一种稀缺资源的情况下,我深刻思考了我只需要具备两个核心能力:提问与评价。
对于提问,背后需要我具备找到问题或需求、定义问题、描述问题的能力。更需要有一套自己解决问题的底层方法逻辑,基于这个逻辑,再泛化到各种不同行业领域中去。当然这个能力也可以通过AI加强。
评价则需要我知道在不同领域,“好”内容的评价体系是什么样的,“需要”的内容是什么样的。这个也可以通过 AI 习得,只不过有真实专业的人给你确认,可以让你效率更高。
这些能力总结起来就是:AI 时代的学习能力。这些都可以通过 AI 快速获取,所以理论上这是一个互相推动的正向飞轮,只要你时间够、脑子够,你可以高效学习很多知识。写到这里我的最深的感叹就是时间不够用。
(ps:我认为很多人对 AI 学习是被很多“黑心”卖课的“知识付费”博主带偏了的,当然这个不仅是博主的问题,本身需求方也存在一些问题,这个先挖个坑,回头再详细写)
我是真信AI,但是绝大多数人不信。
这个观念的改变不仅需要模型能力提升也需要时间,我相信等我我儿子他们那一代,AI会是他们生活中很重要的一部分。
道格拉斯・亚当斯说过这样一句话:“当你出生时已经有的任何科技都是平凡的,都是世界本来秩序的一部分。当你十五到三十五岁之间诞生的任何科技都是新颖的,是令人振奋能改变世界的革命性产物,你可能会在其中寻找到自己的事业。当你三十五岁之后诞生的任何科技,都是不遵守事物发展的自然规律的”,其实可以很好了用来描述当下不同群体对AI的态度。
人对 AI 态度上的差异,很重要的一个方面就是不同年龄段的人的认知行为模式不同,小孩子与 AI 相处的方式是先:没有定义-接触了解-默认接受。而很多成年人因为长时间的教育,已经形成思维定式,学习路径是:先怀疑排斥而不是接纳-不满意就扔掉。在这种情况下是无法学好 AI 的。
其实,从另外角度看看 AI,看看世界上最聪明的那些人以及公司在做什么事情,比如:
1、最近扎克伯格 1 亿美金每人的价格从 OpenAI挖研究员;
2、英伟达已经是全球市值最高的公司了,已经突破 4 万亿美元了;
3、马斯克不惜一切代价在做自己的 AI 产品;
4、 Shopify 的 CEO要求全员所有问题优先问 AI;
自己不确定自己的选择的话,就看看这些人聪明人是怎么选择的。
回到我长时间与 AI 对话思考总结出来的内容讲,我认为对于只使用对话框来用 AI 的人来说(对于绝大多数来说已经够用了),用好 AI 只需把以下三个方面的事情做好:
1、自己先把问题想清楚;
2、把问题整理成 AI 能懂的语言;
3、用你能触及的能力最强的模型;
对于第一点,就可以筛选很多人了,很多人对自己想要解决的问题没有概念,没有进行深入思考,只是一两句简单的话,在这种问题都描述不清楚的情况下,再强的AI也无能为力。
第二点就是需要掌握一些 prompt 提示词的原理,懂得底层逻辑方法,写提示词就是各个模块做加法的事情。使用这个规则至少可以让你得到一个及格的答案,但是想要得到优质答案,就需要进行限制更多、内容更长的符合大模型特性的prompt,这个需要更加深入地学习研究。
对于第三个,我认为这个是硬伤,需要各显神通(懂的都懂)。但是前段时间一朋友给我推荐了一个聚合各类模型的应用,其中就有我的主力模型 Gemini2.5Pro,也有现在号称最强的ChatGPT o3high,在我使用原生gemini 不顺畅的时候,这个也是我的备选方案,有兴趣的话可以注册体验。
可以复制这个地址去浏览器使用:https://askmany.cn/login?i=cbe550fa
其实对于第一、二问题都可以通过 AI 解决。你需要的是从潜意识里把“AI”当人看,要勇于问 AI。你平常怎么跟人沟通,你就怎么跟 AI 沟通,他讲得不好,你就直接说让他改,让他深度一步一步思考,不知道怎么问,你就问AI说应该怎么问,你多跟他沟通、优化提问方式、不断修正,通过这种持续的改善一定可以提高自己使用AI 的能力。
不管 AI 做得好不好,先让他成为你生活的一部分。
曾经以为 AI 创造不了人类没有提供给他的东西,但是越来越多的数据证明,AI 可以创造人类从来不知道的东西,比如在 制药领域,AI可以设计出全新的蛋白质结构,这些能力会慢慢泛化到我们日常生活中来。
我甚至有一个暴论:AI 或许在不远的将来会成为一门类似于数学、物理、化学这种学科。
草稿写了接近 4个小时,改了 2 小时,草草结尾了。
对于 AI Agent、prompt、AI 学习方法等先码住,回头再找时间慢慢写。
最后:
AI 可写不出来“人味”这么浓的内容,AI 的好千篇一律,没有多样性,他写不出来这么“差”的文章。
这个是我写的,不是你 AI 写的。
文章来自微信公众号 “ AIAwakening “,作者 AIAwakening
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0