1000天,AI从「聊天工具」变成「数字同事」!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
1000天,AI从「聊天工具」变成「数字同事」!
7671点击    2025-11-30 15:03

AI走进大众视野,其实也不到1000天。


可就在这短短1000天里,很多事已经彻底换了样。


三年前,人们用GPT-3写诗、讲段子,它能把一句话写顺就是奇迹。


现在的Gemini 3,会读文件、查资料、跑代码、建网站,甚至能把十年前的旧数据整理成一篇14页的学术论文。


在没有具体研究题目的情况下,它也能自己确定研究切口。


AI不再等人开口提问,它开始主动把事情做完;而人与AI之间的关系,也悄悄进入了新位置。


三年前的「惊艳」,现在回看只是序章


如果把时间倒回2022年底,那个节点几乎是AI发展的起跑线。


就在ChatGPT刚上线前夕,Ethan Mollick写下了他在Substack上的第一篇GPT-3测试文章。


1000天,AI从「聊天工具」变成「数字同事」!


彼时的他还在感叹:


AI能写出一段顺畅的文字,已经足够改变世界。


在那篇文章里,他举的例子成了那个时代的代表性画面——让GPT-3写一首关于「糖果驱动的超光速引擎逃离水獭追捕」的诗。


1000天,AI从「聊天工具」变成「数字同事」!


这种轻巧、荒诞又略带才气的创意输出,曾让无数人第一次意识到:机器不只是补全文字,它真的能像在写作。


那一年,全网都在传播类似的故事。


媒体强调「AI会写作」「AI会讲段子」「AI模仿莎士比亚写诗」,技术论坛里也充斥着GPT-3的各种玩法,从写故事、写求职信,到写简单的Python函数。


1000天,AI从「聊天工具」变成「数字同事」!


GPT-3生成的一篇关于众筹如何助力创业的学术综述论文


但那时的能力短板:它能写,也只能写。


你给提示,它完成一句;你给框架,它模仿结构写一段。


再聪明,它也像是一个被困在文字框里的大型自动补全系统。


Mollick之后在文中也承认,当年他第一次感到震撼,是因为「AI 居然能写得这么顺」。


1000天,AI从「聊天工具」变成「数字同事」!


可他没想到的是,仅仅过了三年,Gemini 3只需给它一张截图,AI就能直接「做给你看」。


回头看,GPT-3的所有惊讶都像是时代的开场白。


真正的能力跃迁,还在后面。


AI不止是回应,它还会把事情做完


真正让人意识到时代变了的,是Gemini 3。


Mollick做了一个简单的实验:他把自己三年前写GPT-3的截图扔给Gemini 3,只给了一句提示:


用实际行动来展示人工智能自这篇文章发布以来取得了多大进步。


然后事情失控了。


在Mollick的测试里,Gemini 3直接构建了一个可交互的小游戏


一个用糖果驱动的星舰,要逃离水獭追击,还配了动态文本、小诗和实时状态更新。


1000天,AI从「聊天工具」变成「数字同事」!


三年前只能在文本里描述游戏,如今它直接把游戏做出来。


但小游戏只是预告片。真正的核心在Google同期发布的Antigravity


这是一个能读取本地文件、运行代码、规划任务、执行项目的通用型行动代理。


用户不需要写代码,只用中文或英文告诉它要做的事,AI自己把步骤拆开,然后一点点推进。


Mollick做了一个非常典型的测试:他给Antigravity访问权限,让它读取自己电脑里存着的所有newsletter旧稿。接着只下达一句话:


帮我做一个漂亮的网站,汇总我过去所有关于AI的预测,并去网上查查哪些预测准了、哪些错了。


Gemini 3接过任务后,开始自动读取文件、扫描内容、比对上下文,然后弹出一个行动计划让你确认——


包含网页结构、数据整理方式、需要额外搜索的点、交互形式,甚至包括可能遇到的技术问题。


1000天,AI从「聊天工具」变成「数字同事」!


人工智能第一次询问有关项目的问题,它对需求的理解得非常透彻,给人留下了深刻的印象


只有在需要判断方向时,AI才会ping他:「这里有两个可能路径,你想让我选哪一个?」


1000天,AI从「聊天工具」变成「数字同事」!


Mollick测试时,AI自动生成并部署的demo页面


Mollick的评价很直白:


这不像在prompt一个模型,更像在管理一个队友。


这句话说明了一个事实:Gemini 3已不再停留在语言模型阶段,它正在成为一个能执行任务、推进流程、判断路径的数字行动体。


对普通用户来说,这意味着过去三年最本质的变化不是模型更强,而是AI终于从「只说不做」进入了「又说又做」的时代


当AI会做科研,人类的任务只剩下审核


在Mollick的测试里,Gemini 3在测试中呈现出接近研究生水平的科研工作流程。


他没有给AI任何干净、整齐的数据,而是一份自己十年前做众筹研究时留下的旧文件夹。


各种格式混在一起,命名混乱,甚至包括——


「project_final_seriously_this_time_done.xls」这种文件名。


他把这一整包东西直接丢给Gemini 3,并给了它一句话:


先搞清楚这些数据的结构,把能修的修一修,清理干净,准备做新的分析。


然后AI开始自己工作。没有催促,没有提示,也不需要你告诉它STATA是什么。


它会自动识别文件格式、修复损坏数据、统一字段、重建可读结构,并按照研究常规流程整理出可分析的数据集。


这一步过去通常需要研究生级别的耐心和经验。


Mollick看到结果后,提出了第二个要求:


写一篇新的论文。用这些数据,找一个创业或战略领域有意义的理论问题,自己设计分析方法,写成一篇可投稿的学术文章。


他没有告诉AI要研究什么、没有给任何方向、也没有限定主题。Gemini 3自己就能决定研究切口,


它提出了一个能与现有文献对话的假设,设计合适的统计模型,跑完数据,生成结果,再把整套内容写成了一篇14页的完整论文,包含摘要、理论、方法、数据描述、回归表格、讨论与局限。


1000天,AI从「聊天工具」变成「数字同事」!


最让人意外的,是论文里出现了一个AI自创的指标。


它利用NLP方法计算「项目创意的独特性」,通过文本相似度量化「一个众筹项目到底有多特别」。


在这个案例里,它不只是模仿已有做法,而是尝试做方法层面的扩展。


1000天,AI从「聊天工具」变成「数字同事」!


当然,它并不是完美的。Mollick也指出AI有一些典型问题:模型有的地方过拟合,解释略显自信,理论段落写得有点「太努力」。


但这些问题并非幻觉或混乱,而是更接近研究生写作时的判断偏差和方法细节不足。


当Mollick给出方向性建议,例如「理论部分补充文献」「方法段落写得更稳妥一些」时,Gemini 3能根据这些反馈进行有效修订。


从整个过程可以看出,Gemini 3可以承担科研工作里大量「执行性任务」,而人类在其中的角色更像是审稿人、研究负责人、方向决策者。


1000天,AI从「聊天工具」变成「数字同事」!


回看这三年,GPT-3 时代,人类负责「提出问题、设计方向」AI 负责生成一段文字。


到了Gemini 3,人类提出粗略目标,AI会把数据整理、建模、写作、执行流程全部推进到位,再让你做最终判断。


AI不再停留在对话窗口里,它开始执行项目、处理文件、构建研究环境,甚至能独立做出研究选择。


而人类也不再是修正AI错误的人,而是在逐渐转向「给AI下达任务并审核结果的人」。


这就是1000天带来的变化。


不是某个模型更强,而是整个协作方式已经重写。


AI的位置往前走了一步,人类的角色也随之调整。


这种位移正在成为新的常态。


参考资料:

https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini


文章来自于微信公众号 “新智元”,作者 “新智元”

关键词: AI新闻 , 人工智能 , AI , AI职场
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0