我早上了,还有《Flappy Bird》啥事儿了。
昨天中午,马斯克略显着急地发布“地表最强大模型”。
发布会上,他把Grok3捧得“上天入地”,上能帮Space X上火星,下能“三年内将实现诺贝尔奖级别突破”,多方面性能上媲美或超越现有竞争对手。
凭借着狂堆20万张H100,Grok3 登上AI测评平台 Chatbot Arena LLM 排行榜第一。
不过,发布会后,网友自测beta版的 Grok3 出现各种翻车。有人质疑为什么只放三个榜单,刷榜都没刷全。有人发现 xAI 在做图上用了点儿设计心理学,纵轴只列出1300-1400分分段的排名,细微差距看起来却异常明显,明明都是尖子生,Gemini 1.5 Pro跟倒数第一似的。
整场发布会看下来,让我最兴奋地并不是马斯克“有钱任性”做出的大模型,而是在现场马斯克和两位工程师,直接让Grok3用Python语言写了一款俄罗斯方块和消消乐的结合版2D小游戏,点开即玩。
随后,马斯克称将在 xAI 推出一个人工智能游戏工作室,公开招募有兴趣用 AI 驱动游戏的开发者。
虽然多次被人质疑代练,但马斯克依旧心系游戏。X 上现在关于 Grok3 最热的话题之一就是:网友@Penny2x 用测试版,不断调整提示词,由Grok3从头构建了一个类似“超级玛丽”的游戏。
@Penny2x 表示,他没有做任何编程工作,整个游戏 100% 由 Grok 3 制造,他就在 Grok 3 里输入游戏描述,Grok3 就可以生成完整的代码,他只需要复制代码到文本编辑器里保存后,在浏览器打开就能玩,他再根据体验让 Grok3 改进即可。
该条推阅读量已破百万|X
这个游戏也被他放到了ThankDoge网站,点击阅读原文即玩。别说,还真有点儿意思。
这是一个横版平台跳跃游戏,有积分、三条命复活、遭遇敌人扣命、收集金币的游戏机制。也做出了二段跳、子弹攻击、超级金币等成长型技能。下方还会有对玩家操作的文字描述,看着颇有早期“超级玛丽”的即视感,游戏还区分了桌面端和移动端。
但游戏质量嘛......经不起细敲。
bug会经常出现,比如对跳跃的判定;对子弹攻击的判定,总是绕着角色转,并没有像《超级玛丽》一样发射出去;对生命值的判定,时扣时加。总之玩起来简陋又迷惑。
随后,他又公布了如何让 Grok3 一分钟内做出一个打砖块 html 小游戏的全过程。
整个过程十分简单,在对话框里写下需求,大模型就生成可运行代码,只需要把文本复制进“记事本”等文本软件,改个后缀名转换格式,运行了游戏后再让大模型继续调整。
我按照 @Penny2x 发布的指令,在 DeepSeek、ChatGPT 里分别试了试,与Grok3进行对比,“横测”三大模型“做游戏”的实力。
指令是,“请帮我用 JavaScript 和 HTML 创建一个简单的打砖块游戏。这个游戏应该可以在我桌面上的一个文件里运行。请给代码加上注释,让一个 6 岁的小朋友也能从中学到东西。”
并且经历了一轮。“太棒了,你能加一个分数,以及越来越难的关卡吗?”的升级指令。
Grok3 做出的打砖块,就是简单的左右键横移平台,打掉所有砖块后,下一关会多一层砖块,稍微加一点点速度,过五关后显示“你赢了”,每次失败后,需要手动刷新网页才能重开一局。
Grok 3 的打砖块我都玩到第三关了,感觉还是慢悠悠的|Grok 3
而 DeepSeek 做出的版本,是用鼠标控制移动,这就做出了接球平台的速度变化。同时加入了“三条命”的机会,每过一关后,小球速度有显著提升。DeepSeek 版做出了游戏设计里的“容错率”结合“挑战感”,这就让无聊小游戏的可玩性陡增,同时失败后只需要点击“Game Over”就能重开,不需要刷新网页。
DeepSeek 版打砖块|作者自制
GPT-4o 是最拉垮的,没有关卡提示,没有变速,没有生命值,甚至有小球卡在平台和显示不全的 bug,只赢在了花里胡哨的 UI。
GPT-4o|作者自制
从游戏效果上,这一轮,DeepSeek胜。
不过,Grok 3 确实是把“请给代码加上注释,让一个 6 岁的小朋友也能从中学到东西。”这一需求实现最好的,每一列代码都写了功能批注,能入选编程教育教科书了。相比,GPT-4o和 DeepSeek 在代码备注上都要简略许多。
至于 @Penny2x 能早于发布会拿到优先体验权,原因很简单,可以说,他是马斯克的狂热粉丝了。
上述提到的网站 ThankDoge 就是他建立的,堪称一个美国政府效率部(DOGE)的粉丝网,专门用来总结马斯克的“丰功伟绩”。
他的个人网页上也充斥着《论马斯克如何为全人类牺牲了自己的幸福》、《马斯克是人类史上最成功的建设者》这类文章。他还是特朗普和马斯克“一马平川”的 CP 粉。
Penny2x 的个人网站丨Penny2x.org
这款游戏也被他命名为,“Shiba’s anti-corruption run(柴犬的反腐败运动)”,致敬马斯克在美国政府效率部(DOGE)的裁员活动。
你操控的主角就是“柴犬”,游戏里带蓝帽子的敌人是“民主党”,光头的是@Penny2x 口中“从政府偷金币的狡猾政客”,这游戏也算是极度夹杂私货了。
扯远了。
去年大约也是这个时候,Sora“横空出世”,马斯克就立证自己团队在视频生成上的能力,“大约一年前,特斯拉就能以精确的物理生成真实世界的视频。”
AI预测生成符合物理规律的视频,不仅可以用于训练自动驾驶,也可以用于游戏开发。
而后一位用户在 X 上说,“特斯拉应该制作一款电子游戏”。马斯克立刻回应道,“我想那样做很久了:)。”
马斯克酷爱打游戏,不是什么秘密。
青少年时期的马斯克就是因为对游戏的热爱,促使他开始学习编程,13 岁时,他就编写了一款太空射击游戏《Blastar》,并且 500 美元卖给了一家游戏杂志,赚到了人生第一桶金。
大学期间马斯克会废寝忘食地玩《文明》、《外交》、《魔兽争霸》这种战略游戏。而在他正式开启创业之路前的两次实习打工经历里,其中一家就是游戏公司。
该游戏灵感来源于曾经爆火的《太空侵略者》丨X
2022年收购Twitter时,马斯克在玩了《艾尔登法环》一个通宵后,宣告了他的收购决定。游戏是他释放压力和沉浸思考的一种方式。
他也在采访里说过,许多公司运营和产品设计的灵感都来源于他玩过的游戏,电子游戏帮助他培养了解决问题和逻辑思维的能力。
马斯克还曾在著名游戏展会 E3 上公开对电子游戏表白,称“不是因为电子游戏,我就不会开始编程,我也不会对计算机和技术感兴趣。”
别的政客都是批评“电子游戏的危害”,马斯克反过来批评政客手伸得长,还在 X 上炮轰“电子游戏是让你沉浸在一个充满刺激和创意的另类现实中,并与朋友一起享受乐趣。掺和现实里的政治烂事,只会破坏这种体验。”
公开炮轰政客不懂游戏的马斯克|X
不过,此前马斯克声称自己是《暗黑破坏神4》和《流浪之路2》的全球前 20 名,结果在美国总统就职典礼上,网友发现他《流浪之路2》账号同时在线,被人扒出来他找了代练(本人也承认了),马斯克“游戏大佬”人设轻微崩塌。
这多尴尬啊|X
昨天宣布要在xAI成立AI游戏工作室后,马斯克转发了一条粉丝推文,该粉丝觉得马斯克可以整治游戏圈过度的政治正确和DEI风潮,马斯克回应,“必须得做,让游戏再次伟大!”
X
去年,AI在游戏领域的探索不少。有无需游戏引擎,用视频基座模型直出实时可交互的“Minecraft风格”游戏 Oasis。李飞飞团队的世界模型,用一张图就生成一个3D世界,创造符合真实世界规律的虚拟世界,重要应用之一就是游戏。
从简单的网页游戏,再到未来,跟世界模型融合,将游戏画面扩展到3D效果。每个人都能“手搓”出游戏的一天,可能真快来了。
文章来自于“果壳”,作者“糕级冻雾”。
【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。
视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file
【开源免费】AIEditor.dev是一个开箱即用、并且支持所有前端框架、支持 Markdown 书写模式的AI富文本编辑器。
项目地址:https://github.com/aieditor-team/AiEditor?tab=readme-ov-file
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0