
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。
来自主题: AI资讯
6352 点击 2024-04-11 10:18
纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。
「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。
训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。
红杉近日组织了他们的AI Ascent 2024主题活动。作为VC大佬的红杉出手还是很不凡,除了题为“人工智能的机遇” 开场演讲颇有营养外,已经分享出来的Andrej Karpathy和吴恩达两位AI大神的现场演讲更是不容错过。
创业十个月仍保持神秘 : AI大神李沐大模型创业方向,终于“水落石出”: 利用大模型能力,做游戏引擎,且是面向4A游戏, 关于4A游戏这个概念,目前业内没有统一的“名词解释”,但通常理解为比3A游戏更强大一点的游戏(doge)。