AI资讯新闻榜单内容搜索-GPT-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-2
Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!

Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!

Karpathy 4小时AI大课上线,小白看了都会从零构建GPT-2!

距上次Karpathy AI大课更新之后,又有了1个多月的时间。这次他带了超详细的4小时课程——从零开始实现1.24亿参数规模的GPT-2模型。

来自主题: AI资讯
10284 点击    2024-06-13 11:41
Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练

大神Karpathy已经不满足于用C语言造Llama了! 他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。

来自主题: AI技术研报
10044 点击    2024-05-30 10:30
奥特曼本人确认:神秘gpt2不是GPT-4.5!

奥特曼本人确认:神秘gpt2不是GPT-4.5!

奥特曼本人确认:神秘gpt2不是GPT-4.5!

答案揭晓了! 「神秘gpt2-chatbot不是GPT-4.5」。

来自主题: AI技术研报
6599 点击    2024-05-03 20:47
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」

来自主题: AI资讯
7266 点击    2024-04-11 20:53
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。

来自主题: AI资讯
7983 点击    2024-04-11 10:18
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
6489 点击    2024-04-10 19:11
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。

来自主题: AI技术研报
4238 点击    2024-04-09 16:10
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。

来自主题: AI技术研报
7054 点击    2024-04-09 15:14