AI资讯新闻榜单内容搜索-GPT-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: GPT-2
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑

一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」

来自主题: AI资讯
5640 点击    2024-04-11 20:53
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。

来自主题: AI资讯
6132 点击    2024-04-11 10:18
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
4042 点击    2024-04-10 19:11
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。

来自主题: AI技术研报
2412 点击    2024-04-09 16:10
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。

来自主题: AI技术研报
5279 点击    2024-04-09 15:14
中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

自曝996作息的OpenAI研究员Jason Wei表示,Sora代表着视频生成的GPT-2时刻。竞争的关键,就是算力和数据了。国内有可能成功「复刻」Sora吗?华人团队的这份37页技术报告,或许能给我们一些启发。

来自主题: AI资讯
4543 点击    2024-02-29 14:08
由AI生成的826小时不间断电影在上海太古里向公众播放...

由AI生成的826小时不间断电影在上海太古里向公众播放...

由AI生成的826小时不间断电影在上海太古里向公众播放...

作品《人工智能无限电影(AI-FI)》是艺术家徐冰与团队从2017年开始用GPT-2开发的项目,是与人工智能科学家合作开发的一个没有电影人(如导演、编剧、摄影师或演员等)参与的实时电影生成系统。

来自主题: AI资讯
1991 点击    2023-11-19 22:51