AI资讯新闻榜单内容搜索-Nano

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Nano
神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

今年 4 月,AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

来自主题: AI资讯
5063 点击    2024-11-22 10:18
为了保护Gemini的秘密,谷歌也开始打压刷机

为了保护Gemini的秘密,谷歌也开始打压刷机

为了保护Gemini的秘密,谷歌也开始打压刷机

为了将危险扼杀在襁褓中,谷歌就只能进行无差别打击。

来自主题: AI资讯
4385 点击    2024-09-05 09:59
不是大模型用不起,而是小模型更有性价比

不是大模型用不起,而是小模型更有性价比

不是大模型用不起,而是小模型更有性价比

无法控制成本的大模型终将被“快好省”的小模型取代今年最热的AI赛道中,机构们自然也得下一些判断,比如说——2024年大模型的一个趋势,是将变得“越来越小”。

来自主题: AI资讯
5018 点击    2023-12-28 14:07
微软小模型击败大模型:27亿参数,手机就能跑

微软小模型击败大模型:27亿参数,手机就能跑

微软小模型击败大模型:27亿参数,手机就能跑

上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。

来自主题: AI资讯
6607 点击    2023-12-13 16:21
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!

来自主题: AI资讯
7678 点击    2023-12-13 15:41
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

Transformer大模型工作原理究竟是什么样的?一位软件工程师打开了大模型的矩阵世界。黑客帝国中,「矩阵模拟」的世界或许真的存在。

来自主题: AI资讯
7268 点击    2023-12-04 18:48