AI资讯新闻榜单内容搜索-Llama2

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

让 Llama 2 在 Windows 98 奔腾 2（Pentium II）机器上运行，不但成功了，输出达到 39.31 tok / 秒。

来自主题: AI资讯

7187 点击 2024-12-30 15:15

万亿市场！开源AI大模型发展研究报告 2024

随着开源技术占据各大新兴领域的技术路线，其不断丰富人工智能领域的应用场景。 2023年，Meta 相继发布 Llama 和 Llama2，很快成为广受欢迎的开源大模型，也成为许多模型的基座模型。

来自主题: AI技术研报

5041 点击 2024-11-03 11:09

AI慢思考蒸馏进快思考，Llama2跃升至GPT-4水平，不写过程也能做对题

《思考快与慢》中人类的两种思考方式，属实是被Meta给玩明白了。

来自主题: AI资讯

9518 点击 2024-07-12 15:44

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果

本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与张亚勤炉边对话，Llama2/3作者Thomas Scialom，王小川、杨植麟等最受关注AI创业者……也都现场亮相。

来自主题: AI资讯

4422 点击 2024-06-15 13:16

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报

8661 点击 2024-06-11 10:06

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

大数据巨头Databricks与哥伦比亚大学最新研究发现，在数学和编程任务上，LoRA干不过全量微调。

来自主题: AI技术研报

2173 点击 2024-05-20 21:03

Flash Attention稳定吗？Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知，大语言模型的训练常常需要数月的时间，使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例，其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性，导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报

5670 点击 2024-05-12 15:49

北大开源最强aiXcoder-7B代码大模型！聚焦真实开发场景，专为企业私有部署设计

来自Meta、基于Llama2，可是开源界最先进的AI编程大模型之作

来自主题: AI资讯

4158 点击 2024-04-11 10:02

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大，特别是在长序列的场景中。

来自主题: AI技术研报

4806 点击 2024-04-03 17:29

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际，一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现，随着窗口长度的不断增加，大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude 2，还是开源的Llama2和Mistral，都未能幸免。

来自主题: AI技术研报

7301 点击 2024-04-03 14:31

AI资讯新闻榜单内容搜索-Llama2

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

万亿市场 ！开源AI大模型发展研究报告 2024

AI慢思考蒸馏进快思考，Llama2跃升至GPT-4水平，不写过程也能做对题

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果

用神经架构搜索给LLM瘦身，模型变小，准确度有时反而更高

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

Flash Attention稳定吗？Meta、哈佛发现其模型权重偏差呈现数量级波动

北大开源最强aiXcoder-7B代码大模型！聚焦真实开发场景，专为企业私有部署设计

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

万亿市场！开源AI大模型发展研究报告 2024