AI TNT— 让一部分先用AI实现商业化

Llama 3发布一个月后，一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目，引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构，甚至让Andrej Karpathy亲自下场「背书」。

来自主题: AI技术研报

8932 点击 2024-05-21 15:20

把大模型塞进手机里需要几步？

来自主题: AI资讯

7855 点击 2024-05-21 09:27

大数据巨头Databricks与哥伦比亚大学最新研究发现，在数学和编程任务上，LoRA干不过全量微调。

来自主题: AI技术研报

1475 点击 2024-05-20 21:03

5月14日，开源的大语言模型Falcon 2发布，性能超越Llama 3，消息登上了Hacker News热榜第一。「猎鹰」归来，开源宇宙将会迎来新的霸主吗？

来自主题: AI技术研报

8944 点击 2024-05-20 16:14

杀疯了！一夜之间，全球最强端侧多模态模型再次刷新，仅用8B参数，击败了多模态巨无霸Gemini Pro、GPT-4V。而且，其OCR长难图识别刷新SOTA，图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。

来自主题: AI资讯

8951 点击 2024-05-20 15:54

Llama 3开源后，聊天机器人Meta AI也宣布使用新模型作为基座，在Meta旗下的各种软件（Meta.ai、Instagram、Facebook、WhatsApp）中都可以进行免费体验。

来自主题: AI技术研报

9230 点击 2024-05-18 17:51

70B模型，秒出1000token，换算成字符接近4000！

来自主题: AI技术研报

7595 点击 2024-05-17 17:45

Llama 3首发阵容里没有的120B型号竟意外“曝光”，而且十分能打？！

来自主题: AI资讯

5450 点击 2024-05-13 17:34

猛然间，大模型圈掀起一股“降价风潮”。

来自主题: AI技术研报

6659 点击 2024-05-13 17:21

微软&清华最新研究，打破GPT系列开创的Decoder-Only架构——

来自主题: AI技术研报

4754 点击 2024-05-12 12:51