AI TNT— 让一部分先用AI实现商业化

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 部署

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带怕的

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带怕的

都很贵。

来自主题: AI资讯

8654 点击 2024-09-04 23:19

AI落地前端实操，带你成为公司最懂AI的前端大佬！

AI落地前端实操，带你成为公司最懂AI的前端大佬！

基于公司私有组件生成代码，这个问题的本质是：由于大模型的训练数据集不包含你公司的私有组件数据，因此不能够生成符合公司私有组件库的代码。

来自主题: AI技术研报

7164 点击 2024-09-02 12:42

大模型推理成本降10倍、速度快20倍，AI Infra公司「趋境科技」在推理端开创模型落地新路径

大模型推理成本降10倍、速度快20倍，AI Infra公司「趋境科技」在推理端开创模型落地新路径

2024年，落地，无疑是大模型最重要的主题。

来自主题: AI资讯

9320 点击 2024-08-20 16:31

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

大模型终端部署新趋势：硬件直接支持混合矩阵乘法

在人工智能领域，模型参数的增多往往意味着性能的提升。但随着模型规模的扩大，其对终端设备的算力与内存需求也日益增加。低比特量化技术，由于可以大幅降低存储和计算成本并提升推理效率，已成为实现大模型在资源受限设备上高效运行的关键技术之一。然而，如果硬件设备不支持低比特量化后的数据模式，那么低比特量化的优势将无法发挥。

来自主题: AI资讯

3451 点击 2024-08-19 14:49

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

有CPU就能跑大模型，性能甚至超过NPU/GPU！

来自主题: AI技术研报

9254 点击 2024-08-09 14:16

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

9185 点击 2024-08-02 14:26

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

【LLM开源模型】LLMs-Llama3.1-240723通关攻略笔记v1.0

不同类型的数据配比如何配置:先通过小规模实验确定最优配比，然后将其应用到大模型的训练中。 Token配比结论：通用知识50%；数学与逻辑25%；代码17%；多语言8%。

来自主题: AI技术研报

6839 点击 2024-08-02 11:53

想跑千亿大模型？算力厂商放大招！CPU通用服务器成为新选择

想跑千亿大模型？算力厂商放大招！CPU通用服务器成为新选择

千亿参数规模的大模型推理，服务器仅用4颗CPU就能实现！

来自主题: AI资讯

5799 点击 2024-08-01 15:35

英伟达“AI盒子”升级发布软件和服务，黄仁勋打造物理世界的数字副本

英伟达“AI盒子”升级发布软件和服务，黄仁勋打造物理世界的数字副本

英伟达NIM新升级，助力AI在多领域应用。

来自主题: AI资讯

9127 点击 2024-07-30 11:38

从裸机到700亿参数大模型，这里有份教程，还有现成可用的脚本

从裸机到700亿参数大模型，这里有份教程，还有现成可用的脚本

我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的，机器之心曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。而今天，我们要分享的是一篇深入技术底层的文章，介绍如何将一堆连操作系统也没有的「裸机」变成用于训练 LLM 的计算机集群。

来自主题: AI技术研报

8009 点击 2024-07-24 16:57

上一页当前第1页,共2页下一页