AI TNT— 让一部分先用AI实现商业化

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Llama

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

在发布一周年之际，阿里云通义千问大模型在闭源和开源领域都交上了一份满意的答卷。国内的开发者们或许没有想到，有朝一日，他们开发的 AI 大模型会像出海的网文、短剧一样，让世界各地的网友坐等更新。甚至，来自韩国的网友已经开始反思：为什么我们就没有这样的模型？

来自主题: AI资讯

4750 点击 2024-05-10 10:05

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

2469 点击 2024-05-08 12:21

推理超越 Llama3！面壁Ultra对齐助推开源大模型「理科状元」

推理超越 Llama3！面壁Ultra对齐助推开源大模型「理科状元」

两周前，OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B，Eurux-8x22B 发布时间更早，综合性能相当，尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA，堪称开源大模型中「理科状元」。

来自主题: AI技术研报

7507 点击 2024-05-07 22:38

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

大模型又又又被曝出安全问题！

来自主题: AI技术研报

9025 点击 2024-05-07 22:26

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。

来自主题: AI资讯

8892 点击 2024-05-06 20:51

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

我们知道，Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 实验室推出的 Jamba 等开源大语言模型已经成为 OpenAI 的竞争对手。

来自主题: AI技术研报

8965 点击 2024-05-06 17:49

告别偏科，能玩转多模态、多任务、多领域的强化智能体终于来了

告别偏科，能玩转多模态、多任务、多领域的强化智能体终于来了

随着 Llama 3 发布，未来大模型的参数量已飙升至惊人的 4000 亿。尽管每周几乎都有一个声称性能超强的大模型出来炸场，但 AI 应用还在等待属于它们的「ChatGPT 时刻」。其中，AI 智能体无疑是最被看好的赛道。

来自主题: AI技术研报

3301 点击 2024-05-05 19:40

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

AI做数学题，真正的思考居然是暗中“心算”的？

来自主题: AI技术研报

5445 点击 2024-05-05 19:25

热归热，Groq离取代英伟达GPU有多远？

热归热，Groq离取代英伟达GPU有多远？

2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。

来自主题: AI技术研报

4321 点击 2024-05-02 18:03

Llama 3细节公布！AI产品总监站台讲解：Llama系列超庞大生态系统

Llama 3细节公布！AI产品总监站台讲解：Llama系列超庞大生态系统

Llama 3的开源，再次掀起了一场大模型的热战，各家争相测评、对比模型的能力，也有团队在进行微调，开发衍生模型。

来自主题: AI技术研报

3331 点击 2024-05-01 20:59

上一页当前第11页,共18页下一页