AI TNT— 让一部分先用AI实现商业化

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Llama-2

“只需”10万美元，训练Llama-2级别的大模型。尺寸更小但性能不减的MoE模型来了：它叫JetMoE，来自MIT、普林斯顿等研究机构。性能妥妥超过同等规模的Llama-2。

来自主题: AI技术研报

6602 点击 2024-04-05 17:13

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法：它仅用8k大小的token文档进行训练，就能将Llama-2窗口扩展至128k。

来自主题: AI技术研报

8520 点击 2024-02-29 13:27

融合多个异构大语言模型，中山大学、腾讯 AI Lab 推出 FuseLLM

来自主题: AI技术研报

3616 点击 2024-01-27 13:51

微调LLM需谨慎，用良性数据、微调后角色扮演等都会破坏LLM对齐性能！学习调大了还会继续提高风险！

来自主题: AI技术研报

5743 点击 2023-10-14 14:09