AI资讯新闻榜单内容搜索-LLama

大模型“自学”后能力反下降，Llama/Mistral都没逃过

AI经过多轮“自我提升”，能力不增反降？

来自主题: AI技术研报

8882 点击 2024-07-19 17:04

随着大语言模型展现出惊人的语言智能，各大 AI 公司纷纷推出自己的大模型。这些大模型通常在不同领域和任务上各有所长，如何将它们集成起来以挖掘其互补潜力，成为了 AI 研究的前沿课题。

来自主题: AI技术研报

9286 点击 2024-07-19 16:21

大模型开源的热潮下，隐藏着诸多问题，从定义的模糊到实际开放内容的局限性，Lecun再陷Meta大模型是否真开源的质疑风波只是冰山一角。

来自主题: AI技术研报

9252 点击 2024-07-19 12:34

假如你有闲置的设备，或许可以试一试。

来自主题: AI资讯

10662 点击 2024-07-16 19:50

研究者表示，如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征，则可以进一步提升 System 2 表现不那么好的推理任务的性能。

来自主题: AI技术研报

10272 点击 2024-07-14 13:36

《思考快与慢》中人类的两种思考方式，属实是被Meta给玩明白了。

来自主题: AI资讯

10688 点击 2024-07-12 15:44

评估大模型是否诚实的基准来了！

来自主题: AI技术研报

8517 点击 2024-07-12 00:59

全球首个芯片设计开源大模型SemiKong正式发布，基于Llama 3微调而来，性能超越通用大模型。未来5年，SemiKong或将重塑价值5000亿美元的半导体行业。

来自主题: AI资讯

10572 点击 2024-07-10 18:14

来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。

来自主题: AI技术研报

5578 点击 2024-07-09 15:50

基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型（Large Language Models，LLMs）的强大理解、生成和推理能力

来自主题: AI技术研报

10836 点击 2024-07-07 16:35