# 热门搜索 #
搜索
搜索: AI框架
ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

在大模型实际部署落地的过程中,如何赋予大模型持续学习的能力是一个至关重要的挑战。这使其能够动态适应新的任务并不断获得新的知识。大模型的持续学习主要面临两个重大挑战,分别是灾难性遗忘和知识迁移。灾难性遗忘是指模型在学习新任务时,会忘记其已掌握的旧任务。知识迁移则涉及到如何在学习新任务时有效地应用旧任务的知识来提升新任务学习的效果。

来自主题: AI技术研报
7655 点击    2024-05-29 16:18
只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

本文由GreenBit.AI团队撰写,团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展,倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案,使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报
7413 点击    2024-05-25 18:15
替代MLP的KAN,被开源项目扩展到卷积了

本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。

来自主题: AI资讯
8941 点击    2024-05-19 16:25
GPT-4 提示词冠军如何写 prompt:CO-STAR 框架、文本分段、系统提示

当下,如果我们希望通过 ChatGPT 得到有用的信息,就必须知道如何向它发出清晰的指令。为了指导用户写一个好的 prompt,OpenAI 官方曾上线了 Prompt engineering,谷歌和微软也有类似的动作。

来自主题: AI资讯
6581 点击    2024-05-13 09:31