NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命
NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命该研究主要探讨了大语言模型的全局剪枝方法,旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角,并在相关领域具有重要的应用潜力。
该研究主要探讨了大语言模型的全局剪枝方法,旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角,并在相关领域具有重要的应用潜力。
最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。
现实世界中的强化学习在应用过程中也面临着巨大的挑战,尤其是如何保证系统的安全性。为了解决这一问题,安全强化学习(Safe Reinforcement Learning, Safe RL)应运而生,成为当前学术界和工业界关注的焦点。
这样一套组合拳打下去,AI厂商大概率就会乖乖向网站付费了。
最近,斯坦福大学 NLP 组在读博士 Omar Khattab 发布了一篇博文,讨论了顶级 AI 学者们有关做有影响力研究的思考
世界上首台基于Arm架构的超算,现如今终于退役了。 2018年5月,这台拥有10000个核心的系统Isambard 2首次部署。 它使用了由Cavium开发、台积电制造的64位Armv8 ThunderX2处理器,外加几个Nvidia P100 GPU。
据TechCrunch报道,投资者们正争相进入 ElevenLabs,该公司可能很快就会被估值为 30 亿美元。
Anthropic与Claude 3.5 Sonnet一同发布了一个新功能——Artifacts。
17岁高中生做了个AI APP,短短四个月销售额达100万美元。 小伙儿Zach Yadegari(下面暂称小扎克)在X上炫战绩,引来大量网友围观。
时隔两年,ChatGPT终迎来界面全新升级! 这一次,OpenAI官宣推出canvas。它不再是简单的对话框,而是能与ChatGPT「并肩作战」的全新界面。