AI资讯新闻榜单内容搜索-LLM

从架构、工艺到能效表现，全面了解LLM硬件加速，这篇综述就够了

大语言模型（LLM）的发展同时往往伴随着硬件加速技术的进化，本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。

来自主题: AI资讯

11927 点击 2024-09-20 13:29

To CoT or not to CoT？

来自主题: AI资讯

9854 点击 2024-09-20 13:19

如何处理小众数据，如何让这些模型高效地学习专业领域的知识，一直是一个挑战。斯坦福大学的研究团队最近提出了一种名为EntiGraph的合成数据增强算法，为这个问题带来了新的解决思路。

来自主题: AI资讯

8944 点击 2024-09-20 10:31

近期，浙大和 Salesforce 学者进一步发现：语言模型或许帮助有限，但是图像模型能够有效地迁移到时序预测领域。

来自主题: AI资讯

5738 点击 2024-09-19 15:24

这个小假期，让我感觉很崩溃的是，一项新的研究彻底打破了我们的幻想：LLM的幻觉问题不仅难以解决，而且从根本上来说是无法100%完全消除的。

来自主题: AI资讯

9285 点击 2024-09-18 16:53

关注o1必备的GitHub库，它来了！

来自主题: AI技术研报

7416 点击 2024-09-18 15:59

OpenAI的研究科学家布朗（Noam Brown），这两天在他的自我介绍中，加上了一条：OpanAI o1的联合创始人。

来自主题: AI资讯

4316 点击 2024-09-18 10:56

李笑来曾经说过，学英语最好的方法就是用英语。而英文播客就是练习英语听力的最佳材料之一，可以一边学知识一边练听力。但是英文播客有一个不可能三角：我能学到知识、我很关心话题、我能听懂他们说话。要同时满足这三个条件的播客实在太难找了。但是最近 Google 做了一个 AI 工具，完美地解决了这个问题。

来自主题: AI资讯

7206 点击 2024-09-18 10:53

斯坦福大学的最新研究通过大规模实验发现，尽管大型语言模型（LLMs）在新颖性上优于人类专家的想法，但在可行性方面略逊一筹，还需要进一步研究以提高其实用性。

来自主题: AI技术研报

11263 点击 2024-09-17 23:12

大型语言模型（LLMs）虽然进展很快，很强大，但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】，大概就是看自己输出的结果，自己反思一下有没有错，如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报

9433 点击 2024-09-17 21:26