Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式
Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式2023 年初,Jason Wei 加入了 OpenAI,参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。
2023 年初,Jason Wei 加入了 OpenAI,参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。
2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。
预训练语言模型通常在其参数中编码大量信息,并且随着规模的增加,它们可以更准确地回忆和使用这些信息。
此项研究成果已被 AAAI 2025 录用。该论文的第一作者是南洋理工大学计算与数据科学学院 (CCDS) 的硕士生杨潇,师从苗春燕教授,主要研究方向是图神经网络。
2025年,一场前所未有的智能海啸即将席卷全球。这不是危言耸听,而是基于大量研究得出的预判。这篇万字长文从生态、业态、技术、产品、企业五大维度,系统预测了2025年可能发生的50个重要变革。
2025年,AI应用将继续爆发。 刚刚过去的2024年,海外创投市场对AI公司的投资仍然活跃。根据Crunchbase的数据,AI公司的投资交易在2024年第三季度继续主导风险投资市场,它们在第三季度融资总额达190亿美元,占总风险投资的28%。
万字长文盘点 2024,展望 2025 2024 年,大语言模型(LLM)迎来了翻天覆地的变化。让我们一起回顾过去一年中这个领域的重大发现,梳理其中的关键主题和标志性时刻。
24年,计算摄影概念风靡,影像成了AI应用的主战场,不论是原生相机上应用AI技术去做调教,抑或颇受用户欢迎的AI消除等AI影像应用,都表明,AI给影像打开了全新的一扇窗。然而,对于摄影师来说,AI影像的出现真的是一件好事吗?
2025年,AI应用将何去何从? 大模型从神话走向落地的故事教会我们:技术真正的想象力来自“脱敏”。在对过高的期许和泡沫脱敏以后,还要对技术本身脱敏
在今年的 NeurIPS 2024 大会上,硅谷最著名的 VC 之一 Conviction Capital 创始人 Sarah Guo 和合伙人 Pranav Reddy 做了一场 “AI 创业公司的现状(The State of AI Startups)”的分享。