AI资讯新闻榜单内容搜索-BERT

大模型扩展新维度：Scaling Down、Scaling Out

近年来， Scaling Up 指导下的 AI 基础模型取得了多项突破。从早期的 AlexNet、BERT 到如今的 GPT-4，模型规模从数百万参数扩展到数千亿参数，显著提升了 AI 的语言理解和生成等能力。然而，随着模型规模的不断扩大，AI 基础模型的发展也面临瓶颈：高质量数据的获取和处理成本越来越高，单纯依靠 Scaling Up 已难以持续推动 AI 基础模型的进步。

来自主题: AI技术研报

10241 点击 2025-02-21 15:43

Lex Fridman 五小时播客实录：中美 AI 竞争与国运

在这个对谈中，Lex Fridman 与半导体分析专家 Dylan Patel（SemiAnalysis 创始人）和人工智能研究科学家 Nathan Lambert（艾伦人工智能研究所）展开对话，深入探讨 DeepSeek AI 及其开源模型 V3 和 R1，以及由此引发的 AI 发展地缘政治竞争，特别是中美在 AI 芯片和技术出口管制领域的博弈。　　

来自主题: AI资讯

7985 点击 2025-02-04 18:53

ModernBERT 为我们带来了哪些启示？

当谷歌在 2018 年推出 BERT 模型时，恐怕没有料到这个 3.4 亿参数的模型会成为自然语言处理领域的奠基之作。

来自主题: AI技术研报

8707 点击 2025-01-31 12:34

LoRA最新最权威的一切都在这了，2025综述

在人工智能快速发展的今天，大型基础模型（如GPT、BERT等）已经成为AI应用的核心基石。然而，这些动辄数十亿甚至数万亿参数的模型给开发者带来了巨大的计算资源压力。传统的全参数微调方法不仅需要大量的计算资源，还面临着训练不稳定、容易过拟合等问题。

来自主题: AI技术研报

7617 点击 2025-01-16 10:48

全球首个ChatGPT爆炸案！AI教特种兵造炸弹，特朗普酒店遭自杀袭击

全球首起公开发现借助ChatGPT的犯罪事件，刚刚震惊全美。拉斯维加斯特朗普酒店外发生的Cybertruck爆炸案中，37岁嫌犯利用ChatGPT制造炸弹、查询信息。警方放出的资料显示，ChatGPT在这起案件中起到了重大作用。

来自主题: AI资讯

7719 点击 2025-01-09 15:41

时隔6年，谷歌BERT终于有替代品了！更快更准更长，还不炒作GenAI

真正有用的主力模型。

来自主题: AI技术研报

4629 点击 2025-01-05 21:44

时隔6年BERT升级！仅编码器架构没被杀死，更快更准确更长上下文

时隔6年，一度被认为濒死的“BERT”杀回来了——

来自主题: AI技术研报

5564 点击 2024-12-25 10:21

Mamba作者带斯坦福同学、导师创业，Cartesia获2700万美元种子轮融资

Mamba 这种状态空间模型（SSM）被认为是 Transformer 架构的有力挑战者。近段时间，相关研究成果接连不断。而就在不久前，Mamba 作者 Albert Gu 与 Karan Goel、Chris Ré、Arjun Desai、Brandon Yang 一起共同创立的 Cartesia 获得 2700 万美元种子轮融资。

来自主题: AI技术研报

8114 点击 2024-12-13 17:21

WebRTC创建者加入了OpenAI，他如何思考语音AI的未来？

WebRTC 的早期创建者之一，Fixie.ai 联合创始人兼 CTO Justin Uberti 近日宣布加入 OpenAI，领导实时 AI （Real-Time AI）项目的开发。

来自主题: AI资讯

5668 点击 2024-12-12 11:19

模型小，还高效！港大最新推荐系统EasyRec：零样本文本推荐能力超越OpenAI、Bert

EasyRec利用语言模型的语义理解能力和协同过滤技术，提升了在零样本学习场景下的推荐性能。通过整合用户和物品的文本描述，EasyRec能够生成高质量的语义嵌入，实现个性化且适应性强的推荐。

来自主题: AI技术研报

6641 点击 2024-08-28 15:21