AI资讯新闻榜单内容搜索-训练

GPT-5被5万张H100卡脖子！Altman急筹数十亿美元，欲取代英伟达建起AI芯片帝国

最近，外媒曝出Sam Altman正计划筹集数十亿美元，为OpenAI建起全球性的半导体晶圆厂网络。GPT-5训练严重缺芯，OpenAI誓不让英伟达掌握主动权，干脆自己做新的AI芯片霸主？

来自主题: AI资讯

4054 点击 2024-01-22 15:19

“AI学会欺骗，人类完蛋了”？看完Anthropic的论文，我发现根本不是这回事啊

AGI若到来，人类是否会受到威胁，是一个大众热衷讨论同时研究者们也很关注的问题，从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。

来自主题: AI资讯

8548 点击 2024-01-22 11:05

五位清华教授团建！从复杂推理到算力瓶颈，他们眼中“通用人工智能” 该如何降临？

要真正的实现AGI的话，需要有强大的模型和数量庞大且高质量的数据、可扩展的基础训练以及符号化的方法。

来自主题: AI资讯

10939 点击 2024-01-21 14:38

普林斯顿博士生高天宇指令微调进展速览：数据、算法和评估

自 ChatGPT 等大型语言模型推出以来，为了提升模型效果，各种指令微调方法陆续被提出。本文中，普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展，包括数据、算法和评估等。

来自主题: AI技术研报

8397 点击 2024-01-21 14:14

AI看视频自动找“高能时刻”｜字节&中科院自动化所@AAAI 2024

字节跳动联合中科院自动化研究所提出新方法，用AI快速检测出视频中的高光片段，对输入视频的长度以及期望提取的高光长度都具有极高的灵活性，相关论文已被AAAI 2024收录。

来自主题: AI资讯

6134 点击 2024-01-21 14:02

被OpenAI、Mistral AI带火的MoE是怎么回事？一文贯通专家混合架构部署

本文将介绍 MoE 的构建模块、训练方法以及在使用它们进行推理时需要考虑的权衡因素。

来自主题: AI技术研报

10365 点击 2024-01-20 15:16

一张照片，为深度学习巨头们定制人像图片

主题驱动的文本到图像生成，通常需要在多张包含该主题（如人物、风格）的数据集上进行训练，这类方法中的代表工作包括 DreamBooth、Textual Inversion、LoRAs 等，但这类方案因为需要更新整个网络或较长时间的定制化训练，往往无法很有效地兼容社区已有的模型，并无法在真实场景中快速且低成本应用。

来自主题: AI技术研报

11135 点击 2024-01-20 14:53