一文详解:DeepSeek 第三天开源的 DeepGEMM
一文详解:DeepSeek 第三天开源的 DeepGEMMDeepSeek 开源周的第三天,带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1 的训练和推理提供强大支持,在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。
DeepSeek 开源周的第三天,带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1 的训练和推理提供强大支持,在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。
人工智能(AI)系统或将逃脱人类控制,欺骗人类,甚至给全人类带来灾难性的后果。
在科技界,快速崛起和巨额交易总是备受关注。本周,MongoDB 宣布以 2.2 亿美元的价格收购 Voyage AI——一家刚成立 17 个月、在嵌入(embedding)和重排序(reranking)模型领域处于行业领先地位的 AI 初创公司。
数据库公司 MongoDB Inc.宣布,将以 2.2 亿美元的现金加股票交易收购 Voyage AI,以加速其帮助客户构建人工智能驱动应用程序的能力。
2月18日,开为科技在南京举行重磅发布会,推出了全新的企业级AI Agent平台“Roles”,引来行业内外的密切关注。
由前百度高管 Eric Jing 和 Kay Zhu (之前分别是百度小度的 CEO 和 CTO)联合创立的 AI 搜索引擎 Genspark,在去年完成 6000 万美金种子轮后,据称已经完成了 1 亿美金的 A 轮融资。
随着AI工具越来越普及,类似Deep Researh这样的工具越来越好用,科学研究成果呈现爆炸式增长。以arXiv为例,仅2024年10月就收到超过24,000篇论文提交。
2月22日,中科闻歌2025 AI新产品线上发布会成功举办,升级发布“智川”企业智能体平台1.0与“优雅”音视频大模型平台1.5,助力政企极速落地AI应用与创意灵感,让AI技术精细化满足真实业务场景,加速AI普惠落地。
Clay 集成了75+ 数据提供商(如 LinkedIn、Clearbit、Salesforce),并内置 AI Agent 进行客户研究、销售数据充实和个性化营销。通过无代码/低代码方式,用户可以拖拽式操作进行数据整合、自动化外联和个性化营销,提高业务增长效率。
在人工智能高速发展的今天,我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设,它们看似合理,却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。