DeepSeek改造何恺明残差连接!梁文峰亲自署名,十年首次重大升级
DeepSeek改造何恺明残差连接!梁文峰亲自署名,十年首次重大升级2026年新年第一天,DeepSeek上传新论文。给何恺明2016成名作ResNet中提出的深度学习基础组件“残差连接”来了一场新时代的升级。残差连接自2016年ResNet问世以来,一直是深度学习架构的基石。
2026年新年第一天,DeepSeek上传新论文。给何恺明2016成名作ResNet中提出的深度学习基础组件“残差连接”来了一场新时代的升级。残差连接自2016年ResNet问世以来,一直是深度学习架构的基石。
为什么AI算力霸主永远是英伟达?不算不知道,一算吓一跳:在英伟达平台每花一美元,获得的性能是AMD的15倍。
时隔七年,罗永浩重操「靠嘴吃饭」的旧业,举办了一场状况百出的年度科技春晚。 先是经典环节的直播迟到,重新定义了什么叫晚上 7 点,让我们白白看了近三十分钟广告,紧接着又是一场硬控 4 小时的「广告大会
据我们独家获悉,ListenHub产品的母公司MarsWave完成了200万美元天使+轮融资。本轮由天际资本领投,小米联合创始人王川跟投。同时,MarsWave也对外公布了盈利状况:目前公司年经常性收入(ARR)已突破300万美元,并达到月度盈亏平衡,成为少数已跑通盈利模型的AI原生公司。
2025年的最后一天,上市公司上纬新材董事长彭志辉(稚晖君)发布了一款能装进书包的机器人产品——上纬启元Q1。这是全球首款最小尺寸(0.8m)、实现全身力控的人形机器人,也是智元机器人联合创始人稚晖君担任上纬新材董事长以来,发布的首款具身智能机器人产品。
GetSeed要做的,是帮你从记录里长出新的认知。昨天晚上看了跨年演讲的同学,可能对我做的GetSeed AI录音卡有印象。没印象也没关系,今天这篇内容,我就和你详细讲讲这款AI产品的台前幕后,包括做产品过程中,我所有的思考和遇到的问题。
在 《我招了 6 个 AI 员工一起干活》 一文中,我介绍了如何招聘 6 个 AI 员工,并让他们在同一个工作间一起干活。招聘 AI 员工,我最希望他们帮我干的就是编程相关的活。在给他们具体的任务之前,先评估一下他们的能力。
当英伟达被曝出以20亿-30亿美元洽谈收购AI21 Labs,这是提前锁定「下一代AI主导权」,而不是一笔普通的技术并购。更让人吃惊的是,AI21 Labs全职员工规模约200人,折算下来,人均「身价」高达1000万至1500万美元,远高于大多数独角兽并购案例。
机器之心发布 随着 ChatGPT、Gemini、DeepSeek-V3、Kimi-K2 等主流大模型纷纷采用混合专家架构(Mixture-of-Experts, MoE)及专家并行策略(Expert
近日,来自伊利诺伊大学芝加哥分校、纽约大学、与蒙纳士大学的联合团队提出QuCo-RAG,首次跳出「从模型自己内部信号来评估不确定性」的思维定式,转而用预训练语料的客观统计来量化不确定性,
围绕这一挑战,上海人工智能实验室联合复旦大学、南京大学、南洋理工大学 S-Lab 等单位提出了 LongVie 2—— 一个能够生成长达 5 分钟高保真、可控视频的世界模型框架。
2026年,Scaling Law是否还能继续玩下去?对于这个问题,一篇来自DeepMind华人研究员的万字长文在社交网络火了:Scaling Law没死!算力依然就是正义,AGI才刚刚上路。
,时长 00:20 视频 1:单样例推理速度对比:SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)(注:NVIDIA 平台
独家获悉,月之暗面(Kimi)近期完成 5 亿美元 C 轮融资,IDG 领投 1.5 亿美元,阿里、腾讯、王慧文等老股东超额认购,投后估值 43 亿美元。据了解,王慧文已经累计投资月之暗面 7000 万美元。
MiniMax今起招股,作价461亿港元,拟募资超6亿美元。预计将于1月9日正式挂牌上市,代号00100。
最近,APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算,英伟达 DGX Spark;到手的第一感觉,就是「小而美」。这电脑也太小了,没有 Mac Studio 那般笨重,可能就和 Mac Mini 差不多大;然后是银色的亮和用来散热的金属丝网又让它有点不一样,是专属的硬核美感。
财大气粗的老黄,又要出手了!为了将200多位顶尖AI人才纳入麾下,英伟达被曝拟用20~30亿美金收购一家以色列AI初创公司。这家公司名为AI21 Labs,是以色列为数不多的自主研发大语言模型的公司,其联创还曾创办了明星自动驾驶公司Mobileye(Mobileye被收购后成了英特尔副总裁)。
硅谷三家实验室同时曝出:AI模型未经编程,就涌现出了绝对不该存在的全新能力!同时,Anthropic一位工程表示,自己的代码100%由Claude Code完成。空屋子里,已经出现脚印了?
马斯克“巨硬计划”新消息,第三栋专属厂房已经买下来了,代号MACROHARDRR。果然更硬核,老马透露,其将具备2GW供电规模。若参照此前曝光的(200MW支持11万台GB200)的功耗密度与架构效率推算,可支持约110万台英伟达GB200 NVL72 GPU。
你知道吗,DeepSeekTwitter、Mac、Qwen,最初都只是副项目?真正改变世界的产品,可能根本不在公司的PPT路线图上。
借势Agent浪潮,实时数据企业走上港股舞台。
2026年将至,ChatGPT发布三周年,但关于“AI瓶颈期”的焦虑正达到顶峰。
过去10年,AI大模型的技术本质,是把电力能源通过计算过程转化为可复用的智能。2026年,我们需要让AI模型在单位时间内「吃下」更多能源,并真正将其转化为智能。
AI手机的“灵魂”GUI智能体,就这么全套开源了。
数字孪生行业首家年收入超2.50亿港元的公司。
新加坡国立大学(NUS)的尤洋教授近期发表了一篇深度分析:《智能增长的瓶颈》。在这篇分析文章中,尤洋教授从技术本质出发,直指智能增长的核心矛盾,为我们揭示了 AGI(通用人工智能)的可能路径。
很多人可能不知道,我是 Trae 的老用户。
大家好,我是鲁工。 上周发布了一篇关于如何在Antigravity中组合Claude Opus 4.5和Gemini 3 Pro进行交叉验证的文章,读者反馈不错。
在生成式 AI 技术日新月异的背景下,合成语音的逼真度已达到真假难辨的水平,随之而来的语音欺诈与信息伪造风险也愈演愈烈。作为应对手段,语音鉴伪技术已成为信息安全领域的研究重心。
2025最后几天,是时候来看点年度宝藏论文了。