新范式来了!新能量模型打破Transformer++扩展上限,训练扩展率快35%
新范式来了!新能量模型打破Transformer++扩展上限,训练扩展率快35%是否可以在不依赖额外监督的前提下,仅通过无监督学习让模型学会思考? 答案有了。
是否可以在不依赖额外监督的前提下,仅通过无监督学习让模型学会思考? 答案有了。
硅谷挖角戏码升级!相比Meta3亿美元「血本挖角」,OpenAI来了波反向操作——选择培养人才,奥特曼悄然推进一个名为「驻留计划」(Residency Program)的项目。这个项目有何神秘之处?奥特曼的底气到底从何而来?
最近,一个完全由 AI 制作的广告在社交媒体上爆火,在 X 上有三十多万人观看。
新皮层独家获悉,具身智能公司星动纪元近期完成近5亿元A轮融资。这是该公司自2023年8月成立以来完成的第4轮融资,最近一次是去年10月近3亿元的Pre-A轮。本轮融资由鼎晖资本和海尔资本联合领投,厚雪资本、华映资本、襄禾资本、丰立智能等财务机构及产业资本跟投,老股东清流资本、清控基金等机构继续追加投资;华兴资本担任独家财务顾问。
华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:
三个前沿AI能融合成AGI吗?Sakana AI提出Multi-LLM AB-MCTS方法,整合o4-mini、Gemini-2.5-Pro与DeepSeek-R1-0528模型,在推理过程中动态协作,通过试错优化生成过程,有效融合群体AI智慧。
移动端侧模型迎来“新王”。
不要让AI成为「垃圾制造机」。 谁能想到,一个 AI 生成的视频竟然在 ins 上拿下 2.52 亿次浏览量,仅点赞就达到 325.7 万次。
大神Karpathy提出“软件3.0”才两周,“软件3.5”已经诞生了?交互即智能。指AI不再是黑盒工具,而是透明的思维伙伴。用户可以在AI思考的任何节点进行干预,提供战略指导或纠正方向。
这是一篇在GitHub上获得5.3k+星标的重要技术文档,其中蕴含的洞察值得每一位AI产品开发者深度思考。