2025年,一场前所未有的智能海啸即将席卷全球。这不是危言耸听,而是基于大量研究得出的预判。这篇万字长文从生态、业态、技术、产品、企业五大维度,系统预测了2025年可能发生的50个重要变革。
一直坚持的新年预测大多得到印证,尤其去年命中率90%以上。2025继续。
《2024年的16个可能》,讲到我们同时处在四个周期的起点。而2025年的总体特征,可以用「确定性海啸、多领域临界点、AI自身范式转变、万物智能体、极化有反身性、亟需群体智能」这6点来概括。今天发表我经过持续预研所做出的新年预判:「2025年的50个可能」,分别从生态、业态、技术、产品、企业等五个角度展开。均为对可能发生之事的预判,不是对已发生之事的罗列。仅供参考。
非常确定2025年大模型应用进入大幅增长期,更重要的是:「确定性」本身进入临界点。确定水准已经局部可用甚至高可用,确定质疑的主要技术问题不是根本障碍,确定大模型并不是泡沫豪赌,确定必然能捧得AGI圣杯,确定算力和能源其实可持续,确定千行百业数十亿人必然广泛使用,确定AI2.0会从文本数据走向现实世界,确定投资-技术-产品-市场-应用的飞轮不仅可以闭环而且可以高效循坏,确定这是一个亿万价值的万亿产业……所有这些确定性,正在让事情发生新的化学反应,各方加力,本就风暴感和冲击波都十足的AI2.0变革在2025年必然加速,一场前所未有的巨大能量的迸发与冲击过程近在眼前。如果说30年前在中国发轫的互联网是技术大潮,2025年的AI2.0是扑面而来的科技海啸。其速度力度广度远超当初培育十多年才开始走上正轨的互联网。
人工智能从10个层面进入全方位生态竞争,新IT端边云网感算数智8要素成为全球化基础设施,以及全球化4.0秩序的重要基石。新IT G8企业首当其冲。参见我专文《六位两体的再全球化》和《新IT-G8》。
超级智能与超级平台合体,竞争门槛向百亿美金抬高,生态位优势与智能优势相互增强,促使智能力量快速极化,头部与长尾差别远大于互联网,企业与国家、社会及地缘政治关系发生改变,科技中心主义引起警觉。
后程乏力现象、长创新内力不足问题可能浮现,信心增强同时2025须关注可持续性,AI发展实质来自生态能力、生态现象而非单点突破。以生态创新为创新观进入视野。参见我专文《根问题-源认知-6基点:AI中国如何可持续发展》和《从一心炼丹到全生态竞争》。
经济景气、一级市场投资萎缩向产业深度传导,科创领域需警惕生态断层、负循环可能,资本金融闭环亟待打通,资本闭环是商业闭环不可或缺部分。
遍布二十多个领域的AI创作者经济全面崛起,与环境底色形成明显反差,成为搅动中国经济的活力热泉。参见我专文《创作者经济崛起:智客搅热中国经济,AI催生发展新活力》。
就业冲击转瞬逼近,AI确定是史上多次科技革命以来第一次造成的失业大于创造的就业的科技革命,软件业与程序员的痛苦,快速向其他人群逼近。冲击之下是否会出现生态失衡需要密切关注。参见我专文《智能革命快社会转型慢:人类智慧不能输给时间鸿沟》。
AI、机器人、汽车成为新一轮中国威胁论的三个靶点,同时也是送料焦点,围绕这三个领域的地缘角力最为胶着,高算力汽车SoC供应可能受限。
美对中可能从断点脱钩转向生态抑制,通过改变供应链与供求关系,使得产业链、科技生态无法形成良性的正向循环,以此限制中国科技产业升维发展能力。进口之外芯片出口可能承压。双体系成型,产业市场正向循环的临界点与大分流的分岔点同时到来。
并非基本政策取向发生改变,鼓励发展的同时,从税务、反内卷、反不正当竞争、反对滥用生态支配地位以及数据隐私等传统角度,治理可能加杠杆,规范产业市场规训企业行为,reset行业与其它行业各重关系。参见我专文《内卷真相:为什么平台热衷价格战以至于走向仅退款,商家却困在了流量里》、《比亚迪意欲何为》。此外,黑盒AI不是一个好的用户体验,从监管角度看,白盒AI是共同取向之一。
智能重塑出海,AI2.0赋能新出海,不仅提升科技含量与创新活力,且有助于告别资源成本价格外卷的传统扩张范式,重新定位出海新力量在全球产业链分工与供应链位置,但思维观念与文化精神重塑相对滞后,走出去的在地化生存发展之道仍需探索磨合。
各方完成对AI2.0信心确认,大模型在多类场景实现可用高可用,投资与应用市场均进入加速扩增临界点。放缓论、瓶颈论、泡沫论比以往任何时候都要大的时候, 头部企业信心、决心和力度比以往任何时候都要大。参见我专文《非常确定2025年大模型应用进入大幅增长期》、《大模型争议中的6点共识和趋向》。
移动端后发先至,实时语音自然交互体验成熟力促手机越过PC率先起飞,亿万用户高频使用,DAU-时长-UP值变化显著。
AI向实,To B角度微调、结合RAG与知识库等对开源模型效果改善显著,幻觉程度明显减轻,行业垂直场景付诸规模实用。
部分闭源大模型企业也会推出开源模型,开源模型的开源力度阶梯化,高阶模型开源力度收缩,To B市场、PC及移动端成为开源力量倍增器,开源活力不减。
算力军备竞赛企稳但不会明显放缓,国际头部企业算力基础设施投资金额在百亿美金以上。十万卡走向数十万卡,甚至百万卡架构也在准备中。国产算力成为国内采购主体,算力结构性过剩与不足同时存在,算力的总体利用率有待提高。
Scaling Law既未失效,也未放缓。LLM单位训练单位推理的算力消耗与成本均显著持续下降,但是多模态、视觉理解、空间智能的训练与推理,思维连长思考等深度推理对数据与算力的需求在急剧增长,基于现实感知的万物智能将导致算力与数据的指数级增长。数据枯竭从来都是伪命题,抛开合成数据,感知会打开数据新世界。参见我专文《不,Scaling Law不仅长期有效,而且世界才刚刚打开》、《AI革命是否失去动力,算力开始过剩了吗》。
市场集中度快速提高,全球市场主要向Google、OpenAI、Meta、Anthropic、xAI、五家集中,Apple会加速自有端云模型研发迭代;中国市场集中过程相对缓和,百度、字节、腾讯、阿里优势保持,华为会提速,月之暗面、智谱、幻方、科大讯飞、MiniMax、面壁、零一万物等可能寻求差异化发展,部分企业可能寻求生态联盟或重组合作,百川等继续转向垂直领域专业模型。小米、理想、荣耀等可能成为变局新势力。CV背景AI1.0企业切入AI2.0的,生态影响与能见度不高。
超级入口成型的同时,苹果税也重新引起注视。跨国公司穿透国家市场壁垒的全球化利器,可能因为生态内Apps与开发者等合作伙伴对超级入口的抗拒而变钝,通过Store抽税模式的移动生态基石可能动摇。应用场景面向超级入口全程贯通之际,平台与Apps可能开始构思动态实时的创新结算关系。但2025年这个时机略早。参见我专文《超级入口开始浮现》、《美WDC法官裁定Google违背反垄断法律,不是终局》。
固态电池、智能驾驶SoC 等相关问题会让各方意识到,中国新能源与智能汽车产业没有护城河问题可能浮现。参见我专文《中国电动车不是没有核心技术而是没有护城河》。未来产业市场领导力主要来自能源、智能、形态、生态四要素。四要素都还在迭代过程中。如果不能快速升维就会被降维打击。几年后采用磷酸铁锂、三元锂电池以及没有高阶智驾系统装车的二手新能源车继续大幅贬值,会是这个问题的注脚。汽车市场三个转换加速进行:消费力/性价比转换(消费在支出降级中需求升级),产品形态/产品力转换(能源跨越形态跨越级别跨越),品牌心态转换(造车新势力和国产车认可度上升)。也关注智能体与座舱的场景化反。国产车态势总体乐观。
数智人算力基点从1000TOPS向10000TOS长期演进,目前达到1000TOPS的只是极少数人,但个人智能设备生态与未来的算力关系已经隐约可见。参见我专文《一个人的算力未来能有多?》。每个人都会有自己的IC也就是智脑,智脑又会是每个人自己的CP。手机、电脑、智能体、AI助手等,都是智脑的一部分。智脑是人成为智慧人的基础,也是每个人成为超体个体的标配。
大模型底层原理升维成为头部核心玩家着力重点,模型成本效率提高是跟跑型企业的着力重点。模型素能提升是线性观察角度,模型原理变化背后是智能与世界关系的不断重构,以及智能本身的范式转移,原理产生原力。从长期演进角度看,LLM大语言模型是基座模型的第1范式,多模态基础模型MFM是第2范式,物理世界与科学模型是第3范式,融合现实模型是第4范式,自主智能模型是第5范式,真正的世界模型是第6范式,越往4、5、6越遥远。参见我专文《Ilya似乎困在了LLM里》、《原理之变:脉冲神经网络是方向吗》、《原力来自原理:AI图像原理之变的6个特征》、《模型原理是「AI的第一性原理」》。
进取型的和有实力的中国大模型提供商,会密切关注跟进KAN、SNN、Mamba、TTT、Lory、CLLM、LANISTR、RL4VLM、VLA、LCM、MLLMs、LWM等原理不同层面和技术架构不同方面的变化,而不是以量化、蒸馏等带来的算力与成本降低作为突破亮点,参见我专文《智能发展四象限》、《内场和外场,内卷和外卷》。
这一年引领型的前沿突破,将来自LWM之于空间智能、VLA之于智能驾驶、视觉理解之于具身智能、融合感知之于SICAS智能体的早期探索。感知理解、智能交互与行为能力是智能进化方向。参见我专文《从问答智能到行为智能,Pool是生发未来的新角度》、《现实感知来了,空间智能有了原生传感基础》。
站在每个最终用户角度响应需求、统合进程、达成任务的AI Agent在2025年必然大热,精调微调、模块化、个性定制、可自然交互的AI Agent是AI2.0所有产品服务的最后一米,也是每个用户辐射全网的智能半径,更是深度整合其它应用尤其是互联网服务并且OTT竞争对手形成超级入口的关键。从中长期看,AI Agent处于数字与现实交汇点这一战略要地。主要平台2025年在AI Agent方面必然重兵投入,快速演进产品,强力挤占市场。
但是2025年你不会看到哪怕一个真正的智能体,尽管从一开始智能体、AI Agent 就经常被混为一谈,且几乎所有AI Agent都被视为智能体。智能体在当下是个有名无实的伪概念,产品包装和营销鼓惑意味远大于实际能力本身,但未来智能体不是概念,而是最赫赫然的智能形态的主流存在。智能体将是包括AI Agent、数字机器人、实体机器人乃至万物智能场景下几乎所有智能设备的完整形态,甚至是终极形态。万物智能,实际指向万物智能体。当下几乎所有AI Agent都不符合智能体的基本特征和SICAS的行为能力模型。
无限代理是AI Agent与智能体的桥接,以通用基础模型中作为脑能力底座,以对物理世界和数字世界的理解为基础,以每个用户的个性化场景和需求为基础,进行持续交互、完成任务。但无限代理在实时感知、场景底层统合两个部分的缺陷,使其与成为数字智能体的目标依然有相当距离。
尽管不断有强烈冲击舆论视听的「新动作」,但是机器人2.0其实依然处于突破前夜,具身智能的基础要件与能力尚在形成过程当中,尤其人形机器人2025年销量见长但总量有限。四肢发达与小脑能力进步显著,但大脑能力依然有待深度进化,LLM局部高可用和视觉理解会带来短期增益,而具身智能的长期突破来自于智能体SICAS行为能力模型驱动下尤其在实时感知、智能交互这两个部分的进步。
实际上不会有一个统一的、时间刻度清晰的AGI时刻,AGI是分无数次到来的,有无数个AGI时刻。参见我专文《AGI过程》。不同能力、角度、模态、任务、学科、行业、智能体的AGI时刻是不同的。等待一个时间唯一目标唯一通用智能大模型唯一的AGI时刻,无异于守株待兔、刻舟求剑。2025年从不同应用所能达到的可用水准角度,非已知的新颖任务的测评得分在95分以上以及超过人类在该领域表现的,都可以称之为这个领域的AGI时刻。数学、编程最先可能达成这一目标。
专业模型、科学模型方面2025年将取得显著进展,金融、医疗、教育、法律等领域以及AI4S不同模型的纵深拓展,是卓有成效的一年。参见我专文《科学的范式转移正在真真切切发生》。相比人工智能,生物计算、脑机接口、量子计算不断有新的亮点,但整体进展其实比较缓慢。
能源角度,美国重启核能的同时发展小型核能供电站,中国局部考虑结构性过剩的风能、太阳能电力资源的合理配置和就地消纳,但储能调峰的成本效率问题一时难解。
中国市场新能源上市新车中L2及以上智能辅助驾驶系统装配率可能达到80%,新车中纯电-增程-混动等新能源车总占比年度峰值可能达到60%-70%,但L3能力成为年度发展重点,以及用户购车重点考虑因素,AEB响应范围和成功率不够高的短板问题亟待解决,与智驾系统深度整合势在必然;所有AEB实际达不到车规级标准的L3都是伪L3。参见我专文《用户和车企需要认知对齐》。
AI Glass2025年会火,百镜大战端倪初现,销量达到智能手表早期水平。带简单非AR显示的AI Glass价格低销量占比高,有AR显示的AI+AR的AIR Glass价格高数量少销量占比低。Apple Atlas、Meta Orion等高成本AIR Glass难以正常面市。2025年看到的绝大部分产品会有过渡形态的感觉,但对形成一个可售卖可用产品来说已经基本够了。添加简单显示的Ray-Ban改款和基于M4或M5芯片的AVP改款,体验会有明显改善。参见我专文《2025年AIR Glass的20个信号》和《AIR Glass才是智能眼镜的主力方向》、《AIxAR=AIR》。
手机这个传统物种的用户体验与获得感的改变,2025年反倒可能是比较显著的一年。从高通、荣耀、华为、Vivo、联发科、小米包括ARM等企业的最新动作及苹果相关传闻来看,2025年会是智能手机大年,且有多场热战。AI显而易见是第一战场,超级入口又是AI的第一战场,而语音自然交互的「嘴控」又是超级入口的第一战场,目前大多只是类似新Siri而不是充分贯通了Apps的至少OpenAI的AVM水准的初体验,豆包这方面体验较好。AI操作系统,端侧智能,NPU或者多元异构意义上的AI算力,是基础,SoC走向PC级。强智能在C端的引爆从手机等移动设备开始。手机AI之争,从拼AI核心能力开始,未来以拼生态能力决胜。但明年这场热战,不只战AI,影像、跨屏、场景、折叠屏尤其三折叠也是焦点。个人认为没有多张合成图片Raw,没有15+视频动态范围,没有Log或视频Raw,没有到位的专业模式,没有高画质4K120P,没有相当于10倍光学变焦的远摄,不能算是影像真旗舰。手机形态逐步变化,会变到用户对手机甚至会有新物种一般的「焕新」感觉。
AI2.0智能场景的极大拓展,来自手机无需改装直连卫星上网,2025年是手机卫星互联网元年(不是卫星互联网元年)。参见我专文《手机卫星互联网元年来了》、《卫星互联网全球提速,中国进展到了哪一步》、《黑科技》书中卫星互联网篇章。从卫星短讯、卫星电话到卫星上网,手机上星三年三级跳。不止Starlink一家对此有布局,但华为等中国企业还在测试或测试准备阶段,初步达到组网标准的需要比萨天线的卫星上网。手机卫星互联网星座组网势在必行。智能终端与卫星之间的应用场景爆破,卫星导航、卫星短讯、卫星电话做不到,而智能手机直连卫星上网可以。
智能汽车SoC算力走向2000-3000TOPS,1000TOPS只是端到端走向VLA之际真正可用的L3的算力起跳点。汽车算力复用给个人和家庭作为算力基地,将与其移动能源中心功能一样重要。参见我专文《机器人四重奏:Musk-Tesla-市场-生态在四个节奏上》。PC盒子化、盒子Mini化的尽头是算力颗粒化。移动SoC算力已在走向口袋级PC。口袋里的AI CP(不是AI PC)不断逼近现实。但用户不会揣个盒子满世界跑,Mini还是桌面场景,且相对而言只是中等性能产品。个人计算的未来形态会是「算力移动便携+算力复用网络+云端算力」,在个人算力网、家庭算力网基础上,智驾汽车的上千TOPS级别的SoC成为个人-家庭可用算力。
OS的AI化与AI向OS进化,成为AI OS相向而行的两条路径。AI OS驱动的手机和PC带来前所未有的体验。这方面个人重点关注荣耀和iPhone,后者目前水准体验50多分,到2025年底提升到六七十分有可能。参见我专文《值得为Apple Intelligence上手iPhone16吗》、《Apple Intelligence的6个确定和6个不确定》。
200B也就是两千亿参数以上大模型在消费级单台AI PC实现可运行(量化程度过大的不算),但2025年可能仅限于顶配的M4 Ultra芯片的Mac Studio能做到这一点。参见我专文《100B以内开源大模型个人可用了》、《1230亿参数大模型上身》。
ASIC架构芯片在推理市场主流地位进一步确认,AI2.0得到信心确认AI应用急速扩增拉动推理算力需求相关投资显著增长是一方面原因,需求规模大增显著摊薄ASIC芯片迭代成本是另一方面原因,后者使得研发换代成本与算力效率一样高的短板不再成为制约因素。这是博通等ASIC架构服务商受到关注的根本原因。有AI算力中心、云计算平台、数据中心等业务的头部企业,都自研或委托研发设计了自己的ASIC芯片,TPU、MTIA、Maia、Inferentia2等,没有的也正在准备的路上。
Web3.0的发展会成为AI2.0的共生现象,可以理解为智能世界的要素网络、生产关系和组织结缔,区块链是基础设施里的基础协议,未来是合约型社会。参见我专文《比特币站上10万美元见证历史,6点看法》。如果数字加密货币角度的局部流动接口不可能,可能需要对Web3.0或者数字金融角度的某种特区或者实验区进行早期思路探索。这方面不是大方向毫无必要,而是专割韭菜的老鼠屎太多了。
大模型演进的标杆方向,2025年可能主要还是要看o3、LCM和LWM。尤其是比o1的思维链长思考又更进一步的o3的深度推理,虽然需要消耗数十倍的算力,也需要更长的等待时间。o1 Pro的等待时间已达到几分钟之久。参见我专文《草莓意味:当AI开始思考》。o3在ARC-AGI测试中的水准大幅跃升,可能来自三个方面的进步:一是建立了比思维链更具整体感和动态调适能力的理解力(反过来支持和强化思维链),二是为每一项任务生成任务程序并且动态调适的能力(而不仅仅是思维链),三是思考与监督思考的能力,且机制和过程都更为复杂(而不是Mike Knoop所谓搜索)。三项能力叠加,解决未曾学习过的新问题的能力有了明显进步,不过依然远不足以达到解决传统问题所能达到的阈值,但开启的架构方向,其意义和潜力是当年AlexNet级别的。对此,平面思维会认为是思维链的进化,立体思维会认为是出现了比思维链更高维的整体思考能力。具象一点比喻大模型基座的脑能力进化,是一个「点线面体」逐步形成的过程。点是Token预测等,线是思维链等,面是皮层计算等,体是整体思维。而脑中的元,从Token置换为Patch或其它表征,是DiT-ViT-LCM-LWM们正在干的事,其实质是走出LLM,走出语言符号知识系统这个框,走出人类知识-经验-方法-思维-感知的限制,对世界的感知理解回到现实本身。
新原理范式:年度关注企业,首先是李飞飞的World Labs及其LWM大世界模型。虽然不是真正的世界模型,但她又一次引领了「让未来发生」意义上的前沿探索,和辛顿在不同层面。World Labs对空间智能的探索不应只是被理解为3D视频生成,而是走出基座模型的第二范式,探索第3范式在理解物理世界角度的早期雏形。理解世界从视觉理解、时空智能开始。相比传统物理引擎,走向无形之形,才可能极大拓展泛化边界,并且长期而言反倒比目前图形工作站物理引擎建模、粒子渲染之类的做法更高效甚至也更节省算力。理解4D时空世界方面DiT、ViT比纯Transformer的LLM走得更远,Veo比Sora走得更远,LWM比MLLMs走得更远。如此不断迭代,走出语言符号知识系统,深感物理世界,融合虚拟与现实,才可能涌现不是物理引擎的物理引擎。如果人类可解释可方程可计算可建模然后AI才能够如法炮制,便失去了智能涌现的意义,也失去了涌现的可能。先有世界后有感知与数据然后有理解,且有底律也是基于理解反向发现一些底律,这也是AI4S科学新范式的重要特征。参见我专文《突破预设进入发现与创造新范式是AI的实质意义》、《世界模拟器才是AGI终局,12态势预测》。
关注Google,最有可能2025年在某个重要领域超越OpenAI的企业,实际上Veo2已经超越了Sora。但搜索将是2025年受到AI最大冲击的业务,搜索巨头会不会被翻盘有悬念。
关注微软,因为超级智能与超级平台合体最有可能在2025年进一步引起平台滥用支配地位、垄断角度问题的企业。
关注字节,AI、算法、流量生态而不是TikTok角度,字节或许是2025年最有可能同时面临较大内部外部压力的企业,豆包能不能从移动端颠覆竞争对手的市场地位也值得持续观察。
关注宇树,全网刷屏的四足四轮机器狗产品B2-W已经可以飞檐走壁了,但我们更想了解其大脑能做到什么水准。我即将参加的CES2024,估计还是人型、四足、家庭、服务、物流机器人最吸睛,不过翻跟头、拿东西之类的动作表演,已经不应该是今年的重点了。参见专文《CES2025我重点关注这8类产品技术》、《走向第二曲线:未来渐次发生,为何依然需要重新想像》。
关注理想、小鹏、蔚来和华为,在向端到端、大模型上车过程中,谁的智能驾驶系统会表现出更高素能,谁率先做出真正的L3+,谁又会吹牛说自己率先实现了L4,谁能将大模型的水准提升到现实理解而不仅仅是行车视觉理解的维度。对于类似Transformer+BEV的FSD V13的架构来说,L3甚至L3+已经触手可及,努努力大家都能做到。参见我专文《L3熟了,就在今年,但12个信号之外可能还有意外》。所以这个阶段忽然出现一个情况,大家都有机会,并不是非得用华为不可。但是到L4可能就不好说了,一是场景可能性无限放大,法规与社会对安全系数的严苛度必然比L3高出不少,合格的系统和过不了关的系统,安全系数可能零点几的差别。不过到L4不仅技术还远,公共政策距离也不近。2025年,公共道路对自动驾驶的开放幅度必然有限。参见我专文《Waymo加速进入「奇点」,自动驾驶的中国节奏不可滞后》。汽车的智能这个部分,会垂直统合还是横向产业分层,目前实质上处在这样一个十字路口。最终可能还是术业有专攻,一个企业做不了也做不好全部。
关注敢于做产品形态新物种的企业,关注奇瑞劲云、起亚PV5、小鹏陆地航母这些新物种。不过低空经济雷声大雨点小,阻力比决心大,想法比办法多,尤其新能源载人飞行器可能会面临入市不畅局面。
关注阿里云及其千问而不是幻方DeepSeek。包括Mistral和llama在内,个人一直逢开源大模型必赞,但DeepSeek成本效率就像机器人的四肢发达一样不是个人重点关注方向,用已有模型反刍的数据投喂自己的模型,水准不可能超越已有模型。更深层原因我做过专文分析,大模型现在是两条曲线交织的双螺旋进化。向上走的曲线,追求整理感知理解行为能力的通用智能,拼整体理解意义上的脑能力,思考和监督思考,视觉在内的整体理解,空间智能等现实模型,物理等科学模型,多模态更不在话下。思维链、皮层计算、不同模型原理探索是当下前沿探索的核心。向下走的曲线,提升数据质量,训练意义上的量效比,算力能效比,大幅降低推理成本。这个领域有捷径但没有弯道超车,有后发成本优势但没有后发领先优势,AGI路线更是只能取巧没有投机。向上曲线的模型思考长度速度整体度、多模态、感知思考与行为能力合一等方向,只可能将算力需求拉升到新高度。向下曲线对成本效率有改变,但对捧得AGI圣杯的贡献可以忽略。参见《为什么DeepSeek-V3的火爆不宜过高评价》、《我提出了一个「量效比」的概念》、《大模型发展四定律之下:闭源和开源模型未来谁会更领先》。此处不再赘述。开源大模型接下来也考验生态内力、后程发力。希望国产开源大模型,接下来在多模态、语音交互、视觉理解、空间智能等方面也能持续跟上。
关注xAI,希望有后来巨上的奇迹,能够以开源同时改变开源和闭源竞争格局,尽管概率貌似不大。关注英伟达,AI设计AI芯片的阶段都到来了,英伟达的挑战者还是没有出现?AMD、博通只是不同角度的平替,挑战不了地位,更挑战不了英伟达从硬件到软件从训练推理到智能汽车和机器人等全线SoC布局。但AI芯片的投资热度还在持续,Groq挑战英伟达没戏,不影响十几个Cerebras迎面而来。参见我专文《世界需要下下下一个英伟达》、《越来越有挑战者出现的意味,只是还不够清晰》、《长创新:英伟达登顶的底层逻辑,让我们看清什么》。
关注Meta和Apple,希望llama4能有惊喜,Orion能有公开市场销售版而不是只提供给极少数开发者,希望Apple Atlas远比AVP惊艳,当然AVP赶快更新一下也好。
通过「2025年智能世界的50个可能」,我们对AI2.0的生态、业态、技术、产品、企业进行了一次全景观察和系统预判。但是这世界还有比AI更重要的事,那就是人类群体智能——人类如何面对这场已然来临的确定性海啸,如何面对人工智能科技革命对各个领域的冲击,比人工智能更重要的人类的集体智慧在哪里。
AI确定是史上多次科技革命以来第一次造成的失业大于创造的就业的科技革命。我转发《新智元》文章时分享在朋友圈的这一观点,清华大学教授沈阳看到后,用一分钟瞬时增强模式了一篇AI评论。关键问题提炼得非常精准,尤其快与慢的结构性矛盾,AI比人看得更清楚。
有问题的不是科技革命,而是科技革命与社会转型之间巨大的时间差。仅就快与慢这一点,可能就足以掀翻桌子并且没有足够时间去互相理论。历史上哪一次由科技而社会的革命不是惊心动魄?!所以发展要有科技创新意识,治理要有市场经济意识,商业要有社会生态意识。只盯着自己眼前事,历史只会重复,且此题无解。
走向奇点一定程度上也是走向沸点。全球化重塑、国际关系重构、经济竞争与下行挑战、地缘冲突、种族与文化矛盾等,与IT、AI生态化反,成为可能导致熵增的「加热器」。人类社会如同持续加热的能量体,能量生态里的温度与个体能级不断升高,个体与群体都更为活跃。传统组织、秩序、规则、关系越来越不适应,「社会容器」承载和容纳社会活动的有效性面临考验。
对这场变革,可能需要有更充分的预期和心理准备。面对确定性海啸,如何行稳致远?五种力量影响走向,一是智能科技的创新发展原力,二是企业的觉(悟)力,三是国际国内治理规则的约束和推动力,四是需求引力,五是个人和舆论出于权益保护而对智能及相关企业施加的压力。未来的深处,这五种力量都需要有科技「新三观」,创新未来观、科技价值观和智能发展观。新三观需要以人为本。以人为本的智能发展,需要处理好AI时代的10大关系 1.发展与规范的关系:.加速与对齐的关系:3.集中与分布的关系:4.数据与隐私的关系:5.开放合作与生态保护的关系;6.彼此竞争与共同发展之间的关系;7.智能科技与传统产业之间的关系;8.效率与公平的关系;9.技治与政治的关系;10.科技与伦理道德的关系。参见我专文《辛顿之忧:拿什么面对加速变革的动荡未来》、《人类群体智能比人工智能问题更紧要》、《超级智能的9个奥本海默时刻》。
以人为本的群体智慧有助于实现智能普慧,让AI成为互利共赢的科技变革,让这场确定性海啸成为不会熵增的共同发展。
胡延平,IT前沿创新与智能科技产业研究专家。
《全球创新前沿科技地图》及相关研究项目主导者。历任《互联网周刊》总编、中国互联网协会交流发展中心主任等媒体与行业机构职务,曾创始DCCI互联网数据中心与未来智库等。Futurelabs未来实验室等多个智库首席专家或专家。信息社会50人论坛成员。《数字蓝皮书》等书作者、《黑科技》等书共同作者。
持续多年对科技前沿、产业经济、硬件与软件产品技术服务等进行统合研究,实现宏观趋势洞察、中观研究分析、微观数据模型的有机结合。创立SICAS等多个得到广泛使用的研究模型 ,提出新IT第四产业等多个新概念,发表多篇相关文章。
文章来自于“新智元”,作者“编辑部、HYZ”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales