ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
大模型火了一年半,AI还在「钻木取火」?
5969点击    2024-06-25 09:33

伴随着AI大模型的新一轮进化,这个夏天,人工智能正在引领一波新的热潮。


美国当地时间6月18日,AI大模型的主要显卡芯片供应商英伟达收涨3.51%,市值升至3.34万亿美元,一度超越微软和苹果等科技巨头,成为全球市值最高的上市企业。从2022年11月末ChatGPT发布算起,英伟达市值已上涨9倍以上。


5月至今两个月以来,围绕AI大模型,一个月内十几场发布会,每一场都极具科技含量:国际市场,AI2.0时代的开创者OpenAI公司公布了ChatGPT-4o,AI大模型概念的提出者谷歌,以及微软、Facebook母公司Meta,都有新发布;6月11日,苹果推出Apple Intelligence,其缩写还恰好与AI一模一样。在中国,从腾讯、阿里巴巴到字节跳动,也进行了新发布。


这十几场发布会,每一场都极具科技含量。梦幻的场景,激昂的演讲,全世界的倾听。


然而,人们兴奋着,也失望着。


兴奋的是,重要性堪比电的发明,对人类影响可能比互联网、移动互联网更大的AI,依然在进化、突破,快速接近着人类智能。失望的是,被寄予厚望的AI大模型离期望值依然较远,其应用水平仍在人类初级助手里打转。


或许,是时候冷静盘点一下AI大模型了。


作为经常用来与AI类比的互联网和移动互联网,起码应该具备三个特点:一是拥有海量的大众用户,二是在企业端、政府端被广泛应用,三是成为社会基础设施并带来极大的经济效率提升。更直观地看,互联网、移动互联网都催生了经济新形态,产生了微软、谷歌、亚马逊、苹果、腾讯、阿里巴巴、百度和华为等现象级科技企业,数十亿的现代人接受着这些科技巨头的服务。


从以上三个角度看,从2022年11月30日ChatGPT发布至今,AI大模型在爆火并持续进化一年半之后,其应用水平或者说被接受程度远未达预期,只能说还在发展初期。最为用户接受的ChatGPT,其日活量在尝鲜期过后,下降较快。业内公认的是,迄今为止,没有任何一款AI大模型的应用或产品的使用能达到流行的移动应用水平。



有悲观的业界声音开始发出,代表着AI2.0时代开启的AI大模型,或许依然不会带来真正的AI爆发,这有可能就像十多年前计算机视觉潮(同为AI技术潮)一样,潮来,也将潮去。要迎来比肩互联网和移动互联网的AI爆发,人类或许还需要等待更多时间。


近日,蚂蚁集团 CTO 何征宇的“钻木取火”观点在业内广为流传。他在蚂蚁技术日上公开表示:AI发展目前还处于钻木取火阶段,尽管我们能够利用AI技术,但还没有找到最高效办法,仍然没有找到AI的本质。


这并非危言耸听,事实上,创造了AI大模型Transformer架构的谷歌,其CEO桑达尔·皮查伊近日受访时也表示:AI浪潮仍处于早期阶段。在本轮AI热潮中再次创业的李开复也表示“感觉AI发展仍处早期”。


当然,更多AI领域专家认为,即使AI大模型不是AI爆发的终级形态,但它带来的数字化浪潮和潜力,依然具有想象力。


“AI对于人类来说,一定是和人类发明了电一样的级别。AI大模型,一年前我曾认为它拥有和互联网、移动互联网一样的级别,现在觉得当时有些乐观了。但是,AI大模型依然代表迄今AI技术发展的最高点,只不过我们需要回归理性去看待它。让大模型做它能做到的,让它进步化得更智能、更有用,它依然具有很大的空间。”第四范式总裁胡时伟的话,具有代表性。


1 杀手级AI爆款应用并没有出现


全世界一直在思考,互联网、移动互联网之后,下一个对人类产生划时代影响的技术是什么?大数据、云计算、区块链、元宇宙、人工智能AI都曾在候选名单之中。AI就是近年的新晋胜者,几乎获得科技界一致认同。


“我认为,人类未来回望历史,AI技术的地位一定是超过互联网和移动互联网的。互联网没有智能,AI可以产生类似人的智能这一点已经被确认,因此它为人类带来变革的想像空间更大。”这是一位资深行业研究者的话,在《凤凰周刊》记者的采访中,被其他受访对象广泛认同。


在深入讨论AI之前,可以略回顾一下互联网和移动互联网给人类带来的改变。


互联网和计算机一起,给人类带来了第三次工业革命即信息革命。互联网诞生至今50多年,几乎完成了全世界普及,给全球绝大部分个人、企业和政府机关的生活、生产和运行,带来了几何级别的便利。以微软为代表的大量专业软件系统供应商崛起,谷歌、亚马逊等搜索类、电商类企业崛起。


将移动通信和互联网二者结合起来的移动互联网,在2010年前后与智能手机结合,迎来爆发。在不到10年的时间内,移动互联网对全球大部分个人完成覆盖,大量企业和政府端为完成To C服务,进行了移动互联网变革。在中国,大部分60岁以上老人近年也成为智能手机用户。


全球范围内,崛起于互联网时期的科技企业,几乎全部利用移互技术进行升级,新出现了Facebook、YouTube、微信、抖音、淘宝等10亿级用户移动应用。移动互联网还催生了移动支付、共享经济、数字政务等,初步带来便捷的数字生活、生产方式。



AI技术的提出时间在1956年,甚至比互联网诞生的1969年都要早13年。长期以来,AI都是一门被认为重要但难得其法去使用的技术。


2013年至2017年,第一轮AI技术热潮——计算机视觉热潮掀起。在这轮热潮中,2016年,谷歌的AlphaGo成为第一个战胜围棋世界冠军的人工智能机器人,我国的“AI四小龙”——依图、商汤、云从、旷视诞生。但该轮热潮最终未能带来AI的爆发,大量资本投资失利,大量创业者艰难维持。


2022年11月30日,ChatGPT横空出世,基于Transformer架构的AI大模型自此被捧为AI技术的新未来。


人类通过20余年的继承式学习,才能具有一项或多项专有技能,胜任生活中各种角色,而人工智能则通过数月甚至更短时间的数据训练,拥有比人高得多的技能甚至是智能。


ChatGPT引发的震憾则是全方位的,机器通过类似人的神经网络一样的学习方式,将所见、所听、所看结合既有数据、记忆,在瞬间进行成千上万的并行计算,再以文本、图表、语音、视频等方式表达出来。似乎,人之所以为人的知、情、意,人工智能除了情、意之外,在认知的数量方面超过和辗压人类,质量方面正无限接近人,甚至是超过多数人。


至今,全球大多数科技企业均涉足AI大模型发展和训练,作为科技领先国家的美国和中国,更是各自诞生数百个大模型。这被形象地称为“百模大战”,甚至“千模大战”。


大量的资本冲向AI领域,席卷全球的AI热潮再次涌起。一年半的喧闹之后,人们暮然回首,与投资端的喧闹相比,市场对AI大模型的热情,还远远不及互联网、移动互联网。


除了训练AI大模型需要巨量GPU芯片,因此将芯片企业英伟达一度送上全美市值第一宝座外,这轮热潮下还没有诞生新的科技巨头。全球最好的AI大模型ChatGPT的日活至今只有数千万,国内大模型应用虽然均呈现向好态势,但C端日活和B端尝鲜者数量均不理想。


至今,全行业都在追问:杀手级、现象级或者说爆款AI应用,何时会出现?简单的问题,直击灵魂。业内回答,乐观者说1年内,中观者说2至3年,悲观者说“无法预计”。


6月13日,北京智源人工智能研究院院长王仲远接受媒体群访时说,回顾移动互联网时代或更早期的技术革命,每次新技术的出现都需要一定的周期,包括技术能力的提升、成本的降低以及硬件的支持。当这些条件具备时,能够解决真实用户需求的C端爆款应用才会出现。“因此,对于C端爆款应用,我们还需保持一定的耐心。未来,我们可能会先从B端看到非常好用的工具,然后C端应用会逐步出现。”


2 AI大模型峥嵘初显


尽管可以说AI至今还不能与互联网、移动互联网的技术地位类比,但谁也没法否认AI大模型带来的数字化潜力。“人工智能+”的时代,确实是到来了。


市场研究机构Gartner分析师张桐告诉《凤凰周刊》:“近期的AI领域一系列发布,还是带来了一些惊喜。一是在多模态方面进步巨大,OpenAI、谷歌、微软的最新发布,均强调了处理图像、语音的多模态能力,这与之前主要在文本处理方面的进步,有显著区别,十分关键。二是中国各家企业的AI大模型发布,显示的技术进步程度表明中国没有被美国明显拉开。”他特意提到了美国斯坦福大学AI团队被证实套壳抄袭国内清华与面壁智能团队的AI大模型。


从中国老百姓的角度,也可以从多个方面感受到AI大模型的扑面春风。


首先,我们熟悉的各类应用APP,正在被AI入驻甚至“爆改”。百度搜索关键词的结果,第一条不再是互联网广告或百度词条,而是文心一言大模型给出的智能回答。微信也嵌入了元宝小程序,用户可以进行AI搜索、文档总结、AI作图等应用。淘宝的“淘宝问问”可以用语言方式与用户交互并推荐商品。金融应用支付宝,只要下拉首页,就可以领取并使用AI金融助理、生活助理。


多位业内人士认为,虽然将AI大模型应用于传统APP只是大模型比较简单的初步应用,但这种趋势将继续,并且逐步向深度应用发展。这对公众直观认识AI大模型还是较为有用。


第二个变化是AI大模型正成为人们的工作和生活助手。文本能力方面,AI大模型能力进化最大,已达到上下文数百万至1000万汉字的水平。因此,多数大模型应对文本、文档、书籍的要点总结,简单文章生成和PPT制作等,已显得轻松。音频转文本、视频生成等多模态能力,已让短视频创作的效率明显提高。


第三个变化是AI大模型开始入驻手机。6月11日,苹果2024年全球开发者大会宣布苹果智能(Apple Intelligence)系统适用于iPhone、iPad和Mac等操作系统。会后产生了民间新梗“Siri终于成了人工智能,不再是人工智障了”。苹果AI发布,使世界大致感知到了AI大模型手机的雏形,AI获得类操作系统的权限,可以跨APP调用、统合信息,包括通讯录等隐私信息,最终可以告知你“我太太的航班几点降落”。



瑞银近期的一项预测是,生成式AI智能手机将从2023年的5000万部稳步增长,至2027年将达到5.83亿部,且到2027年收入或达5130亿美元。


下一步AI大模型场景或是汽车。4月,一年一度的北京车展举行,展会的最大亮点并不是117款新车型全球首发,而是AI大模型“上车”。据不完全统计,已有20家左右的汽车品牌宣布AI大模型正式“上车”。


未来,AI上车后大致的场景是:司机可以用自然语言与汽车进行交互,如“打开一半的右边窗户”“空调开到23度”,还可以问“现在堵车的原因是什么”。当然,也要预防坏人提出的“打开车门”要求。


3 千行百业尝鲜AI大模型


今年4月初,阿里巴巴宣布入职一位“AI员工”——程序员通义灵码,其将担任阿里云代码助理,它具备扎实编程基础和200多种编程语言技能,可优化代码、生成测试框架和用例,提高工作效率。它也背了阿里的KPI:未来20%阿里云代码将由其编写。


事实上,AI员工现象,已是全球科技企业常态。高度规则化的程序编写,正是AI大模型最擅长的工作之一。


通义成为阿里云001号AI员工 图/阿里云官微


AI客服是当前行业公认的最适合落地AI大模型的领域。近年第一代智能客服是生活中的槽点,相声、小品、脱口秀中诞生了大量的梗,我们不少人也对其狂喊过“请转人工”。AI大模型加持的智能客服显然会更加智慧,在猜你想问、推你所推方面会更加精准。


值得一提的是,随着数字经济的推进,发达国家、地区以及我国近年的各行各业均在主动或被动地推进数字化进程。AI大模型的出现,客观上对这一进程起着巨大助力作用。例如,阿里巴巴官方资料显示,其大模型已经在汽车、航空、天文、矿业、教育、医疗等行业落地,解决各行各业实际面临的具体问题。例如,在重工业领域,一汽集团联合阿里云打造了汽车行业首个大模型BI应用——GPT-X,通过智能化数据治理和商业分析能力,助力一汽提升决策效率。


王仲远认为,2023年之后,人工智能逐步进入通用人工智能时代,其最大的特点是泛化性、通用性和跨领域的特性,这将影响所有行业。一些行业受到的影响会更快,比如大模型在生成摘要方面效果非常好,因此对所有与文书相关的工作、文案处理等效率提升作用显著。再比如,当前的文生图、文生视频技术,虽然还处于早期阶段,但都是提升效率的工具。“只要与这些能力相关,各行各业都会受益,并且未来会不断出现好用的工具。”


业内专家同时普遍认为,目前AI大模型在大量行业的应用,还处于初级阶段,还不够智能。“可以起到一些效率提升作用,是智能助手,但带来革命性变化,还谈不上。”张桐说。


4 AI爆发或需更多等待


业内的一个共识是,从各方面看,AI技术可能已经接近首次爆发。但无法排除的可能是,AI也有可能需要一个更长的周期才能迎来爆发。


无论如何,有几个现实是AI大模型当前发展不容回避的。


首先,AI大模型十分烧芯片、烧数据,甚至烧电力。每一个大模型动辄需要上万块英伟达GPU,每块价值1万至1.5万美元以上。每次训练还需要规模达百亿、千亿级TOKEN的数据物料,无论英文数据物料还是中文数据物料,现有物料都难以接续。


很难想象,大模型的耗电量会成为能源专家的最新关注点。训练Open AI的GPT-3模型耗电量相当于120个美国家庭一年的用电量。在这背后,大模型的CPU(中央处理器)和GPU(图形处理器)等硬件在执行复杂计算时会消耗大量电力,同时大模型所需巨大内存带来的读写操作,同样需要电力。“这样集中、持续、稳定供应电力的地方并不好找,在这方面,中国的电力基础设施将比美国更容易支持本国的AI大模型发展。”张桐说。


相比动辄数十亿级别的投入,AI大模型带来的收入还十分有限,甚至暂时可以忽略。



其次,AI大模型还有“硬伤”,即不够靠谱的问题仍然没有解决。虽然大部分时候,AI大模型的推理和判断结果令人欣喜,但时而“一本正经地胡说八道”还是会出现。

目前任何大模型都不能幸免。在生活中,AI大模型的错误我们可以容忍,可以一笑置之,但这却关乎大模型商用的前途,例如金融系统和制造业的容错空间就极小。


再次,AI大模型目前的使用门槛还比较高。除了核心功能价格不够普惠外,内行与外行的使用效果差别明显。大多数模型的使用需要进行专门培训。而一个改变人类的基础技术,最终一定是像互联网一样低门槛的。


“AI技术已发展了30年,现在说它还处于钻木取火阶段可能有些夸张,但它仍然处于技术早期这不可否认。”一位大厂的AI专家表示。


科学技术发展带有不可确定性,没有人是先知。或许,AI爆发只差临门一脚。又或许,AI大模型并不是AI爆发的最终解。那么,我们可能需要继续等待。


本文来自微信公众号“凤凰WEEKLY财经”(ID:fhzkzk),作者:宫靖


关键词: 大模型 , AI , ChatGPT-4o , chatGPT , AI应用
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/