ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI这就又回到“雕花”时代了?
7626点击    2024-08-02 12:09

近期,AI领域的发展呈现出一种矛盾的景象:表面上百花齐放,实则暗藏疲态。人工智能领域似乎进入了一个微妙的节点,众多科技巨头和创业公司纷纷推出自己的AI产品,却难掩同质化的窘境。


Character.ai的风波就是一个案例,作为AI明星产品,Character.ai在高峰期的推理请求量已经达到了谷歌搜索流量的五分之一。五个Character.ai就等于一个谷歌?然而,真实的情况不容乐观,根据The Information的报道,Character.ai订阅用户不到10万,近期在努力削减成本,由于融资困难,Character.ai正在考虑出售。


AI社交大多产品都局限于伴聊和角色扮演功能,又存在重度用户消耗推理资源量大,而轻度用户留存差,商业化前景堪忧的问题,例如,Character.ai去年全年收入仅为1520万美元。


Character.ai的困境并非个案。纵观整个AI行业,从科技巨头到初创公司,似乎都陷入了一种“雕花”困境,过分关注表面功能的堆砌,底层的突破出不来了,突破性的创新让位给了同质化的功能微调。


WWDC24上,苹果公司为iPhone和其他设备推出了推出全新的个人AI系统Apple Intelligence,试图通过重新定义“AI”来弥补其在AI布局上的滞后,但除了一贯的强调隐私保护,实际功能展示乏善可陈,集成ChatGPT功能,实现识别对用户情景重要的通知,AI文本处理,图文生成、Siri感知屏幕内容并代替用户执行简单任务。


而Apple Intelligence也免不了“期货”,几天前刚刚开启了测试,第一批功能的正式上线可能需要推迟到十月的iOS 18.1,但也只是基础功能。使用设备端数据回答问题并了解用户屏幕上内容等功能,仍然需要2025年春季。


更加遗憾的是,Apple Intelligence仅支持搭载 A17 Pro 芯片或更新的iPhone,也就是说大部分iPhone用户都体验不了。



微软则试图在PC上进行革新,在5月20日推出了Copilot+ PC,其中包含了人工智能工具Recall,它会定期截取屏幕截图来创建活动记录,以便用户搜索他们之前的操作。


事实上,Recall之前,一款类似的应用Rewind已经上线一年多时间了, 并且拿到了Sam Altman、a16z 等的投资。本质上Recall并没有任何创新,而只是抄了一个Rewind。虽然微软对Recall寄予厚望,不过得到的却是差评,许多用户认为存在巨大的隐私风险,有黑客甚至展示了如何从Recall的主数据库中提取所有信息。出于安全考虑,微软搁置了Recall的发布。


OpenAI作为火车头,也开始在“雕花”方面不遗余力。其备受瞩目的AI视频生成模型Sora发布时间悬而未决,官方解释称还有大量的安全工作要做,但始终没有给出明确的时间表。


同样让人失望的还有号称“Her走进现实”的GPT-4o语音模式,这个本来就被不少人形容为已有的功能堆砌出来的小创新的产品,原定于5月发布,后又一再跳票,只是时不时的用给一小撮人试用一下的方式维持着大家的期待。即便是最新推出的SearchGPT,也难掩其“期货”属性:不仅内测机制黑箱,连Demo都存在低级错误。



在一些网友看来,与其将精力放在实质性的技术突破上,OpenAI似乎更热衷于制造舆论热点。一系列针对谷歌的“抢热点”发布的操作的确相当亮眼,Altman非常利用社交媒体影响舆论,为自家产品造势,然而,漂亮的PPT和热闹的发布会并不能掩盖模型能力迭代缓慢的现实。


GPT-5何时推出已经彻底成为了一个谜。市场曾预测GPT-5可能在2023年底或2024年夏季发布,OpenAI CTO Mira Murati表示有望在2025年底或2026年初推出,而Sam Altman曾强调目前没有固定的发布时间表。


小参数模型GPT-4o mini的推出基本说明了一切。OpenAI也要跟大家卷“雕花”了。


“雕花”的AI产品


在头部企业陷入“雕花”困境的同时,创业团队也未能幸免。随着“模型即产品”的投资窗口期过去。厂商们面临着巨大的变现压力,迫切需要寻找落地场景。AI搜索似乎成为了继聊天机器人和类Character.ai产品之后,又一个开发者们争相涌入的赛道,成为新的热点。


AI搜索被视为大模型应用的重要落地方向,海内外众多企业和开发者纷纷布局,希望在这个风口上分一杯羹。然而,目前的发展态势似乎也难逃“雕花”的困境,所有人似乎都在重复造同一个轮子。


众多玩家推出的AI搜索产品大同小异,缺乏实质性的差异和创新。虽然在功能名称上略有不同。但核心功能几乎如出一辙,这其实也反映出当前大模型的发展遇到了瓶颈。


AI插件太多,浏览器已经不够用了


浏览器插件因其轻量化、低门槛的特点,也成为成为各家争相布局的对象。月之暗面的Kimi浏览器插件强调“轻量小搜索”,字节的豆包浏览器插件也在快速迭代新功能。各类开发者制作的AI插件也是层出不穷。


表面上,这些插件五花八门,功能各异。有的专注于内容生成,有的侧重信息汇总,还有的致力于提高生产力。但仔细观察就会发现,它们大多是在做“雕花”工作,许多插件不过是对已有AI功能的简单封装,或是对大模型API的表层调用,鲜有真正突破性的应用。


所有人都希望获取到用户流量。但这种做法更像是权宜之计,并未从根本上解决商业化难题。PC浏览器用户数量相较于移动端已经相对稀少,这一现实本身就限制了插件的潜在用户基数。它再次印证了当前AI行业陷入的'雕花'困境,在现有技术框架内进行小幅改进和优化和同质化竞争。

回顾上一波以计算机视觉(CV)技术起家的AI企业的起落,我们发现它们并未真正走出“雕花”困境。尽管在技术上取得了显著进展,但场景碎片化和商业化不顺仍然成为它们后继乏力的主因。这些企业往往停留在技术供应商阶段,难以确保长期市场地位,同时还要与科技巨头打价格战,争夺市场份额。


如今,大语言模型似乎正在重复这一历史。虽然GPT等模型在技术上取得了突破性进展,但真正能创造持续价值的商业应用仍然稀缺,模型能力的提升也似乎进入了停滞状态。


OpenAI提出的通用人工智能五级能力评估体系为行业提供了一个发展路径。当AI达到第二阶段('推理者'级别)时,可能具备在消费级市场大规模流行的条件。这意味着,大模型公司需要不断提升AI的通用泛化能力,才能真正突破商业化和产品化的瓶颈。不过在此之前,OpenAI可能还需要融资数百亿美元才能覆盖其成本。


与CV企业不同的是,一些大模型公司已开始推出面向C端的应用,试图接近产品市场契合点(PMF)。这种策略可能帮助它们避免单纯依赖B端非标准化市场的陷阱。但如果仅仅是将现有的AI能力套卡包装成消费级产品,没有真正的突破模型的推理能力、增强跨领域知识整合,以及交互体验等等,很快就会陷入同质化的雕花当中。


华尔街也失去耐心了


为了迎接AI革命,企业仍在投入大量资金建设数据中心等基础设施,但即使是华尔街也开始重新审视他们的调子,从狂热的拥护转变为更为谨慎的支持。


AI进入雕花阶段是否意味着互联网泡沫的重演?最近的一系列研究报告向AI的热潮泼了冷水,警告生成型AI技术依然面临漫长而充满疑问的发展道路。


当高盛都说“也许这只是一个泡沫”时,你就知道这个行业真的遇到了麻烦。在一份名为《生成型AI:过多投入,收益太少?》(Gen AI: too much spend, too little benefit?)的报告中,高盛的分析师讨论了AI是否能解决其被赋予的复杂问题,并对其仍未确定的“杀手级应用”表示怀疑。



巴克莱银行的一份研究报告标题更加生动《云AI资本支出:害怕错过还是梦想田野?》(Cloud AI Capex: FOMO or Field-Of-Dreams?),报告指出数据中心投资是否正在制造一个可能像1990年代互联网泡沫后电信崩溃那样的泡沫,分析师的结论是倾向于FOMO。


红杉资本的合伙人大卫·卡恩最近称,技术是否能收回庞大数据中心投资是“AI的6000亿美元问题”。


这显然不是第一次质疑的声音。关于AI聊天机器人和其他工具的最终收入或潜力问题,已成为任何科技公司财报电话会议上的常见话题。


而微软和英伟达的巨大收益,属于高盛分析师所称的AI投资“卖铲子和镐”的阶段:提供AI所需的半导体、云计算和能源的公司。值得注意的是,AI为Google、微软、亚马逊等头部云厂商带来的增长已经开始放缓。


高盛全球股票研究负责人吉姆·科维洛则怀疑,AI的成本是否会下降到足以证明其价值的程度。“要证明这些成本是合理的,技术必须能够解决复杂问题。”


高盛还采访了MIT经济学家达隆·阿西莫格鲁,他认为这项技术仍远未准备好迎接主流。“鉴于今天生成型AI技术的重点和架构,这些真正变革性的变化不会很快发生,如果有的话,可能在未来10年内也不会发生。”


巴克莱分析师将AI支持者的思维描述为“只要我们开发出AI技术,用户和利润自然就会跟着来”的逻辑,并指出目前的资本支出预测足以支持到2026年12000个ChatGPT规模的AI产品。鉴于投资金额,分析师表示,行业可能正走向类似于互联网泡沫后的电信崩溃的“过度建设”,“明年可能会出现AI投资的调整期。”


红杉资本的合伙人戴维·卡恩还指出,AI还有很长的路要走,警告投资者在“投机狂热”中保持“冷静”。“我们需要确保不要相信现在从硅谷蔓延到全国,乃至全世界的幻觉,”卡恩写道。“这种幻觉认为AGI明天就会到来,我们都需要囤积唯一有价值的资源——GPU。实际上,前方的道路会很漫长。”



人工智能将永远改变商业一切,这已成为商业和学术界的一句口头禅,AI也已成为一个家喻户晓的术语。但这是曲折上升实现的,自20世纪50年代以来,AI经历了几次寒冬,由于未能实现期望而导致对AI兴趣的减弱。这种起伏的背后是对技术的期望与现实之间的复杂关系。回顾这些发展过程,能为我们理解当前生成式AI热潮提供一种历史视角——这里似乎存在着一个规律,就是对AI技术的乐观随之而来的往往是一段挫折期和AI投资下降期,用人们爱用的词来说,就是AI寒冬。


人工智能目前可能仍停留在拨号时代,直到拨号上网逐渐消失后,互联网才真正发挥出潜力,同样的,总有一天我们会拥有一种新的人工智能形式,让今天的ChatGPT像1998年的门户网站一样过时,只是可能无法指望它会在未来一两年内发生。


文章来源微信公众号“硅星人Pro”,作者周一笑


关键词: AI , AI应用 , Character.ai , AI公司
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner