ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
这个国庆,AI混成了“地头蛇”
3143点击    2024-10-09 10:54

AI努力两年半,这个国庆成没成旅游『好帮手』?


今年的国庆假期,忙的不只是人,还有AI。


俄罗斯的大一学生兰娜来到杭州旅游,为了避开人山人海和解决语言不通等问题,难坏了当地负责接待的朋友。最终,朋友想起来可以用AI做全程导游,AI告诉他们可以去金庸故居享受清净的人文景观,还用了AI翻译作为对话交流工具,甚至AI还可以讲解景点文化。


全能的表现,让人们开始相信AI,不再是大模型一类的难懂名词,而是走入生活的人工智能。


而且不仅是AI导游,走在街上的商场里,处处可见AI生成的宣传图;打开小红书或公众号,篇篇是充斥着AI味的文字;打开抖音和淘宝,随手一刷就是数字人的直播;开车在大马路上,和你同行的是无人驾驶网约车“萝卜快跑”;在景区里,排长队的又是某个神奇的高科技VR体验;回到家里,迎接你的又是唤一声名字就能打开的智能家居。


AI的背面,是虚幻与虚假的美好,正在侵占我们的真实生活。国庆期间,有网友用AI APP实现换脸旅游,一张头像就能生成在欧洲或者埃及旅游的照片。不花一分钱,没有一点实际体验,就实现了朋友圈的精装照。


有人惊喜,AI的能力越来越强,能成为生活帮手了;有人惊恐,AI要替代人类,抢走我们的生活了;有人质疑,AI带来的真假难辨,到底是好是坏?


但不得不承认,在线上热搜和线下爆火的AI导游等场景下,AI正在带来新的千亿生意经。


AI正在变成新晋“生活搭子”


国庆期间,“AI成大学生免费地陪”的话题冲上热搜,跟着AI打卡景点成为了新时尚。


这背后是很多大厂的AI Chat产品,都将AI导游从功能演示推进到实用场景中,这其中就包括支小宝、豆包、元宝等产品,他们期待AI能在十一国庆假期期间,真正走入实战看一看效果。


这其中,前往安徽黄山旅游的一位旅客就感叹:“黄小松’真的太强大了!”


“黄小松”,此人并非真人,是安徽黄山风景区与支付宝合作打造的AI旅行助手。当游客进入黄山后,“支小宝”APP就会自动跳出相关功能卡片,提供购票、AI伴游、天气提醒和懒人路线等服务。页面上能显示每个入口的票量,还会推荐游客合适的方向和路线,甚至还可以在特定地点为游客提供拍照姿势的推荐。



在杭州景区,大学生们拿起手机“碰一下”蓝色智能贴,能“召唤”出支小宝,在支小宝上查看杭州景区的介绍、实时人流量,了解景点的文化典故,相对轻松地旅游杭州。


在今年的国庆旅游中,除了在黄山景区使用支小宝作为“导游”,还有一些游客将豆包当做了“贴身导游”。


一位国庆期间前往北京旅游的游客忍不住在网络上种草:“我去故宫和长城游玩,多亏了豆包的讲解,我才更加了解历史文化的背景和内涵!”


豆包的语音功能,基本可以实现低延迟的问答,对于自由行的旅客来说,戴上一个耳机,走到某个景点就让豆包介绍一下,这种体验真的很像请了一个可以24H陪伴的免费地陪,还不用担心被导游带去购物“踩坑”。



与豆包语音交流的文字记录


带着GPT 4o去博物馆游玩的小汪说:“本来以为又要走马观花式的旅游了,想到可以试下GPT 4o的拍照识图功能,没想到效果奇好,以前逛2小时结束的展馆,实际逛了将近6小时。”


“有的展品文字不多,GPT 还能根据图中的一些信息补充相关历史知识,有不懂的还能继续追问,比如这个事发生的时候背景,德川家康为什么一开始愿意听丰成秀吉的话等等。”




当然,现阶段AI chat也不是那么聪明,比如智谱AI分不清天台山和天台庵的区别。在用户已经说了是访古游的前提下,腾讯元宝仍然大量推荐自然景观。豆包把第一天推荐的地方,第二天又推荐了一遍。通义千问则推荐了一个不在旅游城市的地名出来。


AI在信息获取的实效性也不行,产品经理小刘解释道:“因为在AI的知识库里存储的内容很可能已经过时了,所以极大可能会导致生成的文本信息不够准确。” 试想如果游客在查询某个景点的开放时间时,AI提供的信息却已经过期,很可能导致游客白跑了一趟。


除了把AI当成导游,全能的AI还能解决实时翻译、情感陪伴、拍照修图的难题。


以往,阻断很多人选择出国旅游的最大原因就是语音不通,如今有了AI面对面翻译,这个问题再也不是难题了。据悉,荣耀、华为、小米在近日都推出了AI面对面翻译功能。


晓然今年国庆选择了去泰国,在和外国人沟通时,她只需对着华为手机说:“小艺,小艺,面对面翻译。”立马就能调出华为的AI翻译功能,并且支持同声传译。


华为手机-面对面翻译


前文提到提到的俄罗斯学生就是用了通义App,只要不是过于复杂或者方言过重的翻译,现在AI chat产品都还可以一战。


在电影《从你的全世界路过》中,幺鸡录制了一个自己声音的导航,希望在他离开后,这个导航还能一直陪伴着陈末。没想到,如今的这一幕也成为了现实。


高德地图近期推出了AI领航员功能,支持每个人录制自己的语音包,也能设置自己的AI形象。这种人性化的设计一定程度缓解了孤独感,也让旅行变得更温暖和有趣。



高德地图——AI领航员


智能手机里藏着的AI消除功能,也是这次国庆黄金周被疯狂点赞的功能。


因为国庆假期哪个景点都是人挤人,想拍到没有人的照片几乎不可能。而AI消除功能,能轻松地把照片里的杂物和不相关的人全都通过涂抹消除掉,然后再通过AI生成和背景拟合的内容,获得一张主体更清晰的C位照片。




韩路感慨:“自从主流国产手机相册带了AI消除功能,随时拍出包场旅游的感觉。”


AI“霸占”人们的生活后


不只是旅游,AI技术发展速度和扩展范围之快,就像一只“地头蛇”,“游走”在人们生活的各个领域。


打开手机,社交媒体平台上的 AI 算法可以根据用户的搜索历史和兴趣偏好,为用户提供个性化的搜索结果和信息推荐,这在一定程度上影响了人们获取信息的范围和内容。


你发现没有?当你某一天在短视频上给一个泰国旅游的视频点赞后,平台就会疯狂给你推送泰国旅游的视频,迫使你产生想要去泰国旅游的冲动。


即便是不想出去旅游,AI现在也融入生活各种场景。


许多人已经习惯了通过语音交互来完成更多的日常任务,苹果的Siri、小米的小爱同学、华为的小艺,AI助手们利用自然语言处理技术,通过语音指令帮助用户查询天气、设置闹钟、发送短信等。


最近,有人发现小爱同学竟然可以帮忙接听电话了,这样,人们在旅游过程中就可以安心地开启免打扰,还不用担心错过重要的电话。小爱同学不仅能帮忙记录漏接电话的重要内容,还能用人类一样的嘲讽和幽默和对方对话,让对方难以分辨和他对话的是真人还是AI。



尽管AI已经渗透到了生活的全过程,也渗透到了我们生活的方方面面,但目前看还有两层问题。


一层是AI本身存在的技术缺陷,对用户体验还有较大影响。


因为极少的App会把自身的API接口开放给别人使用,导致现有的App各自为政,像是一座座孤岛,尽管每个APP都有其独特的优势和功能,但它们之间缺乏有效的联动和整合,至今没有一个App,可以把旅游的全过程都用AI的能力贯通起来。


各自为政又导致了一个问题,那就是数据源太少,仅依赖自己生态下或合作厂商的内容,导致生成的内容准确性和丰富性都不够。


比如豆包生成的旅游攻略,来源大多是抖音视频和今日头条等字节系的产品。小红书的达芬奇生成的旅游攻略,来源都是小红书的笔记。Kimi生成的旅游攻略,来源主要是马蜂窝、搜狐和一些旅游网站的内容。百度的智能回答,来源主要是知乎和第三方旅游网站。


这样,一个用户就需要在旅行中频繁切换不同的APP来完成订票、规划行程、查找美食、语言翻译等工作,极大地增加了使用的复杂性和时间成本。如果能有一个APP,能够贯通整个旅游过程,将AI的各项能力整合在一起,这种体验对用户来说一定更加丝滑。


同时,AI提供的旅行规划,往往是基于大数据搜索总结出的大多数人的推荐。做AI旅游的产品经理小刘说:“一些小众或新奇的体验,由于信息过少,AI很难把它们作为“标准答案”提供给你。当所有人都按照 AI 的规划走时,就会出现网红景点变成了人挤人的 ‘打卡’,一些同样美不胜收的小众景点却无人问津。”


就像前两天黄山景区曝出有游客因为订不到酒店挤在厕所睡觉,武汉江汉路的街头人头攒动,原本期待的悠闲度假变成了在人海中的艰难穿梭。


另一层则是AI本身带来的不真实问题,而原因却恰恰是AI越来越以假乱真,二者对我们真实生活带来的困惑。


诸如星绘、趣画等App,在换脸照片领域越来越成熟,能把景色瞬时生成仿现场照片,让人难以分辨真假。


同时,AI生成的图虽然美丽,但缺失了真实照片勾连的“多感官记忆”。网友春溪说:“AI生成的图既没有独特性也没有记忆点,迅速生成并瞬间消费,之后只剩下廉价感和乏味感,最后被快速遗忘。”


“而真实的旅游照片,能让你想起那个夏天,海水一次次翻滚着向你涌来,风吹乱头发进入鼻腔,留下咸湿的味道,你拎着裙角哈哈大笑,夕阳在你身后,悄悄沉入海底。


带着AI看世界的畅想能实现吗?


现阶段AI存在很多问题,最令用户吐槽的是,当你想解决时,却发现找不到真人。


还有一位长期使用携程的用户红袖说:“我在携程开发票填错了邮箱,想让后台重新给我发一次,但一直提交失败,就打了客服电话,我反复描述了几遍问题,AI每次的回答都是‘请进入xx页面申请重新发送’。我说了几十遍转人工,才有真人来接。”


Gartner发布的调查报告显示:64%的受访客户都不想要AI客服。在某电商的投诉平台上,关于“找不到人工客服”的问题投诉有近2万条,不少网友投诉称:“智能客服总是答非所问,快把人逼疯了。人工客服永远在忙。”


小红书上有博主还总结了一套找人工客服的技巧:就是你除了开始分大类按键选择之外,要不停地对电话说“转人工”“人工客服”“人工服务”,AI会假装听不懂你说话,一般你需要重复2-3次,ta才会说,好的,为您转接人工服务中……。


现阶段,人工还不可或缺,AI也在努力变得更好。大家不仅努力推进AI能力的进步,让AI更加个性化;也在解决AI与现实融合的问题,未来摘去AI的虚幻面纱。


其中,豆包、文心一言、通义千问这类AI native产品,正在比拼旅游规划的落地效果,也在努力实现自己的AI特色能力。



比如,用豆包,告诉它预计的天数和想去的景点,它可以一键为你生成一个旅游计划表;用航旅纵横的“路线小助手”,它能通过几句对话生成最优惠最快捷的交通路线;用支小宝,能提供最优惠的机票选择,也可直接跳转至购票页面。


航旅纵横-路线小助手


支小宝


用携程问道,能为你推荐最值得去的景点,在国外景点的推荐上也表现出色。



携程问道


用百度地图,输入游玩的天数和地点,能一键生成行程安排,还能看到每个景点之间的距离和出行时间。



百度地图-我的-更多-我的旅程


就像请来了一位旅游规划师,为用户定制了一份个性化的行程方案。当然,这份定制化还不特别成熟,但前进的方向是根据用户所需生成一份最佳的旅行方案。


而为了促进虚幻现实的融合,很多大厂也在推进景区数字化。


百度大脑助力打造的智慧景区,通过智能化检票入园系统,实现了游客全程自助购票入园,让旅客体验更加流畅。游客只需通过手机即可完成购票,通过刷脸即可入园,减少了排队等候的时间。


腾讯推出的沉浸式体验产品“云上中轴”,通过游戏的方式,让用户通过游戏的形式“穿越”到曾经的故宫,在虚拟角色的引导下,游览如今已损坏或不复存在的场景,自由探索北京的地标,让北京中轴线焕活新生。



AI的能力也需要硬件端的进步,说不定今天我们还在拿着手机和AI交互,明天可能就会通过手表或者眼镜来召唤出AI。


9月26日,Meta发布的AR智能眼镜Orion,展现了未来旅游体验的全新可能。Orion支持AI语音、手势追踪、眼球追踪以及通过肌电图腕带(EMG)的方式,使用户拥有以神经信号对其进行操控的能力。


不仅是Meta,国内互联网公司如华为和小米也在加紧布局智能眼镜产品。其中华为的AI眼镜搭载了华为HarmonyOS4操作系统,已接入华为盘古AI大模型,用户可通过敲击镜腿唤醒小艺,实现全天候智慧体验,支持智能播报天气、航班、日程、打车等信息。小米的界环AI音频眼镜搭载多个大模型,通过语音互动实现AI跨平台的统一VUI体验,拥有AI通知播报、AI畅聊、AI捏人、面对面翻译等功能。



想象一下,如果有一天AI可以通过眼镜上的摄像头看世界,那这个AI导游真的就可以像真人一样,每到一个地方,就为你讲解你眼前所见的景象,你不知道朝哪个方向走了,他会直接在你眼前为你指路,甚至可以像贴心女友一样提醒你小心台阶,电影《钢铁侠》中的“贾维斯”,仿佛真的上线了。


文章来自于微信公众号“AI鲸选社”,作者“晓睿”


关键词: AI , 人工智能 , 大模型 , GPT 4o
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales