ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI遭遇“信息诈骗”,新的鸿沟正在出现
4885点击    2023-12-02 16:42

保护AI 人人有责


花59块钱成了百度文心一言的会员,能买到一个它基于虎扑“梗”给你的错误荒谬的结果:“孙继海的儿子叫孙兴慜”。



孙继海中国著名足球运动员、英超曼城名宿,孙兴慜韩国著名足球运动员英超热刺队长,怎么一个韩国人就遗传了一个毫无关系的中国父亲的足球基因?



如上图所示,这其实是虎扑上“梗”无意间对人工智能发挥了“信息诈骗”的作用。我们猜测整个过程或许如下:孙继海儿子=SUN的儿子=SUN儿子=孙儿子=孙兴慜。


在遭遇“信息诈骗”以后文心一言甚至还给出了孙氏族谱,让孙继海有了一堆孙兴*系列的儿子。



你也许觉得这是个小错误,无伤大雅。


但当AI照进现实时,事情会变成什么样?文心一言声称已经开始应用落地。那我们就帮它推进一步,在现实中让它真正落地。


借助文心一言的能力,我们完成了一项“AI工作”:印刷了一幅文心一言做信息源的海报,挂在成都市龙泉驿区足球场上。



“你们用AI做的这个海报,没看出来AI的强大,但咋就不专业呢”,来自球场场馆最直接的评价,“幸好你们是先买了一个月广告位,随便你们挂什么,要是是我们自己设计弄的这个错误,估计下个月就要自己买社保了”。


当有人相信AI落地的愿景是“一个人就是一只营销队伍时”,可能这只营销队伍一个人就没有了。



除了可能工作不保,你的知识体系甚至都面临着威胁。


20多天以来,球场场馆、业余足球爱好者、保洁大姐、公司团结参与者、球场灯光维修师、或许都看见了“孙继海和孙兴慜”是父子关系。具有知识储备和信息辨别能力的人能识别到这里有一个错误,不具备这种能力的孩子很有可能着了被“信息诈骗”的AI的道。


那么如果不借助文心一言寻找“孙继海儿子”用百度搜索来看这个问题的答案。



百度搜索呈现的是一堆非常复杂、有干扰的信息,但人类在在这个时候至少还有自主权,因为它至少看起来是开放的,至少能看到多个信息源。虽然在搜索时代前几个结果也是“孙继海的儿子孙兴慜”,但是至少可以获得多个出处或者来源。进行对比验证,同样是“孙继海的儿子孙兴慜”的信息源头也可以区分新闻网站、专业论坛、短视频,用以判断其事实权重。而错误的AI可能造成最强的信息茧房。


信息获取的口径无限收窄,信息源的处理权收归到大模型里面,AI直接给你得出了唯一答案。这个答案对于只使用AI的人来说是绝对正确的,因为错了你也不知道。


而在那些技术乐观主义者眼中,AI就该是未来你唯一与信息交互的界面,知识和流量的唯一入口。


这对于AI平台来讲一定是好是吗?如果在搜索时代出现“孙继海儿子孙兴慜”这种错误的时候,用户在相信搜索结果带来的后果就只能自行承担。


但到了付费AI时代,人类付费了就没有义务为信息在实行交叉验证和筛选,如果出现错误,人类是“受害者”,但是文心一言既是“信息诈骗”的受害者,它也可能是“信息诈骗”的“帮凶”。



信息诈骗来源于信息鸿沟


文心一言遭遇的“信息诈骗”,也不能否认它在“理解、生成、逻辑、记忆这四大能力上的进步”。只是在“孙继海儿子孙兴慜”这个问题上,文心一言它只是一个才诞生不到一年的“天真孩子”,它好心的为人类做“缩句”,可能也做到了李彦宏所说的“今天,你说的每一句话,它大概率都能听懂。


但它没识别出人类制造的信息鸿沟,这种信息鸿沟可能是人类对特的交流模式或者是情感沉淀,也就是说文心一言可能储存了大量信息,也拥有了十分强大的算法。但是这次被“诈骗事件”是因为它没有识别出某种独特信息,这些独特信息可能对于人类来说是“玩笑”是“梗”,但是对于文心一言这类AI正常来说可能是“语料”是“逻辑”,但也有可能是“信息诈骗”的源头。


“李彦宏介绍,百度新搜索具有极致满足、推荐激发和多轮交互三个特点,当用户搜索问题时,新搜索将“不再是给你一堆链接”,而是通过对内容的理解,生成文字、图片、动态图表的多模态答案。


文心一言急需跨越识不能别人类独有语言信息鸿沟,因为它未来的责任是不再给人类提供多个选择,而变成先替我们完成信息筛选与鉴别,然后确定一个答案再衍生出答案的变种。


在没有文心一言这类AI之前,我们只能靠自己不断的跨越信息鸿沟,拥有不是“唯一答案”同时也要面对各种独特语言、虚假信息、诈骗话术,会使用互联网与正确获得结果就是人类自己在要跨越的信息鸿沟。这对于一个人来讲都不容易。


魏则西“西安电子科技大学2012级学生,当时以600多分的高考成绩考入计算机系”在外人看来是一个标准意义上的会使用互联网的人,但是他为了获得正确结果所付出了最大的代价。而AI出现以后,我们可以完全信任AI帮助人类跨越信息鸿沟,避免付出这样的代价吗?


但看起来就算AI成长了,真的能比人类更容易识别出错误。下决心真的让它落地也并不容易。


财报显示,百度三季度的研发费用为61亿元,同比增加6%,主要是由于支持文心一言研究投入的服务器的折旧开支及服务器托管费增加。



从以上这两段话可以得知,文心一言是一定要去赚钱的,否则无法覆盖它的开销。而赚钱的方式可能还是广告。


百度文心一言的主体是百度公司,从过往百度在获得了流量入口后的盈利模式看,竞价广告模式是它的选择,竞价广告可能是跨越信息鸿沟的障碍之一,在我们对此慢慢免疫的同时,AI时代似乎也逃不过这个人为的鸿沟。这个广告将怎么呈现?还是多个广告呈现竞价吗?


在AI时代它的对话部分结论只有一个,是给看广告还是给看答案,还是先看15秒广告再看答案?还是干脆和竞价排名一样,诞生一个对话产生多个答案?


或者干脆放弃广告,出现只有付费才能享受更高级的AI,接触到更丰富可靠的信息。但付不起钱的人只能忍受错误与不丰富的信息,被落在在另一种新的信息鸿沟的另一端?


循环在信息鸿沟里的:孩子、魏则西和AI


我们可能进入一种循环,文心一言没有跨越信息鸿沟就又有可能创造出新的信息鸿沟,人类在跨越前AI时代的信息鸿沟的同时,还要做好准备跨越AI造成新的信息鸿沟。


在这个循环里孩子、魏则西和文心一言是相互对照出来的影子,因为他们三个都可以看着是“孩子”,真正的小孩子面对信息鸿沟是完全没办法跨越的;魏则西作为很多人眼中的计算机高材生可能还具备帮人跨越信息鸿沟的能力,但是他也掉进了医疗的信息鸿沟里面;虽然文心一言在有很强大的某些功能在帮人们跨越信息鸿沟,但是它在面对人类特有的语言习惯是翻车掉坑里了,可以说魏则西和文心一言在面对各种没有跨过的信息鸿沟时都是“孩子”。


魏则西已经离开,而困在这个信息鸿沟里的循环里的另外两个“孩子”怎么办?


真正的孩子在成长过程中可能主动使用百度搜索的场景会越来越少,要面对的可能是AI没有跨越信息鸿沟造成的收窄的信息茧房,承担使用AI出错造成的工作影响,被动学会筛选对比AI提供的信息,从而增加AI的使用成本。


而从某些角度可以看成孩子的文心一言,单对于“孙继海儿子孙兴慜”这个问题它有机会而且马上就可以更改。但是这个信息鸿沟能跨越吗?百度早已开始把它嫁接到百度各种产品里面开始为变现服务,而百度的各种产品是前AI时代的,前AI时代原始的信息鸿沟充满了各种优质信息和劣质信息。随着文心一言越来越紧密和这些过往的负面遗产接触融合,作为一个孩子,它是在这种融合中提升信息筛选与鉴别、利用信息让自己实现“自增长”,还是掉入前AI时代的信息鸿沟不能自拔?


文心一言从出现诞生后的百度每一季的财报里面,这个“AI童工”开始作为新的利润故事的主角。但是不是该关心一下这个“AI童工”的成长问题,它有好的信息成长环境,能健康正确的长大吗?


文章来自于微信公众号 “指北Focus”(ID:hlwzhibei),作者 “指北小付”


关键词: Ai训练 , 文心一言