ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
我们不能对AI硬件的隐私问题视而不见
6720点击    2024-09-30 13:16

是谁出的题这么的难,到处全都是正确答案。


很多智能儿童手表都会有一个“主打”功能——“聆听”。在家长 app 端发起后,手表端静默执行,自动接通、保持黑屏、不通知孩子,以此实现远程观察孩子状态。


它甚至不说“我在~”丨Giphy


这大概是儿童智能手表中最受家长欢迎和孩子厌恶的功能了。


如果把“孩子”换成你我,“家长”换做 AI 呢?也许你坚信:目前还没有任何一个理由戴着一个时刻“监听”自己的设备。


可如果 AI 给了你一个理由呢?很诱人的那种。


目前各种最火热的 AI 硬件形态,智能眼镜、AI 项链、录音饰品等等,都是以收集不同模态“贴身”数据为基础来实现功能的——训练大模型形成个人知识库,让 AI 拓展更多实用能力。


AI 硬件的隐私问题,已经在激起争议和焦虑。


还记得几个月前微软撤回了 Recall 功能么?Recall 是 Windows 11 上的一项新功能,通过对用户 PC 不断截图——已经删除的电子邮件会被保存,无痕浏览的网页会被截取,并制作成个人数据库。再加上 Copilot,PC 就能变得更“好用”。


漏洞很快就被发现了——虽然用户数据被保存在本地设备上,黑客还是能通过恶意软件远程访问、窃取到数据。


并不用“物理打开”你的电脑丨Giphy


AI 时代,如此多的个人数据在采集、保存、训练、输出的过程中要保证安全,对企业来说是前所未有的挑战,移动时代的隐私保护实践,或许并不再适用。


这个问题,比我们想象中要复杂得多。


互联网时代的遗患


第一层的恐慌和怀疑,来自于本地和云端的拉扯。


今年春季 WWDC 上,苹果官宣与 OpenAI 合作的消息之后,马斯克立刻在 X 表示上“强烈反对”,并将其形容为“creepy spyware”。


i am watching you丨Giphy


OpenAI 被骂得也不算冤——去年 3 月,ChatGPT 流行正盛时,就发生过一起个人数据泄漏危机。不少用户在社交网络反馈,在 ChatGPT 的聊天记录栏中出现了他人的聊天记录,一些人甚至能看到活跃用户的姓名、电子邮件地址、支付地址、信用卡号等私密信息。


刚刚为 AI 应用开始狂热的用户开始认真地担心起来:云端大模型的隐私泄漏和数据安全到底会成为一个多么严重的隐患?


当下对于 AI 隐私安全的讨论,更多是上一个互联网时代延续下来的“焦虑”——用户个人信息和交互数据在云端存储并用于进一步的训练,这是否会加剧隐私泄漏的风险。


2014 年,黑客利用 iCloud 安全机制的漏洞,撞库盗取了账号,流出了一些好莱坞女星照片;2018 年,“剑桥分析”事件曝光,一个 Facebook 上的第三方应用,通过获取的用户社交数据构建了服务于精准投放政治宣传的算法,进而影响选民的投票行为;2021 年,国内一家电商网站被指,在获得系统照片的权限后,删除了“缓存在云端”的照片,让用户以为平台远程操作了本地设备……以及各种推荐算法和个性化广告等,属于上一代决策式人工智能对于用户行为数据的依赖,“天啊,它给我推的这个内容就是我刚刚聊的,我被监听了……”


在“更好的用户体验(也包括更精准的内容投放)”和“更透明安心的隐私保护”之间,当用户经历了天平摇摆的从左到右,“逐渐觉醒”的过程,也开始步步倒逼厂商采取更严格的隐私策略


一些厂商做法是把尽量多隐私数据和运算直接留在硬件本地(代表是苹果,如果你还记得当年 CES 场外苹果揶揄安卓的经典广告语);以及利用差分隐私,联邦学习等技术手段,保障调用数据的隐私和安全,比如华为做个人音乐推荐时用了差分隐私,原始个人数据不上云,在云端进行差分后数据的统计分析。


苹果广告丨India Today


传统的隐私计算多是在算法层开展工作,但是,大模型从训练、输出到能力涌现是一个“黑盒”,不透明、无边界、不可解释,对于以前的基于可解释、清晰、可控的技术路线的隐私计算方法提出了全新挑战。


这让很多智能手机厂商都在加码“端侧模型”的概念。去年底,骁龙 8 Gen3 发布,实现了在“端侧”运行 100 亿参数大模型,为了强调“本地”芯片能力,在演示 0.6 秒生成图像时,还将手机开启了飞行模式。


今天,用户大部分最为关键的个人数据都是在手机上产生的,日历、待办事项、笔记、照片、短信等。手机厂商一致认为,基于这些数据生成“个人 AI 知识库”的过程,也要留在本地,才能保证私密安全。


设个密码啥的,没用丨Giphy


AI 时代,更难的是对于“数据边界”的界定。


要自主,还是要自动?


“隐私意味着用户要知道他们在签署什么。条款应当用清晰易懂的语言,反复强调重点。我对这件事很乐观,我相信用户是聪明的,有些人愿意分享更多数据。但你要问他们,每一次都问,获得明确的授权,让用户准确地知道你用他们的数据干了什么。”


这是 2010年 iCloud 上线前夕,乔布斯与 Walt Mossberg 有过的一段对隐私的精彩论述。并且这段论述,在之后十几年时间里,成为乃至全行业的隐私保护宗旨。


iOS 10 开始,当 iPhone 要获取用户数据和传感器权限(比如蓝牙、通讯录、定位、麦克风、日历、照相机等),都会弹窗进行询问,用户也可以在设置里进行精确管理;iOS 14.5 以来,当 app 需要跟踪用户活动时,都会弹窗询问,并告知用户如果允许,数据将被用在哪里。


但数据统计,后来人们对于该功能越来越不在意丨网络


Android 14 引入了新权限设置,让用户只授权应用访问特定照片或视频,而不用开放整个媒体库。


欧盟的 GDPR 规定:企业在获取用户数据时,必须用具体、清晰的语言描述需要获得什么数据,并得到用户同意。


而 AI 时代,能靠“自主控制权”来分割“数据边界”似乎成为了一个悖论。


AI 应用开发非常流行的一个概念叫“生活流”(Life Stream)。“生活流”的意思是,用户佩戴类似智能眼镜这样的传感器,让 AI 能够与用户同步获得生活中一切的视听信息,同步理解用户生活中的一切,从而训练出一个贴身的“AI 助手”。


未来,每个人都会有个数字助理丨Giphy


而这类产品好用与否的检验标准,就是减轻用户负担,让其自动化、智能化、通用化地去解决问题——这与不断询问用户“数据权限调用和管理”,本身就是矛盾的。


AI Agent(通常中文译作“智能体”)进行工作流编排时,会调用三方接口功能和用户数据,这让服务生态变得复杂:涉及的主体(数据、算法、服务提供方)数量增加,各主体权责交叉,数据交互(理想状态:AI Agent 按需关联各种数据、功能信息)愈发复杂。


越大量,越有效(包括颗粒度低、多样化、贴近垂直场景等)的数据投喂,生成结果往往越好,这是AI数据投喂的基本规则。但是这样会让用户重新陷入一种“太好用了所以无法拒绝”的境地,而最终只能“把数据全部交给 AI”——你可以类比移动互联网时代已经发生的事情:多少人会对搜索上瘾,而又有多少人会对算法推荐上瘾。


根本停不下来丨Giphy


这种 AI 应用的特性让传统隐私保护的“数据护栏”失效了——比如,过去用户将一张敏感照片放进私密相册,或使用无痕模式访问一个“难言之隐”的网页,而一个诊断皮肤病的“智能体医生”就恰好需要你“生活流”里的这些敏感数据。


与之适配的应该是一套全新隐私保护模式。


也许 Apple Intelligence 设想的模型架构是一个可能的答案:在本地运行的基础模型;PCC,私有云计算;接入第三方。简单来说,这是一个按 Query 难度(查询请求的难度)分发的分层模型策略。既要保证端和云之间的数据有效流转、访问、存储,最终目的是用户体验;又要保证数据安全。苹果实则设计了一套涉及到芯片、终端、云端、系统软件的安全机制。


“大收集时代”


第三层问题,是新时代的最令人兴奋和担忧的:一大批硬件厂商,正在打造“超越”智能手机的,更面向未来的 AI 硬件。


包括智能眼镜、录音笔等等,第一批原型产品已经面世。称之为“原型”,是因为这些产品的功能设计上还不够完善,性能也捉襟见肘,还达不到“好用”的程度,但设计思路却不约而同地选择了“默认记录”


还记得 AI Pin 么?别在胸口,摄像头默认对前方;也有录音笔设计得薄片一张,紧贴手机背后,随时启动收音(据说有公司受此启发,要把员工工牌做成这样……);被设计成可日常配备,不会在社交中被“察觉”的智能眼镜更是如此。


默认记录,不易察觉,贴合日常,AI硬件的一个设计思路丨The Verge


单从硬件设计看,这些产品的设计并不新鲜。Google Glass 在十几年前就问世了,更别说各种隐蔽的小型摄像机、录音笔,都早已走出了 007 电影。


Sergey Brin丨Financial Times


但它们的新颖之处,在于躯壳之内包裹的东西——这就从一个技术问题,演化为了一个社会问题。隐蔽的录音录像设备一直有,只不过绝大多数普通人并没有理由去购买使用这些产品。


但 AI 赋予了这些硬件产品存在的理由,甚至可能将社会带入一个人人“佩戴摄像头、录音笔”的轨道,或许当下我们还很难武断地说,这会让社会陷入灾难,但它一定会带来非常深刻的改变。


设备不仅记录使用者,还有使用者周围的一切丨Giphy


十年前,谷歌眼镜刚刚交货的时候,即便数量稀少,也掀起了巨大争议。在当时的硅谷,因为常能碰到佩戴谷歌眼镜的顾客,导致很多酒吧餐馆都贴出了“禁止佩戴谷歌眼镜进店”的标识——这甚至成为了阻碍智能眼镜在那个时代普及的重要因素。


新时代,新技术,新问题丨Giphy


新时代,新硬件,数据被收集和分析的主体,将会从设备使用者个人,变成使用者的周围一切——如果你是一个技术乐观主义者,你就更不该无视这些数据隐私的新问题。


文章来自于“果壳”,作者“Jesse”。




关键词: AI , AI硬件 , openai , AI手表
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT