核心提要:
1. 12月底,《自然-计算科学》发表研究,揭示丹麦科技大学国际研究团队的新产品——“Life2vec”的预报原理。它可以直接预测人的死亡率,准确率高达78%,据称是目前市面上准确度最高的预测方式。团队使用七年间超过230万名35至65岁丹麦人群的数据,分析个人生命历程中的事件序列,预测接下来最有可能发生的事情。
2. “Life2vec”模型类似于ChatGPT,其工作基于大型语言模型,通过分析人类生活中的事件序列,预测各种各样的结果,包括从早逝率到性格的细微差别、根据人生轨迹来反推性格,但它还不能预测一个人会如何死亡。
3. “Life2vec”模型或有助于识别人的疾病风险、帮助政府缩小贫富差距,但也会带来大量隐私、伦理以及数据安全问题。例如,大多数人可能实际上并不想知道他们何时迎来死亡。
如果有一台机器可以预报你的死亡时间,你会怎么办?
这会给人类带来恐慌吗?
丹麦科技大学的一支国际研究团队发布了一款新的大模型产品,名为:“Life2vec”,字面意思是“人生变向器”,它可以直接预测一个人的死亡率,准确率高达78%。
这据称是市面上准确度最高的预测方式。
为了预测“某人”(研究随机挑选的匿名人员)的死亡时间,该团队使用了2008年1月1日至2015年12月31日,七年间超过230万名35至65岁人群的数据。这几乎是丹麦目前所有的中年人的保险数据。研究选择这一群体是因为该年龄段的死亡率更难以预测。
这款叫做“Life2vec”的模型,使用这些数据来推断一个人在2016年之后的四年内,即在2020年幸存的概率。
“为了测试‘Life2vec’的效果如何,我们选择了一组100000个人,其中一半存活,一半死亡。”莱曼(Sune Lehmann)博士说。研究人员知道2016年之后哪些人死亡,但算法不知道。
在实验中,团队找来了600万丹麦人12年(2008~2020年)里生活中的全部数据:住址、学校、就医、诊断、收入和职业等,将其转化为可用于训练大型语言模型的文本。这种模型类似于 ChatGPT,通过分析大量文本数据,预测下一个最可能的词,以此推断未来事件发生的可能性。同理,研究人员开发的“Life2vec”模型可以分析个人生命历程中的事件序列,预测接下来最有可能发生的事情。
“Life2vec”模型采用 2008~2016年的数据进行训练,2016~2020年的数据则用于测试。研究人员将35~65岁的人群分为两组,其中一半在2016~2020年间去世,另一半则存活。他们让“Life2vec”模型对随机选中的“某人”预测在2020年谁活着、谁会死,最后,在2020年年末发现,预测准确率达到了78%。
“Life2vec”模型预测这些人的存亡结果,其准确率比现有 AI 模型和保险业常用的死亡率统计表高出 11%。
研究人员对模型回答的结果进行分析后发现,在同等条件下,作为工程师等技术工人或被诊断患有抑郁或焦虑等心理健康问题也会导致较早死亡,死亡率会更高。但担任管理职位或拥有高收入的个体拥有更高的存活率。
“Life2vec”模型预测失误的死亡案例中,大部分涉及难以预测的突发事故或心脏病。
Life2vec页面
这个可以预报人类死亡时间的AI模型:“Life2vec”,由丹麦技术大学(DTU)、哥本哈根大学、国际电信联盟(ITU)和美国东北大学的研究团队发布。
今年12月底发表于《自然-计算科学》上的一篇名为《利用生命事件序列预测人类寿命》的研究文章,披露了这一预报的原理以及方法。
如果用大量关于人类生活的数据,来训练所谓的“转换器模型”(类似于ChatGPT)来处理语言,它们就能系统地组织数据,生成关于一个人是否可能早逝,或其一生收入的预测。
“Life2vec”模型的工作原理是基于大型语言模型(类似ChatGPT背后语言模型),通过分析人类生活中的事件序列,总结模式和规律。一个人在生活中的所有部分都被赋予了一个代码,例如S52表示前臂骨折,072表示产后出血,POS3513表示某人是计算机系统技术人员等。
训练这个模型的数据使用了约600万丹麦人(据统计,截至2021年2月,丹麦人口为593.5万)的健康数据和劳动力市场依附情况。这个几乎是全部丹麦人口的数据。也就是说,他们可以预测几乎所有丹麦人的死亡时间,或者一生中发生的一些重大的健康事件。
该文章的第一作者,德国技术大学教授莱曼表示:“我们试图用这个模型来解决一个基本问题:在过去条件的基础上,我们有多大可能预测出未来的事件?在科学上,让我们感到兴奋的并不是预测本身,而是能够使模型提供如此精确答案的数据。”
“Life2vec”模型能够预测各种各样的结果,包括从早逝率到性格的细微差别。研究人员表示,他们的框架允许他们发现影响寿命结果的潜在机制以及个性化干预的相关可能性。
Life2vec的用途最初的设计,并不仅仅只是预测死亡率,它还能根据你的人生轨迹来反推你的性格。
这篇研究文章披露,他们从性格测试方面比较权威的模型里挑了一些题目,然后随机找了一些数据库中的“某人”来做性格测试。
比如在“我更喜欢跟别人一起工作而不是一个人工作”这道题上得分高的人,更喜欢交际。然后把人做的结果跟模型预测相比较,发现预测的准确度比神经网络算法高得多。
“Life2vec第一次真正站在个人的角度上,提供了一个可以从今天的选择,窥探未来人生样貌的可能。”
当然,“Life2vec”模型在预测死亡时间时,还有很多的缺陷,比如它还不能预测一个人会如何死亡。例如,算法无法预测一个人是否会在车祸中或者中毒丧生。
但莱曼认为,在不超过五年的时间里,随着全球各国的大量数据的训练,也许我们会看到一个更为精准的模型,可以预测出你的更为准确的死亡时间、甚至死亡方式。
这样一个死亡预报大模型有什么作用?
研究者莱曼认为:“这个模型有一天可能有助于识别一个人的疾病风险,可以帮助他们及时采取措施保持健康。也可以应用于广泛的健康和社会议题,例如预测和早期干预健康问题,或帮助政府缩小贫富差距。但这样的应用程序,也会带来大量隐私、伦理以及数据安全问题,在这个模型能够帮助任何人之前需要先解决这些问题。”
这个“死亡预报模型”是根据丹麦人真实的生活数据训练出来的,预测出来的结果目前来看,也仅适用于丹麦。除此之外,大多数人可能实际上并不想知道他们何时会死亡!莱曼称,为了保护用来训练该系统的丹麦公民的个人隐私信息,该AI模型目前不开放给公众或保险公司使用。
但“Life2vec”的发布,仍然在丹麦以及世界范围引发了讨论与恐慌。
CNN的文章认为,该模型如果被企业滥用可能会造成危害。尤其是保险公司,他们如果利用这个模型预测人们的健康与死亡时间,将可能会拒绝许多需要保险的民众。
“Life2vec模型不应该被保险公司使用,”莱曼在接受访问时强调,“保险的本质在于分担风险,预测谁会遭遇不幸事件或死亡,违背了保险互助的理念。”
但人们忧虑,这个预报人类死亡时间的大模型,或其他同类型的大模型,终有一天会被开放,被某些机构用于现实世界。
如果有一天,你去公司应聘,这家公司把你的资料输入系统,认为你有健康风险,拒聘你,这可能将会成为一个常态式的悲剧。
而这将会影响到人们的就业以及生活。
而如果当某一天,你知道了自己的死亡时间,会不会影响自己活下去的勇气?未知才是一个人生活下去的动力。而得知了临终的时间,你会如何度过余生?
某种程度上,这个预测死亡时间的大模型,可能是一个“坏的发明”。
并且无法预知它可能造成的灾难性的后果。
文章来自于微信公众号 “CC情报局”(ID:cancer-weekly),作者 “李洁”