# 热门搜索 #
搜索
AI首次成功解读了古代赫库兰尼姆卷轴上的文字。
2714点击    2023-10-13 15:01


赫库兰尼姆烧焦的卷轴无法轻易打开,但 X 射线扫描可以揭示其中的内容。


一位21岁的计算机科学学生赢得了一个全球性竞赛,他首次阅读了古罗马城赫库兰尼姆中一卷经过碳化的卷轴上的文字,这些文字自公元79年的火山爆发以来一直无法阅读,这次火山爆发也埋葬了附近的庞贝城。这一突破可能会揭示出自希腊罗马古代以来仅有的完整图书馆中的数百份文献。


卢克·法里托(Luke Farritor)是内布拉斯加大学林肯分校的一名计算机科学学生,他开发了一种机器学习算法,可以检测到卷起的莎草纸上的希腊字母,包括“πορϕυρας”(porphyras),意为“紫色”。法里托使用表面纹理的微小差异来训练他的神经网络,突出显示墨水。


意大利那不勒斯大学的文献学家费德里卡·尼科拉尔迪(Federica Nicolardi)是评审法里托研究结果的学术委员会的成员之一,她说:“当我看到第一张图片时,我感到震惊。”她说,“这实在是一个梦。”现在,“我实际上能看到卷轴内部的一些东西。”


公元79年,维苏威火山喷发,导致赫库兰尼姆被埋在20米厚的火山灰下,数百份卷轴被掩埋。早期的尝试打开这些莎草纸只造成了一堆碎片,学者们担心剩下的部分永远无法打开或阅读。尼科拉尔迪说:“它们都被破碎和挤压了。”


维苏威斯挑战赛设有一系列奖项,其中主奖金为70万美元,用于阅读四个或更多的卷轴文段。10月12日,组织者宣布法里托获得了阅读一个4平方厘米莎草纸上超过10个字符的“第一封信”奖金,奖金为4万美元。自由大学柏林的研究生Youssef Nader获得了第二名,奖金为1万美元。


奢侈图书馆


意大利威尼斯卡·福斯卡里大学的古希腊和罗马历史学家西娅·索默希尔德(Thea Sommerschield)表示,最终能够看到卷轴内的字母和单词是“极其令人兴奋的”。这些卷轴是在18世纪被发现的,当时工人们偶然发现了一座豪华别墅的遗迹,这座别墅可能曾属于凯撒的岳父家族。索默希尔德表示,解读这些莎草纸可能“彻底改变我们对古代历史和文学的了解”。今天所知的大多数古典文本都是多个抄写员在几个世纪内反复抄写的结果。相比之下,赫库兰尼姆图书馆包含了没有其他来源的作品,直接来自作者。


到目前为止,研究人员只能研究已经打开的碎片。已经确认一些拉丁文的作品,但其中大多数包含了与伊壁鸠鲁学派哲学有关的希腊文本。其中有一部分是由伊壁鸠鲁学派创始人伊壁鸠鲁(Epicurus)本人写的《自然论》的片段,以及一位鲜为人知的哲学家费洛德默斯(Philodemus)的作品,涉及有关恶习、音乐、修辞和死亡等主题。有人提出,这个图书馆可能曾经是他的工作收藏。但仍然有600多份卷轴保存完好且没有打开,大部分保存在那不勒斯国家图书馆,少数在英国和法国。还有更多的莎草纸可能仍然保存在别墅未挖掘的较低楼层。


西尔斯及其团队花了数年时间开发了一种方法,通过X射线计算机断层扫描来“虚拟展开”这些极薄的莎草纸层,并将其可视化为一系列平面图像。2016年,他报道称,他使用这种技术阅读了来自以色列恩-格迪的烧毁卷轴,揭示了《利未记》的部分内容,这是犹太教《托拉》和基督教旧约的一部分,写于公元3或4世纪。但恩-格迪卷轴上的墨水含有金属,因此在CT扫描中会明亮发光。而赫库兰尼姆卷轴上的墨水是碳基的,基本上是炭和水,密度与莎草纸上的相同,因此在扫描中不显示出来。


西尔斯意识到,即使在亮度没有区别的情况下,CT扫描可能会捕捉到微小的纹理差异,这些差异可以区分涂有墨水的莎草纸区域。为了证明这一点,他训练了一个人工神经网络,用于阅读已打开的赫库兰尼姆碎片的X射线图像。然后,在2019年,他将两份完好的卷轴从法国巴黎的法国学院带到了位于英国牛津附近的同步辐射X射线设施Diamond Light Source进行了迄今为止最高分辨率的扫描(每个3D图像元素或体素的分辨率为4-8微米)。


然而,阅读完整的卷轴仍然是一项巨大的任务,因此该团队将其所有扫描和代码发布给公众,并启动了维苏威斯挑战赛。西尔斯说:“我们都同意,我们宁愿尽早读出卷轴内部的内容,而不是试图囤积一切。”大约1500个团队很快通过游戏聊天平台Discord进行了讨论和合作。奖金被分为几个阶段,每当达到一个里程碑,获胜的代码就会被公开发布,供所有人继续开发。法里托一直对历史感兴趣,并在孩提时代自学了拉丁文,他很早就参与其中。


与此同时,西尔斯的团队致力于虚拟展开,将已打平的碎片图像提供给参赛者进行分析。关键时刻出现在6月底,当时一位竞赛者指出,在一些图像上,墨水偶尔可以用肉眼看到,呈现为一个被称为“破裂”的微妙纹理。法里托立刻把注意力集中在这个破裂上,寻找更多字母的线索。


在今年8月的一个晚上,他正在参加派对,突然收到一条新的图像已经发布的警报,上面的破裂特别明显。他用手机连接到竞赛平台,在新图像上运行了他的算法。一个小时后回家时,他拿出手机,在屏幕上看到了五个字母。“我欣喜若狂,”他说,“天哪,这实际上会奏效。”从那时开始,他只用了几天的时间来完善模型,并找出获奖所需的十个字母。



古文书学家们也感到兴奋。在已打开的赫库兰尼姆卷轴中,单词“紫色”还没有被阅读出来。紫色染料在古罗马时期非常受欢迎,是由海螺腺体制成的,因此这个词可能指的是紫色、长袍、有能力购买染料的人的地位,甚至是软体动物。但比起单个词汇,阅读任何东西更重要,尼科拉尔迪说。这一进展“给了我们潜在的可能性,可以恢复整个卷轴的文本”,包括标题和作者,以便识别和确定作品的日期。


看不见的图书


伦敦谷歌DeepMind的研究科学家雅尼斯·阿萨埃尔(Yannis Assael)将维苏维斯挑战赛描述为“独特而鼓舞人心”。但他指出,这是一个更广泛转变的一部分,人工智能(AI)越来越多地帮助研究古代文本。例如,去年,阿萨埃尔和索默希尔德发布了一种名为“Ithaca”的AI工具,旨在帮助学者了解未知的古希腊铭文的日期和起源,并提出填补任何空白文本的建议。现在每周接收数百个查询,类似的工作正在应用于从韩文到阿卡德文等不同语言,阿卡德文是古代美索不达米亚地区使用的语言。


西尔斯希望机器学习能打开他所称的“看不见的图书馆”。这包括实际存在但无人能看到的文本,包括中世纪书籍装订中使用的羊皮纸;覆写文献,后来的文字掩盖了下面的一层;以及卡通纸,用于制作古埃及木乃伊外壳和面具的废弃莎草纸。


然而,现在所有人都在关注维苏维斯挑战赛。大奖的截止日期是12月31日,西尔斯形容气氛是“无法抑制的乐观"。法里托已经对卷轴的其他部分运行了他的模型,并可能看到更多的字符出现。



参考链接:https://www.nature.com/articles/d41586-023-03212-1





关键词: AI阅读 , 机器学习 , AI图像