以上这些甲骨文如果盲猜的话,我只能认出“中”字。
第一次见到甲骨文 AI 平台的时候我觉得特别有趣,它不仅能够查询甲骨文以及甲骨片,而且针对每一个甲骨文都有详细的来源出处、释义、甲骨片信息等等,还有高清的甲骨片,甚至能把这么多的甲骨文井然有序地汇总在一起。
甲骨文 AI 平台主页面
甲骨文 AI 协同平台是一个由腾讯SSV支持的项目,旨在数字化甲骨文资料,提供数字工具箱和 AI 技术辅助解读,推动甲骨文研究和传承。项目还设立了数字甲骨共创计划,邀请专家学者和社会各界共同参与。
正经的我们就说到这里,接下里我们看看这个平台到底有什么魔力。
我们来随机点击第一个甲骨文“鼠”进行搜索,呈现在眼前的是这个甲骨文原字、释义、字体流变、异体字、相似字形、出自甲骨片、释读专家等。如图所示:
同样,想要知道甲骨文更多信息也可以通过甲骨文总字表看到,这都为想要全面了解某个甲骨文的朋友提供了极大的便利。
甲骨文总字表
说到甲骨文总字表,目前已收集的甲骨文约有14万+,已收集的字头约4000+,AI 已识别的字形约68万,AI这妥妥的生产提效工具啊!先别急,后续会有“数字工具箱”供大家上手体验,我们先来看看平台里面有什么。
我们点击第一个字,右边显示的是此字形的简体和繁体——“人”,以及“字体流变”。甚至是出自哪片甲骨片、释读专家都能知道。
甲骨文“鼠”相关信息
除了展示和研究功能,甲骨文 AI 协同平台还提供多层影像对齐、对比展示的功能,让用户可以更清晰地了解甲骨文的内容。
同时我们也可以通过平台提供的功能标注重点、记录细节,从而更深入地研究甲骨文,并与其他用户分享他们的研究成果。
看了这么多,甲骨文 AI 协同平台最核心的莫过于高清展示和AI算法识别。
高清展示
按照辞条查找
对比
AI字形匹配
除了以上的部分,还有与AI紧密相关的数据工具箱。
平台鼓励用户参与到甲骨文的研究和共建中来,比如里面让更多人可以分享自己的见解和发现,共同探索甲骨文的世界。
这是摹本生成工具,我分上传了4张图片,生成的效果如下:
摹本的结果非常清晰,字识别的也很清楚,摹本整体效果很不错。
AI查重工具
AI 字型检测工具
说到甲骨文呢,不得不提到商朝,主要是它记录了商朝的历史和日常生活。但甲骨文的研究并非易事,文字众多、形态各异,长时间侵蚀导致的文本模糊不清,年代久远难以辨认。更棘手的是,甲骨文没有一个统一的编码系统,让文本的对比和历史解读变得十分复杂。
这几年 AI 发展的越来越迅速,在专业领域也十分出色。它也可以精确识别甲骨文的各种字形,并在细小的划痕中挖掘出历史信息,帮助学者识别和解读那些难以辨认的文字。同时机器学习的应用能够自动地处理和比对大量文本,极大地提升了研究的效率和精度。
大模型能识别甲骨文吗?
接下来我们让AI猜猜看,这些甲骨文是什么字。
(1)比赛选手分别是:
最近火热的腾讯元宝、开源霸主通义千问、老熟人ChatGPT-4。
(3)比拼内容: 能识别出甲骨文得1分, 能识别出什么字再得2分。
(3)比拼规则:共两轮,每轮满分2分,两轮满分共4分。
先来看看第一轮:上传“鼠”字甲骨文,问AI这是什么字。
(PS:文章最开始有“鼠”字的详细释义,详解可返回查看)
腾讯元宝:
直接说是“梦”字,回答错误,本轮0分。
通义千问:
说是艺术或者象征性的图形,挺能胡说的,回答错误,本轮0分。
ChatGPT-4:
回答“永”字,一看就在胡说八道猜了。很遗憾,回答错误,本轮也是0分。
第二轮:上传甲骨片。看能否识别出是甲骨片,如果能识别出字那最好了。
腾讯元宝:
能识别出是甲骨片,得1分;后面猜测有有甲、骨这些,得分0分。
通义千问:
回答中识别出是古老卡片,但无法识别出时甲骨片,得0分。
ChatGPT-4:
能识别出甲骨碎片,得1分。但是无法识别出具体哪些字,不得分。共得1分。
本次比拼得分:
腾讯元宝 :通义千问 :ChatGPT-4 = 1 :0:1
整体来看,腾讯元宝和 ChatGPT-4 略胜一筹。
也能看出来,通用的AI基本上是无法识别甲骨文的含义的,只有专门针对这方面进行训练的模型才可以胜任。
甲骨文的研究,背后需要大量的资料相互比较以及不同图案之间联系来确定,这里面既需要数据的分析,也需要一定的想象力,现在的生成式AI恰好具备这种能力。
文章来源于“硅星GenAI ”,作者“椒盐玉兔”