计算工具“Read-y Grammarian”助力重建新加坡石碑残缺铭文

几年前,一支语言学研究团队启动开发名为“Read-y Grammarian”的计算工具,目标是重建新加坡石碑上高度残缺的铭文。新加坡石碑为10至14世纪遗物,其刻写文字外观与卡威文等地区书写系统相近,但至今仍未被破译。

据介绍,“Read-y Grammarian”采用专门算法,将数字语言学与铭文学方法结合,用于分析刻录在耐久材料上的古代文字。该系统最初围绕新加坡石碑的修复需求设计,但研究团队表示,其自适应框架经过参数调整后,也可用于重建其他受损历史文本,包括手稿与纸草文献。

石碑的发现与保存现状

资料显示,新加坡石碑于1819年由英国人在新加坡河口首次记录。1843年,为给建筑工程腾出空间,这块砂岩巨石被拆除。原石约三米见方,拆除后大部分被毁,仅存三块碎片。

研究人员曾将碎片送往加尔各答皇家亚洲学会博物馆进行研究,随后相关去向记录中断。根据现有记录,1918年该机构仅将其中一块碎片归还当时的新加坡莱佛士博物馆。

石碑原刻约50行铭文,但全文已遗失。目前可供研究的材料包括:毁坏前的几幅粗略素描、1843年后回收的三块碎片复制品,以及仍保存的一块原始碎片。研究人员指出,铭文所用文字虽与爪哇卡威文等书写系统相似,但并不符合任何已知书写系统,因此至今无人能够读懂。

“预测”式重建方法

研究团队介绍,“Read-y Grammarian”首先对铭文进行数字化处理,为每个已知字符分配唯一的字母数字代码,并记录符号在文本中的具体位置与行数。在此基础上,算法识别缺失区域,逐行推断可能的原始版面布局。

随后,系统结合频率分析以及基于人类语言模式的统计与数学计算,预测可用于填补空白的字符,并将字母数字输出再转换为对应字符。研究人员还可在系统中调整参考语言或语系的相关设置,例如句法与形态学参数,以生成不同版本的重建文本,再由团队对各版本进行语言学合理性评估。

该团队表示,上述流程还可将音素映射到文本中的字符,帮助识别可能的词汇,从而便于将该文字与多种候选语言进行对照测试。

当前进展与后续工作

研究团队称,其最终目标是实现对铭文的完整阅读与理解,并据此完成真正意义上的破译。尽管确定确切语言仍需时间,但团队已重建出若干“完整文本的合理版本”。研究人员认为,在石碑本体几乎被完全摧毁的情况下,这一进展具有重要意义。

团队同时表示,正在开发更先进的模型以扩展“Read-y Grammarian”的能力,包括更快、更大规模生成系统转录文本,并引入历史音韵学等特征以优化结果。

研究人员指出,破译工作的主要难点在于残存材料过少,碎片规模不足以支撑可靠的频率分析或统计研究,而模式识别作为密码分析的核心工具通常需要更多数据。为推进研究,团队计划继续以逐块、逐行方式重建更完整的铭文文本,为后续分析其结构、破解书写系统并识别潜在语言奠定基础。

本文内容转载自The Conversation,采用知识共享许可协议。


分享:


发表评论

登录后才可评论。 去登录