2019 年“认证杯”数学中国数学建模网络挑战赛B题
我们发现了一种未知的语言,现只知道其文字是以 20 个字母构成的。我 们已经获取了许多段由该语言写成的文本,但每段文本只是由字母组成的序 列,没有标点符号和空格,无法理解其规律及含义。我们希望对这种语言开展 研究,有一种思路是设法在不同段文本中搜索共同出现的字母序列的片段。 语言学家猜测:如果有的序列片段在每段文本中都会出现,这些片段就很可 能具备某种固定的含义 (类似词汇或词根),可以以此入手进行进一步的研究。 在文本的获取过程中,由于我们记录技术的限制,可能有一些位置出现了记 录错误。可能的错误分为如下三种: 1. 删失错误:丢失了某个字母; 2. 插入错误:新增了原本不存在的字母; 3.
用户评论