编辑距离(Levenshtein Distance)
是用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词w1,w2之间,由其中一个单词w1变为w2所需要的最少单字符编辑操作次数。 当两个字符串都为空串,那么编辑距离为0; 当其中一个字符串为空串时,那么编辑距离为另一个非空字符串的长度; 当两个字符串均为非空时(长度分别为 i 和 j ),取以下三种情况最小值即可: 1、长度分别为 i-1 和 j 的字符串的编辑距离已知,那么加1即可; 2、长度分别为 i 和 j-1 的字符串的编辑距离已知,那么加1即可; 3、长度分别为 i-1 和 j-1 的字符串的编辑距离已知,此时考虑两种情况,若第i个字符和第j个字符不同,那么 加1即可
用户评论