Spark:基于莱文斯坦(Levenshtein)距离计算字符串相似度
以下程序代码基于spark,使用scala语言,测试时间:2018-08-03str1和str2相似度 = 1 - Levenshtein距离 / max(length(str1), length(str2)) val df = spark.createDataset(Seq( (1, "ab", "abc"), (2, &q