python两个excel字段模糊匹配_基于条件python的2个大数据集模糊模糊模糊字符串匹配...
我有两个大数据集,我已经读入了Pandas数据帧(分别约20K行和约40K行)。当我尝试使用pandas.merge在address字段中直接合并这两个df时,与行数相比,我得到的匹配数微不足道。所以我想我会尝试模糊字符串匹配,看看它是否提高了输出匹配的数量。为此,我尝试在DF1(20K行)中创建一个新列,这是将DF1[addressline]上的fuzzywuzzy extractone函数应用...