1、我记得有一个函数是计算2个字符串相似度的,可是我找不到了。大家谁能告诉我一下阿。。
2、还有一个比较棘手的问题,就是进行字符的模糊比较。
有2个包含身份证号的数据集,一个是数据集中的身份证隐藏了生日的月日。另外一个完整身份证。
我现在想判断除隐藏部门外,剩余部门一致的身份证号。
e.g. A B
1234561981XXXX0015 123456198112120015 /*完整身份证没有计算校验位,仅示例*/
我要挑出上述结果,隐藏部分的多种可能忽略。
我该怎么用通配符进行比较呢?