我想用df2替换df1数据,其中df2是类似df1的数据示例
df1 <- data.frame(
name = c(
"A. MAHJUM-61365",
"A. MAHJUM-61365. MAHJUM-61365",
"A. RIZAL. AD-11002795",
"A. RIZAL. AD-11002795. RIZAL. AD-11002795",
"ABD. KADIR-60447",
"ABD. KADIR-60447ABD. KADIR-60447",
"ABD. KAHAR-62551",
"ABD. RASYID DS-11002082",
"ABDREAS APUNG @SANY",
"ABDUL AZIS @HYUNDAY",
"ABDUL AZIZ @HYUNDAI",
"ABDUL AZIZ@HYUNDAI"
))
并且df2是
df2 <- data.frame(
name = c(
"A. MAHJUM-61365",
"A. RIZAL. AD-11002795",
"ABD. KADIR-60447",
"ABD. KAHAR-62551",
"ABD. RASYID DS-11002082",
"ABDREAS APUNG @SANY",
"ABDUL AZIS @HYUNDAY"
))
如果df1看起来像df2,则df1将被替换为df2
2条答案
按热度按时间icnyk63a1#
由于是子串匹配,我们可以使用
fuzzyjoin
或者使用基于距离的方法
xn1cxnb42#
您可以使用
adist
查找最佳匹配并替换它们。