regex 使用正则表达式连接两个 Dataframe

jgwigjjp  于 2023-08-08  发布在  其他
关注(0)|答案(1)|浏览(77)

我正在尝试使用正则表达式连接2个 Dataframe 。在一个 Dataframe 中是邮政编码区域(例如BA,M)在另一个是邮政编码区(例如. BA 1,M18).我想加入邮政编码区.我的正则表达式是([A-Z][A-Z]?)。如何在这个正则表达式上连接两个 Dataframe ?
我的正则表达式是([A-Z][A-Z]?).

qij5mzcb

qij5mzcb1#

你可以这样做:

df1 = pd.DataFrame(
    {
        "PostcodeArea" : ["BA", "M", "AB"],
        "Location" : ["Bath", "Manchester", "Aberdeen"],

    }
)
df2 = pd.DataFrame(
    {
        "PostcodeDistrict" : ["BA1", "M1", "AB1"],
    }
)

df2.assign(PostcodeArea = df2['PostcodeDistrict'].str.extract(r"([A-Z]+)")).merge(df1, on="PostcodeArea")

# Output:
  PostcodeDistrict PostcodeArea    Location
0              BA1           BA        Bath
1               M1            M  Manchester
2              AB1           AB    Aberdeen

字符串

相关问题