如何使用python pandas dataframe从excel列中提取特定值

sirbozc5  于 2022-12-09  发布在  Python
关注(0)|答案(1)|浏览(220)

需要使用python pandas数据框从excel列中提取特定值
我尝试提取的列产品如下所示&只需从中提取产品#。该列还包含其他数字,但产品#始终位于术语"UK Pro"之后&产品#在特定数据行中可能是3到4位数字。
在[1]中:
产品名称:

  • # Dataframe 如下所示:*

出局[1]:
检查中心:国王2000:英国职业1000:London
检查中心:第321章:我的天英国专业版250:西班牙Name
抄送:英国Pro 3000:法国Name
抄送:英国Pro 810:Poland

    • 预期输出:**
    • 产品编号**

1000
250
3000
810
从这个开始:
[1][1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][19][10][11][12][13][14][15][16][17][18][19][19][19][10][19][10][10][11][11][12][13][14][15][16][17][18][19][19][19][19][10][19][10][11][19][11][19][11][19][11][19][11]19][19][111
但这确实只根据前两次发生的情况进行拆分:的双曲正切值。
然后试了试这个:
df1 ['产品编号']= df1 ['产品']. str. split('英国专业',1). str [0]. str. strip()

omqzjyyz

omqzjyyz1#

您可以使用pandas.Series.str.extract

df["Product #"] = df["Product"].str.extract("UK Pro (\d+)", expand=False)
#输出:
print(df)
   Product #
0        NaN
1        NaN
2       1000
3        NaN
4        NaN
5        250
6        NaN
7       3000
8        NaN
9        810
10       NaN

相关问题