这是一个基本测试的示例脚本,以后应该在PowerQuery/Python中实现。我不是Python开发人员,所以请温和一点。
import pandas as pd
data = [['Sql "syn-eu2-prd-edw-001 database windows net", "syndpeu2prdedw1", Query="SELECT ta FROM rdv_60_137.Account"', "x1"], ["b1", "x2"]]
df = pd.DataFrame(data, columns=["Expression","Key"])
ser = df['Expression']
serpd = pd.Series(ser)
print (serpd)
x = serpd.str.extractall(r'"(.*?)"')
print (x)
z = pd.merge(df, x, how="inner", left_index=True, right_index=True)
print (z)
我们的目标是创建一个新的DataFrame,其中包含第一个集合中的所有记录,但第一个记录将有3个示例,因为Regex函数创建了3行。
哈里·克尔
1条答案
按热度按时间cyvaqqii1#
按
MultiIndex.droplevel
删除MultiIndex的第二级,并按DataFrame.join
添加原始行: