我想在下划线的 range 上拆分 Dataframe 中的行,并将拆分值保存到新列中。
Type Name
Parent ABC_US_Test_en-us
Child ABC_12252020_US_Test_Natl_en-us_Home-vs-Away
Subchild break1
例如,我想将ABC_12252020_US_Test_Natl_en-us_Home-vs-Away
拆分为US_Test_Natl_en-us
的一列和Home-vs-Away
的另一列,这样输出如下所示:
Type Name Type Matchup
Parent ABC_US_Test_en-us
Child ABC_12252020_US_Test_Natl_en-us_Home-vs-Away US_Test_Natl_en-us Home-vs-Away
Subchild break1
换句话说,我想把第二个和第六个下划线之间的所有内容保存到一个新列,把第六个下划线之后的所有内容保存到另一个新列。
2条答案
按热度按时间yhxst69z1#
让我们使用正则表达式模式来提取第2个和第6个下划线之间的匹配组。
结果
正则表达式详细信息
.*?_
:匹配任何字符零次或多次,但尽可能少地匹配后跟文字下划线的字符。smdncfj32#
通常,可以使用
string.split(delimiter)
按字符拆分字符串,使用'character'.join(list)
进行连接。