考虑以下数据框
pd.DataFrame.from_dict({'col_1': ["abcdefg", "hellowworld", "stackoverflow", "thankyou"]})
我想在每4个字符后添加一个连字符所需输出为
pd.DataFrame.from_dict(data = {'col_1': ["abcd-efg", "hell-owwo-rld", "stac-kove-rflo-w", "than-kyou"]})
qco9c6ql1#
使用添加的-将以前的每个组替换为自身
-
df['col_2'] =df['col_1'].str.replace(r'(\w{4})',r'\1-',regex=True).str.strip('\-') col_2 0 abcd-efg 1 hell-owworld 2 stac-koverflow 3 than-kyou
还是你想
df['col_2'] =df['col_1'].str.replace(r'(\w{4})',r'\1-',regex=True).str.strip('\-') col_1 col_2 0 abcdefg abcd-efg 1 hellowworld hell-owwo-rld 2 stackoverflow stac-kove-rflo-w 3 thankyou than-kyou
nnvyjq4y2#
您可以在此处使用str.replace:
str.replace
df["col_1"] = df["col_1"].str.replace(r'(?<=^.{4})', r'-')
mefy6pfw3#
@wwnde建议的执行第一个方法的更新方法
df['col_2'] =df['col_1'].str.replace(r'^(\w{4})',r'\1-',regex=True).str.strip('-')
3条答案
按热度按时间qco9c6ql1#
使用添加的
-
将以前的每个组替换为自身还是你想
nnvyjq4y2#
您可以在此处使用
str.replace
:mefy6pfw3#
@wwnde建议的执行第一个方法的更新方法