我在一个 Dataframe 中有一个列,我正在尝试从一个字符串中提取8位数字。我该怎么做呢
Input
Shipment ID
20180504-S-20000
20180514-S-20537
20180514-S-20541
20180514-S-20644
20180514-S-20644
20180516-S-20009
20180516-S-20009
20180516-S-20009
20180516-S-20009
- 预期产出**
Order_Date
20180504
20180514
20180514
20180514
20180514
20180516
20180516
20180516
20180516
我试了下面的代码,它不工作。
data['Order_Date'] = data['Shipment ID'][:8]
4条答案
按热度按时间wmtdaxz31#
您已接近,需要使用
str
进行索引,该索引适用于Serie
s的每个值:如果没有
NaN
s值,则为了获得更好的性能:x一个一个一个一个x一个一个二个x
如果忽略
str
代码,则按位置过滤列,前N个值如下:gopyfrb32#
您也可以使用
str.extract
5cg8jx4n3#
您还可以决定从
-S
删除到末尾您还可以捕获前8位数字,然后删除所有内容,并使用捕获组的反向引用替换:
irlmq6kh4#
我决定使用带有子集的
.str
访问器: