我有一个pandas框架,上面有一个送货员完成的送货信息。在这个pandas框架中有四列。第一列是DateTime
,第二列是SortieNumber
,第三列是CustomerName
,第四列是ProductCode
。
我想研究这个pandas框架,并在其中找到链。我想知道这个送货员是否在每次出击中以相同的订单向相同的客户送货。我不关心订购的产品。数据框架的第一行是这样的:
DateTime SortieNumber CustomerName ProductCode
01/01/2023 09:00:00 1 Josh 001
01/01/2023 09:10:00 1 Alice 002
01/01/2023 09:15:00 1 Robert 002
01/01/2023 12:00:00 2 Anna 001
01/01/2023 12:00:10 2 Anna 003
01/01/2023 12:15:00 2 Robert 003
01/01/2023 15:00:00 3 Josh 004
01/01/2023 15:05:10 3 Alice 003
01/01/2023 15:15:00 3 Robert 001
01/01/2023 15:30:10 3 Robert 002
01/01/2023 15:35:15 3 Robert 003
字符串
从这个数据中,我想说的是,链Josh-Alice-Robert
发生在3个架次中的2个架次中,Anna-Robert
发生在3个架次中的一个架次中,其余的行依此类推。
这可以做到吗?
2条答案
按热度按时间4xrmg8kj1#
您可以确保行按
SortieNumber
和DateTime
排序,然后删除相同的连续SortieNumber
/CustomerName
,groupby.aggregate
作为字符串和value_counts
:字符串
SortieNumber
中,同一个客户永远不会与另一个客户一起交付,则可以将.loc[…]
简化为.drop_duplicates(['SortieNumber', 'CustomerName'])
。*输出量:
型
如果你想要一个比例,传递
normalize=True
到value_counts
:型
3xiyfsfu2#
字符串