我有一个数据框,里面有看电视的数据。它具有以下功能:通道、开始时间、结束时间和id。它看起来如下所示:
如您所见,用户可以连续观看一些频道(下一行的开始时间比上一行的结束时间晚一秒)。例如,他看电视 ICTV
首先,然后切换到 zap
,然后 KYIV
,然后再次 zap
. 但在下一节课之前还有短暂的休息。
我需要做的是将所有连续的行合并成一行。例如,在本例中,我想将前四行合并为以下内容:
id start end channels
72_1 2019-01-01 08:01:29 2019-01-01 08:05:52 ['ICTV', 'zap', 'KYIV', 'zap']
类似地,原始数据集中的下三行将形成以下行:
id start end channels
72_1 2019-01-01 08:06:14 2019-01-01 08:13:04 ['zap', 'NEWS ONE', 'zap']
现在,我只能对数据集进行完整的迭代,但我相信有一种更有效的方法可以做到这一点。在这种情况下,我将如何连接行?
提前感谢您的帮助!
暂无答案!
目前还没有任何答案,快来回答吧!