例如,我想拆分的列是duration,它有类似-110或2 seasons的数据点,我想为seasons创建一个不同的列,在我当前列中的seasons位置应该为null,因为这将使column int的类型来自string screenshot of my data
我尝试了split函数,但它是用于在数据点之间进行拆分的,而不是用于拆分其他不同的数据点
例如,我想拆分的列是duration,它有类似-110或2 seasons的数据点,我想为seasons创建一个不同的列,在我当前列中的seasons位置应该为null,因为这将使column int的类型来自string screenshot of my data
我尝试了split函数,但它是用于在数据点之间进行拆分的,而不是用于拆分其他不同的数据点
2条答案
按热度按时间wlzqhblo1#
我已经尝试复制你的 Dataframe 的一部分,以提供下面的解决方案-注意,它也将改变np.NaN值为'空'的要求。
根据屏幕截图创建示例 Dataframe :
问题很可能是'duration'列是对象数据类型-即它包含字符串和整数值。我做了2个小函数,它们将利用数据类型并将它们分配到各自的列。第一个是获取所有'string'行并将它们放置在'series_duration'列中:
然后,movies函数会保留整数值(即其中不含“Season”一词的整数值):
bbmckpt72#
我已经创建了一个示例,以向您提供一些有关如何管理此问题的想法。
首先,我创建了一个DF,其中包含int、格式为' X seasons'的字符串和负数:
然后我创建了下一个循环,它所做的是根据值的格式(字符串或负数)创建新列,插入它们并将原始值转换为NaN。
输出将如下所示:
然后,您可以根据需要调整此示例。