我有一些数据可以按列type
分组,然后按另一列order
排序。我想知道我是否可以使用sklearn
的train_test_split
来拆分这些数据,以便将order
值相同且在数字上最后的行拆分为test
。在下面的示例中,我希望最后两行order=3
进入test
的情况。
| 类型|秩序|
| --|--|
| 一| 1 |
| 一| 1 |
| 一| 2 |
| 一| 2 |
| 一| 3 |
| 一| 3 |
我能想到的方法是通过编程的方式来实现,并在从具有多个类型的较大的嵌套框中选择这些值后,在type
上遍历时,将这些值附加到列表,嵌套框或数组中。我想知道是否有一种替代方法可以使用train_test_split
或pandas
中的某些东西来避免循环。
编辑:
我也想有在顶部的行与订单1
和2
,因为我需要他们在培训。
2条答案
按热度按时间vwkv1x7d1#
下面的解决方案是否合适?它根据行是否为“order == maximum order value”来过滤行。
的数据
数据类型:
字符串
筛选行
型
rqenqsqc2#
验证码
字符串
第一个月
型
df[~cond]
个型