通常,我们将df.drop('column_name', axis=1)
用于删除DataFrame中的列。我想将此Transformer添加到管道中
范例:
numerical_transformer = Pipeline(steps=[('imputer', SimpleImputer(strategy='mean')),
('scaler', StandardScaler(with_mean=False))
])
我该怎么做?
4条答案
按热度按时间bxfogqkk1#
你可以像这样编写一个自定义的Transformer:
并在管道中使用它:
输出量:
j5fpnvbx2#
您可以将
Pipeline
封装到ColumnTransformer
中,这样您就可以选择通过管道处理的数据,如下所示:注意:我在这里使用正则表达式模式来排除列
A
。dly7yett3#
最简单的方法是在
sklearn.compose.ColumnTransformer
中使用'drop'
的transformer
特殊值:wgmfuz8q4#
我认为这里所有的答案都过于复杂了。FunctionTransformer就是用于这种类型的过程的:
顾名思义,您可以定义任意函数。因为这里的操作是最基本的,所以我不认为这需要一个独立的类。