ludwig [AutoML] 在回退到文本之前,使用唯一值的截止百分比将数据列标记为CATEGORY,

k0pti3hp  于 1个月前  发布在  Go
关注(0)|答案(1)|浏览(26)

没有提供描述。

lxkprmvk

lxkprmvk1#

梅赛德斯-奔驰绿色数据集就是这个例子:X0-X8列应该是category,其余的都是binary
Ludwig master将5个分类列称为'text':

diff auto_config.json.automl auto_config.json.automl.master
84,86c84,86
<  'input_features': [{'column': 'X0', 'name': 'X0', 'type': 'category'},
<                     {'column': 'X1', 'name': 'X1', 'type': 'category'},
<                     {'column': 'X2', 'name': 'X2', 'type': 'category'},
---
>  'input_features': [{'column': 'X0', 'name': 'X0', 'type': 'text'},
>                     {'column': 'X1', 'name': 'X1', 'type': 'text'},
>                     {'column': 'X2', 'name': 'X2', 'type': 'text'},
89c89
<                     {'column': 'X5', 'name': 'X5', 'type': 'category'},
---
>                     {'column': 'X5', 'name': 'X5', 'type': 'text'},
91c91
<                     {'column': 'X8', 'name': 'X8', 'type': 'category'},
---
>                     {'column': 'X8', 'name': 'X8', 'type': 'text'},
467d466
\

相关问题