Voici ma question, j'espère que quelqu'un peut m'aider à comprendre ..
Pour expliquer, il existe plus de 10 colonnes catégoriques de mon ensemble de données et chacune d'entre elles dispose de 200 à 300 catégories. Je veux les convertir en valeurs binaires. Pour cela, j'ai utilisé le premier codeur d'étiquettes pour convertir des catégories de chaînes en chiffres. Le code de codeur d'étiquette et la sortie sont indiqués ci-dessous.
Après le codeur d'étiquettes, j'ai utilisé un codeur chaud de Scikit-Reprendre à nouveau et cela est fonctionné. Mais le problème est que j'ai besoin de noms de colonnes après un codeur chaud. Par exemple, la colonne A avec des valeurs catégoriques avant de coder. A = [1,2,3,4,..]
Cela devrait être comme ça après le codage,
A-1, A-2, A-3
Tout le monde sait comment attribuer des noms de colonne à (noms de colonne anciens -Value nom ou numéro) après un codage à chaud. Voici mon codage à chaud et sa production;
J'ai besoin de colonnes avec nom parce que j'ai formé Ann, mais chaque fois que chaque fois les données, je ne peux plus convertir toutes les données passées et à nouveau. Donc, je veux ajouter de nouveaux nouveaux à chaque fois. Merci quand même..
Vous pouvez obtenir les noms de colonne à l'aide de .get_feature_names()
attribut.
>>> ohenc.get_feature_names()
>>> x_cat_df.columns = ohenc.get_feature_names()
L'exemple détaillé est ici .