Je suis un tutoriel sur les bases de l’apprentissage automatique et il est mentionné que quelque chose peut être une fonctionnalité ou un label .
D'après ce que je sais, une fonctionnalité est une propriété des données en cours d'utilisation. Je ne peux pas comprendre quelle est l'étiquette, je connais le sens du mot, mais je veux savoir ce que cela signifie dans le contexte de l'apprentissage automatique.
En bref, fonctionnalité est entrée; l'étiquette est sortie. Cela s'applique aux problèmes de classification et de régression.
Une fonctionnalité est une colonne des données de votre jeu d'entrées. Par exemple, si vous essayez de prédire le type d'animal que quelqu'un choisira, vos caractéristiques d'entrée peuvent inclure l'âge, la région d'origine, le revenu familial, etc. L'étiquette est le choix final, comme chien, poisson, iguane, rocher etc.
Une fois que vous avez formé votre modèle, vous lui donnerez une série de nouvelles entrées contenant ces fonctionnalités. il renverra "l'étiquette" prévue (type d'animal) pour cette personne.
Caractéristique:
Apprentissage automatique signifie une propriété de vos données d’entraînement. Ou vous pouvez dire un nom de colonne dans votre jeu de données d'apprentissage.
Supposons que ceci soit votre jeu de données d'entraînement
Height Sex Age
61.5 M 20
55.5 F 30
64.5 M 41
55.5 F 51
. . .
. . .
. . .
. . .
Ensuite, voici Height
, Sex
et Age
sont les caractéristiques.
label:
Le résultat que vous obtenez de votre modèle après l’avoir formé est appelé étiquette.
Supposons que vous alimentiez un ensemble d'algorithmes au-dessus d'un ensemble de données et générez un modèle permettant de prédire le sexe en tant qu'homme ou femme. Dans le modèle ci-dessus, vous transmettez des caractéristiques telles que age
, height
etc.
Donc, après le calcul, le genre sera masculin ou féminin. C'est appelé un Label
Prenons un exemple où nous souhaitons détecter l'alphabet à l'aide de photos manuscrites. Nous introduisons ces exemples d'images dans le programme et le programme les classe en fonction des caractéristiques qu'ils ont obtenues.
Voici un exemple d’entité dans ce contexte: la lettre 'C'
peut être considérée comme une concave tournée vers la droite.
Une question se pose maintenant sur la manière de stocker ces fonctionnalités. Nous devons les nommer. Voici le rôle du label qui existe. Un étiquette est attribué à ces fonctionnalités pour les distinguer des autres fonctionnalités.
Ainsi, nous obtenons étiquettes en sortie avec caractéristiques en entrée.
Les étiquettes sont pas associées à un apprentissage non supervisé.
Voici une approche plus visuelle pour expliquer le concept. Imaginez que vous souhaitiez classer l'animal présenté sur une photo.
Les classes d'animaux possibles sont par exemple des chats ou des oiseaux. Dans ce cas, l'étiquette correspond aux associations de classe possibles, par exemple. chat ou un oiseau, que votre algorithme d'apprentissage automatique prédira.
Les caractéristiques sont des motifs, des couleurs, des formes qui font partie de vos images, par exemple. sourcils, plumes, ou plus d'interprétation de bas niveau, valeurs de pixels.
Label: Oiseau
Caractéristiques: plumes
Étiquette: Cat
Caractéristiques: Furr
Une fonctionnalité brièvement expliquée serait l'entrée que vous avez introduite dans le système et l'étiquette serait la sortie attendue. Par exemple, vous avez nourri de nombreuses caractéristiques d’un chien, telles que sa taille, sa couleur de fourrure, etc., de sorte qu’après le calcul, le chien que vous souhaitez connaître sera renvoyé.
Condition préalable: statistiques de base et exposition à ML (régression linéaire).
On peut y répondre en une phrase -
Ils se ressemblent mais leur définition change en fonction des nécessités.
Laissez-moi expliquer ma déclaration. Supposons que vous ayez un jeu de données. Pour ce faire, considérons exercise.csv
. Chaque colonne du jeu de données est appelée entité. Le sexe, l'âge, la taille, la fréquence cardiaque, la température corporelle et les calories peuvent figurer parmi les différentes colonnes. Chaque colonne représente des caractéristiques ou des propriétés distinctes.
User_ID Gender Age Height Weight Duration Heart_Rate Body_Temp Calories
14733363 male 68 190.0 94.0 29.0 105.0 40.8 231.0
14861698 female 20 166.0 60.0 14.0 94.0 40.3 66.0
11179863 male 69 179.0 79.0 5.0 88.0 38.7 26.0
Pour consolider la compréhension et résoudre le problème, prenons deux problèmes différents (cas de prédiction).
CAS 1: Dans ce cas, nous pourrions envisager d'utiliser - Sexe, taille et poids pour prédire les calories brûlées pendant l'exercice. Cette prédiction (Y) Les calories Voici une Label. Les calories est la colonne que vous souhaitez prédire à l'aide de diverses fonctionnalités telles que - x1: sexe, x2: hauteur et x3: poids.
CAS2: Dans le deuxième cas, nous pourrions vouloir prédire le Heart_rate en utilisant le genre et le poids comme caractéristique. Ici Heart_Rate est un Label prédit en utilisant caractéristiques - x1: sexe et x2: poids.
Une fois que vous avez compris l'explication ci-dessus, vous ne serez plus vraiment confus avec Label et fonctionnalités.