J'ai récemment étudié l'apprentissage supervisé et non supervisé. En théorie, je sais que supervisé signifie obtenir les informations à partir de jeux de données étiquetés et non supervisé, regrouper les données sans donner d'étiquette.
Mais le problème est que je suis toujours confus d’identifier si l’exemple donné est un apprentissage supervisé ou non supervisé au cours de mes études.
Quelqu'un peut-il s'il vous plaît donner un exemple concret?
Enseignement supervisé:
Exemple:
Classification: La machine est formée pour classer quelque chose dans une classe.
- classer si un patient a la maladie ou pas
- classer si un email est un spam ou non
Régression: La machine est entraînée à prévoir certaines valeurs comme le prix, le poids ou la taille.
- prédire le prix de la maison/propriété
- prédire le cours de bourse
Apprentissage non supervisé:
Exemple:
Clustering: Un problème de clustering est l'endroit où vous souhaitez découvrir les regroupements inhérents aux données
- tels que le regroupement des clients par le comportement d'achat
Association: Un problème d'apprentissage des règles d'association est l'endroit où vous souhaitez découvrir des règles décrivant de grandes parties de vos données.
- comme les gens qui achètent X ont aussi tendance à acheter Y
En savoir plus: Algorithmes d'apprentissage automatique supervisés et non supervisés
Enseignement supervisé
Ceci est simple et vous l’auriez fait plusieurs fois, par exemple:
En fonction des informations passées sur les spams, filtrer un nouvel email entrant dans Boîte de réception (normal) ou Dossier indésirable (Spam)
Les systèmes biométriques d'assistance ou ATM, dans lesquels vous entraînez la machine après quelques entrées (de votre identité biométrique - pouce, iris ou lobe d'oreille, etc.), peuvent valider vos entrées futures et vous identifier.
Apprentissage non supervisé
Un ami vous invite à sa fête où vous rencontrez des inconnus. Vous allez maintenant les classer en utilisant des apprentissages non supervisés (aucune connaissance préalable) et cette classification peut être basée sur le sexe, le groupe d'âge, l'habillement, le diplôme ou tout autre moyen que vous souhaitez. Pourquoi cet apprentissage est-il différent de l'apprentissage supervisé? Étant donné que vous n'avez utilisé aucune connaissance antérieure/antérieure sur les personnes et que vous les avez classées "à emporter".
La NASA découvre de nouveaux corps célestes et les trouve différents des objets astronomiques précédemment connus - étoiles, planètes, astéroïdes, Trous noirs, etc. (c’est-à-dire qu’elle n’a aucune connaissance de ces nouveaux corps) aimerait (distance de la Voie Lactée, intensité, force gravitationnelle, décalage rouge/bleu ou autre)
Supposons que vous n'ayez jamais vu un match de cricket auparavant et que, par hasard, regardiez une vidéo sur Internet, vous pouvez maintenant classer les joueurs sur la base de critères différents: les joueurs portant le même type de kits sont dans une classe, les joueurs d'un style sont dans une classe (batteurs, quilleurs, joueurs de champ), ou sur la base d'une main (RH contre LH) ou de quelque manière que ce soit que vous observeriez [et classeriez].
Nous menons une enquête sur 500 questions sur la prévision du niveau de QI des étudiants dans un collège. Comme ce questionnaire est trop volumineux, après 100 étudiants, l’administration décide de réduire le questionnaire à moins de questions et pour cela, nous utilisons une procédure statistique telle que PCA .
J'espère que ces quelques exemples expliquent la différence en détail.
L'apprentissage supervisé a une entrée et une sortie correcte. Par exemple: Nous avons les données si une personne a aimé le film ou non. En interrogeant des personnes et en recueillant leur réponse, que le film leur plaise ou non, nous allons prédire si le film va être frappé ou non.
Regardons l'image dans le lien ci-dessus. J'ai visité les restaurants marqués d'un cercle rouge. Les restaurants que je n'ai pas visités sont marqués d'un cercle bleu.
Maintenant, si j'ai deux restaurants au choix, A et B, marqués par la couleur verte, lequel choisirai-je?
Simple. Nous pouvons classer les données données linéairement en deux parties. Cela signifie que nous pouvons tracer une ligne séparant les cercles rouge et bleu. Regardez la photo dans le lien ci-dessous:
Maintenant, nous pouvons dire avec une certaine confiance que les chances de ma visite à B sont supérieures à A. Il s’agit d’un apprentissage supervisé.
L'apprentissage non supervisé a des entrées. Supposons que nous avons un chauffeur de taxi qui a la possibilité d'accepter ou de refuser les réservations. Nous avons tracé son emplacement de réservation accepté sur la carte avec un cercle bleu et est présenté ci-dessous:
Maintenant, le chauffeur de taxi a deux réservations A et B; Lequel il acceptera? Si nous observons le complot, nous pouvons voir que sa réservation acceptée montre un groupe dans le coin inférieur gauche. Cela peut être montré dans l'image ci-dessous:
Enseignement supervisé
L'apprentissage supervisé est assez courant dans les problèmes de classification car l'objectif est souvent de permettre à l'ordinateur d'apprendre un système de classification que nous avons créé. La reconnaissance des chiffres, encore une fois, est un exemple courant d’apprentissage en classification. De manière plus générale, l’apprentissage de la classification convient à tout problème pour lequel la déduction d’une classification est utile et facile à déterminer. Dans certains cas, il peut même ne pas être nécessaire de donner des classifications prédéterminées à chaque occurrence d'un problème si l'agent peut établir les classifications pour lui-même. Ce serait un exemple d'apprentissage non supervisé dans un contexte de classification.
L'apprentissage supervisé est la technique la plus courante pour la formation de réseaux de neurones et d'arbres de décision. Ces deux techniques dépendent fortement des informations fournies par les classifications prédéterminées. Dans le cas des réseaux de neurones, la classification est utilisée pour déterminer l'erreur du réseau, puis ajuster le réseau pour la minimiser. Dans les arbres de décision, les classifications sont utilisées pour déterminer quels attributs fournissent le plus d'informations pouvant être utilisées pour résoudre le puzzle de la classification. Nous examinerons ces deux aspects plus en détail, mais pour le moment, il devrait être suffisant de savoir que ces deux exemples ont leurs chances de bénéficier d'une "supervision" sous la forme de classifications prédéterminées.
La reconnaissance vocale utilisant des modèles de Markov cachés et des réseaux bayésiens repose également sur certains éléments de supervision afin d'ajuster les paramètres afin de minimiser, comme d'habitude, l'erreur sur les entrées fournies.
Remarquez quelque chose d'important ici: dans le problème de la classification, le but de l'algorithme d'apprentissage est de minimiser l'erreur par rapport aux entrées données. Ces entrées, souvent appelées "jeu d'apprentissage", sont les exemples à partir desquels l'agent tente d'apprendre. Mais bien apprendre la formation n’est pas forcément la meilleure chose à faire. Par exemple, si j'essayais de vous apprendre en exclusivité ou si je ne vous montrais que les combinaisons consistant en un vrai et un faux, mais jamais les deux faux ou les deux vrais, vous pourriez apprendre la règle selon laquelle la réponse est toujours vraie. De même, avec les algorithmes d'apprentissage automatique, un problème courant consiste à sur-ajuster les données et essentiellement à mémoriser l'ensemble d'apprentissage, plutôt que d'apprendre une technique de classification plus générale.
Apprentissage non supervisé
L'apprentissage non supervisé semble beaucoup plus difficile: le but est que l'ordinateur apprenne à faire quelque chose que l'on ne lui dit pas comment faire! En réalité, il existe deux approches d’apprentissage non supervisé. La première approche consiste à enseigner à l'agent non pas en donnant des catégorisations explicites, mais en utilisant une sorte de système de récompense pour indiquer le succès. Notez que ce type de formation s’intégrera généralement dans le cadre du problème décisionnel car l’objectif n’est pas de produire une classification, mais de prendre des décisions qui maximisent les avantages. Cette approche se généralise bien au monde réel, où les agents peuvent être récompensés pour certaines actions et punis pour d'autres.
Souvent, une forme d'apprentissage par renforcement peut être utilisée pour un apprentissage non supervisé, où l'agent fonde ses actions sur les récompenses et les punitions précédentes sans nécessairement même apprendre aucune information sur les effets exacts de ses actions sur le monde. D'une certaine manière, toutes ces informations sont inutiles, car en apprenant une fonction de récompense, l'agent sait simplement quoi faire sans traitement, car il sait exactement quelle récompense il espère obtenir pour chaque action qu'il pourrait entreprendre. Cela peut être extrêmement bénéfique dans les cas où le calcul de toutes les possibilités prend beaucoup de temps (même si toutes les probabilités de transition entre États du monde étaient connues). Par contre, apprendre par essais et erreurs peut prendre beaucoup de temps.
Mais ce type d’apprentissage peut être puissant, car il n’est fondé sur aucune classification d’exemples préalablement découverte. Dans certains cas, par exemple, nos classifications peuvent ne pas être les meilleures possibles. Un exemple frappant est que la sagesse conventionnelle sur le jeu de backgammon a été renversée quand une série de programmes informatiques (neuro-gammon et TD-gammon) qui ont appris grâce à un apprentissage non supervisé sont devenus plus puissants que les meilleurs joueurs encore et encore. Ces programmes ont découvert des principes qui ont surpris les experts du backgammon et ont donné de meilleurs résultats que les programmes de backgammon formés à des exemples préclassés.
Un deuxième type d'apprentissage non supervisé est appelé clustering. Dans ce type d'apprentissage, le but n'est pas de maximiser une fonction d'utilité, mais simplement de trouver des similitudes dans les données d'apprentissage. On suppose souvent que les grappes découvertes correspondront assez bien à une classification intuitive. Par exemple, le regroupement d'individus sur la base de données démographiques peut entraîner un regroupement des riches d'un groupe et des pauvres d'un autre.
Apprentissage supervisé: en termes simples, vous avez certains intrants et vous attendez des extrants. Par exemple, vous avez des données de marché boursier qui sont des données antérieures et pour obtenir les résultats de la saisie actuelle pour les prochaines années en donnant des instructions, elles peuvent vous donner le résultat souhaité.
Apprentissage non supervisé: vous avez des paramètres comme la couleur, le type, la taille de quelque chose et vous voulez un programme permettant de prédire que c’est un fruit, une plante, un animal ou quoi que ce soit, c’est là que Supervisé entre en jeu. Il vous donne une sortie en prenant contributions.