web-dev-qa-db-fra.com

Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé?

En termes d'intelligence artificielle et d'apprentissage automatique, quelle est la différence entre apprentissage supervisé et non supervisé? Pouvez-vous fournir une explication simple et élémentaire avec un exemple?

270
TIMEX

Puisque vous posez cette question très élémentaire, il semble utile de préciser ce qu'est l'apprentissage automatique.

L'apprentissage automatique est une classe d'algorithmes pilotés par les données, c'est-à-dire que contrairement aux algorithmes "normaux", ce sont les données qui "disent" quelle est la "bonne réponse". Exemple: un algorithme hypothétique d'apprentissage sans machine pour la détection des visages dans les images essaierait de définir ce qu'est un visage (disque rond de couleur semblable à la peau, avec une zone sombre où vous attendez les yeux, etc.). Un algorithme d’apprentissage automatique n’aurait pas une telle définition codée, mais "apprendrait par exemples": vous montrerez plusieurs images de faces et de non-faces et un bon algorithme apprendra éventuellement et sera capable de prédire si oui ou non une l'image est un visage.

Cet exemple particulier de détection de visage est supervisé , ce qui signifie que vos exemples doivent être étiquetés ou explicitement. dire quels sont les visages et ceux qui ne le sont pas.

Dans un algorithme non supervisé , vos exemples ne sont pas étiquetés , c’est-à-dire que vous ne dites rien. Bien sûr, dans un tel cas, l'algorithme lui-même ne peut pas "inventer" ce qu'est un visage, mais il peut essayer de cluster les données dans différents groupes, par exemple. on peut distinguer que les visages sont très différents des paysages, qui sont très différents des chevaux.

Puisqu’une autre réponse le mentionne (bien que de manière incorrecte): il existe des formes de supervision "intermédiaires", c’est-à-dire semi-supervisées et apprentissage actif . Techniquement, ce sont des méthodes supervisées dans lesquelles il existe un moyen "intelligent" d'éviter un grand nombre d'exemples étiquetés. En apprentissage actif, l’algorithme lui-même décide de ce qui doit être étiqueté (il peut par exemple être assez sûr d’un paysage et d’un cheval, mais il peut vous demander de confirmer si un gorille est bien l’image d’un visage). Dans l'apprentissage semi-supervisé, il existe deux algorithmes différents qui commencent par les exemples étiquetés, puis se "racontent" la façon dont ils envisagent un grand nombre de données non étiquetées. De cette "discussion", ils apprennent.

479
Davide

apprentissage supervisé est le moment où les données avec lesquelles vous alimentez votre algorithme sont "étiquetées" ou "étiquetées", afin d'aider votre logique à prendre des décisions.

Exemple: filtrage anti-spam Bayes, dans lequel vous devez marquer un élément comme spam pour affiner les résultats.

Apprentissage non supervisé sont des types d'algorithmes qui tentent de trouver des corrélations sans aucune entrée externe autre que les données brutes.

Exemple: algorithmes de clustering d'exploration de données.

51
Yann Schwartz

Enseignement supervisé

Les applications dans lesquelles les données d'apprentissage comprennent des exemples des vecteurs d'entrée ainsi que leurs vecteurs cibles correspondants sont appelées problèmes d'apprentissage supervisé.

Apprentissage non supervisé

Dans d'autres problèmes de reconnaissance de formes, les données d'apprentissage consistent en un ensemble de vecteurs d'entrée x sans aucune valeur cible correspondante. L’objectif de tels problèmes d’apprentissage non supervisés peut être de découvrir des groupes d’exemples similaires dans les données, où il s’appelle clustering.

Reconnaissance de formes et apprentissage automatique (Bishop, 2006)

29
David Robles

Dans l’apprentissage supervisé, l’entrée x est fournie avec le résultat attendu y (c’est-à-dire le résultat que le modèle est censé produire lorsque l’entrée est x), souvent appelée " classe "(ou" label ") de l'entrée correspondante x.

Dans l'apprentissage non supervisé, la "classe" d'un exemple x n'est pas fournie. Ainsi, l'apprentissage non supervisé peut être considéré comme une "structure cachée" dans un ensemble de données non étiqueté.

Les approches de l’apprentissage supervisé comprennent:

  • Classification (1R, Naive Bayes, algorithme d'apprentissage de l'arbre de décision, tel que ID3 CART, etc.)

  • Prédiction de valeur numérique

Les approches de l’apprentissage non supervisé incluent:

  • Clustering (K-means, clustering hiérarchique)

  • Apprentissage de la règle d'association

17
GPrathap

Je peux vous donner un exemple.

Supposons que vous deviez reconnaître quel véhicule est une voiture et lequel est une moto.

Dans le cas d'apprentissage supervisé, votre jeu de données d'entrée (formation) doit être étiqueté, c'est-à-dire que pour chaque élément d'entrée de votre jeu de données d'entrée (formation), vous devez spécifier s'il représente une voiture ou une moto. .

Dans le cas d'apprentissage non supervisé, vous ne nommez pas les entrées. Le modèle non supervisé regroupe les entrées en grappes basées par exemple sur sur des caractéristiques/propriétés similaires. Donc, dans ce cas, il n’existe pas d’étiquettes comme "voiture".

10

Par exemple, très souvent, former un réseau de neurones est un apprentissage supervisé: vous indiquez au réseau auquel la classe correspond au vecteur de fonctionnalité que vous alimentez.

Le clustering est un apprentissage non supervisé: vous laissez l'algorithme décider du groupement des échantillons dans des classes partageant des propriétés communes.

Un autre exemple d’apprentissage non supervisé est cartes auto-organisées de Kohonen .

10
Gregory Pakosz

Apprentissage automatique: Il explore l’étude et la construction d’algorithmes permettant d’apprendre à partir de données et de faire des prédictions sur ces données. De tels algorithmes fonctionnent en construisant un modèle à partir afin de faire des prévisions ou des décisions basées sur les données exprimées sous forme de sorties, plutôt que de suivre des instructions de programme strictement statiques.

Apprentissage supervisé: Il s'agit de la tâche d'apprentissage automatique consistant à inférer une fonction à partir de données de formation étiquetées. Les données de formation consistent en un ensemble d'exemples de formation. Dans l'apprentissage supervisé, chaque exemple est un couple constitué d'un objet d'entrée (généralement un vecteur) et d'une valeur de sortie souhaitée (également appelé signal de supervision). Un algorithme d'apprentissage supervisé analyse les données d'apprentissage et produit une fonction inférée, qui peut être utilisée pour mapper de nouveaux exemples.

L'ordinateur est présenté avec des exemples d'entrées et les sorties souhaitées, données par un "enseignant", et le but est d'apprendre une règle générale mappant les entrées aux sorties. Plus précisément, un algorithme d'apprentissage supervisé prend une valeur connue. ensemble de données d'entrée et de réponses connues aux données (sortie), et forme un modèle pour générer des prévisions raisonnables pour la réponse à de nouvelles données.

Apprentissage non supervisé: C'est apprendre sans enseignant. Une chose fondamentale que vous pourriez vouloir faire avec des données est de les visualiser. Il s'agit de la tâche d'apprentissage automatique consistant à inférer une fonction permettant de décrire une structure cachée à partir de données non étiquetées. Les exemples donnés à l'apprenant n'étant pas étiquetés, il n'y a pas d'erreur ni de récompense pour évaluer une solution potentielle. Cela distingue l'apprentissage non supervisé de l'apprentissage supervisé. L'apprentissage non supervisé utilise des procédures qui tentent de trouver des partitions naturelles de modèles.

Avec l'apprentissage non supervisé, il n'y a pas de retour d'informations basé sur les résultats de la prédiction, c'est-à-dire qu'il n'y a pas d'enseignant pour vous corriger. Sous les méthodes d'apprentissage non supervisé, aucun exemple étiqueté n'est fourni et il n'y a pas de notion de sortie pendant le test. processus d'apprentissage. En conséquence, il appartient au schéma/modèle d’apprentissage de rechercher des modèles ou de découvrir les groupes de données en entrée .

Vous devez utiliser des méthodes d'apprentissage non supervisées lorsque vous avez besoin d'une grande quantité de données pour former vos modèles, ainsi que de votre volonté et de votre capacité à expérimenter et à explorer, et bien sûr d'un défi qui n'est pas bien résolu par des méthodes plus anciennes. Avec un apprentissage non supervisé est possible d'apprendre des modèles plus grands et plus complexes qu'avec l'apprentissage supervisé . Ici en est un bon exemple

.

4
LC 웃

J'ai toujours trouvé que la distinction entre apprentissage non supervisé et supervisé était arbitraire et déroutante. Il n'y a pas de réelle distinction entre les deux cas, il existe une gamme de situations dans lesquelles un algorithme peut avoir plus ou moins de "supervision". L'existence d'un apprentissage semi-supervisé est un exemple évident où la ligne est floue.

J'ai tendance à penser que la supervision donne à l'algorithme un retour d'information sur les solutions à privilégier. Pour un paramètre supervisé traditionnel, tel que la détection de courrier indésirable, vous indiquez l'algorithme "ne commettez aucune erreur sur l'ensemble de formation"; pour un paramètre traditionnel non supervisé, tel que la mise en cluster, vous indiquez l'algorithme "les points proches les uns des autres doivent se trouver dans le même cluster". Il se trouve que la première forme de rétroaction est beaucoup plus spécifique que la dernière.

En bref, quand quelqu'un dit "supervisé", pensez classification, quand il dit "non supervisé", pensez à regrouper et essayez de ne pas trop vous inquiéter à ce sujet.

4
Stompchicken

Apprentissage supervisé: Vous donnez des exemples de données, diversement étiquetés, ainsi que les réponses correctes. Cet algorithme va en tirer des leçons et commencer à prédire des résultats corrects en fonction des entrées suivantes. Exemple : Filtre de courrier électronique anti-spam

Apprentissage non supervisé: Vous donnez simplement des données sans rien dire - comme des étiquettes ou des réponses correctes. L'algorithme analyse automatiquement les modèles dans les données. Exemple : Google Actualités

3
disp_name

Je vais essayer de rester simple.

Apprentissage supervisé: Dans cette technique d'apprentissage, un jeu de données nous est donné et le système connaît déjà la sortie correcte du jeu de données. Donc, ici, notre système apprend en prédisant une valeur qui lui est propre. Ensuite, il vérifie la précision en utilisant une fonction de coût pour vérifier à quel point sa prévision était proche de la sortie réelle.

Apprentissage non supervisé: Dans cette approche, nous avons peu de connaissances, voire aucune, de ce que nos résultats seraient. Au lieu de cela, nous dérivons la structure des données où nous ne connaissons pas l’effet de la variable. Nous faisons la structure en regroupant les données en fonction de la relation entre la variable dans les données. Ici, nous n’avons pas de retour basé sur notre prédiction.

3
vasurb

Apprentissage supervisé

L'apprentissage supervisé est basé sur la formation d'un échantillon de données à partir d'une source de données avec la classification correcte déjà attribuée. De telles techniques sont utilisées dans les modèles à prédiction directe ou MultiLayer Perceptron (MLP). Ces MLP ont trois caractéristiques distinctives:

  1. Une ou plusieurs couches de neurones cachés qui ne font pas partie des couches d'entrée ou de sortie du réseau et permettent au réseau d'apprendre et de résoudre des problèmes complexes
  2. La non-linéarité reflétée dans l'activité neuronale est différentiable et,
  3. Le modèle d'interconnexion du réseau présente un degré élevé de connectivité.

Ces caractéristiques, associées à l'apprentissage par la formation, résolvent des problèmes difficiles et divers. L’apprentissage par la formation dans un modèle ANN supervisé est également appelé algorithme de rétro-propagation des erreurs. L'algorithme d'apprentissage de correction d'erreur entraîne le réseau en fonction des échantillons d'entrée-sortie et trouve le signal d'erreur, qui est la différence entre la sortie calculée et la sortie souhaitée, et ajuste les poids synaptiques des neurones proportionnellement au produit de l'erreur. signal et l'instance d'entrée du poids synaptique. Sur la base de ce principe, l’apprentissage de la propagation d’erreur se produit en deux passes:

Forward Pass:

Ici, le vecteur d’entrée est présenté au réseau. Ce signal d'entrée se propage en aval, neurone par neurone, à travers le réseau et émerge à la sortie du réseau en tant que signal de sortie: y(n) = φ(v(n))v(n) est le champ local induit d'un neurone défini par v(n) =Σ w(n)y(n).. La sortie calculée par la couche de sortie o(n) est comparé à la réponse souhaitée d(n) et trouve l'erreur e(n) pour ce neurone. Les poids synaptiques du réseau pendant cette passe restent les mêmes.

Passage en arrière:

Le signal d'erreur qui provient du neurone de sortie de cette couche est propagé vers l'arrière à travers le réseau. Ceci calcule le gradient local pour chaque neurone dans chaque couche et permet aux poids synaptiques du réseau de subir des modifications conformément à la règle de delta, comme suit:

Δw(n) = η * δ(n) * y(n).

Ce calcul récursif est poursuivi, avec une passe en avant suivie par une passe en arrière pour chaque motif en entrée jusqu'à la convergence du réseau.

Le paradigme d'apprentissage supervisé d'un ANN est efficace et trouve des solutions à plusieurs problèmes linéaires et non linéaires tels que la classification, le contrôle des installations, les prévisions, les prévisions, la robotique, etc.

Apprentissage non supervisé

Les réseaux de neurones auto-organisés apprennent en utilisant un algorithme d'apprentissage non supervisé pour identifier des modèles cachés dans des données d'entrée non étiquetées. Ce non supervisé fait référence à la capacité d'apprendre et d'organiser des informations sans fournir de signal d'erreur pour évaluer la solution potentielle. Le manque de direction de l'algorithme d'apprentissage dans l'apprentissage non supervisé peut parfois être avantageux, car il permet à l'algorithme de rechercher des modèles qui n'avaient pas encore été pris en compte. Les principales caractéristiques des cartes auto-organisées (SOM) sont les suivantes:

  1. Il transforme un modèle de signal entrant de dimension arbitraire en une ou deux dimensions et effectue cette transformation de manière adaptative.
  2. Le réseau représente une structure à anticipation avec une seule couche de calcul constituée de neurones disposés en rangées et en colonnes. A chaque étape de la représentation, chaque signal d’entrée est conservé dans son propre contexte et,
  3. Les neurones traitant des informations étroitement liées sont proches et communiquent via des connexions synaptiques.

La couche de calcul est également appelée couche compétitive, car les neurones de la couche se font concurrence pour devenir actifs. Par conséquent, cet algorithme d'apprentissage est appelé algorithme compétitif. L'algorithme non supervisé dans SOM fonctionne en trois phases:

Phase de compétition:

pour chaque modèle d'entrée x présenté au réseau, le produit intérieur de poids synaptique w est calculé et les neurones de la couche compétitive trouvent une fonction discriminante qui induit une compétition entre les neurones et le vecteur de poids synaptique qui est proche du vecteur d’entrée dans la distance euclidienne est annoncé gagnant du concours. Ce neurone est appelé meilleur neurone correspondant,

i.e. x = arg min ║x - w║.

Phase coopérative:

le neurone gagnant détermine le centre d'un voisinage topologique h de neurones coopérants. Ceci est réalisé par l'interaction latérale d parmi les neurones coopératifs. Ce voisinage topologique réduit sa taille sur une période donnée.

Phase adaptative:

permet au neurone gagnant et à ses neurones de voisinage d'augmenter leurs valeurs individuelles de la fonction discriminante par rapport au motif d'entrée par le biais d'ajustements de poids synaptiques appropriés,

 Δw = ηh(x)(x –w).

Lors de la présentation répétée des schémas d'apprentissage, les vecteurs de poids synaptiques ont tendance à suivre la distribution des schémas d'entrée en raison de la mise à jour du voisinage et ainsi, ANN apprend sans superviseur.

Le modèle auto-organisé représente naturellement le comportement neuro-biologique et est donc utilisé dans de nombreuses applications du monde réel telles que la mise en cluster, la reconnaissance de la parole, la segmentation de texture, le codage de vecteurs, etc.

référence.

3
Sabir Al Fateh

apprentissage supervisé

En cela, chaque motif d'entrée utilisé pour entraîner le réseau est associé à un motif de sortie, qui est la cible ou le motif souhaité. Un enseignant est supposé être présent pendant le processus d'apprentissage, lorsqu'une comparaison est effectuée entre la sortie calculée du réseau et la sortie attendue correcte, afin de déterminer l'erreur. L'erreur peut ensuite être utilisée pour modifier les paramètres du réseau, ce qui entraîne une amélioration des performances.

Apprentissage non supervisé

Dans cette méthode d'apprentissage, la sortie cible n'est pas présentée au réseau. C'est comme s'il n'y avait pas d'enseignant pour présenter le modèle souhaité et, par conséquent, le système apprend de lui-même en découvrant et en s'adaptant aux caractéristiques structurelles des modèles en entrée.

2
coding_ninza

Enseignement supervisé

Vous avez l'entrée x et une sortie cible t. Donc, vous entraînez l'algorithme à généraliser aux parties manquantes. Il est supervisé car la cible est donnée. Vous êtes le superviseur qui dit à l’algorithme: Pour l’exemple x, vous devriez sortir t!

Apprentissage non supervisé

Bien que la segmentation, le regroupement et la compression soient généralement pris en compte dans cette direction, j'ai du mal à trouver une bonne définition.

Prenons encodeurs automatiques pour la compression à titre d'exemple. Bien que vous n'ayez que l'entrée x donnée, c'est l'ingénieur humain qui dit à l'algorithme que la cible est aussi x. Donc, dans un certain sens, cela n’est pas différent de l’apprentissage supervisé.

Et pour le clustering et la segmentation, je ne suis pas trop sûr que cela corresponde vraiment à la définition de l'apprentissage automatique (voir autre question ).

2
Martin Thoma

Apprentissage supervisé, en fonction des données avec une réponse.

Compte tenu des e-mails étiquetés comme spam/non spam, découvrez un filtre anti-spam.

À partir d'un ensemble de données de patients diagnostiqués diabétiques ou non, apprenez à classer les nouveaux patients diabétiques ou non.

Apprentissage non supervisé, étant donné les données sans réponse, laissons le PC grouper les choses.

À partir d’un ensemble d’articles de nouvelles trouvés sur le Web, regroupez-les en articles sur la même histoire.

Avec une base de données de données personnalisées, découvrez automatiquement les segments de marché et regroupez les clients dans différents segments de marché.

référence

2
s-hunter

Apprentissage supervisé: par exemple, un enfant va au jardin familial. Ici, le professeur lui montre 3 jouets maison, balle et voiture. maintenant, le professeur lui donne 10 jouets. il les classera dans 3 boîtes de maison, ballon et voiture en fonction de son expérience antérieure. Donc, l'enfant a d'abord été supervisé par des enseignants pour obtenir les bonnes réponses pour quelques jeux. puis il a été testé sur des jouets inconnus. aa

Apprentissage non supervisé: encore l'exemple de la maternelle. On donne 10 jouets à un enfant. on lui dit de segmenter les semblables. donc basé sur des caractéristiques telles que la forme, la taille, la couleur, la fonction, etc., il essaiera de faire 3 groupes dire A, B, C et de les regrouper. bb

Le mot Superviser signifie que vous donnez une supervision/des instructions à la machine pour l’aider à trouver des réponses. Une fois qu'il a appris les instructions, il peut facilement prédire de nouveaux cas.

Non supervisé signifie qu'il n'y a pas de supervision ou d'instructions sur la façon de trouver des réponses/étiquettes et la machine utilisera son intelligence pour trouver une structure dans nos données. Ici, il ne fera pas de prédiction, il essaiera simplement de trouver des grappes contenant des données similaires.

2
Ashish Anand

Apprentissage supervisé: vous avez étiqueté des données et devez en tirer des leçons. par exemple, les données de la maison avec le prix, puis apprendre à prévoir le prix

Apprentissage non supervisé: vous devez trouver la tendance, puis prédire, sans étiquette préalable. Par exemple, différentes personnes dans la classe, puis une nouvelle personne vient, alors à quel groupe appartient ce nouvel élève.

1
Asad Mahmood

L'apprentissage supervisé est essentiellement une technique dans laquelle les données d'apprentissage à partir desquelles la machine apprend est déjà étiquetée. Supposons un simple classificateur de nombres pairs et impairs dans lequel vous avez déjà classifié les données pendant l'entraînement. Par conséquent, il utilise les données "LABELED".

L'apprentissage non supervisé, au contraire, est une technique dans laquelle la machine étiquette elle-même les données. Ou vous pouvez dire que c'est le cas lorsque la machine apprend d'elle-même à partir de zéro.

0
sayantan ghosh

Apprentissage supervisé

enter image description here

Apprentissage non supervisé

enter image description here

Exemple:

Apprentissage supervisé:

  • Un sac avec Apple
  • Un sac avec orange

    => modèle de construction

  • Un sac mélangé de Apple et d'orange.

    => S'il vous plaît classer

Apprentissage non supervisé:

  • Un sac mélangé de Apple et d'orange.

    => modèle de construction

  • Un autre sac mélangé

    => S'il vous plaît classer

0

En simple apprentissage supervisé est un type de problème d’apprentissage automatique dans lequel nous avons des étiquettes et en utilisant ces étiquettes, nous mettons en œuvre un algorithme tel que régression et classification. ou 1, vrai/faux, oui/non. et la régression est appliquée où mettre une valeur réelle une maison de prix

Apprentissage non supervisé est un type de problème d’apprentissage automatique dans lequel nous n’avons pas d’étiquettes signifie que nous n’avons que des données, des données non structurées et que nous devons regrouper les données (regroupement de données) en utilisant divers algorithmes non supervisés.

En termes simples .. :) C'est ce que je comprends, n'hésitez pas à corriger. apprentissage supervisé Nous savons ce que nous prévoyons à partir des données fournies. Nous avons donc une colonne dans le jeu de données qui doit être prédite. Apprentissage non supervisé Autrement dit, nous essayons d'extraire le sens de l'ensemble de données fourni. Nous n'avons pas de clarté sur ce qu'il faut prédire. La question est donc de savoir pourquoi nous faisons cela? .. :) La réponse est: le résultat de l'apprentissage non supervisé est constitué de groupes/groupes (données similaires réunies). Donc, si nous recevons de nouvelles données, nous les associons au cluster/groupe identifié et en comprenons les caractéristiques.

J'espère que cela vous aidera.

0
khushal wadake

enseignement supervisé

l’apprentissage supervisé est l’endroit où nous connaissons le résultat de l’entrée brute, c’est-à-dire que les données sont étiquetées de manière à comprendre, lors de la formation du modèle d’apprentissage automatique, ce qu’il faut détecter dans le résultat final et à guider le système pendant détecter les objets pré-étiquetés sur cette base, il détectera les objets similaires que nous avons fournis lors de la formation.

Ici, les algorithmes sauront quelle est la structure et la structure des données. L'apprentissage supervisé est utilisé pour la classification

Par exemple, nous pouvons avoir différents objets dont les formes sont carrées, cercles, cercles, notre tâche est d’arranger les mêmes types de formes que le jeu de données étiqueté avec toutes les formes étiquetées, et nous formerons le modèle d’apprentissage automatique sur ce jeu de données, le En fonction des dates de formation, il commencera à détecter les formes.

Apprentissage non supervisé

L'apprentissage non supervisé est un apprentissage non guidé dont le résultat final n'est pas connu. Il regroupe l'ensemble de données. Sur la base de propriétés similaires de l'objet, il divise les objets sur différents groupes et les détecte.

Ici, les algorithmes vont rechercher les différents modèles dans les données brutes, et sur cette base, ils vont regrouper les données. L'apprentissage non supervisé est utilisé pour la mise en cluster.

Par exemple, nous pouvons avoir différents objets de formes multiples: carré, cercle, triangle. Ainsi, les grappes seront basées sur les propriétés de l’objet. Si un objet a quatre côtés, il le considérera comme carré et, s’il a trois côtés, triangle et si aucun côté que cercle, ici les données ne sont pas étiquetées, il apprendra lui-même à détecter les différentes formes

0
Amit Agrawal

L'apprentissage supervisé peut étiqueter un nouvel élément dans l'une des étiquettes formées en fonction de l'apprentissage au cours de la formation. Vous devez fournir un grand nombre de jeux de données de formation, de validation et de test. Si vous fournissez par exemple des vecteurs d'image de pixel de chiffres avec des données d'apprentissage avec des étiquettes, il peut alors identifier les nombres.

L'apprentissage non supervisé ne nécessite pas d'ensembles de données d'apprentissage. Dans l'apprentissage non supervisé, il peut regrouper des éléments dans différents groupes en fonction de la différence entre les vecteurs d'entrée. Si vous fournissez des vecteurs d’images en pixels de chiffres et que vous lui demandez de classer en 10 catégories, il pourra le faire. Mais il sait comment l'étiqueter puisque vous n'avez pas fourni d'étiquettes de formation.

0
sam getty

Apprentissage machine supervisé

"Processus d'un algorithme tirant parti d'un ensemble de données d'apprentissage et prédisant le résultat."

Précision de la sortie prévue directement proportionnelle aux données d'apprentissage (longueur)

L'apprentissage supervisé consiste en des variables d'entrée (x) (jeu de données d'apprentissage) et une variable de sortie (Y) (jeu de données de test). Vous utilisez un algorithme pour apprendre la fonction de mappage de l'entrée au résultat.

Y = f(X)

Principaux types:

  • Classification (axe y discret)
  • Prédictif (axe y continu)

Algorithmes:

  • Algorithmes de classification:

    Neural Networks  
    Naïve Bayes classifiers  
    Fisher linear discriminant  
    KNN 
    Decision Tree 
    Super Vector Machines
    
  • Algorithmes prédictifs:

    Nearest  neighbor  
    Linear Regression,Multi Regression 
    

Zone d'application:

  1. Classer les emails en tant que spam
  2. Classer si le patient a la maladie ou non
  3. Reconnaissance vocale

  4. Prédire le candidat sélectionné ou non

  5. Prédire le cours de bourse

0

Modèles d'apprentissage supervisé/prédictifs: Le modèle prédictif, comme son nom l'indique, est utilisé pour prédire le résultat futur sur la base des données historiques. Les modèles prédictifs reçoivent normalement des instructions claires dès le début en indiquant ce qui doit être appris et comment il doit être appris. Cette classe d'algorithmes d'apprentissage est appelée apprentissage supervisé.

Par exemple: L'apprentissage supervisé est utilisé lorsqu'une entreprise de marketing essaie de déterminer les clients susceptibles de faire l'objet d'un désabonnement. Nous pouvons également l'utiliser pour prédire la probabilité d'occurrence de dangers tels que tremblements de terre, tornades, etc., dans le but de déterminer la valeur totale de l'assurance. Voici quelques exemples d'algorithmes utilisés: voisin le plus proche, Bayes Naïve, arbres de décision, régression, etc.

Apprentissage non supervisé/Modèles descriptifs: Il est utilisé pour former des modèles descriptifs dans lesquels aucune cible n’est définie et où une seule caractéristique est importante l’autre. Le cas de l'apprentissage non supervisé peut être le suivant: lorsqu'un détaillant souhaite savoir quelle est la combinaison de produits, les clients ont tendance à acheter plus souvent. En outre, dans l’industrie pharmaceutique, l’apprentissage non supervisé peut être utilisé pour prédire quelles maladies sont susceptibles de se produire avec le diabète. Voici un exemple d’algorithme utilisé: K- signifie Algorithme de clustering

0
Badri Chorapalli

L'apprentissage supervisé consiste essentiellement à utiliser des variables d'entrée (x) et de sortie (y) et à utiliser un algorithme pour apprendre la fonction de mappage de l'entrée au résultat. La raison pour laquelle nous avons appelé cela supervisé est que l'algorithme apprend à partir du jeu de données d'apprentissage, qu'il effectue des prédictions itératives sur les données d'apprentissage. Supervisé avoir deux types-Classification et Régression. La classification est lorsque la variable de sortie est une catégorie comme oui/non, vrai/faux. La régression se produit lorsque la sortie correspond à des valeurs réelles telles que la hauteur de la personne, la température, etc.

L’apprentissage supervisé par l’ONU est l’endroit où nous n’avons que des données d’entrée (X) et aucune variable de sortie. C'est ce qu'on appelle un apprentissage non supervisé car, contrairement à l'apprentissage supervisé ci-dessus, il n'y a pas de réponse correcte ni d'enseignant. Les algorithmes sont laissés à leurs propres mécanismes pour découvrir et présenter la structure intéressante des données.

Les types d'apprentissage non supervisé sont le regroupement et l'association.

0
Tyagi.Am

Apprentissage supervisé :

Un algorithme d'apprentissage supervisé analyse les données d'apprentissage et produit une fonction inférée, qui peut être utilisée pour mapper de nouveaux exemples.

  1. Nous fournissons des données de formation et nous connaissons une sortie correcte pour une certaine entrée
  2. Nous connaissons la relation entre entrée et sortie

Catégories de problème:

Régression: Prédire les résultats dans une sortie continue => mapper les variables d'entrée à une fonction continue.

Exemple:

À partir de l'image d'une personne, prédisez son âge

Classification: Prédire les résultats dans une sortie discrète => mapper les variables d'entrée en catégories discrètes

Exemple:

Ce client est-il cancéreux?

Supervised learning

Apprentissage non supervisé:

L'apprentissage non supervisé tire des leçons de données de test qui n'ont pas été étiquetées, classées ou catégorisées. L'apprentissage non supervisé identifie les points communs dans les données et réagit en fonction de la présence ou de l'absence de tels points communs dans chaque nouvel élément de données.

  1. Nous pouvons dériver cette structure en regroupant les données en fonction des relations entre les variables contenues dans les données.

  2. Il n'y a pas de retour basé sur les résultats de prédiction.

Catégories de problème:

La mise en grappe: est la tâche qui consiste à regrouper un ensemble d'objets de telle manière que groupe (appelé un cluster) sont plus similaires (dans un certain sens) les uns aux autres que ceux d'autres groupes (clusters)

Exemple:

Prenez un ensemble de 1 000 000 gènes différents et trouvez un moyen de regrouper automatiquement ces gènes en groupes similaires ou liés par des variables différentes, telles que la durée de vie, l'emplacement, les rôles, etc. .

Unsupervised learning

Les cas d'utilisation populaires sont listés ici.

Différence entre la classification et le clustering dans l'exploration de données?

Références:

Supervised_learning

nsupervised_learning

apprentissage automatique de coursera

versdatascience

0
Ravindra babu

L'apprentissage automatique est un domaine dans lequel vous essayez de créer une machine pour imiter le comportement humain.

Vous entraînez la machine comme un bébé. La façon dont les humains apprennent, identifient les caractéristiques, reconnaissent les schémas et s’entraînent de la même façon que vous entraînez la machine en fournissant des données avec diverses caractéristiques. L'algorithme de la machine identifie le modèle dans les données et le classe dans une catégorie particulière.

L'apprentissage automatique est divisé en deux catégories: l'apprentissage supervisé et l'apprentissage non supervisé.

L'apprentissage supervisé est le concept dans lequel vous avez un vecteur/des données en entrée avec une valeur cible correspondante (sortie). Par ailleurs, l'apprentissage non supervisé est le concept dans lequel vous ne disposez que de vecteurs/données en entrée sans aucune valeur cible correspondante.

Un exemple d'apprentissage supervisé est la reconnaissance manuscrite des chiffres où vous avez l'image des chiffres avec le chiffre correspondant [0-9], et un exemple d'apprentissage non supervisé consiste à regrouper les clients en fonction du comportement d'achat.

0
SUN

Dans apprentissage supervisé nous savons ce que l'entrée et la sortie devraient être. Par exemple, étant donné un ensemble de voitures. Nous devons savoir lesquels sont rouges et lesquels sont bleus.

Considérant que, Apprentissage non supervisé, nous devons trouver la réponse avec très peu ou sans aucune idée de ce que devrait être le résultat. Par exemple, un élève peut être capable de créer un modèle qui détecte le sourire des personnes en se basant sur la corrélation de motifs faciaux et de mots tels que "pourquoi souriez-vous?".

0
Buraira Nasir

Il existe déjà de nombreuses réponses qui expliquent les différences en détail. J'ai trouvé ces gifs sur codeacademy et ils m'aident souvent à expliquer efficacement les différences.

Enseignement supervisé

enter image description here Notez que les images d’entraînement portent des étiquettes et que le modèle apprend les noms des images.

Apprentissage non supervisé

enter image description here Notez que ce qui est fait ici n’est qu’un regroupement (clustering) et que le modèle ne sait rien des images.

0
Arun Sethupat