web-dev-qa-db-fra.com

q-learning

Apprentissage Q vs différence temporelle vs apprentissage par renforcement basé sur un modèle

Quelle est la différence entre l'apprentissage par renforcement et la RL profonde?

Quelle est la différence entre Q-learning et SARSA?

Gradients de stratégie dans Keras

Quelqu'un peut-il donner un exemple concret d'apprentissage supervisé et non supervisé?

Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé?

Comment combiner 2 ou plusieurs ensembles de requêtes dans une vue Django?

Comment composer dynamiquement un OR filtre de requête dans Django?

Django filtre de requête combinant AND et OR avec des objets Q ne renvoie pas les résultats attendus)

Comment abandonner correctement une chaîne de promesses node.js en utilisant Q?

Plusieurs fonctions différées chaînées utilisant q dans AngularJS arrêtent de renvoyer des données

Comment fonctionne Angular $ q.when?

Alors que boucle avec des promesses

Comment enchaîner un nombre variable de promesses dans Q, dans l'ordre?

Comment vérifier si une promesse Angular $ q est résolue

Angularjs promet, $ q, reporter

Angularjs $ q.all

Les promesses ne sont-elles pas simplement des rappels?

Comment utiliser réellement Q promise dans node.js?

Définir la promesse vide Bluebird comme dans Q

valeur de retour après une promesse

Problèmes inhérents à jQuery $ .Deferred (jQuery 1.x / 2.x)

Qu'est-ce que l'antipattern de construction de promesse explicite et comment puis-je l'éviter?

Comment attendre qu'une promesse soit résolue?

Résoudre les promesses les unes après les autres (c’est-à-dire en séquence)?

Comment faire une demande Ajax via NodeJS à un point de terminaison

Calcul des valeurs de p ajustées dans Python

Comment enchaîner séquentiellement les promesses avec angularjs $ q?

Quelle est la différence entre renvoyer une valeur ou Promise.resolve from then ()

Comment savoir si un objet est une promesse?

Remplacement des rappels par des promesses dans Node.js

Comment restituer correctement plusieurs valeurs d'une promesse?

Rendu React composants avec promesses dans la méthode de rendu

Pourquoi la méthode de classe interne "ceci" est-elle indéfinie lors de l'utilisation de promesses?

Y a-t-il encore des raisons d'utiliser des bibliothèques de promesses comme Q ou BlueBird maintenant que nous avons des promesses ES6?

Java - Chaîne de fractionnement par nombre et lettres

Comment configurer un chemin de classe supplémentaire dans Spring Boot?

Estimation du nombre de neurones et du nombre de couches d'un réseau neuronal artificiel

Époque vs itération lors de la formation de réseaux de neurones

Comment former un réseau neuronal artificiel pour jouer à Diablo 2 en utilisant une entrée visuelle?

Pourquoi une fonction d'activation non linéaire doit-elle être utilisée dans un réseau de neurones de rétropropagation?

architecture multi-couche perceptron (MLP): critères de choix du nombre de couches masquées et de la taille de la couche masquée?

Formation d'un réseau neuronal avec apprentissage par renforcement

Réseau neuronal convolutif (CNN) pour l'audio

Pré-formation non supervisée pour le réseau de neurones convolutifs dans theeano

Qu'est-ce que «lr_policy» dans Caffe?

Lutte contre le déséquilibre de classe: contribution croissante à la perte et à la DMS

Scikit-learn: Comment obtenir un vrai positif, un vrai négatif, un faux positif et un faux négatif

Un guide pour convert_imageset.cpp

Qu'est-ce que le méta-paramètre `weight_decay` dans Caffe?

Qu'est-ce que la profondeur d'un réseau de neurones convolutionnels?

Causes communes de nans pendant la formation

Extraire des fonctionnalités à l'aide de CNN pré-formé (Tensorflow)

Comment interpréter "perte" et "précision" pour un modèle d'apprentissage automatique

Pourquoi l'entrée est-elle mise à l'échelle dans tf.nn.dropout dans tensorflow?

Comment fonctionne le désengagement et la déconvolution dans DeConvNet

Formation sur les données déséquilibrées avec TensorFlow

Naive Bayes vs SVM pour classer les données texte

Comment déterminer le nombre de couches et de nœuds d'un réseau neuronal

Techniques d'augmentation des données pour les petits ensembles de données d'images?

Comment appliquer l'écrêtage dégradé dans TensorFlow?

Qu'est-ce que l'initialiseur de variables par défaut dans Tensorflow?

Quelle est la différence entre l'itération de valeur et l'itération de stratégie?

Comment comprendre le terme "tensor" dans TensorFlow?

Que font model.predict () et model.fit ()?

Comment mettre plus de poids sur certaines fonctionnalités du machine learning?

Comment calculer le nombre de paramètres d'un réseau LSTM?

TensorFlow - régularisation avec perte de L2, comment s’appliquer à tous les poids, pas seulement au dernier?

TensorFlow - introduisant à la fois la régularisation L2 et le décrochage dans le réseau. Cela a-t-il un sens?

Normalisation des lots dans un réseau de neurones convolutifs

Plusieurs sessions et graphiques dans Tensorflow (dans le même processus)

Keras peut-il gérer des images d'entrée de tailles différentes?

keras: quelle est la différence entre model.predict et model.predict_proba

Quelle est l'intuition d'utiliser le tanh en LSTM

Différence entre la couche dense et la couche d'activation dans Keras

keras: comment sauvegarder l'historique des entraînements

Pourquoi les réseaux de neurones invariants en rotation ne sont-ils pas utilisés par les gagnants des compétitions populaires?

Qu'est-ce qu'un lot dans TensorFlow?

Pourquoi le binary_crossentropy est-il plus précis que categorical_crossentropy pour la classification multiclasse dans Keras?

Qu'est-ce qu'une couche `` Python '' dans caffe?

Quelle est la signification des logits Word dans TensorFlow?

Comment keras définit-il "précision" et "perte"?

Comment utiliser la couche "BatchNorm" dans le café?

TensorFlow: tf.train.batch charge-t-il automatiquement le prochain lot lorsque celui-ci est terminé?

Tensorflow Slim: TypeError: int32 prévu, liste contenant les tenseurs de type '_Message' à la place

Former un classificateur d'images multi-classes à Keras

Comment inspecter des variables dans un fichier de point de contrôle dans TensorFlow lorsque TensorFlow ne peut pas trouver l'attribut tools?

Keras binary_crossentropy vs categorical_crossentropy performance?

Comment rendre TensorFlow + Keras rapide avec un ensemble de données TFRecord?

Erreur Keras: attendue pour voir 1 tableau

Compréhension intuitive des convolutions 1D, 2D et 3D dans les réseaux de neurones convolutionnels

Est-ce un bon taux d'apprentissage pour la méthode Adam?

Plusieurs à un et plusieurs à plusieurs exemples de LSTM à Keras

enregistrer le temps de calcul pour chaque époque en Keras pendant model.fit ()

LSTMStateTuple vs cell.zero_state () pour RNN dans Tensorflow

Erreur Keras: dense_input_1 devrait avoir 3 dimensions

Rôle de "Flatten" dans Keras

Comment calculer l'incertitude de prédiction à l'aide de Keras?

Comment implémenter la segmentation sémantique multi-classes?

Optimisation hyperparamétrique pour le modèle Pytorch