J'ai cherché sur Internet mais j'ai trouvé très peu d'informations à ce sujet, je ne comprends pas ce que chaque variable/valeur représente dans les fichiers .cfg
De yolo. J'espérais donc que certains d'entre vous pourraient m'aider, je ne pense pas que je suis le seul à avoir ce problème, donc si quelqu'un connaît 2 ou 3 variables, veuillez les poster afin que les personnes qui ont besoin de telles informations à l'avenir puissent les trouver.
Les principaux que j'aimerais savoir sont:
subdivisions
pourriture
élan
canaux
filtres
activation
Voici ma compréhension actuelle de certaines des variables. Pas nécessairement correct cependant:
Sur la gauche, nous avons un seul canal avec 4x4 pixels, la couche de réorganisation réduit la taille de moitié, puis crée 4 canaux avec des pixels adjacents dans différents canaux.
Beaucoup de choses sont plus ou moins explicites (taille, foulée, batch_normalize, max_batches, largeur, hauteur). Si vous avez d'autres questions, n'hésitez pas à commenter.
Encore une fois, veuillez garder à l'esprit que je ne suis pas sûr à 100% de bon nombre d'entre elles.
lot le nombre d'images choisies dans chaque lot pour réduire les pertes
subdivisions division de la taille du lot en no. de sous-lots pour traitement parallèle
décroissance est un paramètre d'apprentissage et comme spécifié dans le journal, un élan de 0,9 et une décroissance de 0,0005 sont utilisés
momentum est un paramètre d'apprentissage et comme spécifié dans le journal, un momentum de 0,9 et une décroissance de 0,0005 sont utilisés
canaux Canaux fait référence à la taille de canal de l'image d'entrée (3) pour une image BGR
filtres le nombre de filtres utilisés pour un algorithme CNN
activation la fonction d'activation de CNN: principalement la fonction Leaky RELU est utilisée (ce que j'ai vu principalement dans les fichiers de configuration)
Bien qu'il s'agisse d'une demande d'aide assez ancienne, pour les futurs utilisateurs à la recherche d'une réponse, vous pouvez trouver toutes les explications sur la page Wiki à l'intérieur de la fourchette la plus célèbre du projet Yolo original https://github.com/AlexeyAB/darknet/wiki
En particulier, copier et coller uniquement la partie [net] de ici comme suit:
[net]
batch=1
- nombre d'échantillons (images, lettres, ...) qui seront précossés en un seul lotsubdivisions=1
- nombre de mini-lots dans un lot, taillemini_batch = batch/subdivisions
, donc le GPU traitemini_batch
échantillons à la fois, et les poids seront mis à jour pourbatch
échantillons (1 processus d'itérationbatch
images)width=416
- taille du réseau (largeur), donc chaque image sera redimensionnée à la taille du réseau pendant la formation et la détectionheight=416
- taille du réseau (hauteur), donc chaque image sera redimensionnée à la taille du réseau pendant la formation et la détectionchannels=3
- taille du réseau (canaux), donc chaque image sera convertie en ce nombre de canaux pendant la formation et la détectioninputs=256
- la taille du réseau (entrées) est utilisée pour les données non-image: lettres, prix, toutes les données personnalisées
Quoi qu'il en soit, vous devriez même essayer de chercher dans le relatif partie Github/issues quelque chose, même naïf, que vous voulez savoir, car généralement il a déjà été demandé et répondu.
Bonne chance.