Je me demandais quelle était la différence entre la couche d'activation et la couche dense dans Keras.
Étant donné que la couche d'activation semble être une couche entièrement connectée et que Dense a un paramètre pour passer une fonction d'activation, quelle est la meilleure pratique?
Imaginons un réseau fictif comme celui-ci: Input -> Dense -> Dropout -> Final Layer Final Layer devrait être: Dense (activation = softmax) ou Activation (softmax)? Quel est le plus propre et pourquoi?
Merci tout le monde!
L'utilisation de Dense(activation=softmax)
équivaut à calculer d'abord ajouter Dense
puis ajouter Activation(softmax)
. Cependant, il y a un avantage de la deuxième approche - vous pouvez récupérer les sorties de la dernière couche (avant l'activation) à partir d'un tel modèle défini. Dans la première approche - c'est impossible.