Dans la plupart des architectures, les couches conv sont suivies d'une couche de regroupement (max/moy, etc.). Comme ces couches de mise en commun sélectionnent simplement la sortie de la couche précédente (c'est-à-dire conv), pouvons-nous simplement utiliser la convolution avec la foulée 2 et nous attendre à des résultats de précision similaires avec un besoin de processus réduit?
Oui, cela peut être fait. Son expliqué dans le document 'Striving for simplicity: The all convolutional net'
https://arxiv.org/pdf/1412.6806.pdf . Citation du journal:
"Nous constatons que le regroupement maximal peut simplement être remplacé par une couche convolutionnelle avec une foulée accrue sans perte de précision sur plusieurs repères de reconnaissance d'image"