Je ne parviens pas à télécharger le jeu de données ImageNet original depuis leur site officiel. Cependant, j'ai découvert que pytorch a ImageNet comme l'un de ses ensembles de données de vision de la torche.
Q1. Est-ce le jeu de données ImageNet original?
Q2. Comment puis-je obtenir les classes de l'ensemble de données comme cela se fait dans Cifar-10
classes = [‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’]
Le torchvision.datasets.ImageNet
est juste une classe qui vous permet de travailler avec l'ensemble de données ImageNet, elle ne contient pas les images et les étiquettes ImageNet en elle-même. L'ensemble de données ImageNet doit d'abord être téléchargé, puis son chemin doit être passé à l'argument root
de torchvision.datasets.ImageNet
. À partir de maintenant, vous devez le télécharger manuellement à partir de http://image-net.org/download-images (notez qu'il a une taille énorme, ~ 148 Go, donc le téléchargement via torrent peut être une meilleure option, par exemple une recherche sur academictorrents - mais je ne sais pas si c'est légal), car elle n'est plus accessible au public:
if download is True:
msg = ("The dataset is no longer publicly accessible. You need to "
"download the archives externally and place them in the root "
"directory.")
raise RuntimeError(msg)
Elif download is False:
msg = ("The use of the download flag is deprecated, since the dataset "
"is no longer publicly accessible.")
warnings.warn(msg, RuntimeWarning)
( source )
Si vous avez juste besoin d'obtenir les noms de classe et les indices correspondants sans télécharger l'ensemble de données (par exemple, si vous utilisez un modèle pré-entraîné et que vous souhaitez mapper les prédictions sur des étiquettes), vous pouvez les télécharger par exemple. de ici ou de this github Gist.