web-dev-qa-db-fra.com

Ensemble de données Pytorch ImageNet

Je ne parviens pas à télécharger le jeu de données ImageNet original depuis leur site officiel. Cependant, j'ai découvert que pytorch a ImageNet comme l'un de ses ensembles de données de vision de la torche.

Q1. Est-ce le jeu de données ImageNet original?

Q2. Comment puis-je obtenir les classes de l'ensemble de données comme cela se fait dans Cifar-10

classes = [‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’]
2
reginald

Le torchvision.datasets.ImageNet est juste une classe qui vous permet de travailler avec l'ensemble de données ImageNet, elle ne contient pas les images et les étiquettes ImageNet en elle-même. L'ensemble de données ImageNet doit d'abord être téléchargé, puis son chemin doit être passé à l'argument root de torchvision.datasets.ImageNet. À partir de maintenant, vous devez le télécharger manuellement à partir de http://image-net.org/download-images (notez qu'il a une taille énorme, ~ 148 Go, donc le téléchargement via torrent peut être une meilleure option, par exemple une recherche sur academictorrents - mais je ne sais pas si c'est légal), car elle n'est plus accessible au public:

if download is True:
    msg = ("The dataset is no longer publicly accessible. You need to "
           "download the archives externally and place them in the root "
           "directory.")
    raise RuntimeError(msg)
Elif download is False:
    msg = ("The use of the download flag is deprecated, since the dataset "
           "is no longer publicly accessible.")
    warnings.warn(msg, RuntimeWarning)

( source )

Si vous avez juste besoin d'obtenir les noms de classe et les indices correspondants sans télécharger l'ensemble de données (par exemple, si vous utilisez un modèle pré-entraîné et que vous souhaitez mapper les prédictions sur des étiquettes), vous pouvez les télécharger par exemple. de ici ou de this github Gist.

0
Andreas K.