web-dev-qa-db-fra.com

Comment déterminer le type de fichier sans extension sous Windows?

Je reçois parfois des fichiers de mes clients dont l'extension de fichier est incorrecte. Par exemple, le nom est image.jpg mais le fichier est en réalité une image TIFF. Dans de nombreux cas, je peux le clarifier en ouvrant le fichier dans un éditeur de texte, en examinant les quelques premiers octets, puis en déduisant le type de fichier correspondant.

Cela fonctionne pour moi avec les fichiers JPEG, TIFF, GIF et PDF. Cependant, il existe beaucoup plus de types de fichiers.

Est-il possible d'automatiser l'identification du type de fichier correct en analysant les données contenues?

148
Martin

Vous pouvez utiliser l’outil TrID qui contient une bibliothèque croissante de définitions de types de fichiers pour identifier les fichiers avec.

 Screenshot

Les caractères génériques sont pris en charge. Ainsi, dans votre exemple, vous pouvez simplement placer toutes les images à examiner dans un dossier, par exemple. C:\verifyimages - alors vous pouvez utiliser la commande:

trid C:\verifyimages\*

Cela examinera tous les fichiers du dossier verifyimages.


Une version graphique est également disponible, TrIDNet :

 Screenshot

Il existe une documentation sur la manière d'intégrer facilement TrID ou TrIDNet dans Windows Explorer et Total Commander:

Explorateur Windows

Commandant total

141
3498DB

fichier

Fichier teste chaque argument pour le classer. Il existe trois ensembles de tests, exécutés dans cet ordre: les tests de système de fichiers, les tests de nombres magiques et les tests de langue. Le test premier qui réussit entraîne l'impression du type de fichier.

Le type imprimé contiendra généralement l’un des mots texte (le fichier ne contient que des caractères d’impression et quelques caractères de contrôle courants et peut probablement être lu en toute sécurité sur un terminal ASCII), exécutable (le fichier contient le résultat de la compilation d'un programme sous une forme compréhensible pour un noyau UNIX ou un autre), ou données signifiant autre chose (les données sont généralement «binaires» ou non imprimables) . Les exceptions sont les formats de fichiers connus (fichiers core, archives tar) connus pour contenir des données binaires.

49

Auparavant, je travaillais à la Bibliothèque nationale de France pour créer un système d'archives numériques contenant non seulement des livres numérisés, mais également des millions d'artefacts numériques contenant toutes sortes de types de fichiers étranges. Nous avons utilisé JHOVE pour reconnaître les formats de fichier.

JHOVE est une source ouverte, elle est gérée par JSTOR et la bibliothèque de l’Université de Harvard. Il est assez simple de utiliser .

12
Nicolas Raoul

J'utilise les bibliothèques OutsideIn d'Oracle dans mes programmes. Pas gratuit, mais ils fonctionnent bien, surtout pour les images. Le marché dit qu'il prend en charge plus de 500 types de fichiers.

1
Richard Brightwell

Vous pouvez vérifier le type de fichier à partir de n’importe quel ordinateur, y compris Windows, à

http://www.checkfiletype.com

0
John Williams