J'ai besoin d'écrire un script pour savoir si un document donné est au format .doc ou non. J'utilise une machine Amazon Linux. J'ai essayé d'utiliser la commande de fichier linux. Pour un fichier doc donné, la commande file génère les informations sur le fichier comme suit:
sample_file.doc: Composite Document File V2 Document, No summary info
J'ai découvert que la commande file fournit les mêmes informations de type de fichier pour les fichiers Excel 2003 (.xls).
Je veux savoir quels sont tous les types de fichiers (comme doc, xls) sous Document Composite Document File V2 et comment puis-je vérifier si le fichier donné est un fichier doc ou non sur une machine Amazon Linux 2012?
Il s'agit d'un format de document de Microsoft. J'ai utilisé le guide ici pour convertir mes fichiers sans problèmes.
Essentiellement, vous pouvez utiliser l'outil unoconv
pour la conversion vers un format plus convivial.