Disons que j'ai 2000 fichiers .ODT. Leurs noms sont des nombres aléatoires. Comment puis-je rechercher, disons, une "liste de prix"? Comment trouver le document dont j'ai besoin sans les ouvrir tous un par un et vérifier si c'est le bon?
Existe-t-il un programme permettant de rechercher les mots dans les documents sans les ouvrir?
Vous auriez besoin d'une solution d'indexation de texte intégral, dotée d'un filtre prenant en charge l'indexation du texte intégral de ces fichiers.
Une option pour cela est le paquetage tracker
dans Ubuntu. Vous devrez installer tracker
et tracker-miner-fs
pour cela. Vous voudrez probablement aussi tracker-gui
pour l'interface utilisateur de l'outil de recherche.
Une alternative est Recoll . Une fois vos fichiers indexés, il trouve les fichiers correspondants assez rapidement. Effectue également des recherches dans les ODS, ODP et PDF. Fonctionne assez bien.
Cela fonctionne pour tout ce que openoffice peut lire; Je voulais odt seulement dans ce cas:
find -name \*.odt -exec sh -c 'unoconv --stdout -f text "{}" | grep -i string_to_search_for' \;