J'ai quelques fichiers avec différentes extensions telles que *.pdf
, *.mp3
, *.jpg
et quelques autres. Tous sont stockés dans un répertoire parent
.
Comment obtenir une liste de toutes les extensions, créer des dossiers à partir de ces extensions, puis déplacer tous les fichiers dans leurs dossiers respectifs?
Le script python ci-dessous effectue le travail. Les fichiers cachés sont stockés séparément dans un dossier, ainsi que les fichiers sans extension.
Puisqu'il pourrait être utilisé à des fins plus diverses, j'ai ajouté quelques options:
exclude = ()
remove_emptyfolders = True
ou False
)shutil.move(subject, new_dir+"/"+name)
par:
shutil.copy(subject, new_dir+"/"+name)
Le scénario:
#!/usr/bin/env python3
import os
import subprocess
import shutil
# --------------------------------------------------------
reorg_dir = "/path/to/directory_to_reorganize"
exclude = (".jpg") # for example
remove_emptyfolders = True
# ---------------------------------------------------------
for root, dirs, files in os.walk(reorg_dir):
for name in files:
subject = root+"/"+name
if name.startswith("."):
extension = ".hidden_files"
Elif not "." in name:
extension = ".without_extension"
else:
extension = name[name.rfind("."):]
if not extension in exclude:
new_dir = reorg_dir+"/"+extension[1:]
if not os.path.exists(new_dir):
os.mkdir(new_dir)
shutil.move(subject, new_dir+"/"+name)
def cleanup():
filelist = []
for root, dirs, files in os.walk(reorg_dir):
for name in files:
filelist.append(root+"/"+name)
directories = [item[0] for item in os.walk(reorg_dir)]
for dr in directories:
matches = [item for item in filelist if dr in item]
if len(matches) == 0:
try:
shutil.rmtree(dr)
except FileNotFoundError:
pass
if remove_emptyfolders == True:
cleanup()
SI il y a un risque d'écrasement indésirable des fichiers en double
Au prix de quelques lignes supplémentaires, nous pouvons éviter d’écraser les doublons possibles. Avec le code ci-dessous, les doublons seront renommés en:
duplicate_1_filename, duplicate_2_filename
etc.
Le scénario:
#!/usr/bin/env python3
import os
import subprocess
import shutil
# --------------------------------------------------------
reorg_dir = "/path/to/directory_to_reorganize"
exclude = (".jpg") # for example
remove_emptyfolders = True
# ---------------------------------------------------------
for root, dirs, files in os.walk(reorg_dir):
for name in files:
subject = root+"/"+name
if name.startswith("."):
extension = ".hidden_files"
Elif not "." in name:
extension = ".without_extension"
else:
extension = name[name.rfind("."):]
if not extension in exclude:
new_dir = reorg_dir+"/"+extension[1:]
if not os.path.exists(new_dir):
os.mkdir(new_dir)
n = 1; name_orig = name
while os.path.exists(new_dir+"/"+name):
name = "duplicate_"+str(n)+"_"+name_orig
n = n+1
newfile = new_dir+"/"+name
shutil.move(subject, newfile)
def cleanup():
filelist = []
for root, dirs, files in os.walk(reorg_dir):
for name in files:
filelist.append(root+"/"+name)
directories = [item[0] for item in os.walk(reorg_dir)]
for dr in directories:
matches = [item for item in filelist if dr in item]
if len(matches) == 0:
try:
shutil.rmtree(dr)
except FileNotFoundError:
pass
if remove_emptyfolders == True:
cleanup()
Avec OP en tête, nous avons tous oublié d’ajouter une instruction sur la façon de l’utiliser. Puisque des questions en double peuvent apparaître ( et faire ), cela peut néanmoins être utile.
reorganize.py
Dans la section head du script, définissez le répertoire ciblé (avec les fichiers à réorganiser):
reorg_dir = "/path/to/directory_to_reorganize"
(utilisez des guillemets si le répertoire contient des espaces)
extensions possibles que vous voudriez exclure (probablement aucune, comme ci-dessous):
exclude = ()
et si vous souhaitez supprimer les dossiers vides par la suite:
remove_emptyfolders = True
Exécutez le script avec la commande:
python3 /path/to/reorganize.py
NB si vous souhaitez copier les fichiers au lieu de move , remplacez:
shutil.move(subject, new_dir+"/"+name)
par:
shutil.copy(subject, new_dir+"/"+name)
S'il vous plaît essayez d'abord sur un petit échantillon.
Vous pouvez utiliser find
avec une commande exec
un peu complexe:
find . -iname '*?.?*' -type f -exec bash -c 'EXT="${0##*.}"; mkdir -p "$PWD/${EXT}_dir"; cp --target-directory="$PWD/${EXT}_dir" "$0"' {} \;
# '*?.?*' requires at least one character before and after the '.',
# so that files like .bashrc and blah. are avoided.
# EXT="${0##*.}" - get the extension
# mkdir -p $PWD/${EXT}_dir - make the folder, ignore if it exists
Remplacez cp
par echo
pour un fonctionnement à sec.
Plus efficace et plus ordonné serait d’enregistrer la commande bash
dans un script (par exemple, à /path/to/the/script.sh
):
#! /bin/bash
for i
do
EXT="${i##*.}"
mkdir -p "$PWD/${EXT}_dir"
mv --target-directory="$PWD/${EXT}_dir" "$i"
done
Et puis exécutez find
:
find . -iname '*?.?*' -type f -exec /path/to/the/script.sh {} +
Cette approche est assez flexible. Par exemple, pour utiliser le nom de fichier au lieu de l'extension (filename.ext
), nous l'utilisons pour EXT
:
NAME="${i##*/}"
EXT="${NAME%.*}"
ls | gawk -F. 'NF>1 {f= $NF "-DIR"; system("mkdir -p " f ";mv " $0 " " f)}'
Calcul de la liste des extensions (après déménagement):
ls -d *-DIR
Calcul de la liste des extensions (avant de déménager):
ls -X | grep -Po '(?<=\.)(\w+)$'| uniq -c | sort -n
(dans ce dernier exemple, nous calculons et trions le nombre de fichiers pour chaque extension)
Essayez ce script shell.
#!/bin/sh
src=`dirname "$1"`/`basename "$1"`;
for file in "$src"/*?.?*; do
if test -f "$file"; then
dest="$src${file##*.}"_files;
mkdir -p "$dest";
mv "$file" "$dest";
fi;
done;
# pass the directory to re-organize as first argument
# moves only regular files which have extension
# ignores other type of files including
# files having no extension, hidden files, directories, and links.
Si vous avez installé Perl renommer/prename:
rename 's!(.*)\.(\w+)$! mkdir($2); "$2/$&"!ge' *