Je suis un utilisateur de longue date et je soumets des questions pour la première fois. J'ai passé une journée entière à rechercher ce site et de nombreux autres sites pour trouver une solution, mais je dois recourir à demander de l'aide pour résoudre ma situation.
Historique: Notre serveur HP Proliant, Centos 5.9 a été mis hors tension hier sans procédures d'arrêt appropriées. À partir de ce moment, la partition/home a été dans un état où nous ne pouvons pas la fsck, la monter ou la démonter. umount indique qu'il n'est pas monté, mais mount/fsck indique qu'il est occupé ou déjà monté. Cela a initialement provoqué le démarrage du serveur. Nous avons finalement supprimé le disque/la partition de/etc/fstab afin que le démarrage n'échoue pas.
# mount -t ext3 /dev/cciss/c0d0p1 /home
mount: /dev/cciss/c0d0p1 already mounted or /home busy
# fsck /dev/cciss/c0d0p1
fsck 1.39 (29-May-2006)
e2fsck 1.39 (29-May-2006)
fsck.ext3: Device or resource busy while trying to open /dev/cciss/c0d0p1
Filesystem mounted or opened exclusively by another program?
Comme vous pouvez le voir, le disque n'est monté en aucune façon.
sortie df:
# df
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/cciss/c0d1p3 198381228 24920704 163220696 14% /
/dev/cciss/c0d1p2 267818128 191652 253802544 1% /logs
/dev/cciss/c0d1p1 194442 33575 150828 19% /boot
tmpfs 49495044 0 49495044 0% /dev/shm
sortie de montage:
# mount
/dev/cciss/c0d1p3 on / type ext3 (rw)
proc on /proc type proc (rw)
sysfs on /sys type sysfs (rw)
devpts on /dev/pts type devpts (rw,gid=5,mode=620)
/dev/cciss/c0d1p2 on /logs type ext3 (rw)
/dev/cciss/c0d1p1 on /boot type ext3 (rw)
tmpfs on /dev/shm type tmpfs (rw)
none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw)
sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw)
/ etc/fstab
# cat /etc/fstab
LABEL=/ / ext3 defaults 1 1
LABEL=/logs /logs ext3 defaults 1 2
LABEL=/boot /boot ext3 defaults 1 2
tmpfs /dev/shm tmpfs defaults 0 0
devpts /dev/pts devpts gid=5,mode=620 0 0
sysfs /sys sysfs defaults 0 0
proc /proc proc defaults 0 0
LABEL=SW-cciss/c0d1p5 swap swap defaults 0 0
/ etc/mtab
# cat /etc/mtab
/dev/cciss/c0d1p3 / ext3 rw 0 0
proc /proc proc rw 0 0
sysfs /sys sysfs rw 0 0
devpts /dev/pts devpts rw,gid=5,mode=620 0 0
/dev/cciss/c0d1p2 /logs ext3 rw 0 0
/dev/cciss/c0d1p1 /boot ext3 rw 0 0
tmpfs /dev/shm tmpfs rw 0 0
none /proc/sys/fs/binfmt_misc binfmt_misc rw 0 0
sunrpc /var/lib/nfs/rpc_pipefs rpc_pipefs rw 0 0
/ proc/monte
# cat /proc/mounts
rootfs / rootfs rw 0 0
/dev/root / ext3 rw,data=ordered 0 0
/dev /dev tmpfs rw 0 0
/proc /proc proc rw 0 0
/sys /sys sysfs rw 0 0
/proc/bus/usb /proc/bus/usb usbfs rw 0 0
devpts /dev/pts devpts rw 0 0
/dev/cciss/c0d1p2 /logs ext3 rw,data=ordered 0 0
/dev/cciss/c0d1p1 /boot ext3 rw,data=ordered 0 0
tmpfs /dev/shm tmpfs rw 0 0
none /proc/sys/fs/binfmt_misc binfmt_misc rw 0 0
sunrpc /var/lib/nfs/rpc_pipefs rpc_pipefs rw 0 0
/etc/auto.misc /misc autofs rw,fd=7,pgrp=9694,timeout=300,minproto=5,maxproto=5,indirect 0 0
-hosts /net autofs rw,fd=13,pgrp=9694,timeout=300,minproto=5,maxproto=5,indirect 0 0
lsof
# lsof /dev/cciss/c0d0p1
#
fuser
# fuser /dev/cciss/c0d0p1
#
fdisk -l
# fdisk -l /dev/cciss/c0d0
Disk /dev/cciss/c0d0: 1800.2 GB, 1800280694784 bytes
255 heads, 63 sectors/track, 218871 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
/dev/cciss/c0d0p1 * 1 218871 1758081276 83 Linux
Selon d'autres recommandations sur le Web, nous avons utilisé le terminal distant ILO3 pour démarrer à partir d'un Centos LiveCD. Lorsque nous avons fait cela, nous avons pu monter/démonter, fsck, la partition sans aucune erreur ni problème. (ie: le disque lui-même est très bien).
Nous avons également utilisé "debugfs" pour effectuer un effacement d'inode pour le Journal Inode <8>. fsck a ensuite reconstruit le journal sans erreur. Encore une fois, nous avons pu monter/démonter le disque sans aucun problème lors du démarrage dans le LiveCD.
Lorsque nous sommes revenus à la partition de démarrage normale, nous sommes de retour au même endroit, incapable de monter ou de fsck car le système d'exploitation pense que la partition est occupée.
J'essaie de comprendre ce que d'autre au sein de Linux pourrait indiquer que ce disque est en cours d'utilisation. Quels autres utilitaires peuvent être utilisés pour trouver cela et l'effacer?
Toute aide est grandement appréciée.
lsof et fuser sur/home, ainsi que l'affichage du contenu/home et des autorisations de répertoire.
# lsof /home
# fuser /home
# ls -la /home
total 16
drwxr-xr-x 2 root root 4096 Mar 15 2013 .
drwxr-xr-x 27 root root 4096 Nov 19 08:31 ..
# ls -l / | grep home
drwxr-xr-x 2 root root 4096 Mar 15 2013 home
#
Le montage -o remount échoue, car cette partition n'a pas été montée depuis le dernier démarrage. (Il s'agissait d'une partition fonctionnelle depuis l'installation du serveur, et n'a montré ce problème qu'après le redémarrage dur d'hier).
# mount -o remount -t ext3 /dev/cciss/c0d0p1 /home
mount: /home not mounted already, or bad option
Je pourrais rajouter cette partition à/etc/fstab et redémarrer si nécessaire.
sortie dmsetup:
# dmsetup table
mpath0: 0 3516173232 multipath 1 queue_if_no_path 0 1 1 round-robin 0 1 1 104:0 1000
mpath0p1: 0 3516162552 linear 253:0 63
# dmsetup info
Name: mpath0
State: ACTIVE
Read Ahead: 256
Tables present: LIVE
Open count: 1
Event number: 1
Major, minor: 253, 0
Number of targets: 1
UUID: mpath-3600508b1001cb6e6453d25c4052abca5
Name: mpath0p1
State: ACTIVE
Read Ahead: 256
Tables present: LIVE
Open count: 0
Event number: 0
Major, minor: 253, 1
Number of targets: 1
UUID: part1-mpath-3600508b1001cb6e6453d25c4052abca5
lsof -n
# lsof -n | grep /home
#
# multipath -ll
mpath0 (3600508b1001cb6e6453d25c4052abca5) dm-0 HP,LOGICAL VOLUME
[size=1.6T][features=1 queue_if_no_path][hwhandler=0][rw]
\_ round-robin 0 [prio=1][active]
\_ #:#:#:# cciss!c0d0 104:0 [active][ready]
# multipath -F
# multipath -ll
#
# mount -t ext3 /dev/cciss/c0d0p1 /home
# cat /proc/mounts | grep home
/dev/cciss/c0d0p1 /home ext3 rw,data=ordered 0 0
Il est probablement utilisé par le mappeur de périphériques.
Vérifiez votre table de mappage de périphérique à l'aide de dmsetup table
. S'il est là, effacez le mappage avec dmsetup remove <name>
.
Sinon, recherchez également les erreurs dans dmesg
.
# dmsetup table
mpath0: 0 3516173232 multipath 1 queue_if_no_path 0 1 1 round-robin 0 1 1 104:0 1000
mpath0p1: 0 3516162552 linear 253:0 63
Ah ah! multipath a revendiqué le disque. Vous pouvez voir en exécutant multipath -ll
.
Courir: multipath -F
pour vider toutes les cartes inutilisées puis multipath -ll
ne devrait rien produire.
Ou utilisez simplement /dev/mapper/mpath0p1
au lieu de /dev/cciss/c0d0p1
.
Je viens de rencontrer cela après avoir cloné un SAN LUN existant sur un nouveau serveur. Ma solution était:
mount -o remount,rw /dev/sda1
(où sda1 est ce avec quoi vous rencontrez des problèmes)/etc/blkid/blkid.tab
Le serveur a ensuite démarré.
En ce qui concerne le processus de dépannage, lors de l’essai de lsof ou de l’unité de fusion, ne vous contentez pas de vérifier la partition appropriée - vérifiez directement le disque. Cela vous aurait rapidement orienté vers la bonne solution:
Mauvais:
fuser /dev/cciss/c0d0p1
Bien:
fuser /dev/cciss/c0d0
Mauvais:
lsof /dev/c0d0p1
Bien:
lsof /dev/ | grep c0d0