Ubuntu 11.04 sur mon Thinkpad T520 gèle de manière aléatoire depuis que je l’ai installée.
J'ai posé la question suivante il y a longtemps, mais cela ne m'a pas vraiment aidé: Comment déboguer lorsque le système se bloque ou lorsqu'il se bloque de nouveau pour se connecter?
Voici un copier/coller complet de mon fichier xsession.errors:
J'ai aussi tout essayé dans la question suivante:
Que dois-je faire quand Ubuntu se fige?
J'ai essayé REISUB et les autres suggestions de cette question, mais rien ne semble fonctionner. La seule chose qui fonctionne est la réinitialisation de l'ordinateur portable.
Toute aide est appréciée et si j’ai besoin de fournir plus d’informations/journaux, il suffit de demander que je suis vraiment motivé pour résoudre ce problème.
Mettre à jour
00:00.0 Host bridge: Intel Corporation 2nd Generation Core Processor Family DRAM Controller (rev 09)
00:02.0 VGA compatible controller: Intel Corporation 2nd Generation Core Processor Family Integrated Graphics Controller (rev 09)
00:16.0 Communication controller: Intel Corporation 6 Series Chipset Family MEI Controller #1 (rev 04)
00:16.3 Serial controller: Intel Corporation 6 Series Chipset Family KT Controller (rev 04)
00:19.0 Ethernet controller: Intel Corporation 82579LM Gigabit Network Connection (rev 04)
00:1a.0 USB Controller: Intel Corporation 6 Series Chipset Family USB Enhanced Host Controller #2 (rev 04)
00:1b.0 Audio device: Intel Corporation 6 Series Chipset Family High Definition Audio Controller (rev 04)
00:1c.0 PCI bridge: Intel Corporation 6 Series Chipset Family PCI Express Root Port 1 (rev b4)
00:1c.1 PCI bridge: Intel Corporation 6 Series Chipset Family PCI Express Root Port 2 (rev b4)
00:1c.3 PCI bridge: Intel Corporation 6 Series Chipset Family PCI Express Root Port 4 (rev b4)
00:1c.4 PCI bridge: Intel Corporation 6 Series Chipset Family PCI Express Root Port 5 (rev b4)
00:1d.0 USB Controller: Intel Corporation 6 Series Chipset Family USB Enhanced Host Controller #1 (rev 04)
00:1f.0 ISA bridge: Intel Corporation 6 Series Chipset Family LPC Controller (rev 04)
00:1f.2 SATA controller: Intel Corporation 6 Series Chipset Family 6 port SATA AHCI Controller (rev 04)
00:1f.3 SMBus: Intel Corporation 6 Series Chipset Family SMBus Controller (rev 04)
03:00.0 Network controller: Intel Corporation Centrino Ultimate-N 6300 (rev 35)
0d:00.0 System peripheral: Ricoh Co Ltd Device e823 (rev 05)
0d:00.3 FireWire (IEEE 1394): Ricoh Co Ltd FireWire Host Controller (rev 04)
Bus 002 Device 003: ID 0bdb:1911 Ericsson Business Mobile Networks BV
Bus 002 Device 002: ID 8087:0024 Intel Corp. Integrated Rate Matching Hub
Bus 002 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
Bus 001 Device 006: ID 04f2:b217 Chicony Electronics Co., Ltd
Bus 001 Device 005: ID 0a5c:217f Broadcom Corp. Bluetooth Controller
Bus 001 Device 004: ID 147e:2016 Upek Biometric Touchchip/Touchstrip Fingerprint Sensor
Bus 001 Device 003: ID 045e:0737 Microsoft Corp.
Bus 001 Device 002: ID 8087:0024 Intel Corp. Integrated Rate Matching Hub
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub
J'ai le même problème, et la cause du problème est facile à voir en cherchant dans /var/log/syslog
. Essentiellement, le GPU est arrêté et cause une erreur de segmentation dans compiz:
Sep 9 10:29:46 helix kernel: [ 7946.237954] [drm:i915_hangcheck_elapsed] *ERROR* Hangcheck timer elapsed... GPU hung
Sep 9 10:29:46 helix kernel: [ 7946.250096] [drm:i915_do_wait_request] *ERROR* i915_do_wait_request returns -11 (awaiting 3077849 at 3077840, next 3077850)
Sep 9 10:30:10 helix kernel: [ 7970.376485] compiz[1571]: segfault at 0 ip 00007f4da365b7d1 sp 00007fff1dbd5690 error 6 in i965_dri.so[7f4da35ea000+ac000]
Sep 9 10:30:15 helix kernel: [ 7975.150824] compiz[10649]: segfault at 0 ip 00007f059c445be8 sp 00007fff629e2d90 error 6 in i965_dri.so[7f059c3d4000+ac000]
Sep 9 10:30:20 helix kernel: [ 7979.892104] compiz[10671]: segfault at 0 ip 00007f1b2cd1cbe8 sp 00007fff9ef21f40 error 6 in i965_dri.so[7f1b2ccab000+ac000]
Sep 9 10:30:24 helix kernel: [ 7984.489864] compiz[10691]: segfault at 0 ip 00007f05d48debe8 sp 00007fffee43a810 error 6 in i965_dri.so[7f05d486d000+ac000]
Sep 9 10:30:29 helix kernel: [ 7989.095058] compiz[10710]: segfault at 0 ip 00007f74d0326be8 sp 00007fff09f4a480 error 6 in i965_dri.so[7f74d02b5000+ac000]
Sep 9 10:30:33 helix kernel: [ 7993.793423] compiz[10730]: segfault at 0 ip 00007fe855c9fbe8 sp 00007fff23af8570 error 6 in i965_dri.so[7fe855c2e000+ac000]
Sep 9 10:30:38 helix kernel: [ 7998.316195] compiz[10750]: segfault at 0 ip 00007fa4facb3be8 sp 00007fffe0b08c10 error 6 in i965_dri.so[7fa4fac42000+ac000]
Vous pouvez voir que le noyau utilise le pilote i915 pour ce chipset par défaut:
00:02.0 VGA compatible controller: Intel Corporation 2nd Generation Core Processor Family Integrated Graphics Controller (rev 09) (prog-if 00 [VGA controller])
Subsystem: Lenovo Device 21cf
Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx+
Status: Cap+ 66MHz- UDF- FastB2B+ ParErr- DEVSEL=fast >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
Latency: 0
Interrupt: pin A routed to IRQ 43
Region 0: Memory at f0000000 (64-bit, non-prefetchable) [size=4M]
Region 2: Memory at e0000000 (64-bit, prefetchable) [size=256M]
Region 4: I/O ports at 6000 [size=64]
Expansion ROM at <unassigned> [disabled]
Capabilities: <access denied>
Kernel driver in use: i915
Kernel modules: i915
Il s’agit d’une toute nouvelle machine avec une nouvelle installation de 11.04, elle n’est donc pas liée à une mise à niveau ou quelque chose du genre.
En résumé, je recommanderais ce qui suit:apt-get install xserver-xorg-video-intel libdrm-intel1
(je suis presque sûr que vous en avez)apt-get install libdrm-intel1-dbg xserver-xorg-video-intel-dbg
Puis démarrez votre noyau avec le débogage activé (drm.debug = 0x06) et montez le fichier debugfs: Sudo mount -t debugfs debugfs /sys/kernel/debug
De plus, vous pouvez configurer votre système pour les cœurs à l'aide de ulimit:
ulimit -c unlimited
ulimit -s unlimited
(etc)
Vérifiez les modifications avec ulimit -a
Lorsque le problème se reproduit, vous pouvez utiliser /usr/bin/intel_gpu_dump
pour obtenir plus de détails sur l'état du GPU APRÈS que le GPU soit bloqué comme auparavant.
Des informations supplémentaires peuvent être trouvées sous /sys/kernel/debug/dri/0/i915_error_state
APRÈS qu’un crash s’est produit.
Vous pouvez également extraire les informations de la pile du fichier principal généré, généralement sous /.
En résumé, cela ressemble à un bug pour moi. Vous pouvez prendre ces informations, ainsi qu’un rapport de pile de logiciels et déposer un rapport de bogue officiel.
Vérifiez si le fichier /var/log/syslog
contient des messages d'erreur du moment où votre système a gelé. Si vous trouvez des messages d'erreur, vous pouvez essayer de les rechercher dans Launchpad .
Votre ordinateur a un processeur Sandy Bridge, et il existe quelques bugs connus liés à cela. Par exemple, j'ai récemment rencontré des blocages du système dus à un bogue # 761065 sur un T520.