Mysterious minutes-long system freeze

4

Attualmente sto vivendo periodi di tempo molto lunghi (~ 5 minuti alla volta) durante i quali il mio portatile si blocca. Ho preso un'immagine della situazione per evidenziare alcuni sintomi (non è stato possibile effettuare uno screenshot a causa del blocco).

Ecco l'immagine:

Quindi, cosa si blocca:

  • I blocchi della VM (lato destro), erano in fase di arresto
  • I siti web non verranno caricati (sullo sfondo)
  • Impossibile eseguire il ping dei siti Web (finestra del terminale) e, dopo un po ', non è possibile immettere testo nella finestra del terminale (notare il cursore di testo' apri rettangolo ')
  • Il browser di file si blocca e non mostra il contenuto della cartella (finestra Dolphin)
  • Impossibile aprire Dash home

Che cosa non si blocca:

  • Può ancora spostare il mouse
  • Può ancora mettere a fuoco la finestra
  • Puoi ancora inserire un terminale con alt - ctrl - f1

Informazioni aggiuntive:

  • Sembra che ci siano 2 livelli, uno durante il quale posso ancora aprire nuovi programmi, per esempio, e uno durante il quale anche questo non è più possibile. Sospetto che il secondo stadio inizi quando tento di visualizzare il contenuto della cartella Inizio ( ~ ), ma potrei esserne completamente fuori.

  • Dopo circa 5 minuti, il sistema si sblocca come se non fosse mai successo niente.

  • Succede alcune volte al giorno. Un riavvio non lo fa andare via.

  • In almeno un caso (proverò di più mentre continua a verificarsi), il passaggio a una diversa rete wifi risolve istantaneamente il problema. Il passaggio alla rete originale non comporta la ricomparsa del problema (immediatamente).

Non so da dove cominciare a guardare, ma leggere in giro suggerisce che l'output dmesg potrebbe essere un buon posto. Il suo contenuto può essere trovato qui . La (porzione pertinente del) contenuto di /var/log/syslog può essere trovata qui . In entrambi, viene menzionato un arresto anomalo del firmware in [3125.851869], che è il 9 gen. 19:24:03.

Sto utilizzando la versione 16.10 su un nuovo Dell XPS 13 Kaby Lake. Fammi sapere se posso fornire ulteriori informazioni.

Modifica

Il dmesg log ora menziona un errore hardware:

[   38.276956] Key type id_legacy registered
[  300.462458] mce: [Hardware Error]: Machine check events logged
[  311.013944] SUPR0GipMap: fGetGipCpu=0x3
[  311.521449] vboxdrv: ffffffffc0000020 VMMR0.r0
[  311.706008] vboxdrv: ffffffffc0102020 VBoxDDR0.r0
[  311.799288] vboxdrv: ffffffffc0122020 VBoxEhciR0.r0
[  327.508305] wlp58s0: AP 88:03:55:f4:9c:e8 changed bandwidth, new config is 2462 MHz, width 1 (2462/0 MHz)
[  404.851340] vboxdrv: ffffffffc0000020 VMMR0.r0
[  404.984658] vboxdrv: ffffffffc0102020 VBoxDDR0.r0
[  746.410756] hrtimer: interrupt took 9058 ns

Il contenuto di /var/log/mcelog si trova in questo pastebin .

Modifica

Alcuni suggerimenti suggeriscono che il problema potrebbe essere relativo al disco rigido, quindi lascia che ti fornisca alcune informazioni al riguardo.

Il sistema è in esecuzione su un ssd crittografato (non solo sulla cartella home), che è probabilmente il motivo per cui non viene visualizzato sotto /dev/sda , ma piuttosto /dev/mapper/ubuntu--vg-root . Se è di aiuto, l'intero output di df -l è:

Filesystem                  1K-blocks      Used Available Use% Mounted on
udev                          4003752         0   4003752   0% /dev
tmpfs                          805328     10204    795124   2% /run
/dev/mapper/ubuntu--vg-root 235927440 214041380   9831944  96% /
tmpfs                         4026636       292   4026344   1% /dev/shm
tmpfs                            5120         4      5116   1% /run/lock
tmpfs                         4026636         0   4026636   0% /sys/fs/cgroup
/dev/loop2                      77952     77952         0 100% /snap/ubuntu-core/1357
/dev/loop0                      76800     76800         0 100% /snap/ubuntu-core/423
/dev/loop1                     131968    131968         0 100% /snap/arduino-mhall119/3
/dev/nvme0n1p2                 483946    136447    322514  30% /boot
/dev/nvme0n1p1                 523248      3676    519572   1% /boot/efi
tmpfs                          805324       140    805184   1% /run/user/1000

Cercando di trovare alcune informazioni sulla salute, eseguendo gsmartcontrol , il Controllo integrità di base è "sconosciuto" e visualizzando l'output, le ultime righe hanno letto Read NVMe SMART/Health Information failed: NVMe Status 0x4002

Ottengo lo stesso risultato quando eseguo sudo smartctl -a /dev/nvme0n1 :

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.8.0-34-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       THNSN5256GPUK NVMe TOSHIBA 256GB
Serial Number:                      X64S14LCT18T
Firmware Version:                   5KDA4101
PCI Vendor/Subsystem ID:            0x1179
IEEE OUI Identifier:                0x00080d
Controller ID:                      0
Number of Namespaces:               1
Namespace 1 Size/Capacity:          256,060,514,304 [256 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Fri Jan 13 19:05:21 2017 CET
Firmware Updates (0x02):            1 Slot
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001e):     Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Warning  Comp. Temp. Threshold:     78 Celsius
Critical Comp. Temp. Threshold:     82 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        0       0
 1 +     2.40W       -        -    1  1  1  1        0       0
 2 +     1.90W       -        -    2  2  2  2        0       0
 3 -   0.0120W       -        -    3  3  3  3     5000   25000
 4 -   0.0060W       -        -    4  4  4  4   100000   70000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         2
 1 -    4096       0         1

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x4002

Non trovo alcuna informazione su questo stato.

    
posta ElRudi 09.01.2017 - 19:54

0 risposte

Leggi altre domande sui tag