Il sistema si blocca, ma accessibile da SSH

7

Ho eseguito uno script Python per un lungo periodo di tempo che si basa sul modulo pyCUDA.

In due occasioni, il desktop è diventato bloccato e totalmente insensibile, tranne, stranamente, tramite SSH. L'accesso remoto mostra che lo script Python non è più in esecuzione quando il sistema è (localmente) bloccato. Poiché questo script Python viene eseguito per molto tempo, non sono mai stato in grado di vedere quando si blocca esattamente. Non è mai stato bloccato senza che lo script sia stato eseguito.

Esecuzione 12.04 con una GPU GeForce 460. Lo script Python non effettua una chiamata CUDA che dura più di un'ora, ma centinaia che durano meno di 30 secondi, quindi non penso che la GPU stia bloccando il sistema. Grazie per qualsiasi idea.

    
posta Peter Becich 04.11.2012 - 08:40

2 risposte

2

Hai detto che quando si accede tramite SSH, lo script non è più in esecuzione. È perché è terminato o è andato in crash?

Puoi anche eseguire il tuo script con strace. In questo modo puoi acquisire tutte le chiamate di sistema che effettua, in particolare quello che fa quando termina / si blocca.

strace -f /path/script.py -o /tmp/output.log

Produrrà un file piuttosto grande, quindi assicurati di avere abbastanza spazio libero.

    
risposta data Marcin Kaminski 24.11.2012 - 00:56
2

Alcune idee e suggerimenti per il debug:

  • Quando si accede tramite SSH, il sistema è inattivo o è un processo che si blocca con un carico pesante?
  • Che cosa significa "totalmente insensibile"? Puoi ancora arrivare a un terminale virtuale premendo Ctrl-Alt-F1? Colpire CapsLock attiva / disattiva il LED di stato sulla tastiera?
  • Anche se lo script non può utilizzare la GPU per lunghi periodi alla volta, quanto consuma la memoria massima della GPU?
  • Arrestare il server X ed eseguire lo script da un terminale virtuale impedisce in modo affidabile i blocchi?
risposta data kynan 20.01.2013 - 02:01

Leggi altre domande sui tag