Come la curiosità mi ha aiutato a risolvere un problema hardware
La curiosità alimenta la ricerca della conoscenza e della verità, che si tratti di hardware, software open source, programmazione, costruzione di un PC, ottimizzazione delle impostazioni o semplicemente apprendimento di una nuova applicazione.
Solitamente ho una dozzina di computer attivi e funzionanti sulla mia rete domestica, sì, 12. E sono responsabile di molti altri in altre località. Con così tanti computer si verificano sempre guasti di vario tipo e alla fine ne diagnostico molti come problemi hardware. Ma può essere difficile diagnosticare quale componente hardware causa il problema.
Proprio questa settimana, ho avuto un problema sconcertante di cui ho diagnosticato erroneamente la causa sulla mia workstation principale, per due volte. Questo articolo illustra il processo che ho seguito. Ti mostro dove e perché ho preso la strada sbagliata e quanto può essere facile farlo.
I primi sintomi
Ho lavorato su diversi progetti. Recentemente avevo molte applicazioni aperte su più desktop e stavo appena iniziando a funzionare quando lo schermo si è oscurato. La maggior parte (non tutte) delle ventole della mia postazione di lavoro principale si sono fermate e ho fatto un respiro profondo. Non avevo mai visto nulla di simile prima, ma sapevo che il mio sistema era nei guai.
C'erano due indizi principali con cui dovevo lavorare. Il display si oscurò e diversi ventilatori si fermarono. Tuttavia, i LED di alimentazione e di attività del disco sul pannello frontale erano ancora accesi, anche se a un livello di luminosità inferiore al solito. Anche la maggior parte delle luci LED RGB decorative sulla scheda madre, sui DIMM di memoria e sulle ventole si sono spente.
Ho provato i pulsanti di accensione e ripristino senza risultati. Ho spento l'alimentazione direttamente utilizzando l'interruttore a bilanciere dell'alimentatore. Riaccenderlo ha provocato la stessa serie di sintomi.
Pensieri iniziali
Questi sintomi e decenni di esperienza con tutti i tipi di guasti mi hanno indirizzato all'alimentatore.
Ho rimosso l'alimentatore e ho utilizzato il tester dell'alimentatore per controllarlo. Il tester ha indicato che l'alimentatore era buono e che tutte le tensioni rientravano nelle specifiche. Tuttavia, sapevo che il tester avrebbe potuto sbagliarsi. I tester per alimentatori non eseguono test in condizioni di pieno carico come quelle che esistono quando il computer è in funzione e assorbe poche centinaia di watt di potenza. Ho seguito il mio istinto e ho installato il mio alimentatore di riserva da 1000 W.
Con una media di 12 computer nella mia rete domestica, ho imparato a tenere a portata di mano molti pezzi di ricambio. Mi risparmia molta frustrazione perché non devo correre al negozio di computer locale o ordinare online e aspettare la consegna quando le cose si rompono, e le cose si rompono sempre con così tanti computer in giro.
L'alimentatore sostitutivo ha risolto il problema nonostante il risultato ottenuto dal tester dell'alimentatore. Anche se il tester ha avuto ragione molte volte in passato, la mia esperienza, la mia conoscenza e il mio istinto mi hanno detto diversamente.
Sfortunatamente, il mio istinto era sbagliato.
Ripensamenti
La mia postazione di lavoro presentava nuovamente gli stessi sintomi. È molto improbabile che due diversi alimentatori si guastino esattamente nello stesso modo.
Idea successiva: doveva essere la scheda madre. Non tengo schede madri di riserva in giro, quindi ne ho ordinata una nuova online e ho pensato che avrei potuto utilizzare la memoria extra che già avevo e spostare la CPU sulla nuova scheda madre insieme alla sua unità di raffreddamento a liquido all-in-one.
Risoluzione disciplinata dei problemi
La nuova scheda madre avrebbe impiegato un paio di giorni per arrivare, quindi ho deciso di prepararmi rimuovendo quella vecchia dalla workstation. Ma prima di scollegare l'alimentazione alla scheda madre, la mia curiosità ha preso il sopravvento e mi ha costretto ad accendere il sistema con solo la scheda madre, la CPU e la memoria installate. Avevo disconnesso tutto il resto.
Una buona risoluzione dei problemi richiede l'isolamento di tutte le potenziali variabili e tutto ciò che avevo fatto finora era stato testare l'alimentatore. Ho dovuto testare ogni componente.
Questo processo mi ha richiesto di scollegare i cavi del pannello frontale per l'audio e il pannello multimediale del dashboard che include vari slot USB, SATA e per schede di memoria.
Con la sola scheda madre collegata ho avuto una sorpresa: tutto ha funzionato normalmente!
Il computer stesso non si avviava perché non c'erano unità di archiviazione collegate e non veniva visualizzato nulla perché avevo rimosso l'adattatore video. Ma non c'erano sintomi di guasti all'alimentazione o alla scheda madre. Ciò ha stuzzicato ancora di più la mia curiosità. Se la scheda madre fosse davvero difettosa, i sintomi esisterebbero ancora.
Quindi ho avviato una sequenza di spegnimento, reinstallazione di uno dei componenti rimossi e riaccensione.
Si scopre che i sintomi sono stati causati dal dashboard multimediale del pannello frontale.
Ho rimosso il dashboard multimediale e ho ricollegato tutto il resto. La mia workstation si è avviata correttamente e ha funzionato come previsto. Avevo individuato il colpevole.
Come è iniziato
Avendo individuato il problema reale, ho subito capito la causa principale. Era iniziato un paio di giorni prima. Stavo lavorando e testando diversi dispositivi USB esterni, tra cui varie fotocamere, dispositivi di archiviazione che utilizzo per i backup e un hub USB esterno.
Ho preso un cavo USB e l'ho collegato a uno slot USB 2.0 sul dashboard multimediale. Tutto si fermò e la maggior parte delle luci e dei ventilatori si spensero. Ho scollegato il cavo USB, che ormai era molto caldo, e mi sono bruciato le dita. Avevo inavvertitamente collegato l'estremità di tipo C alla presa USB 3.0 di tipo A, provocando un cortocircuito dell'alimentazione.
Dopo aver scollegato il cavo USB, tutto è tornato alla normalità, tranne che così non è stato. Il dashboard multimediale è durato ancora qualche giorno e poi è andato completamente in cortocircuito, indebolito dal mio errore disattento.
Saltare alle conclusioni
La conoscenza e l'esperienza a volte possono contare più di strumenti come i tester per alimentatori. Tranne quando non lo fanno. Alla fine ho trovato la vera causa del problema, ma avrei dovuto vederlo prima.
Anche se avevo ragione nel ritenere che si trattasse di un problema di alimentazione, sono stato distratto non leggendo correttamente i sintomi e seguendo quella linea di indagine fino alla sua logica conclusione. Avrei potuto isolare la vera causa del problema prima di quanto ho fatto e risparmiare il tempo impiegato a configurare il mio laptop come dispositivo primario temporaneo finché non avessi potuto riparare la mia workstation principale.
Gli amministratori di sistema lavorano con dispositivi complessi e può essere facile trarre conclusioni affrettate. Ho oltre 50 anni di esperienza nel settore informatico e continuo a farlo. Devo solo ricordarmi di fare qualche respiro yoga profondo e continuare a scavare finché non isolo la causa principale del problema.
Curiosità
Almeno ho seguito la mia curiosità mentre aspettavo che arrivasse la scheda madre sostitutiva. Ciò mi ha permesso di riportare le cose alla normalità molto prima di quanto avessi aspettato fino all'arrivo della nuova scheda madre. E avrei potuto scartare una scheda madre perfettamente buona non testandola ulteriormente.
C'è un detto sulla curiosità che uccide il gatto. Odio questo detto perché è usato troppo spesso da genitori, colleghi, capi con i capelli a punta, insegnanti e altri che vogliono solo che noi curiosi li lasciamo in pace. In realtà, la curiosità alimenta la ricerca della conoscenza e della verità, che si tratti di hardware, software open source, programmazione, costruzione di un PC, ottimizzazione delle impostazioni o semplicemente apprendimento di una nuova applicazione. Alimenta la tua curiosità!