R: Raggiungere l'Alta Affidabilità è difficile e dispendioso. Più si cerca di rendere indipendente dai guasti il sistema, più il sistema diventa difficile e costoso. I seguenti trucchi, consigli, idee e voci non confermate forse possono aiutarvi nella vostra ricerca.
- I dischi IDE si possono rompere in maniera tale che il disco rotto su un cavo IDE può impedire al disco funzionante sullo stesso cavo di rispondere, facendo apparire la cosa come se tutti e due i dischi fossero rotti. Poiché RAID non protegge dal malfunzionamento di due dischi si dovrà o mettere un solo disco su un cavo IDE o, se ci sono due dischi sullo stesso cavo, essi devono fare parte di set RAID differenti.
- I dischi SCSI si possono rompere in maniera tale da impedire l'accesso alle altre unità SCSI collegate in cascata. La modalità di malfunzionamento implica un cortocircuito del pin (condiviso dalle altre unità) attraverso il quale viene segnalato che il dispositivo è pronto; poiché questo collegamento è condiviso, non si possono effettuare operazioni finché il cortocircito non sia rimosso. Quindi, due dischi SCSI sulla stessa catena non devono appartenere allo stesso set RAID.
- Simili considerazioni valgono anche per i controller. Non usate tutti i canali di un controller; usate diversi controller.
- Non usate la stessa marca o modello per tutti i dischi. Non è improbabile che dei forti temporali ve ne possano rompere due o più (sì, tutti usiamo degli stabilizzatori di corrente, ma questi non sono macchine perfette). Il caldo e l'insufficiente ventilazione del disco sono altri killer di dischi. I dischi a buon prezzo spesso si surriscaldano. L'uso di modelli differenti di dischi e controller diminuisce la probabilità che qualsiasi cosa succeda ad un disco (il caldo, uno shock fisico, vibrazioni, sovratensioni) possa succedere anche agli altri nello stesso modo.
- Per cautelarsi da malfunzionamenti del controller o del PC, potrebbe essere possibile costruire un set di dischi SCSI che sia "twin-tailed"; collegato cioé a due computer. Un computer monta il filesystem in lettura-scrittura, mentre il secondo computer lo monta in sola lettura, e agisce da "hot spare" (ricambio a caldo ndt). Quando il computer che agisce da "hot spare" viene informato del fatto che il computer principale si è rotto (ad es. attraverso un watchdog), toglie tensione al computer principale (per essere sicuri che sia realmente spento) e quindi effettua un fsck e rimonta il filesystem in lettura-scrittura. Se qualcuno riesce a far funzionare questa configurazione lo prego di farmi sapere.
- Usare sempre un UPS ed effettuare shutdown puliti. Anche se uno shutdown sporco può non danneggiare i dischi, l'esecuzione di ckraid su un sistema di dischi anche piccolo è estremamente lenta. Oppure potete hackerare il kernel e fare un debug del codice che riguarda la ricostruzione a caldo...
- I cavi SCSI sono famosi per essere delle creature dal comportamento variabile, soggette ad ogni sorta di accidenti. Usate i migliori cavi che possiate rimediare. Si usi il bubble-wrap per assicurarsi che i cavi non stiano troppo vicino l'uno all'altro generando mutue interferenze. Si osservino rigorosamente le restrizioni sulla lunghezza dei cavi.
- Date un'occhiata a SSI (Serial Storage Architecture). Anche se dispendiosa, si dice che sia più affidabile della tecnologia SCSI.
- Divertitevi, è più tardi di quanto immaginiate.