Eine genaue Uhrzeit steht noch nicht fest, das hängt auch vom Support ab (wann ich dort das ok bekomme).
Das bedeutet, dass für eine kurze Zeit der Server ganz aus sein wird (geht normal recht schnell) und dass ich anschließend erst in das Rettungssystem muss, da natürlich von der leeren Festplatte nicht gebootet werden kann.
Sowie dann die Rekonstruktion des RAID1 startet, fahre ich den Server wieder normal hoch, d.h. er sollte dann wieder benutzbar sein.
Wenn alles einwandfrei läuft, dürfte die Sache in einer halben Stunde erledigt sein. Ansonsten eben entsprechend länger...
Hintergrundinfo:
Der Kernel liefert alle paar Tage:
- Code: Alles auswählen
ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1.00: (irq_stat 0x40000001)
ata1.00: tag 0 cmd 0xb0 Emask 0x1 stat 0x51 err 0x4 (device error)
ata1: EH complete
Die SMART-Daten der Festplatte sind in Ordnung. Da ein Tausch der SATA-Kabel nichts veränderte, wird nun vorsichtshalber die (erste) Festplatte getauscht, bei Bedarf später auch noch die zweite (da dort die Meldung auch erscheint, nur seltener). Hilft hier alles nichts steht auch noch ein Mainboardtausch an.
Edit:
Einen Datenverlust dürfte es in jedem Fall nicht geben, da neben dem RAID1 die Datenbank auf einen zweiten Server fast in Echtzeit synchronisiert wird, d.h. mit einer Zeitverzögerung von normal weniger als einer Sekunde.
Gruß
Aaron