Manteniment de discs durs

De Guifi.net - Wiki Català

Icona d'esboç

Aquest article està en desenvolupament. Pràcticament totes les pàgines del Wiki de Guifi.net són editables, però en aquesta falta informació essencial. Ampliant-ho ajudaràs a millorar Guifi.net.
Potser puguis ajudar-te amb els wikis castellà i anglès si tenen una pàgina equivalent.





Els disc durs, junt a les plaques bases, són els components més susceptibles de fallar, per això és important:

Adicionalment, per a servidors o per ordinadors que treballin amb dades sensibles, a mode de previsió s'ha de valorar també:

Afegir un RAID i/o afegir LVM i/o decidir el sistema d'arxius més adient per les tasques que realitzaran

Comparativa de disc durs segons la utilitat

Els discs SSD (Unitat d'eStat Sòlid)

  • Aventatges: Són els millors discs en termes de consum i vida útil (al no tenir components mecànics, l'erosió i desgast es produeix molt més a poc a poc i no té motor que pugui fallar).
  • Inconvenients: Són cars i tenen poca capacitat amb relació als SATA

Recomenables si no es necesita massa capacitat, per exemple per a enrutadors, portàtils o servidors que només facin servir sistema operatiu.

Discs SATA

Són els discs durs per a servidors que requereixen gran capacitat.

Discs IDE

Antic connector de discs durs que encara es poden trobar a plaques de routers. Actualment en desús per l'ús massiu del connector SATA, com a curiositat val a dir que la connexió que fa servir Compact Flash és una adpatació d'IDE, per lo tant les tarjetes Compact Flash porten una controladora IDE integrada.

  • Inconvenients: Velocitat de transmissió de dades molt lenta.

Només recomanables en cas de cost zero (reciclatge).

Discs SCSI

Discs durs dissenyats principalment per a servidors actualment en desús per l'ús massiu del connector SATA.

Només recomanables en cas de cost zero (reciclatge).

Connexió de corrent

No per obvi menys important: la connexió dels discs durs ha de ser la del seu voltatge i amperatge procurant garantint-la de forma constant amb [font d'alimentació|fonts d'alimentació] adients. En discs durs amb parts mecàniques les seves necessitats de corrent són als de 3,5" (habituals) als 5 i als 12 Volts amb un amperatge que sol anar dels 0,65 als 0,72 Ampers als 5 volts i dels 0,35 al 0,6 Ampers als 12 Volts; i als de 2,5" (els de portàtils) als 5 Volts amb un amperatge al voltant dels 0,55 Ampers. Està inscrit sempre a la part superior dels discs durs. La dada de l'Amperatge defineix la quantitat d'energia que consumirà el disc dur (però en principi no és més que orientativa i no definirà si el disc dur gastarà més o menys electricitat, ja que hi ha altres factors com la quantitat d'accessos a disc o la tecnologia d'aquest, per exemple fer servir la tecnologia NCQ evita fer voltes de més als discs durs i poden reduir temps i energia.

Comprovació de funcionament de discs durs

Hi ha tres eines fonamentals per a la comprovació dels discs durs:

  • fsck: comprova la integritat del sistema d'arxius
  • smartmontools: conjunt d'eines per visualitzar i rebre avisos sobre discs durs que pugin ser susceptibles de fallar en breu
  • badblocks: detecta blocs amb errors i els pot marcar per a no fer-los servir

I una eina addicional que és la proveïda pel seu fabricant.

fsck

Fa una comprovació de l'estat del sistema d'arxius (útil per a relocalitzar dades després d'una apagada sobtada del disc dur)

fsck /dev/partició_del_disc

On partició_del_disc pot ser sda1, per exemple.

Per, a més, comprovar si el disc dur té blocs amb errors es fa servir el:

fsck -c /dev/partició_del_disc

smartmontools

Smartmontools és un conjunt d'eines de monitorització de discs durs. Es compon de dos programes principals: smartctl per visualitzar dades a temps real per pantalla i smartd, per a rebre avisos.

Instal·lació:

apt-get install smartmontools smart-notifier

Visualitzar dades d'un disc dur:

smartctl -a /dev/discdur

La sortida s'interpreta de la següent manera:

SMART overall-health self-assessment test result

indica l'estat del disc dur. PASSED significa que el disc dur està en bon estat.

Power_Cycle_Count

indica el número de vegades que ha arrancat el disc dur

Power_On_Half_Minutes

indica el temps total que ha treballat el disc dur

Reallocated_Sector_Ct

indica els sectors danyats

A la part final llista els errors enregistrats al disc dur.

La presència d'errors a la visualització smartmontools no et parla sobre errors presents reals d'un disc dur. Encara que smartmontools et digui que no ha passat el test, el disc dur pot continuar funcionant, però es tracta d'un avís òptim sobre un disc dur que has de jubilar en no massa temps. Per a errors reals del disc es fa servir l'eina badblocks.

Una eina gràfica que corre smartmontools per sota és smart-gui, poc recomanable per servidors, ja que necessita un entorn de X.

badblocks

Identificar i reparar blocs fets malbé dins d'una partició

si lo que volem és salvar lo que quedi del disc, i també les dades:

badblocks -svnf /dev/sdb1 -o llista-badblocks.txt

Els paràmetres: -s ens mostra el proces de escaneig del disc, amb el percentatge de blocs comprovats. -v mode verbose -n mode no destructiu, és a dir, que si es recuperaren els blocs fets malbé la informació al disc dur no serà feta malbé o o eliminada. -f repara els blocs fets malbé -o addicionalment ens guarda un llistat dels blocs fets malbé, per si l'hem de tornar a necessitar

Nota: l'argument -w du a terme una escritura destructiva, és a dir esborra les dades al dics dur. Només fer-ho servir en cas que volguem provar d'arreglar el disc dur per a dur a terme un nou formateig. Això és poc recomanable, ja que després de tenir un disc amb blocs fets malbé lo millor és no tornar-ho a fer servir, ja que el motiu pel qual podrien haver aparegut podria continuar existint i a que fessin malbé nous blocs. Si hem identificat, però, que la causa de l'error està fóra del disc, podria ser bo.

Identificar blocs fets malbé a un disc dur i fer una partició nova on no els faci servir

badblocks /dev/disc_dur > llista-badblocks.txt

Això pot trigar hores.

Després fer la partició, per exemple ext3:

mkfs.ext3 -l llista-badblocks.txt /dev/partició_del_disc_dur

Veure els blocs fets malbé a un sistema d'arxius

dumpe2fs -b  filesystemname

Esborrar les dades dels inodes que marquen els blocs dolents

Podria fer perdre dades:

debugfs -w /dev/sdc1
clri <1>
quit

Això en realitat lo que fa és netejar l'inode número 1 (el primer que conté el llistat de blocs fets malbé marcats) del teu sistema d'arxius.

Després has de fer córrer e2fsck

Identificació de tipus d'error

Error de partició

Error físic de blocs de disc

Error físic de motor de disc

Error de la controladora de la placa base

A vegades la controladora de la placa base pot fallar, un error d'aquest tipus pot significar un error per part de la placa base:

Dec 11 18:41:25 npx-desktop kernel: [  325.010436] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Dec 11 18:41:25 npx-desktop kernel: [  325.010447] ata1.00: BMDMA stat 0x25
Dec 11 18:41:25 npx-desktop kernel: [  325.010455] ata1.00: failed command: READ DMA
Dec 11 18:41:25 npx-desktop kernel: [  325.010471] ata1.00: cmd c8/00:08:58:1e:a6/00:00:00:00:00/ea tag 0 dma 4096 in
Dec 11 18:41:25 npx-desktop kernel: [  325.010475]          res 51/40:08:58:1e:a6/00:00:00:00:00/ea Emask 0x9 (media error)
Dec 11 18:41:25 npx-desktop kernel: [  325.010483] ata1.00: status: { DRDY ERR }
Dec 11 18:41:25 npx-desktop kernel: [  325.010488] ata1.00: error: { UNC }
Dec 11 18:41:25 npx-desktop kernel: [  325.025242] ata1.00: configured for UDMA/133
Dec 11 18:41:25 npx-desktop kernel: [  325.025271] ata1: EH complete

Es pot provar de sol·lucionar, fent proves de desactivació de baixar la velocitat de DMA a 100 o desactivant DMA i ACPI (i, per lo tant, forçant a fer servir el processador). A /etc/default/grub afegim la següent linia:

GRUB_CMDLINE_LINUX="libata.dma=0 libata.noacpi=1"

i, després, update-grub

Errors de controladors del sistema operatiu

Es pot provar de sol·lucionar, fent proves de desactivació de NCQ (és possible que es perdi velocitat o que mai la hagués pogut tenir, perquè el disc no hagués funcionat mai amb NCQ).

A /etc/default/grub afegim la següent linia:

GRUB_CMDLINE_LINUX="libata.force=1.00:noncq" 

i, després, update-grub

Errors pendents d'identificar

Sembla error del motor del disc dur:

[2513158.907095] Buffer I/O error on device sdc5, logical block 14737350
[2513197.456102] sd 23:0:0:0: [sdc] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
[2513197.456102] sd 23:0:0:0: [sdc] Sense Key : Aborted Command [current]
[2513197.456102] sd 23:0:0:0: [sdc] Add. Sense: No additional sense information
[2513197.456102] end_request: I/O error, dev sdc, sector 149932608
[ 9.672007] ata3: link is slow to respond, please be patient (ready=0)
[ 14.320007] ata3: COMRESET failed (errno=-16)

També errors a la RAM podrien provocar errors als discs durs, a l'hora d'escriure en ells, però no està comprovat.

Còpies de seguretat

Formateig de disc durs

Afegir RAID

Afegir LVM

Sistemes d'arxius

afegeix aquí les virtuts de cada sistema d'arxius

LVM en clúster

Actualitzar firmware

L'actualització de firmware dels discs durs és una tasca molt poc habitual i que necessita de recursos especials que només s'hauria de fer en cas de que la controladora del disc dur hagués quedat inutilitzada.

Encara que hi ha altres maneres de fer-ho la millor és fent servir el maquinari-programari PC3000 o algun dels seus clònics, de preu alt tots ells.

Enllaços externs generals

Eines de l'usuari