Aviso de fallo de disco duro
Buenas,
La verdad es que con este portátil no gano para sustos. Después de haber reparado (entraba en garantía) una línea verde vertical que aparecía en la pantalla (cambiaron la pantalla), ahora resulta que parece que falla el disco duro.
Me explico más. Al recuperar este portátil después de lo de la pantalla, tuve que reinstalar todo ya que por misteriosas razones no era capaz de entrar al sistema que anteriormente tenía. Es un Portátil clónico de los de PCBox. Instalé de nuevo Lenny, con backports, multimedia y repos de virtualbox. No hace ni dos semanas y el disco me empieza a fallar. De repente, en pleno funcionamiento, el sistema se queda frito y ya no responde nada nada. Cuando me paso a las tty, no me sale la sesión sino que me habla de error I/O con diferentes numeraciones. Después de que esto me ha ocurrido más de una vez, me ha empezado a aparecer un mensaje nada más arrancar el sistema (antes del menú del grub), diciéndome que "un fallo en el sistema es inminente, salve sus datos y reemplace el disco duro". Nombra a SMART. He buscado sobre esta aplicación, (funcionando en live, como ahora), y, tras haber hecho un chequeo del disco con gparted, los resultados del SMART son desoladores:
ubuntu@ubuntu:~$ sudo smartctl -l selftest -i -H /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
===
START OF INFORMATION SECTION ===
Device Model: SAMSUNG HM250JI
Serial Number: S0TVJD0Q232181
Firmware Version: HS100-08
User Capacity: 250,059,350,016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Fri Feb 5 09:07:26 2010 UTC
==> WARNING: May need -F samsung or -F samsung2 enabled; see manual for details.
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
Failed Attributes:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 001 001 010 Pre-fail Always FAILING_NOW 1026
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: handling damage?? 00% 2882 -
ubuntu@ubuntu:~$
Según esto, parece que al disco duro este le quedan dos telediarios. ¿Esto puede ser así de tajante? ¿Podría intentar su reparación de alguna forma? Ya he visto que con herramientas habituales no sirve, porque sigue dando el error. De todas formas, ¿no es una duración muy corta en la vida del disco duro? Lo llevaría al servicio técnico por la garantía; pero estos de pcbox no me dan ningún dato respecto al tiempo que va a tardar la reparación... y lo necesito sí o sí para un taller que doy el fin de semana del 19.
La verdad es que no creo que vuelva a comprarme un portátil en esta tienda; más bien iré a la tienda de la esquina, pequeña y más profesional, que pienso que pueden conseguirme hardware igualmente compatible y con mejor atención al cliente (tengo entendido que atienden bastante bien, de forma muy personalizada, reparando cuando es posible en el propio establecimiento). Aunque el precio se dispare un poco más.
¿Alguna recomendación al respecto? ¿Alguna nave todavía por quemar?
Saludos y gracias.
- Inicie sesión o regístrese para enviar comentarios
- 3154 lecturas


¿Puedes entrar en modo single user y ejecutar fsck?
¿Qué diferencia hay si lo hago desde el live? Es que cuando se intenta hacer fsck te dice algo como que "puedes dañarlo muy seriamente" por hacerlo con la partición montada; y en CD-live está desmontada si no la montas expresamente. Hombre, como parece que lo que falla es la partición /home, sí que puedo entrar, irme a las tty, desmontar esa partición y ejecutarlo. ¿Sirve también eso?
Si tengo que entrar en modo single user tengo que repasar cómo se hace...
¿Qué diferencia hay si lo hago desde el live? Es que cuando se intenta hacer fsck te dice algo como que "puedes dañarlo muy seriamente" por hacerlo con la partición montada; y en CD-live está desmontada si no la montas expresamente. Hombre, como parece que lo que falla es la partición /home, sí que puedo entrar, irme a las tty, desmontar esa partición y ejecutarlo. ¿Sirve también eso?
Si tengo que entrar en modo single user tengo que repasar cómo se hace...
No hay diferencia, es mas, creo que es mejor y todo hacerlo desde live.
Ya que lo haces, hazlo de todas las particiones.
Un saludo y suerte.
Si, lo puedes hacer desde live-cd, si es un problema del sistema de archvos podria arreglartelo.
1 - no pierdas tiempo intentando otras cosas que se te puede pasar el arroz y haz una copia ya
El disco duro se puede escribir y borrar un número limitado de veces y por lo visto esos peaso profesionales te han vendido un portatil con un disco viejo, muy trabajado ya antes, que podría estar llegando al final de su ciclo vital. Cuando llega a la última ya no hay garantía de que funcione, es mejor desecharlo o usarlo sólo para cosas que no importe que se pierdan.
lo primero es salvar los datos y lo segundo instalar los paquetes smartmontools o smart-notifier y examinar cuantos ciclos de vida le quedan a tu disco, el comando smartctl viene en el primer paquete indicado y debería serte útil. Es fácil que ya lo tengas instalado y que los avisos te hayan llegado via smartd.
# smartctl -a /dev/tu_disco_duro | less
Busca en concreto la línea que pone "Power_Cycle_Count", cuanto más alto sea el número peor. Explicar como calcular el número de veces que se puede borrar un disco es un dolor de cabeza, pero hay mucha información disponible en esdebian por ejemplo. De todos modos una cosa es que el disco pueda fallar en cualquier momento y otra es que vaya a hacerlo obligatoriamente.
[y después de toda ésta parrafada ni había visto que ya lo tienes instalado, típico XDDDD]
Bueno, pues por partes.
El equipo no ha conseguido arrancar desde el single-mode-user. Ha sacado muchos mensajes de error, pero no ha terminado de arrancar.
Ya tengo guardados los datos en un disco externo. La faena son las distros que tenía instaladas en virtualbox... habrá que volver a ponerlas.
Además de los mensajes que ya me dio el smartctl que he puesto en el primer post, ahora, poniéndolo como me decís me da el siguiente resultado:
ubuntu@ubuntu:~$ sudo smartctl -a /dev/sdasmartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
===
START OF INFORMATION SECTION ===Device Model: SAMSUNG HM250JI
Serial Number: S0TVJD0Q232181
Firmware Version: HS100-08
User Capacity: 250,059,350,016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Fri Feb 5 11:29:29 2010 UTC
==> WARNING: May need -F samsung or -F samsung2 enabled; see manual for details.
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
See vendor-specific Attribute list for failed Attributes.
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 32) The self-test routine was interrupted
by the host with a hard or soft reset.
Total time to complete Offline
data collection: ( 106) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 106) minutes.
SCT capabilities: (0x003f) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 554
3 Spin_Up_Time 0x0007 252 252 025 Pre-fail Always - 2687
4 Start_Stop_Count 0x0032 098 098 000 Old_age Always - 2507
5 Reallocated_Sector_Ct 0x0033 001 001 010 Pre-fail Always FAILING_NOW 1026
7 Seek_Error_Rate 0x000e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 095 095 000 Old_age Always - 2885
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1292
191 G-Sense_Error_Rate 0x0032 087 087 000 Old_age Always - 133528
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 82
194 Temperature_Celsius 0x0022 118 079 000 Old_age Always - 40 (Lifetime Min/Max 6/53)
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 7741
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 252 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always - 1002
201 Soft_Read_Error_Rate 0x0032 252 252 000 Old_age Always - 0
223 Load_Retry_Count 0x0032 094 094 000 Old_age Always - 6560
225 Load_Cycle_Count 0x0032 089 089 000 Old_age Always - 111721
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: handling damage?? 00% 2882 -
SMART Selective Self-Test Log Data Structure Revision Number (0) should be 1
SMART Selective self-test log data structure revision number 0
Warning: ATA Specification requires selective self-test log data structure revision number = 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Interrupted [00% left] (0-65535)
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
ubuntu@ubuntu:~$
El famoso "power Cycle Count", para no volverse loco buscando, dice "1292"
Saludos.
Lo primero es que me he equivocado y es Load_Cycle (En el mío no lo indica por alguna razón que tengo que investigar, así que asumí que era ese otro). Lo que indica Power Cycle es que el número de veces que has arrancado ese disco es razonablemente normal, luego no parece un caso de disco viejo que se hace pasar por nuevo al menos.
Pero a lo que vamos... ufff.. load_Cycle_Count es alto pero sobre todo Load_Cycle_Count/Power_on_Hours = 38 es anormalmente alto, lo ideal es que no pase de 15.
Deberías tirar de hdparm, ese disco no está bien configurado y gasta más del doble de ciclos por día de lo normal. Es decir que a ese paso durará menos de la mitad de años que un disco normal.
hdparm es un material sensible y hay que manejarlo con mucho cuidado, estudiate el manual antes de hacer nada
Bueno, pues aquí de nuevo.
Finalmente he ido donde los de pcbox, y parece que se quedan el disco y me dan una respuesta en un tiempo razonablemente corto. Así, ni tan mal; porque tengo el portátil mientras para funcionar vía Live-CD, como ahora.
Sobre lo de funcionar con hdparm... varias cosas:
¿No tendría que ser, en este caso que lo reconoce como /dev/sda, sdparm en lugar de hdparm? Porque veo que también existe.
¿No tendría que conocer bien, no sólo las especificaciones del comando, sino también los detalles técnicos del disco? Y es que yo, de hardware no tengo ni idea...
¿Es lo habitual que, para evitar que un disco se machaque antes de la cuenta, hay que hacer una configuración especial con herramientas de este tipo? Porque yo este tema siempre lo he dejado como viene por defecto...
Los detalles del disco los tienes encima en tu penúltimo post.
Es posible que sea mejor sdparm, sí, aunque nunca lo he usado. hdparm es más antiguo y en principio trabaja con varios tipos de discos tanto IDE como ATA, SATA, etc siempre que pueda hacer emulación. No soy experto en hardware raro o muy nuevo, conozco lo que yo uso como mucho, así que ese punto deberás mirarlo por tu cuenta con calma, o preguntar a alguien que te pueda informar mejor.
En cualquier caso hdparm -i /tu/dispositivo debería decirte claramente si te identifica el disco o no.
Otra prueba de fuego es pasar badblocks,, ya sea en modo solo lectura o en escritura,,, y descartas problemas a nivel de disco, nada que ver con el fsck que cheque el estado del sistema de ficheros....
Y ante la duda,,, esto ya falla de por si, esta en garantia y que se jodan y lo cambien,,, y sino mejor aun que te don otro portatil de otro fabricante o por un poco mas te compras uno de marca,,, pero vamos tambien joden,,, parace que hay que tener suerte con las compras,, por mucho que leamos, por mucha marca,, al final nos la meten doblá