CLASIFICACIÓN Y FALLAS EN EL SISTEMA DISTRIBUIDO.
Fallas
en procesos: Los resultados que
son obtenidos de los procesos son incorrectos y causa que el estado
(funcionamiento) se desvíe de las especificaciones establecidas.
Por ejemplo:
- DeadLocks.
- Timeout's.
- Protection Violation.
- Entradas inválidas.
- Inconsistencias.
Falla del sistema: Ocurre cuando el procesador
o elementos básicos del sistema fallan al ejecutar una operación (cpu, memoria,
fuente de poder, etc.). El sistema es detenido para que sea necesario reiniciarla a un estado correcto.
Las fallas del sistema se
clasifican en seis tipos:
Falla
de amnesia: Cuando sé inicializa el sistema y no se conoce él estado que
se tenía antes de la falla.
Falla
de amnesia parcial: Cuando sé reinicializa el sistema y sé conoce parte del
estado que se presentaba antes de ocurrir la falla. También se predefine un
estado inicial para fallas.
Falla
de pausa: Ocurre cuando el sistema sé reinicializa al mismo estado que
se encontraba antes de la falla.
Falla de aborto (Halting):
Cuando un sistema nunca sé reinicializa.
Fallas en medios secundarios de
almacenamiento: Ocurre cuando él medio de almacenamiento no puede
ser accesado. Esta falla es causada generalmente por errores en paridad, daño
en cabezas lectoras, partículas de polvo o daño en sectores del medio.
Comúnmente sé utilizan medios alternos que permiten reducir las condiciones de
riesgo como: espejo de discos, arreglo de discos, etc.
Fallas del medio de
comunicación: Ocurre cuando un sitio no puede comunicarse o establecer
comunicación con otro sitio dentro de un ambiente de red. Es causado comúnmente
por fallas en el switcheo de los nodos o las ligas de comunicación entre los
dispositivos que se están usando. Puede ocurrir en media falla o una falla
completa en las comunicaciones del sistema.
Diversos elementos de
un sistema distribuido pueden fallar; procesadores, red, dispositivos,
software, etc.
• Tipos de fallos:
Transitorios:
Falla
una vez y luego funciona correctamente.
Intermitentes: El
fallo aparece de forma intermitente.
Permanentes: Una
vez falla el elemento, ya no se recupera.
De
acuerdo al funcionamiento del componente con fallo:
Fallo de parada: el componente
que falla se para y no interfiere en el resto del sistema.
Fallos por omisión: fallo que
causa que un componente no responda a parte de su cometido. Por ejemplo, un
canal de comunicación puede presentar fallos por omisión de envío y recepción.
Fallos de temporización (rendimiento): no se cumple el rendimiento esperado, el componente responde
demasiado tarde.
Fallos de respuesta: El elemento
responde incorrectamente a las peticiones.
Fallos bizantinos (arbitrario): comportamiento arbitrario y malicioso. El elemento falla de
forma descontrolada.
Ejemplos de fallos
procesador
|
Red de comunicación
|
En el reloj
|
Dispositivo de almacenamiento.
|
Fallo parada
|
Tiene todos los tipos de fallos.
|
Fallo de respuesta: se adelanta o atrasa.
|
Fallo parada: no se puede leer ni escribir.
|
Fallos bizantinos
|
|
|
Fallos por omisión: los datos son inaccesibles.
|