Definition

Código de borrado (EC)

El código de borrado (Erasure Coding o EC) es un método de protección de datos en la cual los datos se dividen en fragmentos, se expanden y se codifican con piezas de datos redundantes, y se almacenan en un conjunto de diferentes lugares, tales como discos, nodos de almacenamiento o ubicaciones geográficas.

El contenido continua más abajo

El objetivo del código de borrado es permitir que los datos que se han dañado en algún momento en el proceso de almacenamiento en disco sean reconstruidos mediante el uso de información sobre los datos que está almacenada en otro lugar de la matriz.

El código de borrado crea una función matemática para describir un conjunto de números, de modo que puedan ser comprobados por su exactitud y recuperados si uno está perdido. La denominada interpolación polinómica o sobremuestreo es el concepto clave detrás de los códigos de borrado. En términos matemáticos, la protección ofrecida por el código de borrado se puede representar en forma sencilla mediante la siguiente ecuación: n = k + m. La variable "k" es la cantidad original de datos o símbolos. La variable "m" corresponde a los símbolos adicionales o redundantes que se añaden para proporcionar protección contra fallas. La variable "n" es el número total de símbolos creados después del proceso de codificación de borrado.

Por ejemplo, en una configuración de 10 a 16, o EC 10/16, seis símbolos adicionales (m) serían añadidos a los 10 símbolos de base (k). Los 16 fragmentos de datos (n) serían extendidos a través de 16 unidades, nodos o ubicaciones geográficas. El archivo original puede ser reconstruido a partir de 10 fragmentos verificados.

Los códigos de borrado, también conocidos como códigos de corrección de errores en recepción (FEC), fueron desarrollados hace más de 50 años. Diferentes tipos han surgido desde entonces. En uno de los tipos más antiguos y más comunes, Reed-Solomon, los datos se pueden reconstruir utilizando cualquier combinación de símbolos "k", o piezas de datos, incluso si los símbolos "m" se pierden o no están disponibles. Por ejemplo, en EC 10/16, seis unidades, nodos o puntos geográficos podrían perderse o no estar disponibles, y el archivo original todavía sería recuperable.

El código de borradopuede ser útil con grandes cantidades de datos y cualquier aplicación o sistema que necesita tolerar fallas, como los sistemas de arreglos de discos, redes de datos, aplicaciones de almacenamiento distribuido, almacenes de objetos y almacenamiento de archivos. Un caso de uso común actual para la codificación de borrado es almacenamiento en la nube basada en objetos.

Este contenido se actualizó por última vez en agosto 2014

Investigue más sobre Almacenamiento y gestión de datos

Close