Actividad IV

La información y los datos suelen ser el mayor activo de una compañía, máxime a día de hoy en pleno auge de la data. Por ello, la normalización de datos es clave en la gestión de los sistemas de información de una organización, tanto en grandes como pequeñas empresas.

En qué consiste la normalización de una base de datos

Se trata de un proceso de organización de las bases de datos en el que se aplica una serie de reglas para tener una estructura de datos saneada. En otras palabras, el objetivo es eliminar duplicidades o dependencias innecesarias en las tablas de datos y entre las relaciones que estas unen - o bien aportarlas, si la necesidad es la contraria-.

Por ejemplo, la normalización de los datos fiscales en curso de una empresa permitiría eliminar de ese registro otros indicadores temporales, relativos a su histórico, o que dependan de terceras tablas.

La correcta asignación del valor de los datos es tan importante porque será la única manera de garantizar que se eliminan redundancias y que, por ende, los cambios en la data se implementen y cruzan correctamente.

Ventajas de la normalización de datos

El enriquecimiento de una base de datos supone una serie de ventajas incuestionables para la empresa. En primer lugar, al evitar duplicidades se simplifica notablemente la gestión y actualización de datos en los registros. Esto también se traduce, en términos generales, a una mejora en la productividad del equipo, además de una mejor gestión de la base de datos.

También facilita la integración de datos con fuentes externas y, en última instancia, refuerza la veracidad y la seguridad de la información con la que se trabaja.

Aunque existen muchos niveles de normalización, son solo tres los más habituales en las empresas. Nos referiremos a ellos como "Formas Normales" y cada una aplica unas reglas o criterios que determinan el nivel de vulnerabilidad de los datos a posibles inconsistencias o anomalías. A mayor nivel de forma normal, mayor normalización.

Primera forma normal

Para que nuestros datos estén en primera forma normal es necesario, en primer lugar, contar con tablas separadas para cada conjunto de datos relacionados. A continuación se debe asignar una clave primaria a cada grupo de datos, que no contenga atributos nulos.

Otras claves importantes son no incluir datos de significado similar en la misma tabla, que los atributos sean mínimos e indivisibles y que las columnas y filas sean independientes, para que un cambio de orden no influya en su significado.

Segunda forma normal

A los requisitos de la primera forma normal se suma la gestión de múltiples registros. Es decir, si un dato aplica a diferentes localizaciones, debemos crear tablas separadas y relacionarlas a través de una clave ajena o externa. Por ejemplo, para hacer seguimiento del desarrollo de una app, diferenciamos los datos de la aplicación de los de las distintas fases de implementación. Así, los datos se relacionan mediante la clave ajena.

Tercera forma normal

Para alcanzar este nivel, los datos del mismo registro deben estar estructurados de modo que todos los campos dependan de la clave primaria. Este nivel es conveniente en tablas de datos que requieren de continua actualización. Así evitamos desglosar la información en diferentes tablas.

Normalizar y enriquecer la base de datos de tu empresa permite estructurar y gestionar correctamente toda la información y el llamado "dato único", ese que supone el máximo valor de la organización y que condiciona incluso la toma de decisiones directivas.

FN de Boyce-Codd

Es una FN ligeramente más estricta que la 3FN. En concreto requiere esté en 3FN y que que no existan dependencias funcionales no triviales de los atributos que no sean un conjunto de la clave candidata. O dicho de otra forma: una tabla está en FNBC si está en 3FN y los únicos determinantes (atributo que depende de otro atributo) son claves candidatas.

Es muy difícil que una tabla que está en 3FN no esté en FNBC, pero podemos «lograrlo» eligiendo mal las claves de nuestras tablas. Por ejemplo, si tenemos una tabla con idTrabajador, idDepartamento, idResponsable, donde el idResponsable es la persona responsable del trabajador. La clave sería, si cada trabajador puede trabajar en varios departamentos y tener distintos responsables (idTrabajador, idDepartamento, idResponsable). Pero si resulta que cada responsable lo es de un único departamento, entonces idResponsable dependería de idDepartamento, lo que convierte a idResponsable en «determinante» (atributo que depende de otro atributo), pero no es clave candidata.

Este problema se solucionaría creando otra tabla (idDepartamento, idResponsable) y eliminando idResponsable de la entidad anterior.

2.2.4 Cuarta forma normal 4FN

La cuarta forma normal (4FN) tiene por objetivo eliminar las dependencias multivaluadas.

Una relación está en 4NF si y sólo si en cada dependencia multivaluada X ->-> Y no trivial, X es clave candidata

Una dependencia multivaluada A ->-> B es trivial cuando B es parte de A. Esto sucede cuando A es un conjunto de atributos, y B es un subconjunto de A.

Tomemos por ejemplo la tabla de Agenda que se analizo en el recurso 2.1, pero dejando sólo los atributos multivaluados:

Agenda (nombre, teléfono, correo)

Lo primero que debemos hacer es buscar las claves y las dependencias. No olvidemos que las claves candidatas deben identificar de forma unívoca cada tupla. De modo que estamos obligados a usar los tres atributos para formar la clave candidata.
Pero las dependencias que tenemos son:

nombre ->-> teléfono
nombre ->-> correo

Y nombre no es clave candidata de esta relación.

Resumiendo, debemos separar esta relación en varias (tantas como atributos multivaluados tenga).

Teléfonos(nombre, teléfono)
Correos(nombre, correo)

Ahora en las dos relaciones se cumple la 4FN.

2.2.5 Quinta forma normal 5FN

Sirve para eliminar dependencias de proyección o reunión.

Una relación se encuentra en quinta forma normal (5FN), o forma normal de Proyección-Unión, si se encuentra en 4FN y las únicas dependencias que existen son las denominadas dependencias de Join de una tabla con sus proyecciones, relacionándose entre sí mediante la clave primaria, o cualquier clave alternativa.

Se dice que hay dependencia de Join entre una tabla y sus proyecciones, si es posible obtener la tabla original por medio de la unión de dichas proyecciones.

Una relación se encuentra en 5FN o forma normal de Proyección-Unión, si se encuentra en 4FN y las únicas dependencias que existen son las denominadas dependencias de Join de una tabla con sus proyecciones, relacionándose entre sí mediante la clave primaria, o cualquier clave alternativa.
Se dice que hay dependencia de Join entre una tabla y sus proyecciones, si es posible obtener la tabla original por medio de la unión de dichas proyecciones.

La 5FN se emplea cuando existe mucha información redundante en una tabla, o cuando se hace inmanejable, debido a la existencia de muchos atributos.

Ejemplo

Persona (rut, datPers1, datPers2, datPers3, datPrev1, datPrev2, datLab1 , datLab2 , datLab3 , datLab4)

DatPersPer (rut, datPers1 , datPers2 , datPers3)
DatPrevPer (rut, datPrev1, datPrev2)
DatLabPer (rut, datLab1 , datLab2 , datLab3 , datLab4)

ACTIVIDAD REALIZADA:

CLIC PARA IR AL ARCHIVO

webnode DB
Todos los derechos reservados 2021
Creado con Webnode
¡Crea tu página web gratis! Esta página web fue creada con Webnode. Crea tu propia web gratis hoy mismo! Comenzar