Diferencia entre Star Schem a vs Snowflake Schema

En este artículo, discutiremos en detalle las diferencias entre el esquema de estrella y el esquema de copo de nieve. El esquema es la forma de describir lógicamente todas las bases de datos o almacenes de datos utilizando bases de datos relacionales. La descripción puede incluir el nombre y los detalles de los registros de cualquier tipo con todos los agregados y elementos de datos. Los almacenes de datos utilizan el esquema Star, Snowflake, Fact Constellation y Galaxy.

Esquema de estrella

Es el esquema de almacén de datos más simple. Como su nombre lo indica, su estructura es como una estrella. En este esquema, la tabla de hechos está presente en el centro y el número de tablas de dimensiones está asociada a ella a través de una clave externa y la tabla de dimensiones contiene el conjunto de atributos. En este esquema, cada dimensión se representa con una sola tabla de dimensiones, pero las tablas de dimensiones no están unidas entre sí. Sus ventajas incluyen la reducción, la fácil comprensión de los datos, el uso óptimo del disco y el aumento del rendimiento. Veamos un ejemplo para una mejor comprensión.

Ejemplo:

Considere una empresa de fabricación de refrigeradores y necesitamos crear un esquema para las ventas de esta empresa de fabricación de refrigeradores. Las ventas tendrán las siguientes dimensiones:

  • Articulo
  • Ubicación
  • Rama
  • Hora

El esquema tiene una tabla de hechos en el centro de ventas que contendría claves para asociar con cada dimensión, con dos medidas, es decir, unidades vendidas y dólares vendidos.

Esquema de copo de nieve

El esquema del copo de nieve es la extensión del esquema estelar. Le agrega dimensiones adicionales. Como su nombre lo indica, parece un copo de nieve. En este esquema, las tablas de dimensiones están normalizadas, es decir, los datos se dividen en tablas adicionales. Dividir la mesa reduce la redundancia y el desperdicio de memoria. Tiene la forma jerárquica de tablas dimensionales. Las tablas de dimensión y subdimensión están asociadas con las claves primarias y externas en la tabla de hechos. Es más fácil de implementar y usa menos espacio en disco. Como tiene varias tablas, el rendimiento de la consulta se reduce. Se requiere más mantenimiento porque hay más tablas de búsqueda. Veamos un ejemplo para una mejor comprensión.

Ejemplo:

Considerando el mismo ejemplo que el anterior de la compañía de fabricación de refrigeradores, en el esquema del copo de nieve, la tabla de hechos es la misma que en el esquema en estrella, pero la principal diferencia está en la definición o el diseño de las tablas de dimensiones.

En este esquema, la tabla de dimensión única del artículo se ha normalizado y se ha dividido y se ha creado una nueva tabla de proveedores que incluye información sobre el tipo de proveedor. De manera similar, la tabla de dimensiones de ubicación se normaliza y los datos se dividen en una nueva tabla de ciudades que contiene detalles de la ciudad en particular.

Comparación cara a cara entre Star Schema y Snowflake Schema (Infografía)

A continuación se presentan las principales 9 diferencias entre Star Schema y Snowflake Schema.

Diferencias clave entre el esquema de estrella y el esquema de copo de nieve

Veamos algunas diferencias importantes entre Star Schema y Snowflake Schema.

Esquema de estrella:

  • Las jerarquías de dimensión en el esquema en estrella se almacenan en la tabla de dimensiones.
  • Contiene una tabla de hechos central rodeada por una tabla de dimensiones.
  • En esto, una combinación única asociaba la tabla de hechos con una tabla de dimensiones.
  • Tiene un diseño simple.
  • La estructura de datos está desnormalizada.
  • La consulta se ejecuta a un ritmo más rápido.
  • En este cubo, el procesamiento es más rápido.
  • Tiene más datos redundantes.
  • Utiliza consultas simples.
  • El esquema de estrella es fácil de entender.
  • En un esquema de estrella, se consume más espacio.

Esquema de copo de nieve:

  • Las jerarquías en un esquema de copo de nieve se almacenan en tablas separadas.
  • También contiene una tabla de hechos rodeada por una tabla de dimensiones y estas tablas de dimensiones están rodeadas por una tabla de dimensiones.
  • En este esquema, se necesitan muchas combinaciones para obtener los datos.
  • Tiene un diseño complejo.
  • La estructura de datos se normaliza en el esquema del copo de nieve.
  • La consulta se ejecuta comparativamente más lenta que el esquema en estrella.
  • En el esquema del copo de nieve, el procesamiento del cubo es más lento.
  • Contiene datos menos redundantes.
  • Utiliza consultas complejas.
  • El esquema del copo de nieve es comparativamente difícil de entender ese esquema estelar.
  • En el esquema del copo de nieve, se consume menos espacio.

Tabla de comparación de esquema de estrella vs esquema de copo de nieve

Discutamos las comparaciones entre Star Schema y Snowflake Schema.

Característica

Esquema de estrella

Esquema de copo de nieve

Mantenimiento / CambioTiene más datos redundantes y, por lo tanto, es más difícil de cambiar o mantener.Este esquema es más fácil de cambiar y mantener debido a la menor redundancia
ComprensibilidadLa complejidad de la consulta es menor y, por lo tanto, es fácil de entender.Las consultas aplicadas son más complejas y, por lo tanto, difíciles de entender.
Tiempo de ejecución de consultasTiene menos claves foráneas y, por lo tanto, la ejecución de la consulta es más rápida y requiere menos tiempo.Debido a más claves externas, el tiempo de ejecución de la consulta es mayor o la consulta se ejecuta lentamente
Tipo de almacén de datosMejor para datamarts que tienen una relación única, es decir, uno a uno o uno a muchosMejor para relaciones complejas, es decir, muchas relaciones.
Cantidad de unionesTiene más número de unionesTiene menos número de uniones.
Tabla de dimensionesTiene solo una tabla de dimensiones para cada dimensiónTiene una o más tablas de dimensiones para una sola dimensión
UsabilidadSi el tamaño de la tabla de dimensiones es menor, es decir, menor número de filas, se prefiere el esquema en estrellaBueno para usar cuando el tamaño de la tabla de dimensiones es mayor
Normalización y desnormalizaciónTanto la tabla de hechos como las tablas de dimensiones están desnormalizadas.Una tabla de hechos se desnormaliza mientras que la tabla de dimensiones se normaliza
Modelo de datosSigue un enfoque de arriba hacia abajoSigue un enfoque ascendente

Conclusión

En este artículo, discutimos en detalle el Esquema de estrellas vs Esquema de copo de nieve. Estos esquemas se utilizan para representar el almacén de datos. Son similares en algunos aspectos y diferentes en otros. Snowflake es la extensión del esquema estelar. Cuando los datos son más, se prefiere el copo de nieve, ya que reduce la redundancia, pero la estrella es comparativamente más popular que el esquema de copo de nieve.

Artículos recomendados

Esta es una guía de Star Schema vs Snowflake Schema. Aquí también discutimos las diferencias clave entre el esquema de estrella y el esquema de copo de nieve con la infografía y la tabla de comparación. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Codificación vs decodificación: principales diferencias
  2. Diferencia entre datos pequeños y datos grandes
  3. Pruebas funcionales versus pruebas no funcionales
  4. Prueba de humo vs Prueba de cordura
  5. ¿Qué son las pruebas de cordura y cómo funcionan?