Introducción a la tabla de dimensiones
Una tabla de dimensiones está presente en el esquema de estrella o copo de nieve. Las tablas de dimensiones ayudan a describir dimensiones, es decir, valores de dimensión, atributos y claves. Generalmente es de tamaño pequeño. El tamaño puede variar de varias a miles de filas. Describe los objetos presentes en la tabla de hechos. La tabla de dimensiones se refiere a la recopilación o grupo de información relacionada con cualquier evento medible. Forman un núcleo para el modelado dimensional. Contiene una columna que se puede considerar como una columna de clave principal que ayuda a identificar de forma única cada fila o registro de dimensión. Se está uniendo a las tablas de hechos a través de esta clave. Cuando se crea una clave llamada clave sustituta generada por el sistema, se utiliza para identificar de forma exclusiva las filas en la dimensión.
¿Por qué necesitamos usar?
- Su ayuda para almacenar el historial de la información o información dimensional.
- Es fácil de entender que las tablas normalizadas.
- Se pueden agregar más columnas a la tabla sin afectar las aplicaciones existentes que las usan.
Tipos de tabla de dimensiones
Los siguientes son los diferentes tipos de tabla de dimensiones:
1. SCD (Dimensiones que cambian lentamente)
Los atributos de dimensión que tienden a cambiar lentamente con el tiempo en lugar de cambiar en un intervalo de tiempo regular se denominan dimensiones que cambian lentamente. Por ejemplo, cambios de dirección y número de teléfono, pero no regularmente. Veamos un ejemplo de un hombre que viaja a diferentes países, por lo que necesita cambiar su dirección de acuerdo con ese país. Esto se puede hacer de tres maneras:
Tipo1: sobrescribe el valor anterior. Este método es fácil de aplicar y ayuda a ahorrar espacio, por lo tanto, reduce los costos. Pero, la historia se pierde en este escenario.
La mesa antes del cambio
CARNÉ DE IDENTIDAD | NOMBRE | PAÍS | NACIONALIDAD |
1001 | Rachel | India | indio |
Mesa después del cambio
CARNÉ DE IDENTIDAD | NOMBRE | PAÍS | NACIONALIDAD |
1001 | Rachel | China | indio |
Tipo2: agregue una nueva fila con el nuevo valor. En este método, el historial se guarda y se puede usar cuando sea necesario. Pero se necesita un gran espacio, por lo tanto, aumenta el costo.
La mesa antes del cambio
CARNÉ DE IDENTIDAD | NOMBRE | PAÍS | NACIONALIDAD |
1001 | Rachel | India | indio |
Mesa después del cambio
CARNÉ DE IDENTIDAD | NOMBRE | PAÍS | NACIONALIDAD |
1001 | Rachel | India | indio |
1001 | Rachel | China | indio |
Tipo3: agregue una nueva columna. Es el mejor enfoque ya que la historia se puede mantener fácilmente.
La mesa antes del cambio
CARNÉ DE IDENTIDAD | NOMBRE | PAÍS | NACIONALIDAD |
1001 | Rachel | India | indio |
Tabla después del cambio
CARNÉ DE IDENTIDAD | NOMBRE | PAÍS | VIEJO PAIS | NACIONALIDAD |
1001 | Rachel | China | India | indio |
2. Dimensión conformada
Esta dimensión se comparte entre múltiples áreas temáticas o data marts. Lo mismo se puede usar en diferentes proyectos sin ninguna modificación realizada en el mismo. Esto se usa para mantener la consistencia. Las dimensiones conformadas son aquellas que son exactamente iguales o un subconjunto apropiado de cualquier otra dimensión.
3. Dimensión basura
Una dimensión basura es un grupo de atributos de baja cardinalidad. Contiene atributos diferentes o diversos que no están relacionados con ningún otro atributo. Estos pueden usarse para implementar RCD (dimensión que cambia rápidamente) como banderas, pesas, etc.
4. Dimensión degenerada
Atributos que se almacenan en la tabla de hechos en sí y no como una tabla de dimensiones separada, esos atributos se llaman dimensión degenerada. Por ejemplo, número de boleto, número de factura, número de transacción, etc.
5. Dimensión del juego de roles
Tener múltiples relaciones con la tabla de hechos se llama dimensión de juego de roles. En otras palabras, es cuando la misma clave de dimensión con todos sus atributos relacionados se une a muchas claves foráneas presentes en la tabla de hechos. Puede cumplir múltiples propósitos dentro de la misma base de datos existente.
¿Cómo funciona en el Data Warehouse?
- La dimensión se refiere a la recopilación o grupo de información relacionada con cualquier evento medible. Forman un núcleo para el modelado dimensional. Cuando se crea una dimensión, se genera una estructura de un proyecto. Creado se puede utilizar en diferentes proyectos y refleja la idea de reutilización. Cuando se realiza un cambio en cualquiera de ellos, su efecto se refleja solo en esa tabla en particular. Cuando se va a crear un informe, el usuario puede tomar los datos ya que las tablas de dimensiones contienen toda la información necesaria.
- Al realizar el modelado de dimensiones, los datos atómicos se cargan en estructuras dimensionales. Luego, los modelos dimensionales se generan o construyen alrededor de los procesos de negocio. Al crearlo, debe tenerse en cuenta para filtrar los valores de dominio y almacenar las etiquetas de los informes en estas tablas. Debe garantizarse que la clave sustituta (clave generada por el sistema utilizada durante la creación de la tabla de dimensiones que ayuda a identificar de forma única cada registro presente en la tabla de dimensiones) debe utilizarse mientras se crea la tabla de dimensiones. Se debe desnormalizar porque su tarea es permitir que el usuario lea y analice los datos fácilmente y de manera eficiente, en lugar de administrar las transacciones. El objetivo principal de la dimensión es proporcionar el filtrado, realizar la agrupación y el etiquetado eficiente.
Ventajas
A continuación se presentan las diferentes ventajas de la tabla de dimensiones:
- Tiene una estructura simple.
- Es fácil de analizar y comprender.
- Datos desnormalizados.
- Ayuda a mantener información histórica para cualquier dimensión.
- Fácil de recuperar datos de él.
- Rápido para crear e implementar.
- Da el contexto que rodea a cualquier proceso de negocio.
Conclusión: tabla de dimensiones
Esta es una parte integral del modelado de datos. Se utiliza en el esquema de estrella o copo de nieve. Contiene las dimensiones, claves y valores de los atributos de la tabla de hechos. Existen diferentes tipos de los cuales se utilizan en diferentes escenarios.
Artículos recomendados
Esta es una guía de la tabla de dimensiones. Aquí hemos discutido Tipos, Cómo funciona la Tabla de dimensiones en el almacén de datos con Ventajas. También puede consultar nuestros otros artículos relacionados para obtener más información.
- Tabla de hechos versus tabla de dimensiones
- ¿Qué es la tabla de hechos?
- ¿Qué es el cuadro?
- Mezcla de datos en Tableau