Introducción al diseño del almacén de datos

Un almacén en términos comunes significa, almacenar algo en un lugar y casos similares en industrias para almacenar la cantidad compleja de datos en una ubicación. Business Intelligence (BI) le permite consultar datos de las fuentes de datos y solo se puede confiar cuando hay un buen diseño del almacén de datos.

El almacén de datos integra múltiples fuentes de datos y será un buen soporte para análisis e informes analíticos. Si tiene un diseño de almacenamiento de datos deficiente, afectará el crecimiento de su organización al tener datos de consulta inexactos.

Tome un ejemplo de popularidad de la tienda web de Amazon ordenando el artículo y puede ser entregado en nuestra puerta. Cuando el cliente inicia sesión en el sitio de comercio electrónico y busca el producto disponible en la tienda. Luego seleccionamos y pedimos el artículo, tan pronto como el proveedor lo acepta y lo despacha de inmediato. Aquí podemos ahorrar nuestro tiempo para comprar el artículo requerido.

Un caso similar a este almacén de datos también, los datos se pueden almacenar y obtener del sistema de transacciones. El almacén de datos como un concepto de dos grandes

  • OLAP - Procesamiento analítico en línea
  • OLTP - Procesamiento transaccional en línea

Ambos son sistemas de procesamiento en línea, pero tienen algunas diferencias. OLTP administra la aplicación transaccional como ATM, OLAP utiliza para el procesamiento analítico como informes, pronósticos, etc.,

Recopilación de requisitos

  • La recopilación de requisitos es una fase en el diseño del almacén de datos. Necesita determinar los criterios e implementarlos con éxito. Se utilizarán dos estrategias para el diseño del almacén de datos, una se llama negocio y otra se llama técnica.
  • La estrategia comercial se centra en la visión comercial a largo plazo y ayuda a aumentar las ganancias para el crecimiento. El requisito de estrategia técnica se basa en informes de usuario, análisis, selección de hardware, método de desarrollo, técnica de prueba, entorno de implementación y capacitación del usuario.
  • Cuando determinamos la estrategia comercial y técnica, también necesitamos diseñar el plan BCP (Recuperación de Desastres). Cuando ocurre un desastre por personas o personas, debemos tener un plan para recuperar los datos rápidamente y garantizar que no se pierdan datos. Desarrollar el plan de recuperación ante desastres es uno de los desafíos y crea confianza para la organización.

Configuración del entorno

  • Una vez que reunimos los datos para el diseño del almacén de datos, necesitamos hacer una configuración adecuada del entorno para el desarrollo, las pruebas y la producción. Preferiblemente, debe haber un sistema separado para la aplicación, la base de datos y también separado para informes / ETL.
  • Cuando construimos un entorno separado para cada uno, aseguramos que todos los cambios se puedan desarrollar / probar y luego pasar a la producción.
  • Si tenemos un único entorno diseñado para todas estas actividades, podría terminar con problemas y pérdida de datos. Por ejemplo, cuando ocurre un incidente en el sistema, no pudimos navegar y encontrar la forma de solucionarlo, lo que lo hace más complejo.

Modelado de datos

  • Una vez que se establece la recopilación de requisitos y el entorno, lo siguiente es diseñar cómo conectar la fuente de datos, procesar y almacenar en el almacén de datos. Esta técnica se llama modelado de datos. Puede ser un análisis del objeto y la relación entre los demás.
  • Cuando se diseñó el almacén de datos, los ingenieros diseñaron cómo y dónde deben almacenarse los datos. En la misma ocasión, también debemos definir la forma posible de recuperar los datos del almacén de datos. Una vez identificada la fuente, el equipo puede construir la lógica y crear una vista de esquema de estructura.

Tipos de modelo de datos

Hay tres tipos

  • Conceptual
  • Lógico
  • Físico

Los tres tipos de modelo de datos se mencionan a continuación:

1. Conceptual: dice QUÉ contiene el sistema y está diseñado por arquitectos comerciales para definir el alcance de la estrategia comercial.

2. Lógico: Esto define CÓMO se puede crear el lógico en DBMS, será diseñado por Business Analyst y Data Architect para crear un conjunto de reglas para almacenar / recuperar los datos

3. Físico: define cómo se puede implementar el sistema.

Uso del diseño de Data Warehouse

Ser un buen diseño de almacén de datos puede llevar mucho tiempo al recuperar los datos. Cada paso tiene que seguir con eficacia para que el sistema sea bueno. Ayudará a la organización a manejar los tipos complejos de datos y mejorar la productividad en función del análisis de tendencias. Por lo tanto, cada paso en el diseño de la arquitectura DWH es importante y más consciente en el método de selección. La organización entra en cada flujo posteriormente y conduce a la implementación exitosa del almacén de datos.

Hay pocos usos importantes de aplicaciones de Data Warehouse

1. Industria bancaria: la mayoría de los bancos están utilizando el almacén de datos para almacenar una gran cantidad de datos de transacciones y la capacidad de recuperar los datos de la consulta mucho más rápido. Se puede administrar como datos de clientes, tendencias del mercado, informes, análisis, etc.

2. Industria financiera: es similar a la banca, pero el único objetivo es mejorar los cambios financieros mediante el análisis de los datos del cliente.

3. Gobierno: en la actualidad, el Gobierno gestiona muchos datos en línea y almacena en la base de datos relacional. Cada dato tiene una relación entre sí como Aadhaar, PAN está vinculado a muchas fuentes.

4. Asistencia sanitaria: los gerentes de asistencia sanitaria y los servicios de tanta información. Mantiene los detalles clínicos, los registros de los clientes y los ayuda a predecir los resultados, analizar los comentarios y generar los informes.

5. Seguro: compañía de seguros utilizada principalmente para patrones de datos, tendencias de clientes y mantenimiento de registros.

6. Industria de fabricación y distribución: se utiliza más ampliamente en todas las industrias para almacenar información de artículos y les ayuda a predecir el artículo de demanda para fabricación y ventas. Analizando el artículo vendido que ofrece mejores técnicas de toma de decisiones.

7. Servicios de minoristas: Los minoristas son el intermediario entre el productor y el cliente. El almacén de datos los ayuda para promociones y tendencias de compra de artículos.

8. Industria telefónica: las industrias telefónicas gestionan una gran cantidad de datos históricos que ayudan a que los datos de los clientes sean tendencia y objetivo para impulsar campañas publicitarias.

Ventajas de Data Warehouse

  • Ofrece inteligencia empresarial mejorada
  • Garantiza la calidad y la coherencia de los datos.
  • Ahorra tiempo y dinero
  • Rastrea datos históricamente inteligentes
  • Genera alto ROI

Desventaja de Data Warehouse

  • Informe extra de trabajo
  • Inflexibilidad y homogeneización de datos.
  • Preocupaciones de propiedad
  • Demandas de grandes cantidades de recursos.
  • Los problemas ocultos consumen tiempo

Artículos recomendados

Esta es una guía para el diseño del almacén de datos. Aquí discutimos la técnica de diseño del almacén de datos, recopilación de requisitos, configuración del entorno, usos, ventaja / desventaja. También puede consultar el siguiente artículo para obtener más información:

  1. Beneficios de Data Warehouse
  2. Implementación del almacén de datos
  3. Modelado de almacén de datos
  4. Herramientas de Data Warehouse
  5. Top 4 diferentes tipos de modelos de datos

Categoría: