Introducción a la tabla de caída de colmena

La palabra clave "DROP" se refiere a la eliminación. Para la eliminación de datos, requerimos que los datos estén presentes en la colmena.

En Hadoop, tenemos dos funcionalidades:

  1. Almacenamiento de datos
  2. Procesamiento de datos

Para el almacenamiento de datos, HDFS (Hadoop Distributed File System) entra en escena. Ahora, cuando decimos que tenemos datos en la tabla de la colmena, significa dos cosas:

  1. Los datos están en HDFS
  2. Tenemos una tabla de colmena creada sobre ese archivo HDFS y cargamos los datos de ese archivo HDFS en la tabla de colmena.

Básicamente, para que la tabla desplegable de colmena tenga los datos, el archivo de datos es un requisito previo. En este artículo, vamos a ver cómo colocar tablas en la colmena, qué sucede cuando se cae la tabla y todo lo relacionado con la tabla desplegable en la colmena.

Tipos de tabla de caída en la colmena

En la colmena, hay dos tipos de tablas:

  1. Tabla interna o tabla administrada
  2. Tabla externa o tabla no administrada

Tabla administrada / tabla interna:

  1. En Hive, " user / hive / warehouse " es el directorio predeterminado. Las tablas internas se almacenan en este directorio de forma predeterminada. No tenemos que proporcionar la ubicación manualmente al crear la tabla.
  2. El comando "Eliminar tabla" elimina los datos de forma permanente.
  3. Hive administra toda la seguridad de las tablas administradas.

Ya tengo una tabla presente en el directorio "usuario / colmena / almacén" llamada "códigos".

Para verificar si la tabla existente está administrada o no, podríamos usar el siguiente comando:

Sintaxis del comando:

Describa nombre_tabla con formato;

Salida:

Veamos, los datos presentados en la tabla "códigos".

Primero, usando el comando hive-

En segundo lugar, usando Hue (Hadoop User Experience a Web UI)

Comando Eliminar: soltar tabla nombre_tabla;

Salida:

Ahora, si quiero seleccionar los datos de los "códigos", me dará un error porque la tabla está eliminada.

Además, no podrá ver esta tabla en el directorio predeterminado que es

"Usuario / colmena / almacén"

Observa aquí,

Tabla no gestionada / Tabla externa:

  1. Tablas externas, debemos proporcionar la ruta donde necesitamos almacenar esa tabla usando la palabra clave 'ubicación' en el comando crear tabla.

Por ejemplo:

CREAR TABLA EXTERNA stg_s2_json.products

(producto sin cadena, cadena de nombre de producto, cadena de descripción, cadena activa, cadena de fecha creada, cadena de fecha actualizada) campos delimitados en formato de fila terminados por ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. La colmena solo elimina los metadatos. Los datos son permanentes.
  2. Estas tablas pueden ser utilizadas por cualquier persona que tenga acceso a HDFS, por lo que deben administrar la seguridad a nivel de carpeta.

Para comprender la caída de la tabla externa, utilizaremos la tabla "productos".

Verifiquemos si la tabla es interna o externa. Nuevamente, el comando "describir nombre_tabla con formato".

Observe el "límite 10" en el comando de selección. Table Products contiene los siguientes datos:

Para comprobarlo en Hue, se ve así:

Veamos qué sucede cuando dejamos caer esta tabla:

Sintaxis:

Drop table table_name;

Salida:

Ahora, si intenta recuperar los datos de la tabla, arroja un error.

Primero, usando el comando "select" en el terminal, me arrojará un error que significa que los metadatos para la tabla externa se eliminan.

Observe el error aquí:

Segundo, verificando el estado de los datos, el archivo "products.json" todavía está presente en HDFS, lo que significa que los datos son permanentes.

Conclusión

Voy a facilitarlo y proporcionarle puntos clave para ambos tipos de tablas. Usted decide qué tipo se adaptará a sus necesidades.

Mesa interna

Tabla externa

También se llama "Tabla administrada"También se llama "tabla no administrada"
No es necesario proporcionar la ubicación, el directorio predeterminado de Hive administra estos datosNecesidad de proporcionar ubicación
Elimina los metadatos de la tabla y (Los datos son temporales)Hive dejará los datos intactos (los datos son permanentes)
La colmena controla la seguridad de la mesa.Necesidad de administrar la seguridad a nivel de carpeta

Artículos recomendados

Esta es una guía de Hive Drop Table. Aquí discutimos la introducción de Hive Drop Table, Tipos de Drop Table en Hive a lo largo de la sintaxis. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. ¿Qué es una colmena?
  2. Arquitectura de la colmena
  3. Comandos de la colmena
  4. ¿Qué es la base de datos Oracle?
  5. Orden de la colmena por
  6. Instalación de colmena

Categoría: