Introducción a Pig entrevista Entrevista Preguntas y respuestas

Apache Pig es una plataforma de alto nivel para la cual se utiliza para crear programas que se ejecutan en Hadoop. El lenguaje del cerdo se conoce como latín del cerdo. Pig está escrito en Java y fue desarrollado por Yahoo Research y la fundación de software Apache. Su lanzamiento inicial ocurrió el 11 de septiembre de 2008. Preparándose para una entrevista de trabajo en Pig. Estoy seguro de que desea conocer las preguntas y respuestas más comunes de la entrevista de cerdo que lo ayudarán a descifrar la entrevista de cerdo con facilidad.

A continuación se muestra la lista de las principales preguntas y respuestas de la entrevista de cerdo en su rescate. Estas preguntas de la entrevista se dividen en dos partes:

  • Parte 1 - Preguntas de la entrevista de cerdo (Básico)
  • Parte 2 - Preguntas de la entrevista de cerdo (Avanzado)

Parte 1 - Preguntas de la entrevista de cerdo (Básico)

Esta primera parte cubre preguntas y respuestas básicas de la entrevista de Pig

Q1.¿Cuál es la diferencia entre Map Reduce y Pig?

Responder:
Map Reduce es un lenguaje compilado y la eficiencia de código de Map-reduce es alta y Pig es un lenguaje de script con menos eficiencia de código.

Q2.¿Qué quieres decir con la bolsa en Pig?

Responder:
Colección de tuplas se conoce como una bolsa en un cerdo.

Q3.¿Cuáles son los tipos de datos complejos en Pig?

Responder:
Map, Tuples y Bag son los tipos de datos complejos de Pig.

Q4.¿Qué se aplana en Pig?

Responder:
Cuando queremos eliminar el anidamiento de los datos en tupla o bolsa, usamos Flatten.

Q5.Supongamos que tenemos un nombre de archivo con abc.csv y que tiene el atributo como id, nombre, año, calificación, duración. ¿Cómo cargarás este archivo a un cerdo?

Responder:
películas = CARGAR 'ruta de abc.csv' UTILIZANDO Pig Storage (', ') como (id, nombre, año, calificación, duración);

Q6.¿Cuál es la diferencia entre PigLatin y HIVEQL?

Responder:
HIVEQL es un lenguaje declarativo y PigLatin es un correo procesal.

Pasemos a las siguientes preguntas de la entrevista de cerdo.

Q7.¿Qué quieres decir con una bolsa interior y una bolsa exterior de cerdo?

Responder:
La relación dentro de la bolsa se refiere a la bolsa interna y la relación normal se conoce como bolsa externa.

Q8.¿Cuál es la diferencia entre Group y COGROUP?

Responder:
El operador GROUP se usa para agrupar los datos en una sola relación y COGROUP se usa para hacer la relación en GROUP y JOIN.

Q9.¿Cuál es la diferencia entre COUNT y COUNT_STAR?

Responder:
La función COUNT no funciona con un valor NULL cuando contamos un elemento en una bolsa, pero COUNT_STAR considerará el valor NULL.

Q10. ¿Cuáles son los operadores de diagnóstico disponibles en Apache Pig?

Responder:
Operador de volcado, operador de descripción, operador de explicación, operador de ilustración.

Q11.¿Qué quieres decir con operador UNION y SPLIT?

Responder:
Al usar un operador UNION podemos fusionar el contenido de dos o más relaciones y un operador DERRAMADO se usa para dividir la relación individual en dos o más relaciones.

Q12.¿Cómo obtener las 10 mejores tuplas de la relación R?

Responder:
Mediante el uso de la función TOP ().

Pasemos a las siguientes preguntas de la entrevista de cerdo.

Q13.¿Cuáles son las similitudes entre Pig y Hive?

Responder:
Pig usa PigLatin y Hive usa HiveQL, ambos convierten los comandos en trabajos de MapReduce.

Q14.¿Cuáles son los diferentes tipos de funciones UDF de JAVA que son compatibles con Apache Pig?

Responder:
Las funciones algebraicas, Eval, Filter son los tipos de funciones UDF.

P15. Tiene un archivo movies.txt en el directorio HDFS con 1000 registros. Desea ver solo los primeros 10 registros del archivo movies.txt. ¿Cómo harás ésto?

Responder:
Primero, debe cargar el archivo movies.txt con el nombre de la relación película:
movies = LOAD 'ruta de acceso de movies.txt' UTILIZANDO Pig Storage (', ') como (atributos);
Resultado = límite de empleado 10

Parte 2 - Preguntas de la entrevista de cerdo (Avanzado)

Veamos ahora las preguntas avanzadas de la entrevista de cerdo.

Q16.¿Cómo interactúan los usuarios con Hadoop en Pig?

Responder:
Mediante el uso de grunt shell

Q17.¿Es compatible Pig con comandos de varias líneas?

Responder:
si

Q18.¿Cuáles son todas las clases de estadísticas en un paquete pigstats?

Responder:
PigStats, JobStats, OutputStats, InputStats.

Q19.¿Qué es UDF?

Responder:
La función que no está integrada en el operador pero que puede crear mediante programación una función para mostrar la funcionalidad.

Q20.Explique la mayúsculas y minúsculas en Pig Latin?

Responder:
Las funciones y los nombres de las relaciones son sensibles a mayúsculas y minúsculas en Pig Latin, pero un nombre o palabra clave y parámetro no distinguen entre mayúsculas y minúsculas.

Q21.¿Qué es Grunt in Pig?

Responder:
Grunt es un terminal de comando que es un shell interactivo donde le damos el comando de Pig.

Q22.¿Cuál es el requisito de MapReduce en la programación de Pig?

Responder:
MapReduce es un motor de ejecución.

Pasemos a las siguientes preguntas de la entrevista de cerdo.

Q23.¿Qué es el motor Pig?

Responder:
El motor Pig proporciona el entorno de ejecución para ejecutar los programas pig. Convierte las operaciones porcinas en trabajos MapReduce.

Q24.¿Cuáles son los modos de ejecución de Pig?

Responder:
Modo local: la operación Pig se ejecutará en una sola JVM.
Modo MapReduce: se ejecutará el clúster Hadoop.

Q25.¿Cuáles son las diferentes funciones de Eval disponibles en pig?

Responder:
AVG, CONCAT, MAX, MIN, SM, SIZE, COUNT son diferentes funciones EVAL pig.

Q26.¿Qué quieres decir con CARGAR y ALMACENAR en Pig?

Responder:
Estos son el operador para cargar y almacenar los datos en hdfs.

Pasemos a las siguientes preguntas de la entrevista de cerdo.

Q27.¿Qué función matemática está disponible en Pig?

Responder:
ABS, ACOS, LOG, ROUND, CBRT, SORT son las funciones matemáticas disponibles en Pig.

Q28.¿Qué hizo la palabra clave distinta en Pig?

Responder:
Las palabras clave distintas eliminan las palabras clave duplicadas de los registros. Por ejemplo:
películas = CARGAR 'ruta de abc.csv' UTILIZANDO Pig Storage (', ') como (id, nombre, año, calificación, duración);
New_movies = distinct (id, nombre, año, calificación, duración);

Q29.¿Qué quieres decir con tipo de datos primitivo en Pig?

Responder:
Int, Long, Float, Double, Char array, Byte array son los tipos de datos primitivos en Pig.

Q30: ¿Qué quieres decir con una tupla en Pig?

Responder:
Un conjunto ordenado de campo de datos se llama Tuple.

Conclusión

Si se está preparando para los trabajos relacionados con Hadoop, debe preparar el Pig para eso porque este tema desempeñará el papel principal para asegurar buenos comentarios en la entrevista. Las preguntas de la entrevista del cerdo que se comparten arriba le ayudarán a preparar los conceptos básicos y teóricamente del cerdo, pero debe tener las manos en el cerdo. Le ayudará a desarrollar la confianza y el conocimiento avanzado.

Artículo recomendado

Esta ha sido una guía para la Lista de preguntas y respuestas de la entrevista de cerdos para que el candidato pueda tomar medidas enérgicas contra estas preguntas de la entrevista de cerdos fácilmente. Aquí cubrimos tanto las preguntas de entrevista de cerdo básicas como las avanzadas. También puede consultar los siguientes artículos para obtener más información:

  1. Preguntas útiles para la entrevista de Apache PIG
  2. Preguntas de la entrevista de C ++
  3. Preguntas de la entrevista de Spark que debes saber
  4. Preguntas de la entrevista de pepino