Marcos de datos en R - ¿Cómo extraer datos de marcos de datos en R?

Tabla de contenido:

Anonim

Introducción a los marcos de datos en R

Un marco de datos es una estructura tipo matriz 2D (bidimensional) en la que se aceptan diferentes tipos de datos como caracteres, numéricos, etc. El marco de datos es un subconjunto de una lista que tiene cada componente de igual longitud. Básicamente, el marco de datos es una tabla en la que cada columna contiene valores de una variable y cada fila contiene un conjunto de valores de cada columna.

Hay algunas características del marco de datos.

  • Se requiere el nombre de la columna
  • Los nombres de fila deben ser únicos
  • El número de elementos en cada columna debe ser el mismo.

Pasos para crear marcos de datos en R

Comencemos con la creación de un marco de datos que se explica a continuación,

Paso 1: Crear un marco de datos de una clase en una escuela.

Código:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Cuando ejecutamos este código, obtendremos un marco de datos como este.

Salida:

Aquí, en nuestro ejemplo, el marco de datos es muy pequeño, pero en la vida real, mientras tratamos el problema, tenemos muchos datos. Entonces, para comprender la estructura de los datos, pasamos la función Str ().

Paso 2: Agregamos la siguiente línea en nuestro código.

Código:

Str(tenthclass)

Cuando ejecutamos todo el código, obtendremos resultados.

Salida:

El resultado anterior significa que tenemos 5 observaciones de 3 variables. Luego explica el tipo de datos de cada variable. Como en nuestro ejemplo, el número de rollo es un entero, el nombre es carácter y las marcas están numeradas.

Una vez que comprendamos la estructura de los datos, pasaremos el código mencionado a continuación para comprender los datos de manera más estadística.

Paso 3: Ahora, usaremos una función summary ()

Código:

summary(tenthclass)

Salida:

El resumen proporciona una mejor comprensión de nuestros datos. Nos dirá que queremos decir, mediana, cuartil, Max y Min. Estas cosas nos ayudarán a tomar una mejor decisión.

¿Cómo extraer datos de marcos de datos en R?

Aquí continuaremos el caso anterior. Supongamos que queremos saber el nombre del alumno en la décima clase, solo nombre. Entonces, ¿cómo vamos a extraer?

Nuestro marco de datos se ve así.

roll_number Nombre Marcas

1 1 Juan 77

2 2 Sam 87

3 3 Casey 45

4 4 Ronald 68

5 5 Mateo 95

Para obtener el nombre como una salida, pasaremos el siguiente código.

Código:

onlyname = tenthclass$Name
print(onlyname)

Salida:

Aquí, si rompemos el código, simplemente colocamos el signo de dólar entre el nombre de nuestro marco de datos y el nombre de la variable que queremos como salida.

Ahora considere una situación, el maestro quiere saber todo sobre la tirada número 2, como su nombre y cuánto anotó.

Aquí necesitamos todo sobre el número de rollo 2, por lo que pasaremos el código mencionado a continuación.

Código:

result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)

Salida:

Expandir en marcos de datos

El marco de datos se puede aumentar y disminuir de tamaño agregando o eliminando columnas y filas.

1. Añadir fila

Tenemos dos marcos de datos. Un marco de datos pertenece a la décima sección de la clase A y otro marco de datos pertenece a la décima sección de la clase B. Ahora estas diferentes secciones se están fusionando en una sola clase.

Ejemplo # 1: Clase 10 A

Código:

tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)

Salida:

Ejemplo # 2: Clase 10 B

Código:

tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)

Salida:

Ejemplo # 3: función rbind ()

Ahora tenemos que fusionar estas dos clases en una sola clase. Usaremos la función rbind () aquí. La única limitación al agregar una nueva fila es que necesitamos incorporar las nuevas filas en la misma estructura que el marco de datos existente.

Código:

new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)

Salida:

2. Agregar columna

Ahora considere un caso en el que tenemos que agregar detalles del grupo sanguíneo de todos y cada uno de los estudiantes en la clase 10. Agregaremos una nueva columna y lo llamaremos "Grupo de sangre".

Nuestro marco de datos se ve así.

Código:

tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)

Salida:

Código:

tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)

Salida:

Eliminar fila y columna del marco de datos

Para eliminar filas y columnas del marco de datos, utilizamos la siguiente implementación de código.

1. Eliminar columna

Código:

print(tenthclass)

Salida:

En este marco de datos, si tenemos que eliminar la variable del grupo sanguíneo (columna más a la derecha), pasaremos el siguiente código.

Código:

tenthclass$Blood_group = NULL
print(tenthclass)

Salida:

Sin pasar por el comando NULL, podemos eliminar directamente la variable de nuestro marco de datos.

2. Eliminar fila

Código:

print(tenthclass)

Salida:

Ahora considere una situación en la que no necesitamos marcas de John, por lo que tenemos que eliminar la fila superior.

Código:

tenthclass = tenthclass(-1, ) print(tenthclass)

Salida:

Actualizar datos en el marco de datos

Código:

print(tenthclass)

Salida:

Supongamos que Sam obtuvo 98 marcas, pero según nuestras marcas de marco de datos son 87. Entonces podemos pasar el siguiente código para rectificarlo.

Código:

tenthclass$Marks(2) = 98
print(tenthclass)

Salida:

Conclusión

Los marcos de datos son una forma muy común de enunciado del problema. Es una lista de la variable del mismo número de filas con ID de fila únicos. Este artículo nos ayuda a saber cómo podemos agregar una fila, agregar una columna, eliminar una fila, eliminar una columna del marco de datos y también nos dice cómo podemos actualizar los datos en el marco de datos.

Artículos recomendados

Esta es una guía de marcos de datos en R. Aquí discutimos los diferentes pasos para crear marcos de datos y cómo extraer datos de marcos de datos en R. También puede consultar los siguientes artículos para obtener más información.

  1. Los 5 tipos de datos principales en R
  2. Lista de paquetes R útiles
  3. R CSV Files
  4. Funciones del programa R - Importancia
  5. Factoriza en R con ventajas