Descripción general del marco de datos R
Los marcos de datos son una lista de vectores con la misma longitud. Sin embargo, la diferencia entre los marcos de matriz y de datos es que los marcos de datos aceptan varios tipos de datos. (Carácter, numérico, etc.). En este tema, vamos a aprender sobre R Data Frame.
Ventajas de usar marcos de datos
- Recogida distribuida de datos y organizada.
- Tiene mejores optimizaciones en comparación con una base de datos relacional.
- Contiene una variedad de datos que es heterogéneo.
Crear un marco de datos en R
Creamos data_frame. A continuación se muestra el ejemplo para declarar un marco de datos.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
En el ejemplo anterior, no hemos definido las variables. Veamos ahora cómo asignamos valores a las variables y cómo las almacenamos en el marco de datos.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Salida:
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
3 4 z FALSO
Estructura del marco de datos
Cuando queremos saber la estructura de un marco de datos particular. Podemos usar la siguiente función.
Estrella ()
str(Data_frame)
Salida:
Número: num 2 3 4
alfa: Factor w / 3 niveles "x", "y", "z": 1 2 3
Booleanos: logi VERDADERO VERDADERO FALSO
Extracción de datos específicos del marco de datos
1. Usando el nombre de la columna
Podemos extraer un conjunto particular de datos del marco de datos.
De nuestro ejemplo anterior, extraigamos solo la primera columna del marco de datos que es Número.
Data_ frame <- data. Frame(Number)
Salida:
Número
1 2
2 3
3 4
2. Usando las filas
Podemos extraer los datos de las filas al igual que en el siguiente ejemplo.
Supongamos que queremos imprimir solo dos filas de la columna Número.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Salida:
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
3 4 z FALSO
------------
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
Podemos observar la diferencia en la primera y segunda salida.
3. Imprimir filas y columnas específicas
También podemos imprimir filas y columnas específicas.
En el siguiente ejemplo, imprimimos 1ª y 2ª fila, columnas
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Salida:
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
3 4 z FALSO
-------------
Número alfa
1 2 x
2 3 a
4. Agregar otra columna al marco de datos
Podemos agregar otra columna junto con valores al marco de datos.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Salida:
Clase de número alfa booleanos
1 2 x VERDADERO A
2 3 y VERDADERO B
3 4 z FALSO C
5. Agregar una fila al marco de datos
Usamos la función rbind para agregar una nueva fila al marco de datos existente.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Salida:
Clase de número alfa booleanos
1 2 x VERDADERO A
2 3 y VERDADERO B
3 4 z FALSO C
4 5 x FALSO D
6. Combinando ambos marcos de datos
También podemos combinar dos marcos de datos para producir una sola salida.
Para combinar dos marcos de datos, necesitamos tener la misma columna para los marcos de datos.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Salida:
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
3 4 z FALSO
-------------–
Número alfa booleanos
1 4 x VERDADERO
2 5 y VERDADERO
3 6 z FALSO
-------------–
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
3 4 z FALSO
4 4 x VERDADERO
5 5 y VERDADERO
6 6 z FALSO
Inspección de marcos de datos
A continuación se muestran las diferentes formas de inspeccionar un marco de datos y proporciona información sobre un marco de datos al igual que la función de estrella anterior.
1. Nombres: proporciona los nombres de las variables en el marco de datos
Sintaxis : names(data frame name)
Ejemplo
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
salida : (1) “Número” “alfa” “Booleanos”
2. Resumen: proporciona las estadísticas del marco de datos.
Sintaxis: summary(data frame name)
Ejemplo
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Salida:
Número alfa booleanos
Min. : 2.0 x: 1 Modo: lógico
1er cuarto: 2.5 y: 1 FALSO: 1
Mediana: 3.0 z: 1 VERDADERO: 2
Media: 3.0 NA's: 0
3er cuarto: 3.5
Max. : 4.0
3. Head: proporciona los datos de las primeras filas.
Sintaxis: Head( name of the data frame)
Ejemplo
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Salida:
Número alfa booleanos
1 2 x VERDADERO
2 3 y VERDADERO
3 4 z FALSO
4 5 a VERDADERO
5 6 b FALSO
6 7 c FALSO
4. Cola: imprime las últimas filas en el marco de datos.
Sintaxis: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Salida:
Número alfa booleanos
5 6 b FALSO
6 7 c FALSO
7 8 d FALSO
8 9 f FALSO
9 10 g FALSO
10 11 j FALSO
Conclusión
Los marcos de datos son un concepto importante en la programación de R. Es fácil pero poderoso en la creación de conjuntos de datos que se pueden modificar y acceder fácilmente. Al igual que la matriz, se puede acceder a los conjuntos de datos a través de los nombres de filas y columnas con la adición y eliminación de datos de manera fácil.
Artículos recomendados
Esta es una guía para R Data Frame. Aquí discutimos la creación de un marco de datos en R con la estructura y la extracción de datos específicos del marco de datos. También puede echar un vistazo a los siguientes artículos para obtener más información:
- Tipos de datos en C
- Carrera de ciencia de datos
- Tecnologías de Big Data
- Plataforma de ciencia de datos
- Booleanos de Java