Introducción al histograma en R

En este artículo, comenzaremos con el histograma básico en la implementación y personalizaciones de R. El histograma juega un papel importante en el análisis de datos para visualizar los datos. La programación R es un entorno especial para la computación estadística y los fundamentos para la ciencia de datos. En la programación de R, los conjuntos de datos y las funciones se agrupan en forma de paquetes. La mayoría de los programas de análisis visual utilizan histogramas y hacen que el ancho del contenedor sea el predeterminado. Permiten comprender rápidamente los conocimientos de los datos, que es un papel principal en la ciencia de datos. Aquí construiremos un histograma usando comandos R.

¿Qué es el histograma?

El histograma es una representación gráfica de una distribución de conjunto de datos con la que podríamos analizar fácilmente qué factor tiene una mayor cantidad de datos y la menor cantidad de datos. En otras palabras, el histograma permite hacer gráficos de frecuencia acumulativos en el eje xy el eje y. En realidad, los histogramas toman datos agrupados y no agrupados. Para un histograma de datos agrupados se construye considerando los límites de clase, mientras que los datos no agrupados son necesarios para formar la distribución de frecuencia agrupada. Ayudan a analizar el rango y la ubicación de los datos de manera efectiva. Alguna estructura común de histogramas se aplica como normal, sesgado, acantilado durante la distribución de datos.

A diferencia de una barra, el histograma de gráfico no tiene espacios entre las barras y las barras aquí se nombran como contenedores con los que los datos se representan en intervalos iguales. Histograma Toma variables continuas y se divide en intervalos, es necesario elegir el ancho correcto del contenedor. La principal diferencia entre el gráfico de barras y el histograma es que el primero usa conjuntos de datos nominales para trazar, mientras que el histograma traza los conjuntos de datos continuos. R usa la función hist () para crear histogramas. Esta función hist () usa un vector de valores para trazar el histograma. El histograma se compone de un rango de valores continuos en el eje x, el eje y traza valores frecuentes de datos en el eje x con barras de variaciones de alturas.

Sintaxis:

La sintaxis para crear histograma es

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Crear un histograma en R

Para el análisis, el histograma de propósito requiere un conjunto de datos incorporado para importar en R. R y sus bibliotecas tienen una variedad de paquetes y funciones gráficas. Aquí utilizamos el conjunto de datos de Pasajeros suizos y aéreos. Para calcular un histograma para un valor de datos dado, la función hist () se usa junto con un signo $ para seleccionar una determinada columna de datos del conjunto de datos para crear un histograma.

El siguiente ejemplo calcula un histograma del valor de los datos en la columna Examen del conjunto de datos denominado Swiss.

Ejemplo 1: Creemos un histograma simple

Código:

hist (swiss $Examination)

Salida:

Hist se crea para un conjunto de datos suizo con un examen de columna. esto simplemente traza un contenedor con frecuencia y eje x.

Ejemplo 2: histograma con más argumentos

Para lograr una mejor comprensión de los histogramas, necesitamos agregar más argumentos a la función hist para optimizar la visualización del gráfico. Al cambiar la etiqueta x e y a un rango de valores, se agregan argumentos xlim e ylim a la función.

Ejemplo:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Salida:

El código anterior traza un histograma para los valores del conjunto de datos Pasajeros aéreos, da título como "Histograma para más arg", la etiqueta del eje x como "Lista de nombres", con un borde verde y un color Amarillo a las barras, al limitar el valor de 100 a 600, los valores impresos en el eje y en 2 y haciendo el ancho del contenedor a 5.

Agregar dos colores diferentes a la barra

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Salida:

Agregar más barras al histograma

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Salida:

Ejemplo 3: Histograma en R Su devuelve un valor

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Salida:

Ejemplo 4: uso del argumento de ruptura para cambiar el ancho del contenedor

Para tener más puntos de interrupción entre el ancho, se prefiere usar el valor en la función c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Salida:

El gráfico anterior toma el ancho de la barra a través de valores de secuencia.

Ejemplo 5: Implementación de la curva de distribución normal en histograma

Utilizaremos el conjunto de datos 'suizo' para los valores de datos para dibujar un gráfico. Aquí la curva de función () se usa para mostrar la línea de distribución.

Código:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Salida:

Ejemplo 6: Trazado de distribución de probabilidad

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Crear gráficos de densidad en histograma en R

La distribución de una variable se crea utilizando la función densidad (). A continuación se muestra el ejemplo con el conjunto de datos mtcars. Los gráficos de densidad ayudan en la distribución de la forma.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Salida:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

El siguiente histograma en R muestra la altura como un examen en el eje xy la densidad se traza en el eje y.

Salida:

Conclusión

Eso es todo sobre el histograma y precisamente el histograma es la forma más fácil de entender los datos. Como hemos visto con un histograma, podríamos dibujar gráficos únicos y múltiples, utilizando el ancho del contenedor, la corrección del eje, el cambio de colores, etc. El histograma ayuda a visualizar las diferentes formas de los datos. Finalmente, hemos visto cómo el histograma permite analizar conjuntos de datos y los puntos medios se usan como etiquetas de la clase. El histograma ayuda a cambiar los intervalos para producir una descripción mejorada de los datos y funciona, particularmente con datos numéricos. Los histogramas son más preferidos en el análisis debido a su ventaja de mostrar un gran conjunto de datos. Según el resultado, podríamos sesgar visualmente los datos y hacer algunas suposiciones.

Artículos recomendados

Esta ha sido una guía sobre el histograma en R. Aquí hemos discutido el concepto, la sintaxis y cómo crear un histograma en R con ejemplos. También puede consultar los siguientes artículos para obtener más información:

  1. Ejemplos de histogramas
  2. Carrera en programación R
  3. Diagrama de Gantt en Tableau
  4. Carrera en programación de computadoras
  5. ¿Cómo crear un gráfico lineal en R?

Categoría: