Introducción a la lista de paquetes R

Un paquete en lenguaje de programación R es una unidad que proporciona las funcionalidades requeridas que se pueden utilizar al cargarlo en el entorno R. Una lista de paquetes R es similar a una biblioteca en C, C ++ o Java. Entonces, esencialmente, un paquete puede tener numerosas funcionalidades como funciones, constantes, etc. que permitiremos al usuario utilizarlas en el contexto de un problema particular. En R, se puede cargar un paquete requerido usando la función library (). En caso de que un paquete no esté presente, se puede instalar utilizando la función install.packages (). Los paquetes hacen que las tareas aparentemente difíciles sean fáciles gracias a sus funcionalidades listas para usar.

¿Qué son los paquetes R?

Hay muchos paquetes en R, y la selección de un paquete depende de su aplicación. Aunque hay ciertos paquetes que se usan ampliamente debido a las funcionalidades que proporcionan, no es el caso de que otros paquetes sean menos importantes. Diferentes paquetes tienen diferentes propósitos; algunos están relacionados con técnicas estadísticas, algunos pertenecen a visualizaciones, etc.

En la siguiente sección, veremos algunos de los paquetes importantes en R:

1. coche

Este paquete es compañero de la regresión aplicada. Es un gran paquete que proporciona varias funcionalidades para el análisis estadístico. La importación de este paquete en el entorno R importa otros paquetes relacionados como MASS, estadísticas, gráficos, etc. Algunas de las funciones en el paquete incluyen Anova, avPlots, Boxplot, carPalette, gráficos de densidad, infIndexPlot, hipótesis lineal, logit, prueba atípica, qqPlot, gráficos residuales, diagrama de dispersión, matriz de diagrama de dispersión, etc. Las amplias capacidades del paquete se pueden medir a partir del número de funciones que proporciona.

2. Corrplot

El paquete proporciona una visualización gráfica de una matriz de correlación y un intervalo de confianza. El paquete también proporciona algoritmos para realizar el reordenamiento de matrices. Numerosas opciones incluyen elegir los colores requeridos, etiquetas de texto, etiquetas de color, diseño, etc. Varios métodos de visualización o métodos de parámetros en el paquete corrplot son "círculo", "cuadrado", "elipse", "número", "sombra", "color" y "pastel". La función corrplot que incorpora varias opciones ofrece una representación visualmente atractiva de la correlación entre diferentes variables que, de lo contrario, en circunstancias normales, como los números, son difíciles de interpretar. Las correlaciones positivas se muestran en azul y las negativas en rojo. La intensidad del color y el tamaño del círculo son proporcionales a los coeficientes de correlación.

3. DataExplorer

Este paquete se ocupa de la exploración y el tratamiento automatizados de datos. Proporciona un proceso automatizado de exploración de datos destinado a tareas analíticas y modelado predictivo. Esto es crucial ya que permite al usuario comprender datos y extraer información. Cada variable en el análisis es escaneada y analizada por el paquete. Además, el paquete proporciona funcionalidades para la visualización de estas variables utilizando técnicas gráficas típicas. También proporciona métodos comunes de procesamiento de datos para tratar y formatear datos.

4. Gmodels

El paquete gmodels proporciona varias herramientas en R para trazar datos. Contiene varias funciones, como glh.test, que se utiliza para probar, imprimir o resumir una hipótesis lineal general para un modelo de regresión. La función hace. los contrastes convierten los contrastes legibles por humanos en la forma que R requiere para el cálculo. La matriz devuelta por make.contrasts puede usarse como argumento para el argumento de contrastes de las funciones del modelo. La función coefFrame ajusta un modelo a cada subgrupo definido por , luego devuelve un marco de datos con una fila para cada ajuste y una columna para cada parámetro. La función estimable calcula y prueba los contrastes y otras funciones lineales estimables de los coeficientes del modelo para lm, glm, etc. La función fit.contrast calcula y prueba los contrastes arbitrarios para los objetos de regresión.

5. Gplots

Este paquete proporciona funcionalidades de visualización a través de múltiples herramientas de programación. Las funciones del paquete funcionan sobre el concepto de cálculo y trazado. Las funciones gráficas del paquete se demuestran mediante diversas funciones, como el diagrama de banda, boxplot2, col2hex, ci2d, hist2d, diagrama de texto, diagrama de sumidero, piloto de globo, plotCI, medios de diagrama, etc. Estas funciones permiten trabajar con configuraciones relacionadas con el color, texto y otros aspectos gráficos complejos de la visualización. También se ocupan de elementos complejos involucrados en la visualización basada en estadísticas, por ejemplo, lmplot2, funciones de diagrama de residuos que permiten al usuario conducir un diagnóstico de regresión detallado a través de diagramas de diagnóstico. Si es necesario trazar múltiples datos en la misma región, pero con ejes separados, entonces esto es posible usando la función de sobre trama en el paquete.

6. Ggplot2

Es uno de los paquetes muy famosos en R que proporciona amplias capacidades visuales y presenta los resultados incluso de técnicas estadísticas y matemáticas complejas. Las numerosas funcionalidades proporcionadas por el paquete permiten al analista obtener información de los datos de la manera más interactiva. La descripción de R para la función es "un sistema para crear gráficos declarativamente que se basa en la Gramática de Gráficos". Esta gramática de gráficos significa que el usuario tiene que decirle a 'ggplot2' sobre la forma en que las variables deben asignarse a la estética, por lo que esto esencialmente significa que especifica qué aspectos gráficos usar, y ggplot2 funcionará en función de los detalles.

7. Lubridate

Este paquete R facilita el trabajo con fechas y horas. El paquete lubridate permite una fácil manipulación de datos de fecha y hora. Analiza un número y proporciona una disposición de datos adecuada, de hecho, las funciones de análisis en el paquete manejan una amplia variedad de formatos y separadores que simplifican el proceso de análisis. Una de las características notables es que el paquete proporciona funcionalidades para manejar fechas con diferentes zonas horarias.

8. Hmisc

Llamado Harrell Miscellaneous, el paquete Hmisc contiene muchas funciones que se pueden aprovechar para el análisis de datos, gráficos de alto nivel y operaciones de utilidad. También incluye funciones para calcular el tamaño y la potencia de la muestra, importar y anotar conjuntos de datos, imputar valores perdidos, proporcionar funcionalidades avanzadas de tabla, agrupación de variables, manipulación de la cadena de caracteres, conversión de objetos R a código HTML, etc.

9. Celosía

El paquete ofrece un sistema de visualización de datos de alto nivel inspirado en los gráficos Trellis. Se enfatiza en datos multivariados. Las potentes capacidades de visualización del paquete proporcionan la solución gráfica necesaria. Algunas de las funciones notables en el paquete son B_07_cloud que ayuda a producir un diagrama de dispersión 3D y un diagrama de superficie de estructura alámbrica; D_level. colores, una función para calcular colores falsos que representan variables numéricas o categóricas; B_06_levelplot, una función que genera gráficos de nivel y gráficos de contorno; A_01_Lattice, una función que proporciona capacidades gráficas Lattice. B_09_tmd es una función que genera el diagrama de Tukey Mean - Difference; B_11_oneway, una función que se ajusta al modelo unidireccional. El paquete, por lo tanto, proporciona amplias funcionalidades para visualizaciones a través de varias funciones.

10. MatrixModels

Este paquete permite modelar con matrices 'Matrix' dispersas y densas. Para lograr esto, utiliza predicción modular y respuesta, clases de módulos. Todas las funciones proporcionadas por el paquete son igualmente importantes, algunas de las cuales son lm.fit.sparse, que es una función más adecuada para modelos lineales dispersos, solveCoef que resuelve los coeficientes y el coeficiente de incremento, modelo. Una matriz que construye posiblemente matrices de diseño o modelo dispersas, glm4 que se ajusta a modelos lineales generalizados.

11. Multcomp

El paquete permite comparaciones múltiples de k grupos en modelos lineales generalizados. Una lista de nueve procedimientos estándar a saber. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott y Tetrade, se proporcionan al usuario, y el usuario selecciona las comparaciones en función del requisito. Además de esto, también se proporciona una interfaz de entrada gratuita para la matriz de contraste que permite comparaciones especiales. La característica notable es que las comparaciones en sí no están restringidas a ningún diseño en particular, como equilibrado o simple, sino que los programas están diseñados de tal manera que se adaptan a múltiples comparaciones dentro del modelo lineal general que permite covariables, medias correlacionadas, valores faltantes. etc.

12. OpenMx

Este paquete básicamente trata con modelos de ecuaciones estructurales extendidas. Proporciona funcionalidades para crear modelos de ecuaciones estructurales. Estos modelos pueden manipularse mediante programación. Los modelos pueden especificarse con matrices o rutas como LISREL o RAM. Algunos de los tipos de modelos incluyen grupos múltiples, factor confirmatorio, distribución de mezclas, umbral categórico, funciones de ajuste diferencial, etc.

13. Plyr

Es un paquete muy importante que proporciona funcionalidades para la manipulación de datos. Proporciona herramientas para dividir, aplicar y combinar datos. Viene con un conjunto de herramientas que ayudan a resolver un conjunto común de problemas. Por ejemplo, a veces podemos necesitar dividir una gran tarea en tareas más pequeñas que sean manejables, luego operamos en cada una de las piezas y finalmente, volvemos a unir todas las piezas.

14. Qcc

El paquete adquiere importancia debido a las diversas funcionalidades de análisis de calidad que proporciona. Proporciona gráficos de control de calidad Shewhart para datos continuos, atributos y recuentos. Entre otros gráficos importantes se encuentran los gráficos Cusum y EWMA y las curvas de características de funcionamiento. También ofrece funcionalidad de análisis de capacidad de proceso. El gráfico de Pareto y el gráfico de causa y efecto y los gráficos de control multivariante son herramientas útiles que proporciona el paquete.

15. RandomForest

Como su nombre indica, este paquete se usa para construir un algoritmo de bosque aleatorio. El paquete implementa el algoritmo de bosque aleatorio de Breiman, que se basa en el código FORTRAN original de Beiman y Cutler. El algoritmo se usa para clasificación y regresión. El paquete también se puede utilizar en modo no supervisado para evaluar las proximidades entre los puntos de datos.

16. Psych

Es un paquete destinado a un propósito especial. El paquete proporciona un procedimiento para la investigación psicológica, psicométrica y de la personalidad. Las funciones son principalmente para el análisis multivariado utilizando diversas técnicas estadísticas multivariadas.

Conclusión-Lista de paquetes R

Existen numerosos paquetes en R, y la aplicación de un paquete depende de los requisitos. La comunidad Lista de paquetes R ha estado creciendo muy rápido, y cada día se agrega un paquete. Los paquetes múltiples pueden proporcionar funcionalidades similares, pero la selección de un paquete debe basarse en un estudio cuidadoso.

Artículos recomendados

Esta es una guía para una Lista de paquetes R. Aquí discutimos la introducción a los paquetes R y algunos paquetes importantes de R. También puede consultar nuestros otros artículos sugeridos para obtener más información:

  1. Paquetes Java
  2. ¿Qué es JNDI en Java?
  3. JColorChooser
  4. Programación R vs Python

Categoría: