ANOVA bidireccional en R - Prueba ANOVA de dos vías en R Guía fácil - Ejemplos

Tabla de contenido:

Anonim

Descripción general de ANOVA de dos vías en R

El ANOVA de dos vías (Análisis de varianza) nos ayuda a comprender la relación entre una variable dependiente continua y dos variables independientes categóricas. En este tema, vamos a aprender sobre ANOVA de dos vías en R.

A continuación se presentan las hipótesis de interés bajo ANOVA de dos vías.

  1. H₀: Llámelo el efecto principal, que es el primer factor que depende de la variable continua
  2. H₀: el efecto Principal también se trata del efecto sobre la segunda variable sobre la variable continua dependiente.
  3. H₀: la interacción es el efecto combinado de la primera variable del segundo factor en la variable dependiente

A continuación se detallan las normas que debe cumplir un ANOVA de dos vías.

  1. Las observaciones deben ser independientes.
  2. Las observaciones deben distribuirse normalmente.
  3. Debe haber la misma varianza en las observaciones.
  4. No hay valores atípicos en el diseño.
  5. Los errores deben ser independientes.

Nota

Necesitamos transformar nuestros datos si se viola la normalidad y la varianza igual.

Ejemplo de ANOVA de dos vías en R

Realicemos una prueba ANOVA unidireccional en el conjunto de datos de niveles de cáncer que contiene 48 filas y 3 variables de datos:

Tiempo tomado: tiempo de supervivencia de un animal

Diferentes niveles de cáncer 1 - 3

Tratamiento: tratamientos utilizados de 1-3

Antes de probar, necesitamos los siguientes datos en la mano.

  • Importando los datos
  • Eliminar variables innecesarias
  • Convierta las variables (niveles de cáncer) como nivel ordenado.

A continuación se muestra el conjunto de datos.

Observaciones: 48

Variables: 3

tiempo de supervivencia 0.31, 0.45, 0.46, 0.43, 0.36, 0.29, 0.40, 0.23, 0.22, 0 …

niveles de cáncer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …

Tratamiento A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Objetivos

  1. H₀: sin cambios en el tiempo promedio de supervivencia entre el grupo
  2. H₀: el tiempo de supervivencia es diferente para al menos un grupo.

Pasos

  • Verifica los niveles de cáncer. Podemos ver tres valores de caracteres porque los convertimos en factores con un verbo mutado.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Calcule la media y la desviación estándar

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Salida:

Un tibble: 3 x 4

cancerlevels count_cancerlevels mean_time sd_time

1 1 16 0.617500 0.20942779

2 2 16 0.544375 0.28936641

3 3 16 0.276250 0.06227627

  • En el paso tres, puede verificar gráficamente si hay una diferencia entre las distribuciones. Tenga en cuenta que incluye el punto nervioso.
  • Ejecute la prueba con el comando AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Sintaxis:

y ~ X1 + X2 +… + Xn (X1 + X2 +… se refiere a las variables independientes)

y ~. Utilice todas las variables restantes como variables independientes.

Asegúrese de guardar el modelo e imprimir el resumen.

Código

  • aov (time ~ cancerlevels, data = df): ejecute la prueba ANOVA con la siguiente fórmula
  • summary (anova_one_way): imprime el resumen de la prueba

Df Suma Sq Media Sq Valor F Pr (> F)

Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***

Residuos 45 1.972 0.0438

-

Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

El valor p es inferior al umbral de 0, 05. La diferencia estadística se indica con '*' en el caso anterior.

Prueba unidireccional a Anova bidireccional en R

Veamos cómo la prueba unidireccional se puede extender a ANOVA bidireccional. La prueba es similar al ANOVA de una vía, pero la fórmula difiere y agrega otra variable de grupo a la fórmula.

y = x1 + x2

  • H0 : Las medias son iguales para ambas variables (variables de factor)
  • H3 : las medias son diferentes para ambas variables

Agrega variables de tratamiento a nuestro modelo. Esta variable indica el tratamiento administrado al paciente. Le interesa ver si existe una dependencia estadística entre los niveles de cáncer y el tratamiento administrado al paciente.

Ajustamos nuestro código agregando un tratamiento con la otra variable independiente.

Df Suma Sq Media Sq Valor F Pr (> F)

Niveles de cáncer 2 1.0330 0.5165 20.64 5.7e-07 ***

Tratar 3 0.9212 0.3071 12.27 6.7e-06 ***

Residuos 42 1.0509 0.0250

Tanto los niveles de cáncer como el tratamiento son estadísticamente diferentes de 0. Con esto, podemos rechazar la hipótesis NULL. Además, confirme que cambiar el tratamiento o el tipo de cáncer afecta el tiempo de supervivencia.

Prueba

ANOVA unidireccional: H3: el promedio es diferente para al menos un grupo

ANOVA de dos vías: H3- El promedio es diferente para ambos grupos.

Diferencia entre ANOVA unidireccional y bidireccional

Diferencias entre ANOVA unidireccional y ANOVA bidireccional

ANOVA unidireccionalANOVA bidireccional
Diseñado para permitir pruebas de igualdad entre 3 o más mediosDiseñado para evaluar la interrelación de dos variables independientes en una variable dependiente.
Involucra una variable independienteInvolucra dos variables independientes
Analizado en 3 o más grupos categóricos.Compara múltiples grupos de dos factores
Tiene que satisfacer dos principios: replicación y aleatorizaciónTiene que satisfacer tres principios que son la replicación, la aleatorización y el control local.

Ventajas de ANOVA bidireccional

  • En el ejemplo anterior, la edad y el género en nuestro ejemplo ayudan a reducir la variación de errores, haciendo que el diseño sea más eficiente.
  • El ANOVA de dos vías nos permite probar el efecto de dos factores al mismo tiempo.

Aplicaciones de ANOVA

  1. Comparando el kilometraje de diferentes vehículos, combustible y tipos de carretera.
  2. Conocer el impacto de la temperatura, la presión o la concentración química en algunas reacciones químicas (reactores de potencia, plantas químicas, etc.)
  3. Impacto de diferentes catalizadores en las velocidades de reacción química
  4. Comprender el impacto de los comerciales y los diferentes números de respuestas de los clientes.
  5. Impacto del rendimiento, la calidad y la velocidad de fabricación en biología (proceso basado en la cantidad de células en las que se dividen)

Artículos recomendados

Esta es una guía de ANOVA de dos vías en R. Aquí discutimos los ejemplos, objetivos, pasos y la diferencia entre ANOVA de una vía y de dos vías. También puede echar un vistazo a los siguientes artículos para obtener más información:

  1. ANOVA en R
  2. Cómo interpretar los resultados usando la prueba ANOVA
  3. Regresión vs ANOVA
  4. GLM en R