Fórmula de varianza (tabla de contenido)

  • Fórmula
  • Ejemplos

¿Qué es una fórmula de varianza?

El término "varianza" se refiere al grado de dispersión de los puntos de datos de un conjunto de datos a partir de su media, que se calcula como el promedio de la desviación al cuadrado de cada punto de datos de la media de la población. La fórmula para una varianza se puede obtener sumando la desviación al cuadrado de cada punto de datos y luego dividiendo el resultado por el número total de puntos de datos en el conjunto de datos. Matemáticamente, se representa como,

σ 2 = ∑ (X i – μ) 2 / N

dónde,

  • X i = i th punto de datos en el conjunto de datos
  • μ = media poblacional
  • N = Número de puntos de datos en la población

Ejemplos de fórmula de varianza (con plantilla de Excel)

Tomemos un ejemplo para comprender el cálculo de la varianza de una mejor manera.

Puede descargar esta Plantilla Excel de Variance Formula aquí - Plantilla Excel de Variance Formula

Fórmula de varianza - Ejemplo # 1

Tomemos el ejemplo de un salón de clases con 5 estudiantes. La clase tuvo un chequeo médico en el que se pesaron y se capturaron los siguientes datos. Calcule la varianza del conjunto de datos en función de la información dada.

Solución:

La media poblacional se calcula como:

  • Media poblacional = (30 kgs + 33 kgs + 39 kgs + 29 kgs + 34 kgs) / 5
  • Media poblacional = 33 kgs

Ahora, necesitamos calcular la desviación, es decir, la diferencia entre los puntos de datos y el valor medio.

Del mismo modo, calcule todos los valores del conjunto de datos.

Ahora, calculemos las desviaciones al cuadrado de cada punto de datos como se muestra a continuación,

La varianza se calcula usando la fórmula dada a continuación

σ 2 = ∑ (X i - μ) 2 / N

  • σ 2 = (9 + 0 + 36 + 16 + 1) / 5
  • σ 2 = 12, 4

Por lo tanto, la varianza del conjunto de datos es 12.4 .

Fórmula de varianza - Ejemplo # 2

Tomemos el ejemplo de una empresa de nueva creación que consta de 8 personas. Se da la edad de todos los miembros. Calcule la varianza del conjunto de datos en función de la información dada.

Solución:

La media poblacional se calcula como:

  • Media poblacional = (23 años + 32 años + 27 años + 37 años + 35 años + 25 años + 29 años + 40 años) / 8
  • Media poblacional = 31 años

Ahora, necesitamos calcular la desviación, es decir, la diferencia entre los puntos de datos y el valor medio.

Del mismo modo, calcule todos los valores del conjunto de datos.

Ahora, calculemos las desviaciones al cuadrado de cada punto de datos como se muestra a continuación,

La varianza se calcula usando la fórmula dada a continuación

σ 2 = ∑ (X i - μ) 2 / N

  • σ 2 = (64 + 1 + 16 + 36 + 16 + 36 + 4 + 81) / 8
  • σ 2 = 31, 75

Por lo tanto, la varianza del conjunto de datos es 31.75 .

Explicación

La fórmula para una varianza se puede derivar mediante los siguientes pasos:

Paso 1: Primero, cree una población que comprenda una gran cantidad de puntos de datos. Estos puntos de datos serán denotados por X i .

Paso 2: A continuación, calcule el número de puntos de datos en la población que denota N.

Paso 3: Luego, calcule las medias de la población sumando todos los puntos de datos y luego dividiendo el resultado por el número total de puntos de datos (paso 2) en la población. La media poblacional se denota por μ.

μ = X 1 + X 2 + X 3 + X 4 + X 5 / N

o

μ = ∑ X i / N

Paso 4: Luego, reste la media de la población de cada uno de los puntos de datos de la población para determinar la desviación de cada uno de los puntos de datos de la media, es decir (X 1 - μ) es la desviación para el primer punto de datos, mientras que ( X 2 - μ) es para el segundo punto de datos, etc.

Paso 5: A continuación, determine el cuadrado de todas las desviaciones respectivas calculadas en el paso 4, es decir (X i - μ) 2 .

Paso 6: Luego, sume todas las desviaciones cuadradas respectivas calculadas en el paso 5, es decir (X 1 - μ) 2 + (X 2 - μ) 2 + (X 3 - μ) 2 + …… + (X n - μ) 2 o ∑ (X i - μ) 2 .

Paso 7: Finalmente, la fórmula para una varianza se puede derivar dividiendo la suma de las desviaciones al cuadrado calculadas en el paso 6 por el número total de puntos de datos en la población (paso 2) como se muestra a continuación.

σ 2 = ∑ (X i - μ) 2 / N

Relevancia y usos de la fórmula de varianza

Desde la perspectiva de un estadístico, una varianza es un concepto muy importante para comprender, ya que a menudo se usa en la distribución de probabilidad para medir la variabilidad (volatilidad) del conjunto de datos con respecto a su media. La volatilidad sirve como una medida de riesgo y, como tal, se encuentra que la variación es útil para evaluar el riesgo de cartera de un inversor. Una variación cero significa que todas las variables en el conjunto de datos son idénticas. Por otro lado, una varianza más alta puede ser indicativa del hecho de que todas las variables en el conjunto de datos están lejos de la media, mientras que una varianza más baja significa exactamente lo contrario. Tenga en cuenta que la varianza nunca puede ser un número negativo.

Artículos recomendados

Esta ha sido una guía para la fórmula de varianza. Aquí discutimos cómo calcular la varianza junto con ejemplos prácticos y una plantilla de Excel descargable. También puede consultar los siguientes artículos para obtener más información:

  1. Ejemplos de fórmula de variación de cartera (plantilla de Excel)
  2. Guía de fórmula de varianza de población
  3. ¿Qué es la fórmula cuartil?
  4. Fórmula para calcular el tamaño de la muestra