Calcular varianza muestral

Calcular varianza muestral

Cuartil

Para escribir la ecuación que define la varianza, lo más sencillo es utilizar el operador de suma, Σ. El operador de suma no es más que una forma abreviada de escribir: “Toma la suma de un conjunto de números”. Como ejemplo, mostraremos cómo usaríamos el operador de suma para escribir la ecuación para calcular el valor medio del conjunto de datos 1. Empezaremos asignando cada número a la variable, X1-X6, de esta manera:
Piensa en la variable (X) como la cantidad medida de tu experimento -como el número de hojas por planta- y piensa que el subíndice indica el número de ensayo (1-6). Para calcular el número medio de hojas por planta, primero tenemos que sumar los valores de cada uno de los seis ensayos. Utilizando el operador de suma, lo escribiríamos así:
A veces, para simplificar, se omiten los subíndices, como hicimos a la derecha, arriba. La supresión de los subíndices hace que las ecuaciones estén menos recargadas, pero se sigue entendiendo que se están sumando todos los valores de X.
Ahora que sabes cómo funciona el operador de suma, puedes entender la ecuación que define la varianza de la población (ver la nota al final de esta página sobre la diferencia entre la varianza de la población y la varianza de la muestra, y cuál deberías usar para tu proyecto de ciencias):

Desviación estándar

Varianza s2 = Desviación Estándar s = Recuento n = Media \( \overline{x} \) = Suma de Cuadrados SS = Solución[ s^{2} = \dfrac{sum_{i=1}^{n}(x_i – \overline{x})^{2}{n – 1} \]^{2} = \dfrac{SS}{n – 1} \} \Para obtener estadísticas más detalladas, utilice la calculadora de estadísticas descriptivas
La varianza es una medida de la dispersión de los puntos de datos con respecto a la media. Una varianza baja indica que los puntos de datos son generalmente similares y no varían mucho de la media. Una varianza alta indica que los valores de los datos tienen una mayor variabilidad y están más dispersos de la media.
La fórmula de la varianza de a es la suma de las diferencias al cuadrado entre cada punto de datos y la media, dividida por el número de valores de datos. Esta calculadora utiliza las siguientes fórmulas en sus cálculos de varianza.

Gama

Ahora que tenemos la distribución muestral de la media de la muestra, vamos a centrar nuestra atención en encontrar la distribución muestral de la varianza de la muestra. El siguiente teorema nos servirá para ello.
Ahora vamos a demostrar el número 2. Esta es una de esas demostraciones que quizás tengas que leer dos veces… quizás leerla la primera vez sólo para ver a dónde vamos con ella, y luego, si es necesario, leerla de nuevo para captar los detalles. Vamos a empezar con una función que llamaremos \ ~ (W\):
Bien, vamos a hacer una pausa aquí para ver lo que tenemos. Hemos tomado la cantidad del lado izquierdo de la ecuación anterior, le hemos añadido 0 y hemos demostrado que es igual a la cantidad del lado derecho. Ahora, qué podemos decir de cada uno de los términos. Bien, el término del lado izquierdo de la ecuación
es una suma de \ ~ (n\) variables aleatorias independientes chi-cuadrado (1). Eso es porque hemos asumido que \(X_1, X_2, \ldots, X_n\) son observaciones de una muestra aleatoria de tamaño \(n\) de la distribución normal \(N(\mu, \sigma^2)\N.) Por lo tanto:

Fórmula de la varianza de la población

La desviación estándar de la media (DE) es la medida más utilizada de la dispersión de los valores en una distribución. La DE se calcula como la raíz cuadrada de la varianza (la desviación media al cuadrado de la media).
La SD es la mejor medida de dispersión de una distribución aproximadamente normal. No es el caso cuando hay valores extremos en una distribución o cuando la distribución es asimétrica, en estas situaciones el rango intercuartil o el semi-intercuartil son las medidas de dispersión preferidas. El rango intercuartil es la diferencia entre los centiles 25 y 75. El rango semi-intercuartil es la mitad de la diferencia entre los centiles 25 y 75. Para cualquier distribución simétrica (no sesgada), la mitad de sus valores se encontrarán a un rango semi-intercuartil a cada lado de la mediana, es decir, en el rango intercuartil. Cuando las distribuciones son aproximadamente normales, la DE es una mejor medida de la dispersión porque es menos susceptible a la fluctuación del muestreo que el rango (semi)intercuartílico.

Acerca del autor

admin

Ver todos los artículos