Calcular mediana datos agrupados

Calcular mediana datos agrupados

Comentarios

Por cierto, con los datos de ejemplo que has proporcionado, en los que creo que había un error en uno de tus rangos (todos estaban separados por guiones excepto uno, que estaba separado por una coma), como strsplit utiliza por defecto una expresión regular para dividir, puedes utilizar la función así:
¿Y de esta manera? Cree vectores para cada paréntesis salarial, asumiendo una distribución uniforme en cada banda. Luego haz un gran vector a partir de esos vectores, y toma la mediana. Similar a ti, pero un resultado ligeramente diferente. No soy matemático, así que el método podría ser incorrecto.

Mediana

Ahora, $N=25 \N implica \frac N2 = 12,5$, lo que significa que tenemos que buscar el intervalo que cubre el 12º elemento y el 13º elemento. Observando las frecuencias acumuladas, vemos que el tercer intervalo (20-30) cubre el 12º elemento, mientras que el cuarto (30-40) cubre el 13º. Si se supone que tomamos ambos intervalos como clase mediana para utilizar la fórmula:
Curiosamente, si consideramos el intervalo 30-40 como clase mediana, obtendríamos la misma mediana utilizando la fórmula anterior. Sin embargo, no estoy seguro de que este sea el caso para todos los problemas de este tipo. En ese caso podemos tomar cualquiera de los dos intervalos como clase mediana.
No sé si hay alguna regla para este tipo de situaciones que diga que tenemos que seleccionar la frecuencia acumulada (y por lo tanto el intervalo correspondiente como la clase mediana) que está más cerca del valor de $\frac N2$, en ese caso tenemos que tomar el intervalo 20-30 en este ejemplo como clase mediana. Será estupendo y suficiente si alguien puede confirmar dicha regla.

Cómo calcular la mediana de datos agrupados en excel

Ahora, $N=25 \N implica \frac N2 = 12,5$, lo que significa que tenemos que buscar el intervalo que cubre el 12º elemento y el 13º elemento. Observando las frecuencias acumuladas, vemos que el tercer intervalo (20-30) cubre el 12º elemento, mientras que el cuarto (30-40) cubre el 13º. Si se supone que tomamos ambos intervalos como clase mediana para utilizar la fórmula:
Curiosamente, si consideramos el intervalo 30-40 como clase mediana, obtendríamos la misma mediana utilizando la fórmula anterior. Sin embargo, no estoy seguro de que este sea el caso para todos los problemas de este tipo. En ese caso podemos tomar cualquiera de los dos intervalos como clase mediana.
No sé si hay alguna regla para este tipo de situaciones que diga que tenemos que seleccionar la frecuencia acumulada (y por lo tanto el intervalo correspondiente como la clase mediana) que está más cerca del valor de $\frac N2$, en ese caso tenemos que tomar el intervalo 20-30 en este ejemplo como clase mediana. Será estupendo y suficiente si alguien puede confirmar dicha regla.

Media

Por cierto, con los datos de ejemplo que has proporcionado, en los que creo que había un error en uno de tus rangos (todos estaban separados por guiones excepto uno, que estaba separado por una coma), como strsplit utiliza por defecto una expresión regular para dividir, puedes utilizar la función así:
¿Y de esta manera? Cree vectores para cada paréntesis salarial, asumiendo una distribución uniforme en cada banda. Luego haz un gran vector a partir de esos vectores, y toma la mediana. Similar a ti, pero un resultado ligeramente diferente. No soy matemático, así que el método podría ser incorrecto.

Acerca del autor

admin

Ver todos los artículos