SIGNIFICADO DE LA VARIANZA Y DE LA DESVIACIÓN ESTÁNDAR

Considerando que las medidas de tendencia central miden el como los datos se agrupan o amontonan dentro del conjunto de la muestra o la población la Varianza y la Desviación Estándar miden el como los datos de la muestra o la población se dispersan.

Dispersión:

    Cuando se tienen dos o más conjuntos de datos es fácil observar que existe una probabilidad de que los valores de posición central coincidan aunque un conjunto tenga mayor dispersión que el otro o los otros. 

En el siguiente ejemplo se puede visualizar que las tres curvas tienen la misma posición central, aunque la curva A tiene menor variabilidad que la curva B y esta a su vez tiene menor variación que la curva C. Al calcular las medias de estas curvas no se está considerando una diferencia importante que existe entre estas.

Se debe de observar la Media, la Moda y la Mediana sólo muestran la información limitada de las características de los conjuntos de datos - el como se amontonan o se agrupan - por lo que se hace necesario ampliar el conocimiento sobre el comportamiento de los datos como lo es la dispersión o variabilidad que existe entre ellos. De lo anterior se hace necesario obtener información adicional que permita elaborar un juicio sobre la confiabilidad de los valores de tendencia central.

Por ejemplo la curva C presenta una mayor variabilidad de los datos, lo que muestra que el valor de tendencia central es menos representativo considerado como un todo, a diferencia de que éstos se agrupen más estrechamente alrededor de la media como se puede ver en la curva A.

Presiona para amplificar

La dispersión se mide considerando la diferencia de dos valores elegidos del conjunto de datos. Esta dispersión se puede considerar como una medida de desviación promedio las cuales son la Varianza y la Desviación Estándar, que son las cuales permiten visualizar la distancia promedio de cualquier conjunto de datos con respecto a la Media de la distribución. 

Varianza:

Todos los conjuntos de datos ya sea una muestra o una población tienen un valor llamado Varianza y se representa así:

donde la Varianza es el promedio de la desviación de las observaciones con respecto a la media pero elevada al cuadrado, ya que la media divide el conjunto de datos en dos partes iguales de tal manera que al obtener la diferencia de cada uno de los datos con respecto a la media siempre se obtendrá un valor igual a cero, para evitar este problema se ha empleado el método de los mínimos cuadrados permitiendo que todas las diferencias sean positivas y así poder encontrar dicha desviación promedio.

La Desviación Estándar es la forma de poder unificar esa desviación promedio de los datos con respecto a la media y así poder trabajar con las mismas unidades que la muestra o población inicial, ya que, la varianza es equivalente a las unidades de la muestra o población elevadas al cuadrado por la aplicación del método de mínimos cuadrados.

De lo anterior se puede deducir que la Desviación Estándar es la raíz cuadrada de la Varianza y quedaría de la siguiente manera:

 

INICIO                        BIBLIOGRAFÍA                        PROGRAMA