La distribución de probabilidad conocida como distribución normal es, por la cantidad de fenómenos que explica, las mas importantes de las distribuciones estadísticas.
A la distribución normal también se le denomina con el nombre de campana de Gauss, pues al representar su función de probabilidad, esta tiene forma de campana.
La distribución normal o de Gauss es sin duda la más importante de cuantas hay, tanto por razones prácticas como teóricas.
Historia de la Distribución Normal
La distribución normal fue presentada por primera vez por Abreham de Moivre en 1738, Laplace uso la distribución normal en el análisis de errores de experimentos, el método de mínimos cuadrados fue introducido por Legendre en 1805. Gauss que afirmaba haber usado el método normal desde 1794, lo justificó rigurosamente en 1809 asumiendo una distribución normal de los errores. EL nombre de Gauss se ha asociado a esta distribución porque la usó con profusión cuando analizaba datos astronómicos.
El nombre de "campana" viene de Espirit Jouffret que usó el termino "bell sirface" (superficie campana) por pirmera vez en 1872 para una distribución normal bivariante de componentes independientes. El nombre de "distribución normal" fue otorgado independientemente por Charles S., Francis Galton y Wilhelm Lexis hacis 1875.
La Curva Normal
Es la gráfica de la llamada función de densidad de probabilidad
donde µ es la medida poblacional o σ es la desviación de la población. Cuando los parámetros de la ecuación toman los valores µ = 0 y σ = 0, la curva se llama curva norma estandarizada y es el que se usa con mucha frecuencia en estadísticas. La integral definida de dicha función
lo que significa que el área bajo la curva, dentro de esos límites es 1
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecer en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.
Al considerar distribuciones binomiales, tipo B (n, p) para un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencia se aproximan a una curva en "forma de campana".
La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal.
- Caracteres morfológicos de individuos (personas, animales, plantas, etc.) de una especie, ejemplo: tallas, pesos, envergaduras, diámetro, perímetro.
- Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.
- Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.
- Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio.
- Errores cometidos al medir ciertas magnitudes.
- Valores estadísticos maestrales, por ejemplo: la media.
- Otras distribuciones como la binomial o la Poisson son aproximaciones normales.
En una curva normal las tres medidas de tendencia central coinciden en el centro, la media, la moda, la mediana, si acaso, puede haber una escasa diferencia entre alguna de ellas. También es asimétrica respecto de la media, que es el punto más elevado de la curva y por lo tanto, el área bajo la curva hacia la izquierda de la media es el 50% y el otro 50% se localiza a la derecha.
Una característica muy importante de la curva es que a partir de su eje simetría se puede dividir
Cuando se habla de la distribución normal, realmente se está hablando de una familia de curvas. Como se puede apreciar en la función de la curva norma, la curva depende de dos variables además de la variable de la variable independiente x, tales como la media, y la desviación estándar. Por lo tanto se tendrá curvas diferentes para funciones con desviación estándar diferente aun cuando sus medias fueses iguales, como se muestra en la siguiente imagen
Las curvas tienen desviación estándar igual y la media es diferente, las curvas serán idénticas pero centradas en diferente posición en el eje horizontal.
Unidad de la Distribución Normal como Patrón
Un modelo probabilístico es un modelo matemático que describe el comportamiento de una variable aleatoria. Es una función que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una población en particular y que se denominan parámetros del modelo.
La distribución normal es construida a partid de la distribución de frecuencias relativas de clase de un grupo de datos. Se construye a partir del histograma de proporciones. Una distribución normal es aquella curva que sigue una forma de "campana".
La distribución normal es construida a partid de la distribución de frecuencias relativas de clase de un grupo de datos. Se construye a partir del histograma de proporciones. Una distribución normal es aquella curva que sigue una forma de "campana".
Si una distribución se aproxima o no a una curva normal, es obvio que no basta con saber si esta tiene forma de campana o no; otras distribuciones tienen una forma un tanto parecida, además de que la campana puede tener alturas distintas, según el tipo de distribución del que se trate.
Uso de la Curva Normal
Las distribuciones de frecuencia, aunque manifiestan un comportamiento norma, no necesariamente pueden ser comparadas en virtud de que los parámetros µ y σ serán diferentes en cada caso.
Normalizar la curva es obtener tasas o proporciones de cada desviación respecto de su media. Estas tasas o proporciones tiene unidades de media, y en todo caso, la media de la distribución resultante será cero. Para obtener una medida estándar de cualquier distribución obtenemos su desviación respecto de la media y la normalización de acuerdo con su desviación, es decir, si llamamos z a la nueva media estandarizada, cada valor de z se obtiene así:
Normalizar la curva es obtener tasas o proporciones de cada desviación respecto de su media. Estas tasas o proporciones tiene unidades de media, y en todo caso, la media de la distribución resultante será cero. Para obtener una medida estándar de cualquier distribución obtenemos su desviación respecto de la media y la normalización de acuerdo con su desviación, es decir, si llamamos z a la nueva media estandarizada, cada valor de z se obtiene así:
Distribución Normal Bivariada
Es una generalización de la distribución normal unidimensional a dimensiones superiores.
Cuando hay más de una variable aleatoria presente, es decir, hay dos o más, siempre está la posibilidad de que alguna manera esté relacionada. Por eso se trabaja con sun función de distribución conjunta.
Se habla en ese caso de un vector aleatorio, distribuido según una función de distribución Fx que ahora toma sus valores en (donde n es la cantidad de variables).
Para la distribución normal bivariante, la curva de regresión es la recta obtenida representado:
No hay comentarios:
Publicar un comentario