Cómo calcular el inverso de la distribución acumulativa normal estándar

Por macarena cansino ; última actualización 15/08/2019

El inverso de la distribución acumulativa normal estándar es una función que nos provee un valor específico de la variable (z) asociado a un valor de probabilidad acumulada, veamos cómo se calcula.

El inverso de la distribución acumulativa normal estándar es una función que nos provee un valor específico de la variable (Z) asociado a un valor de probabilidad acumulada, siempre que la variable siga una distribución normal con una media  (equis barra) y una desviación estándar “σ” (sigma).

Por ejemplo, de manera no exhaustiva, cuál es el valor máximo de estatura dentro del cual se encontrarán el 60% de los jóvenes jugadores de fútbol (valor que determina una probabilidad menor o igual al 0,60) sabiendo que la media de estatura del equipo es 1,79 metros con una desviación de 0,25 m.

Como tal, no existe una distribución normal inversa, pero sí el inverso de la función de densidad de probabilidad acumulada.

Distribución gaussiana inversa o distribución normar inversa son términos un tanto incorrectos para referirse al inverso de la distribución acumulativa normal o también llamada función de distribución acumulada inversa (ICDF por las siglas en inglés) para la normal o la normal estándar.

Vamos paso a paso para que logres la mayor compresión del tema.

Hablemos un poco de la distribución normal, la normal estándar, la función de probabilidad acumulada, el inverso de la función acumulada normal y finalmente aprendamos a calcular el inverso de la distribución acumulativa normal estándar.

Te puede interesar: ¿Cómo crear un gráfico de desviación estándar en Excel?

La distribución normal

La distribución normal, también llamada distribución de Gauss o gauseana, es por mucho el punto central de las estadísticas. Es el modelo de distribución de probabilidad de variables continuas de mayor uso y más importante de la estadística.

Infinidad de variables de interés común pueden atribuirse a un modelo de distribución normal, como las medidas morfológicas en los individuos de una población y su peso.

En los últimos siglos, numerosos han sido los estudios que atribuyen el comportamiento de variables y fenómenos naturales al modelo de distribución normal.

El sitio español vinculado a la atención médica Fisterra.com nos reseña: “la distribución normal es una de las distribuciones de probabilidad más estudiadas en textos médicos y una de las mejores usadas en la práctica”.

Solo por mencionar algunos casos, se atribuye la distribución normal a variables como:

  • Las medidas anatómicas de los individuos de una población o especie: Estatura, tamaño de algún órgano, medida de los huesos. 
  • El efecto de un fármaco sobre alguno de los caracteres fisiológicos. 
  • El coeficiente intelectual y otras características psicológicas.
  • Medidas de tensión arterial, lípidos, glucosa en sangre.
  • Comportamiento de consumidores en marketing, como consumo promedio de determinado artículo. 

Algunas características de la distribución normal

Algunas características o propiedades muy comprensibles de la distribución normal son:

  • Su media o esperanza es igual a “µ” (miú).
  • Posee una varianza denotada como “σ2” (sigma cuadrado).
  • La desviación estándar es  2 por lo tanto igual a σ (sigma). 
  • Cuando una variable X sigue una distribución normal, con media “µ” y desviación “σ”, se denota X~ N(µ,σ) 
  • Tiene forma de campana de gauss, dado que es simétrica en la diferencia de sus valores respecto a  µ. 
  • Tanto su media como su moda y mediana tienen coincidencia en  µ. 
  • Su gráfica en forma de campana, es asintótica en el eje horizontal (eje X).
  • Siempre existirá un 95% de probabilidad de que el valor de una variable normal este comprendido entre µ- 1.96σ y  µ+ 1.96σ.

Te puede interesar: ¿Cómo crear un gráfico de distribución normal en Excel?

¿Qué es la distribución normal estándar?

Una distribución normal estándar se denota N (0,1) es una distribución normal con media igual a cero y desviación estándar igual a 1. Fisterra.com nos explica la importancia y la aplicabilidad de la distribución normal estándar.

Cualquier variable “X” que se distribuye normal con parámetros o estimadores (µ,σ) puede generar una característica de “estandarización” o se puede convertir en una distribución normal estándar Z~ N(0,1) mediante la transformación Z = (X - µ)/σ, a ello también se le llama “tipificación de la normal”.

Es una propiedad muy usada en la práctica, por cuanto, para la distribución normal estándar se tienen tablas de probabilidad acumulada “p(Z ≤ zi)” a partir de la cual se lee fácilmente el valor de probabilidad de un dato menor o igual a cierto valor de Z denotado “zi”.

La estandarización o “tipificación” permite resolver simples aplicaciones o aproximaciones del comportamiento de variables a las que se puede atribuir un comportamiento de normalidad.

Por otra parte si despejas “X” de la fórmula Z = (X - µ)/σ. Tendrás las expresión X= Z*σ + µ.

La cual, te permite obtener el valor de la variable “X” dado cierto valor de Z, a una media y varianza conocida o inverso de la distribución acumulativa normal estándar.

De esta forma se puede obtener valores para cualquier variable normal a partir de un valor de “Z” tabulado correspondiente a distribución normal estándar.

Más sobre el tema: ¿Cómo calcular datos normalizados?

¿En qué consiste la función de probabilidad acumulada?

La función de distribución acumulada (FDA) o función de densidad de probabilidad acumulada de una variable “X” medida en un valor específico “xi” es la probabilidad de que la variable tome un valor menor o igual a “xi”.

En el caso de la distribución normal, como una de las distribuciones que aplica a variables continuas, la FDA es el área bajo la función de densidad de probabilidad (o de campana de Gauss) comprendida entre el infinito negativo hasta “xi” (equis sub i).

Las tablas de la normal estándar o comúnmente llamada tabla de la distribución normal no son otra cosa que la tabulación de la FDA para determinado valor de Z con dos decimales de apreciación.

Puedes encontrar ejemplares de la tabla normal (distribución normal tabla) en sitios reconocidos como el Departamento de Matemáticas de la Universidad de Arizona.

Te puede interesar: ¿Cómo utilizar Excel para realizar una campana de Gauss?

¿Cómo calcular la probabilidad de una distribución normal?

Las formas más comunes y simples para calcular el valor de probabilidad de una distribución normal son mediante el uso de la tabla normal estándar o apoyándose en una hoja de cálculo.

Menos común resulta el uso de calculadoras de distribución normal, una de ellas Easycalculation.com.

Vayamos a un ejemplo.

Volvamos al ejemplo del equipo de fútbol masculino donde la media de estatura es 1,79 metros con una desviación estándar de 0,25 m. queremos conocer la probabilidad de que al elegir un jugador al azar este mida a lo sumo 1,84 metros.

Si queremos hacer esta apreciación por tabla, debemos conocer el valor de Z.

Usamos la ecuación Z = (X - µ)/σ. Dónde:

  • Z es el valor normal estándar con el que iremos a la tabla y obtendremos la FDA. 
  • X es la estatura máxima del jugador (valor dado) de 1,84 metros. 
  • µ es la media de estatura del equipo de 1,79 metros.
  • σ es la desviación estándar (variación de estatura respecto a la media) del equipo 0,25 m.  

Calculamos Z = (1,84 m – 1,79 m)/0,25 m = 0,20. Con ese valor vamos a tabla normal y buscamos el valor de probabilidad (FDA) acumulada a la izquierda.

A nivel del reglón o fila buscamos 0,2 y en las columnas nos ubicamos en .00 en el cruce o intercepción leemos el valor 0,57926 que corresponde con el valor de probabilidad requerido.

La probabilidad de que la estatura del jugador sea a lo sumo 1.84 metros es superior a 0,5 e igual a 0,5793.

¿Qué es el inverso de la distribución normal?

El Centro de Soporte del programa estadístico Minitab nos explica que el inverso de la distribución normal, es el valor específico de la variable (xi) que satisface un valor de densidad de probabilidad acumulada.

Respecto al inverso de la distribución acumulada normal estándar es el valor de “Z” dado un valor de probabilidad p(Z≤ zi).

También llamada función de distribución acumulada inversa (ICDF), es una ecuación que nos determinada el valor de la variable a partir de un valor de probabilidad conocido en apoyo de la distribución normal estándar.

La fórmula de la función de distribución normal inversa como tal, es muy compleja, por lo que resulta difícil de calcular con lápiz y papel.

Sin embargo, los programas de hojas de cálculo a menudo incluyen funciones diseñadas para encontrar el valor de esta función; veamos cómo.

Más sobre el tema: ¿Cómo encontrar el valor Z en Microsoft Excel?

Calcular el inverso de la distribución acumulativa normal estándar

Nos enfocaremos en como calcular el inverso para la distribución normal mediante paquetes de hojas de cálculo como Open Office o Excel.

Inverso de la normal estándar con Open Office

Si no lo tienes disponible debes descargar e instalar Open Office Calc. Carga el programa y selecciona Spreadsheet. Esto te llevará a una hoja de cálculo Open Office en blanco.

Ve a la celda A1 e ingresa "media". En la celda A2, ingresa "desviación estándar". Ve a la celda B1 e ingresa el valor cero (0), y en la B2, el uno (1), ello por cuanto la distribución normal estándar tiene una media igual a cero, y el desvío estándar igual a 1.

Ve a la celda C1 y escribe “valor de probabilidad”. Comenzando en la columna C2, escribe la probabilidad como números entre cero (0%) y uno (100%).

Si deseas calcular más de una distribución estándar inversa, tendrás una probabilidad diferente para cada cálculo. Escribe todas tus probabilidades (si tienes más de una), en la columna C.

Recuerda, la función acumulativa estándar inversa toma la probabilidad como una entrada, y ésta es siempre un número entre cero y uno, pero nunca es igual a cero o uno.

Ve a la columna D1 e ingresa “distribución normal estándar inversa”. Escribe la fórmula para la distribución normal inversa en la celda D2.

Las entradas de la fórmula son: el valor de probabilidad, la media y la desviación estándar. La fórmula es: “= NORMINV (C2; $A$2; $B$2)”.

Recuerda que los signos de dólar "$" son necesarios para que la media y la desviación sean constantes cuando se copia y pega la fórmula.

Si tienes que calcular más de una inversa, copia y pega la fórmula de la celda D2 tantas celdas de la columna D, como sea necesario.

En la columna D tendrás todos los valores de la función inversa, recuerda, estos son valores de Z que satisfacen cada uno de los valores de probabilidad acumulada.

La función =NORMINV() toma a la probabilidad, a la media y la desviación estándar como entradas y como salida al valor de Z (o X) que los satisface (valor de la función acumulativa inversa estándar).

Una forma sencilla de comprobar la exactitud de tus cálculos es utilizar la función de Open Office llamada “NORMSDIST()”.

Si utilizas el resultado de NORMINV en la celda E2, obtendrás la probabilidad (que será el mismo número en C2). Por ejemplo: si ingresas "=NORMDIST(D2)" en la celda E2 con los mismos argumentos, el resultado será igual a lo mostrado en C2 y así sabrás que has hecho el procedimiento correcto.

Te puede interesar: ¿Cómo hacer la distribución Weibull en Excel?

Inverso de la distribución acumulada normal con Excel

Si deseas utilizar Excel en lugar de Open Office, la fórmula INV.NORM cumple el mismo objetivo.

Abre un documento u hoja de cálculo en Microsoft Excel. Ve a cualquier celda.

En el menú “Fórmulas” haz clic en “Estadísticas”. Aparecerán todas las fórmulas de Excel aplicables a ese campo.

Selecciona o busca INV.NORM, la cual, corresponde a la fórmula del inverso de la distribución acumulada para la normal.

Aparecerá un cuadro de diálogo con tres campos requeridos.

En el primero ingresas la probabilidad, suponte 0,6. El segundo la media, para nuestro ejemplo inicial 1,79 (metros) y finalmente la desviación estándar, 0,25 según nuestro ejemplo.

La fórmula retornará un resultado que se corresponde con el valor “xi” que satisface la probabilidad p (X ≤xi). En nuestro caso el valor máximo de estatura en metros que determina una probabilidad de 0,6.

En otras palabras el valor máximo de estatura en el que se encuentra el 60% de los jugadores equivalente a 1,85 metros.