martes, 3 de junio de 2014

Distribución normal

La distribución normal fue definida por De Moivre en 1733 y es la distribución de mayor importancia en el campo de la estadística.

Una variable es normal cuando se ajusta a la ley de los grandes números, es decir, cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas causas de efecto infinitesimal.

Las variables normales tienen una función de densidad con forma de campana a la que se llama campana de Gauss.

Su función de densidad es la siguiente:

Los parámetros de la distribución son la media y la desviación típica, μ y σ, respectivamente. Como consecuencia, en una variable normal, media y desviación típica no deben estar correlacionadas en ningún caso (como desgraciadamente ocurre en la inmensa mayoría de las variables aleatorias reales que se asemejan a la normal.

La curva normal cumple las siguientes propiedades:

1) El máximo de la curva coincide con la media.

2) Es perfectamente simétrica respecto a la media (g₁ = 0).

3) La curva tiene dos puntos de inflexión situados a una desviación típica de la media. Es convexa entre ambos puntos de inflexión y cóncava en ambas colas.

4) Sus colas son asintóticas al eje X.

Para calcular probabilidades en intervalos de valores de la variable, habría que integrar la función de densidad entre los extremos del intervalo. por desgracia (o por suerte), la función de densidad normal no tiene primitiva, es decir, no se puede integrar. Por ello la única solución es referirse a tablas de la función de distribución de la variable (calculadas por integración numérica) Estas tablas tendrían que ser de triple entrada (μ, σ, valor) y el asunto tendría una complejidad enorme.

Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una correspondencia de sus valores con los de otra variable con distribución normal, media 0 y varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas variables se obtiene mediante la ecuación:

La función de distribución de la variable normal tipificada está tabulada y, simplemente, consultando en las tablas se pueden calcular probabilidades en cualquier intervalo que nos interese.

De forma análoga a lo pasaba con las variables Poisson, la suma de variables normales independientes es otra normal.


Histograma de una normal idealizada	Histograma de una muestra de una variable normal

Distribución exponencial

La distribución exponencial es el equivalente continuo de la distribución geométrica discreta. Esta ley de distribución describe procesos en los que:

Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un instante t_f, no depende del tiempo transcurrido anteriormente en el que no ha pasado nada.

Ejemplos de este tipo de distribuciones son:

El tiempo que tarda una partícula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se utiliza en Ciencia para, por ejemplo, la datación de fósiles o cualquier materia orgánica mediante la técnica del carbono 14, C¹⁴;
El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un paciente;
En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos sigue un modelo probabilístico exponencial. Por ejemplo, el tiempo que transcurre entre que sufrimos dos veces una herida importante.

Concretando, si una v.a. continua X distribuida a lo largo de $I\!\!R^+$ , es tal que su función de densidad es
$\begin{displaymath}{ \mbox{\fbox{$\displaystyle f(x) = \lambda e^{-\lambda x} \mbox{si } 0<x $ } } } \end{displaymath}$
se dice que sigue una distribución exponencial de parámetro $\lambda$ , $X{\leadsto}{ {{\bf Exp} \left( \lambda \right)} }$ .

**Figura:** Función de densidad, f, de una ${ {{\bf Exp} \left ( \lambda \right )} }$ .
$\includegraphics[angle=-90, width=0.8\textwidth]{fig06-04.epsi}$

Un cálculo inmediato nos dice que si x>0,

$\begin{displaymath}\int_0^x \lambda e^{-\lambda t} \, dt = \left. -e^{-\lambda t} \right]_0^x = 1 - e^{-\lambda x} \end{displaymath}$

luego la función de distribución es:

$\begin{displaymath}F(x) = \left\{ \begin{array}{ll} 1 - e^{-\lambda x} & \mbox{si } 0<x \\ \\ 0 & \mbox{ en otro caso.} \end{array}\right. \end{displaymath}$

**Figura:** Función de distribución, F, de ${ {{\bf Exp} \left ( \lambda \right )} }$ , calculada como el área que deja por debajo de sí la función de densidad.
$\includegraphics[angle=-90, width=0.8\textwidth]{fig06-05.epsi}$

Para calcular el valor esperado y la varianza de la distribución exponencial, obtenemos en primer lugar la función característica

$\begin{displaymath}\phi_X(t) = \int_0^{+\infty} e^{itx} \lambda e^{-\lambda x}\,... ...-\lambda)x} \right]_0^{+\infty} = - \frac{\lambda}{it-\lambda} \end{displaymath}$

para después, derivando por primera vez

$\begin{eqnarray}\html{eqn61}\nonumber \phi_X^,(t) &=& \frac{\lambda i}{(it-\lamb... ...ight]} } &=& \frac{\phi_X^,(0)}{i} = \frac{1}{\lambda} \nonumber \end{eqnarray}$

y derivando por segunda vez,

$\begin{eqnarray}\html{eqn61}\nonumber \phi_X^{,,}(t) &=& \frac{-2 \lambda i^2}{(... ...} = \frac{-2 \lambda}{-\lambda^3} =\frac{2}{\lambda^2} \nonumber \end{eqnarray}$

Entonces la varianza vale

$\begin{displaymath}{ {{\bf Var } \left[ X \right]} }={ {{\bf E} \left[ X^2 \righ... ...a^2} - \left(\frac{1}{\lambda}\right)^2 =\frac{1}{\lambda^2} \end{displaymath}$

6.8.4.1 Ejemplo

En un experimento de laboratorio se utilizan 10 gramos de $\,_{84}^{210}\!Po$ . Sabiendo que la duración media de un átomo de esta materia es de 140 días, ¿cuantos idas transcurrirán hasta que haya desaparecido el $90\%$ de este material?

Solución: El tiempo T de desintegración de un átomo de $\,_{84}^{210}\!Po$ es una v.a. de distribución exponencial:

$\begin{eqnarray}\html{eqn61}T{\leadsto}{ {{\bf Exp} \left( \lambda=\frac{1}{140}... ... &\Longleftrightarrow&\qquad F(t)=1 - e^{-\lambda \,t} \nonumber \end{eqnarray}$

Como el número de átomos de $\,_{84}^{210}\!Po$ existentes en una muestra de 10 gramos es enorme, el histograma de frecuencias relativas formado por los tiempos de desintegración de cada uno de estos átomos debe ser extremadamente aproximado a la curva de densidad, f. Del mismo modo, el polígono de frecuencias relativas acumuladas debe ser muy aproximado a la curva de su función de distribución F. Entonces el tiempo que transcurre hasta que el $90\%$ del material radiactivo se desintegra es el percentil 90, t₉₀, de la distribución exponencial, es decir

$\begin{displaymath}F(t_{90}) = 0,9 \;\;\Leftrightarrow\;\;e^{-\lambda\,t_{90}}= ... ...t_{90}=- \frac{1}{\lambda}\, \ln 0,1 \approx 322 \mbox{ días} \end{displaymath}$

**Figura:** Como el número de átomos (observaciones) es extremadamente alto en 10 gramos de materia, el histograma puede ser aproximado de modo excelente por la función de densidad exponencial, y el polígono de frecuencias acumuladas por la función de distribución.
$\includegraphics[angle=-90, width=0.8\textwidth]{fig06-06.epsi}$

6.8.4.2 Ejemplo

Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribución exponencial con media de 16 años. ¿Cuál es la probabilidad de que a una persona a la que se le ha implantado este marcapasos se le deba reimplantar otro antes de 20 años? Si el marcapasos lleva funcionando correctamente 5 años en un paciente, ¿cuál es la probabilidad de que haya que cambiarlo antes de $25\%$ años?

Solución: Sea T la variable aleatoria que mide la duración de un marcapasos en una persona. Tenemos que

$\begin{eqnarray}\html{eqn61}T{\leadsto}{ {{\bf Exp} \left( \lambda=\frac{1}{16} ... ... &\Longleftrightarrow&\qquad F(t)=1 - e^{-\lambda \,t} \nonumber \end{eqnarray}$

Entonces

$\begin{displaymath}{{\cal P}}[T\leq 20] = \int_0^{20}\, f(t)\,dt = F(20) = 1-e^{-\frac{20}{16}}= 0,7135 \end{displaymath}$

En segundo lugar

$\begin{eqnarray}\html{eqn61}{{\cal P}}[T\leq 25_{\mid T\geq 5}] &=& \displaystyl... ...tminus}-1{\!\!\!\setminus} +e^{-\frac{5}{16}} = 0,7316 \nonumber \end{eqnarray}$

Luego como era de esperar, por ser propio a un mecanismo exponencial,

$\begin{displaymath}{{\cal P}}[T\leq 25_{\mid T\geq 5}] = {{\cal P}}[T\leq 20] \end{displaymath}$

o sea, en la duración que se espera que tenga el objeto, no influye en nada el tiempo que en la actualidad lleva funcionando. Es por ello que se dice que ``la distribución exponencial no tiene memoria".

Teorema de Bayes

Esperanza matemática

La esperanza matemática o valor esperado de una variable aleatoria discreta es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso.

Los nombre de esperanza matemática y valor esperado tienen su origen en los juegos de azar y hacen referencia a la ganancia promedio esperada por un jugador cuando hace un gran número de apuestas.

Si la esperanza matemática es cero, E(x) = 0, el juego es equitativo, es decir, no existe ventaja ni para el jugador ni para la banca.

Ejemplos
Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 € ó un segundo premio de 2000 € con probabilidades de: 0.001 y 0.003. ¿Cuál sería el precio justo a pagar por la papeleta?

E(x) = 5000 · 0.001 + 2000 · 0.003 = 11 €

Un jugador lanza dos monedas. Gana 1 ó 2 € si aparecen una o dos caras. Por otra parte pierde 5 € si no aparece cara. Determinar la esperanza matemática del juego y si éste es favorable.

E = {(c,c);(c,x);(x,c);(x,x)}

p(+1) = 2/4

p(+2) = 1/4

p(−5) = 1/4

E(x)= 1 · 2/4 + 2 · 1/4 - 5 · 1/4 = −1/4. Es desfavorable

Distribución hipergeométrica

Una variable tiene distribución hipergeométrica si procede de un experimento que cumple las siguientes condiciones:

1) Se toma una muestra de tamaño n, sin reemplazamiento, de un conjunto finito de N objetos.

2) K de los N objetos se pueden clasificar como ‚éxitos y N - K como fracasos.

X cuenta el número de ‚éxitos obtenidos en la muestra. El espacio muestral es el conjunto de los números enteros de 0 a n, ó de 0 a K si K < n.

En este caso, la probabilidad del ‚éxito en pruebas sucesivas no es constante pues depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son independientes entre sí.

La función de probabilidad de la variable hipergeométrica es:

Los parámetros de la distribución son n, N y K.

Los valores de la media y la varianza se calculan según las ecuaciones:

Si n es pequeño, con relación a N (n << N), la probabilidad de un ‚éxito variar muy poco de una prueba a otra, así pues, la variable, en este caso, es esencialmente binomial; en esta situación, N suele ser muy grande y los números combinatorios se vuelven prácticamente inmanejables, así pues, la probabilidades se calculan más cómodamente aproximando por las ecuaciones de una binomial con p = K / N.

La media de la variable aproximada (μ = n p = n (K / N)) es la misma que la de la variable antes de la aproximación; sin embargo, la varianza de la variable binomial es ligeramente superior a la de la hipergeométrica.

el factor por el que difieren ser siempre menor que 1 y tan próximo a 1 como cierto sea que n << N.

El aspecto de la distribución es bastante similar al de la binomial. Como ejemplo, mostramos los casos análogos a los de las binomiales del apartado anterior (p inicial = 0,25 y n = 4)

Distribución binomial

La distribución binomial es típica de las variables que proceden de un experimento que cumple las siguientes condiciones:

1) El experimento está compuesto de n pruebas iguales, siendo n un número natural fijo.

2) Cada prueba resulta en un suceso que cumple las propiedades de la variable binómica o de Bernouilli, es decir, sólo existen dos posibles resultados, mutuamente excluyentes, que se denominan generalmente como éxito y fracaso.

3) La probabilidad del ‚éxito (o del fracaso) es constante en todas las pruebas. P(éxito) = p ; P(fracaso) = 1 - p = q

4) Las pruebas son estadísticamente independientes,

En estas condiciones, la variable aleatoria X que cuenta el número de ‚éxitos en las n pruebas se llama variable binomial. Evidentemente, el espacio muestral estar compuesto por los números enteros del 0 al n. Se suele decir que una variable binómica cuenta objetos de un tipo determinado en un muestreo de n elementos con reemplazamiento.

La función de probabilidad de la variable binomial se representa como b(x,n,p) siendo n el número de pruebas y p la probabilidad del ‚éxito. n y p son los parámetros de la distribución.

La manera más fácil de calcular de valor de números combinatorios, como los incluidos en la expresión anterior, es utilizando el triángulo de Tartaglia

La media y la varianza de la variable binomial se calculan como:

Media = μ = n p

Varianza = σ² = n p q

Gráficamente el aspecto de la distribución depende de que sea o no simétrica Por ejemplo, el caso en que n = 4:

Distribución de probabilidad de variables aleatorias discretas

Variables aleatorias discretas

Distribución uniforme

La distribución uniforme es la que corresponde a una variable que toma todos sus valores, x₁, x₂... , x_k, con igual probabilidad; el espacio muestral debe ser finito.

Si la variable tiene k posibles valores, su función de probabilidad sería:

donde k es el parámetro de la distribución (un parámetro es un valor que sirve para determinar la función de probabilidad o densidad de una variable aleatoria)

La media y la varianza de la variable uniforme se calculan por las expresiones:

El histograma de la función toma el aspecto de un rectángulo, por ello, a la distribución uniforme se le suele llamar distribución rectangular.

Teorema de Bayes ejercicios resueltos

EJEMPLO 1

En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos de 24 meses. Un pediatra que ingresa a la sala selecciona un infante al azar.

a. Determine el valor de la probabilidad de que sea menor de 24 meses.

b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una niña.

SOLUCIÓN:

Se definen los sucesos:

Suceso H: seleccionar una niña.

Suceso V: seleccionar un niño.

Suceso M: infante menor de 24 meses.

En los ejercicios de probabilidad total y teorema de bayes, es importante identificar los sucesos que forman la población y cuál es la característica que tienen en común dichos sucesos. Estos serán los sucesos condicionados.

a. En este caso, la población es de los infantes. Y la característica en común es que sean menores de 24 meses. Por lo tanto, la probabilidad de seleccionar un infante menor de 24 meses es un ejemplo de probabilidad total. Su probabilidad será:

b. Para identificar cuando en un ejercicio se hace referencia al teorema de bayes, hay que partir de reconocer esta es una probabilidad condicionada y que la característica común de los sucesos condicionantes ya ha ocurrido. Entonces, la probabilidad de que sea niña una infante menor de 24 meses será:

EJEMPLO 2

Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías correctivas. Se sabe además, que son de genero masculino el 25% de los que se realizan correcciones faciales, 15% implantes mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine:

a. Determine la probabilidad de que sea de género masculino

b. Si resulta que es de género masculino, determine la probabilidad que se haya realizado una cirugía de implantes mamarios.

SOLUCIÓN:

Se definen los sucesos:

Suceso F: pacientes que se realizan cirugías faciales

Suceso M: pacientes que se realizan implantes mamarios

Suceso O: pacientes que se realizan otras cirugías correctivas

Suceso H: pacientes de género masculino

a. La probabilidad de que sea de género masculino se refiere a un problema de probabilidad total, ya que es el suceso condicionado y las cirugías los condicionantes. Dicho valor será:

b. Como el suceso condicionado ha ocurrido entonces se aplica el teorema de bayes, luego, el valor de la probabilidad será:

EJEMPLO 3

Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada equipo es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen probabilidades de error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía y observa que tiene un error. Determine la probabilidad de que se ha usado el primer aparato.

SOLUCIÓN:

Se definen los sucesos:

Suceso P: seleccionar el primer aparato

Suceso S: seleccionar el segundo aparato

Suceso T: seleccionar el tercer aparato

Suceso E: seleccionar un resultado con error

Se puede observar que la pregunta es sobre determinar la probabilidad de que un examen errado sea del primer aparato, es decir, ya ha ocurrido el error. Por lo tanto, debemos recurrir al teorema de bayes. Claro está, que es necesario de igual forma obtener la probabilidad de que los aparatos produzcan un resultado erróneo, por lo tanto: