Distribuciones de probabilidad discretas

Distribución Uniforme Discreta

Se dice que la variable aleatoria $X$ tiene una distribución uniforme discreta en los enteros $a, a+1,\ldots, b$, si su distribución de probabilidad es de la forma \begin{align*} p(x) = \frac{1}{b-a+1} \quad \quad x = a,a+1, \ldots, b \end{align*}

Media y Varianza Uniforme Discreta

Si $X\sim Unif\{a, a+1,\ldots,b\}$ entonces se puede probar que la media y varianza de la variable aleatoria $X$ están dadas por \begin{align*} \mathbb{E}(X)=\frac{a+b}{2} \quad \quad Var(X)=\frac{(b-a+1)^2-1}{12} \end{align*}

Distribución Acumulada Uniforme Discreta

Si $X\sim Unif\{a, a+1,\ldots,b\}$ entonces se puede probar que la función de distribución acumulada de la variable aleatoria $X$ es de la forma \begin{align*} F(x) = \frac{x-a+1}{b-a+1} \quad \quad & a\leq x\leq b \end{align*}

Ejercicio

Suponga que se decide realizar una rifa en la Facultad de Ciencias Económicas con el fin de otorgar a uno de sus docentes una bonificación salarial correspondiente a una semana de salario. Para realizar la rifa, la Facultad enumera del \(1\) al \(297\) a la totalidad de docentes, de tal forma que los primeros \(87\) números corresponden a docentes del Departamento de Administración de empresas, los siguientes \(76\) corresponden a docentes del Departamento de Contaduría, los siguientes \(89\) corresponden a docentes del Departamento de Economía, y los números finales a docentes del Departamento de Estadística y Matemáticas. Si sacar cualquier número en la rifa posee la misma probabilidad

  1. Calcule la probabilidad de que el número que se saque en la rifa sea el \(8\)?
  2. Calcule la probabilidad de que el número que se saque en la rifa pertenezca al Departamento de Contaduría?
  3. Calcule la esperanza matemática y desviación estándar de la variable aleatoria?.

Solución

Para resolver este ejercicio, debemos tener en cuenta que todos los números de la rida poseen la misma probabilidad, es decir, nos dicen que la función de masa de probabilidad de la rifa está dada por \[\begin{align*} p(x) = \frac{1}{297-1+1}=\frac{1}{297} \quad \quad x = 1,2, \ldots, 297 \end{align*}\] es decir, que cada uno de los números de la rifa tienen una probabilidad de \(1\) entre \(297\) en salir.

  1. Basados en esta distribución, en el primer punto nos piden calcular la probabilidad de que el número que sale en la rifa sea igual a \(8\), es decir que \[\begin{align*} \mathbb{P}(X=8) \end{align*}\] Entonces, dado que la función de distribución de probabilidad Uniforme discreta, no depende de la variable aleatoria \(X\), se tendrá que esta probabilidad es igual a \[\begin{align*} \mathbb{P}(X=8) &= p(8) \\ &= \frac{1}{297} \\ &= 0.003367003 \end{align*}\] Es decir, que se tendrá un \(3.37\%\) de probabilidad, de que el número elegido por la rifa sea el número \(8\).
  2. En este caso, se nos pide calcular la probabilidad de que el número que se saque en la rifa pertenezca al Departamento de Contaduría, entonces, como nos dicen en el enunciado que los números del \(1\leftrightarrow87\) pertenecen al Departamento Administración de empresas, del \(88\leftrightarrow163\) pertenecen al Departamento de Contaduría, del \(164\leftrightarrow252\) pertenecen al Departamento de Economía y del \(253\leftrightarrow297\) pertenecen al Departamento de Estadística y Matemáticas, así que nuestro interés será calcular \[\begin{align*} \mathbb{P}\left(88 \leq X \leq 163\right) \end{align*}\] Entonces como a función de distribución acumulada de la distribución Uniforme discreta está definida, podemos emplearla para calcula la probabilidad de interés, tal que \[\begin{align*} \mathbb{P}\left(88 \leq X \leq 163\right) &= \mathbb{P}\left(X \leq 163\right) - \mathbb{P}\left(X < 88\right) \\ &= \mathbb{P}\left(X \leq 163\right) - \mathbb{P}\left(X \leq 87\right) \\ &= F(163) - F(87) \\ &= \frac{163-1+1}{297-1+1} + \frac{87-1+1}{297-1+1} \\ &= \frac{163}{297} + \frac{87}{297} \\ &= \frac{76}{297} \\ &= 0.2558923 \end{align*}\] Y por tanto, se tendrá una probabilidad del \(25.59\%\) de que el número seleccionado en la rifa pertenezca al Departamento de Contaduría.
  3. Finalmente, en esta pregunta nos piden calcular la media y desviación estándar de la variable aleatoria, y para ello podemos emplear la definición de esperanza matemática y varianza para el caso de la distribución Uniforme discreta, tal que el valor esperado sería igual a \[\begin{align*} \mathbb{E}(X) &= \frac{1+297}{2} \\ &= \frac{298}{2} \\ &= 149 \end{align*}\] mientras que la varianza es igual a \[\begin{align*} Var(X) &= \frac{(297-1+1)^2-1}{12} \\ &= \frac{88209 - 1}{2} \\ &= \frac{88208}{12} \\ &= 7350.667 \end{align*}\] Ahora, dada la relación que hay entre la varianza y la desviación estándar, se tendrá que \[\begin{align*} Sd(X) &= \sqrt{Var(X)} \\ &= \sqrt{7350.667} \\ &= 85.73603 \end{align*}\] Y por tanto, se tendrá que en promedio, se espera que el número extraído en la rifa será de \(149\), con una desviación estándar de \(85.73603\).

Teoremas de Aproximación

Teorema de Aproximación Hipergeométrica a Binomial

Si $X\sim h(N,M,n)$ con $n$ pequeña en comparación con $N$ ($n/N <0.05$) entonces se dice que $X\stackrel{a}{\sim}b(n,p)$ con $p = M/N$.

Ejercicio

Una gran distribuidora tiene \(800\) equipos de computo, de los cuales se sabe que \(8\) de ellos están defectuosos. Una compañía compra \(20\) de estos y le son despachados al azar. ¿Cuál es la probabilidad de que en la muestra se observen \(2\) o más defectuosos?. Emplee tanto la distribución hipergeométrica como la aproximación a binomial y comente sobre los resultados obtenidos

Solución

En este caso estamos interesados en calcular una probabilidad hipergeométrica de que en una muestra de \(n=20\) equipos de computo, extraídos de un total de \(N=800\) equipos, se encuentren como mínimo \(2\) equipos defectuosos, cuando se sabe que dentro de los \(N=800\) hay un total de \(M=8\) equipos defectuosos, esto es \[\begin{align*} \mathbb{P}(X\geq 2) \end{align*}\] Ahora, antes de plantear la probabilidad, será necesario encontrar los limites en donde está definida la función de probabilidad discreta, tal que \[\begin{align*} \max\{0, M-(N-n)\} &\leq x \leq \min\{M,n\} \\ \max\{0, 8-(800-20)\} &\leq x \leq \min\{8,20\} \\ \max\{0, 8-(780)\} &\leq x \leq \min\{8,20\} \\ \max\{0, -772\} &\leq x \leq \min\{8,20\} \\ 0 &\leq x \leq 8 \\ \end{align*}\] y por tanto, tendremos que el número de equipos de cómputo defectuosos encontrados en la muestra puede ser de \(x=0, 1, 2, \ldots 8\).

Ahora, podemos emplear la distribución hipergeométrica para calcular la probabilidad de interés, tal que \[\begin{align*} \mathbb{P}(X\geq 2) &= \sum_{x=2}^{8} \frac{\left(\begin{array}{c}8\\ x\end{array}\right) \left(\begin{array}{c}792\\ 20-x\end{array}\right)}{\left(\begin{array}{c}800\\ 20\end{array}\right)} \\ &= 0.01520272 \end{align*}\] Es decir, que la probabilidad de que como mínimo se encuentren \(2\) equipos de computo defectuosos dentro de la muestra de \(10\) equipos de computo, extraídos de un grupo de \(800\) de los cuales se sabe queh hay \(8\) artículos defectuosos, es de \(1.52\%.\).

Ahora, si realizamos la aproximación de la distribución hipergeométrica a la distribución binomial que resultado tendríamos?.

Para ello será necesario calcular el valor del parámetro \(p\) de la distribución binomial, el cual está dado por \[\begin{align*} p &= \frac{M}{N} \\ &= \frac{8}{800} \\ &= 0.01 \end{align*}\] Es decir que la distribución \(h(N=800, M=8, n=20)\) puede aproximarse a una distribución \(b(n=20, p=0.01)\), donde observamos que \(n/N = 20/800 = 0.025\), y por tanto, se tendrá que la aproximación debería ser buena, debido a que cumple la condición de la aproximación.

Entonces, al emplear la distribución binomial para calcula la probabilidad tendremos que \[\begin{align*} \mathbb{P}(X\geq 2) &= \sum_{x=2}^{20} \left(\begin{array}{c}20\\ x\end{array}\right)0.01^x(1-0.01)^{20-x}\\ &= 0.01685934 \end{align*}\] Lo cual indica que, al realizar la aproximación, se tiene un \(1.69\%\) de probabilidad de encontrar al menos \(2\) equipos de computo defectuosos de una muestra de \(20\) artículos seleccionados, cuando la probabilidad de que un artículo sea defectuoso es del \(1\$\).

Al observar las dos probabilidades anteriores, la calculada con la distribución hipergeométrica \(1.52\%\), y la calculada con la aproximación binomial \(1.69\%\), donde se aprecia que las dos son relativamente similares, y en consecuencia, se dice que la aproximación binomial dadas las características del ejercicio ofrece una buena aproximación al que se obtendría con la distribución hipergeométrica.

Teorema de Aproximación Binomial a Poisson

Si $X\sim b(n,p)$ con $n$ grande $(n\geq 100)$ y $p$ pequeña $(p\leq 0.01)$ entonces se dice que $X\stackrel{a}{\sim}P(\lambda)$ donde $\lambda = np$

Ejercicio

Suponga que al realizar un estudio sobre un proceso de producción, se encontró que el \(3\%\) de los artículos producidos resultaba tener algún tipo de defecto. Si se producen \(900\) artículos en un día, cuál es la probabilidad de que \(30\) artículos o menos resulten tener algún tipo de defecto. Emplee tanto la distribución binomial como la aproximación a Poisson y comente sobre los resultados obtenidos.

Solución

En este caso estamos interesados en calcular una probabilidad binomial de un grupo \(n\) de \(900\) artículos, de los cuales se busca a que el número de artículos defectuosos \(X\), sea de al menos \(30\) defectuosos, sabiendo que la probabilidad de producir un artículo defectuoso es del \(3\%\). Esto es \[\begin{align*} \mathbb{P}(X \leq 30) &= \sum_{x=0}^{30} \left(\begin{array}{c}900\\ x\end{array}\right) (0.03)^x(0.97)^{900-x} \\ &= 0.7581561 \end{align*}\] Es decir, que la probabilidad de que como máximo \(30\) artículos de los \(900\) sean defectuosos es del \(75.81\%\).

Ahora, si realizamos la aproximación de la distribución binomial a la distribución Poisson que resultado tendríamos?.

Para ello será necesario calcular el parámetro \(\lambda\) de la distribución Poisson, el cual está dado por \[\begin{align*} \lambda &= np \\ &= 900(0.03) \\ &= 27 \end{align*}\] Es decir que la distribución \(b(n=900, p=0.03)\) puede aproximarse a una distribución \(Pois(\lambda=27)\), que \(n\) es grande y \(p\) es pequeño (aunque éste no cumpla la condición de que \(p\leq 0.01\), pero dichas condiciones son valores para tener como puntos de referencia). Por tanto, al calcular la probabilidad con la distribución Poisson tenemos que \[\begin{align*} \mathbb{P}(X \leq 30) &= \sum_{x=0}^{30} \frac{e^{-27}27^x}{x!} \\ &= 0.7553101 \end{align*}\] Lo cual indica que, al realizar la aproximación, se tiene un \(75.53\%\) de probabilidad de que al menos \(30\) artículos de los \(900\) seleccionados, resulten tener algún tipo de defecto.

Al observar las dos probabilidades anteriores, la calculada con la distribución binomial \(75.81\%\), y la calculada con la distribución Poisson \(75.53\%\), se aprecia que las dos son muy similares, y en consecuencia, se dice que la distribución Poisson dadas las características del ejercicio ofrece una buena aproximación al que se obtendría con la distribución binomial.