Prueba de hipótesis

Una hipótesis estadística es una afirmación o conjetura que se realiza sobre una población o sobre los parámetros de la misma, en donde el objetivo es decidir si la afirmación hecha se encuentra apoyada por la información obtenida de una muestra de la población de interés.

Por ejemplo, un médico afirma que el peso ideal de las personas de cierta población sigue una distribución normal con peso promedio de $73$kg y desviación estándar de $3$kg.

Componentes de una prueba de hipótesis

Hipótesis nula

Sea $\theta$ un parámetro de interés desconocido y sea $\theta_0$ un valor particular de $\theta$, entonces se tendrá que la hipótesis nula estará dado por

  • Bilateral $H_0: \theta = \theta_0$
  • Unilateral izquierda $H_0: \theta \geq \theta_0$
  • Unilateral derecho $H_0: \theta \leq \theta_0$

matemáticamente $H_0: \theta \geq \theta_0$ y $H_0: \theta \leq \theta_0$ es matemáticamente equivalente a escribir $H_0: \theta = \theta_0$ y por tanto, se acostumbra a usar esta última en los tres casos.

Hipótesis alternativa

Es el complemento lógico de la hipótesis nula, y por tanto, ésta estará dado por

  • Bilateral $H_0: \theta \neq \theta_0$
  • Unilateral izquierda $H_0: \theta < \theta_0$
  • Unilateral derecho $H_0: \theta > \theta_0$

Ésta hipótesis no puede contener la igualdad, a menos que se quiera una hipótesis alternativa específica.

Estadístico de prueba

El estadístico de prueba será el valor usado para tomar la decisión entre $H_0$ y $H_1$. Éste dependerá del parámetro de interés y de la distribución muestral del estadístico. Entre los estadísticos de prueba más usados de tiene a $Z$, $t_v$. $\chi^2_v$ y $F_{v_1,v_2}$.

Región crítica

La región crítica o región de rechazo representa los valores del estadístico de prueba que conduce a rechazar la hipótesis nula, es decir, \begin{align*} RC:\{\text{valores del estadístico de prueba que conducen a rechazar }H_0\} \end{align*}

Por ejemplo, si se emplea la afirmación del médico sobre el peso promedio de los estudiantes, se tendrá el siguiente juego de hipótesis \begin{align*} H_0: \mu = 73 kg \\ H_1: \mu \neq 73 kg \end{align*}

Supongamos una región crítica arbitraria, tal que \begin{align*} RC:\{\bar{X}|\bar{X}<71 \text{ o } \bar{X}>75\} \end{align*}

P-valor

Es el nivel de significancia más bajo en el que el valor observado del estadístico de prueba es significativo. Por tanto, un valor relativamente pequeño puede sugerir que el valor observado del estadístico de prueba sea poco probable, y por tanto, $H_0$ deba ser rechazado.

Dado que el P-valor puede interpretarse como el tamaño de la región crítica $RC$ que se obtiene a partir de los datos, entonces para un nivel de significancia preestablecido, el criterio de decisión debe ser \begin{align*} \text{P-valor }<\alpha \Rightarrow \text{ Rechazar } H_0 \end{align*}

Errores tipo I, II y potencia de la prueba

Dado un juego de hipótesis, se tendrán cuatro posibles escenarios

siendo $\alpha$: la probabilidad de cometer un error tipo I. Este se define como \begin{align*} \alpha = \mathbb{P}(\text{Rechazar }H_0|H_0 \text{ es verdadera}) \end{align*} usualmente se emplean valores de $\alpha$ de $0.1, 0.05, 0.01$.
$\beta$: la probabilidad de cometer un error tipo II. Este se define como \begin{align*} \beta = \mathbb{P}(\text{No rechazar }H_0|H_0 \text{ es falsa}) \end{align*} Este valor es imposible de calcular a menos de que se tenga una hipótesis alternativa específica, tal que \begin{align*} H_1:\theta = \theta_1 \end{align*} con $\theta_1$ un valor específico a probar.

Nota

  1. Los errores tipo I y II están inversamente relacionados, es decir, cuando aumenta uno, disminuye el otro.
  2. Un aumento en el tamaño muestral $n$, reducirá tanto $\alpha$ y $\beta$ de forma simultanea.
  3. Si $H_0$ es falsa, $\beta$ es máxima cuando el verdadero valor del parámetro se aproxima al valor hipotético.