Contrastes de hipótesis

Definición.- Contraste de hipótesis

El contraste de hipótesis es una herramienta que, como su propio nombre indica, nos permite contrastar una cierta hipótesis relacionada con algún parámetro poblacional o con la propia estructura de datos de la población.

Definición.- Hipótesis nula

La hipótesis nula es el enunciado para el que se plantea para corroborar o descartar su validez por medio del contraste de hipótesis. Esta hipótesis debe estar referida a información poblacional que comprobaremos mediante la información muestral.

La hipótesis nula se denota por H0.

Definición.- Hipótesis alternativa

La hipótesis alternativa es el resultado esperado si finalmente concluimos que no se cumple la hipótesis nula. La denotaremos por H1.

Definición.- Estadístico de contraste

El estadístico de contraste será la función de elementos muestrales o estadístico que utilicemos para la realización del contraste.

Definición.- Región crítica

Llamaremos Región Crítica al conjunto de valores que puede tomar nuestro estadístico de contraste y que hacen constituyen una evidencia suficiente para afirmar que la hipótesis nula es falsa.

Definición.- Región de aceptación

Llamaremos Región de Aceptación al conjunto de valores que puede tomar nuestro estadístico de contraste que no constituyen una evidencia suficiente para rechazar la hipótesis nula.

region_critica

Al realizar un contraste de hipótesis podemos tener las siguientes situaciones:

errores contrastes

  • La probabilidad de cometer este error de tipo II  se denota por β y nos ayuda a calcular lo que denominamos potencia del contraste. La potencia del contraste es la probabilidad de rechazar la hipótesis nula cuando es realmente falsa y se calcula como 1 – β. También la podemos expresar como la probabilidad de aceptar la hipótesis alternativa cuando es cierta.
  • La probabilidad de cometer error de tipo I se denomina nivel de significación del contraste y se designa por α. El nivel de significación es fijado por el investigador y habitualmente se trata de minimizar lo máximo posible. Son valores de uso habitual para el nivel de significación 0,1, 0,05 o 0,01.

p-valor

El p-valor es el nivel de significación más pequeño con el que se debe rechazar la hipótesis nula, teniendo en cuenta la información de la muestra observada.

Otras formas de expresarlo:

  • Probabilidad de que el valor observado del estadístico de contraste esté en la región crítica, cuando la hipótesis nula es cierta.
  • Probabilidad de que el estadístico de contraste observado nos indique que debemos rechazar la hipótesis nula, cuando es cierta.

Se calcula como:

P( El valor observado del estadístico esté dentro de la región crítica/H0)

 El p-valor proporciona una regla de decisión tan válida como la región crítica y más sencilla de manejar, ya que la mayoría de los software estadísticos incluyen su cálculo en los contrastes de hipótesis que incorporan.

La regla de decisión es que, una vez fijado el nivel de significación, si este es mayor que el p-valor obtenido rechazaremos la hipótesis nula y de lo contrario diremos que no tenemos evidencias suficientes para rechazarla, es decir:

contrastes_decision

El nivel de significación no debe determinarlo el p-valor obtenido , debe decidirse antes de realizar el muestreo y en ningún caso dependerá el p-valor o del valor del estadístico.

Bibliografía Recomendada