Tema 9 "Introducción a la inferencia estadística. Intervalos de confianza y contraste de hipótesis"


Tema 9
Introducción a la inferencia estadística. Intervalos de confianza y contraste de hipótesis

Inferencia estadística
Al conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población, le denominamos inferencia estadística.
Dos formas de inferencia estadística:
                -Estimación del valor en la población (parámetro) a partir de un valor de la muestra (estimador).
                -Contrate de hipótesis, a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la población.

Las dos formas de inferencia estadísticas:
-Estimaciones pueden ser puntuales o a través de intervalos de confianza para aproximarnos a valor de un parámetro.
                -Pruebas de hipótesis, miden el valor de una muestra difiere de la hipótesis nula (aquellas que suponen que no hay diferencias) ¿el valor obtenido es diferente al valore especificado por H0?
                -Estadística inferencial: extraer conclusiones y/o tomar decisiones concernientes a la población basándose en los resultados de una muestra
-Ejemplo:
                               -Estimación: estimar el peso promedio de la población usando el peso promedio de la muestra
                               -Prueba de hipótesis: probar el peso promedio de la población es de 65kg
Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en los resultados se una muestra.

Estimaciones
Proceso de utilizar información de una muestra para extraer conclusiones acerca de toda la población.
Se utiliza la información recogida para estimar un valor
Puede realizarse estimación puntual o estimación por intervalos mediante el calculo de intervalos de confianza
Estimación de la población p:
                -Estimación puntual: consiste en considerar el valor del estadístico muestral como una estimación del parámetro poblacional. “Si la tensión sistólica de una muestra es de 125mmHg una estadística puntual es considerar este calor como una aproximación a la sistólica media de la población”. Genera normalmente mucha incertidumbre e imprecisión.
                -Estimación por intervalos: lo mas normal y aconsejable, nos da cierta fiabilidad a pesar de que no tiene mucha precisión (en una horquilla estrecha de valores). Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada, habitualmente del 95%. “a partir de los datos de una muestra hemos calculado que hay un 95% de probabilidad de asístola media de una población este comprometida entre 120 y 130 mmHg (120 y 130 son los limites del intervalo de confianza”. Se puede crear para cualquier parámetro de población (cualquier medida). Se utiliza como indicador de la variabilidad de las estimaciones. Cuanto mas estrecho sea ese intervalo, mejor, pero hay mayor probabilidad de error.

Ejemplo inferencia y estimación:
Estudio tiempos de curación de ulceras en muestras de 100 pacientes.
Media del tiempo muestra 1=53,77 días (media de cuanto tardan en curar)àestimador puntual
Nueva muestra, media del tiempo 2=57.08 dias
Si seleccionaramos muchas muestras, cada una nos daría un valor distinto
Construimos histogramas con los estimadores de la media de tratamiento calculados en 2oo muestras distintas de 100 pacientes cada una
 

Error estándar
Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la ulcera)
El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomas de una población.
Cuanto mas pequeño es el error estándar de un estimador, mas nos podemos fiar del valor de una muestra concreta.
Si el lugar de variar el valor de la media en las muestras entre 52 y 64 dias, cariara entre 20 y 90 días, seria menos probable que al seleccionar una muestra y calcular su media, esta estuviera cercana a 57.46, que es el valor de la media en la población.

Calculo del error estándar
Depende de cada estimador:
                -Error estándar para una media: s/√n
                -Erro estándar para proporcionar: √p(1-p)/n
De ambas formulas se deduce que, mientras mayor sea el tamaño de una muestra, menor será el error estándar. 

Teorema central del limite
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribuion de sus valores sigue una distribución normal con media de la de la población y desviación típica igual al error estándar del estimador de que se trate.
Si sigue una distribución normal, sigue los principios básicos de esta:

Intervalos de confianza
Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio)
Se trata de un par de números tales que, con un nivel de confianza determinados, podemos asegurar que el valor del parámetro es mayor o menor que ambos números
Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite
Calculo:
                -I.C. de un parámetro=estimador +-Z (e. Estándar)
                -Z es un calor que depende del nivel de confianza 1-a con que se quiera dar el intervalo
                                -Para nivel de confianza 95% z=1.96
                               -Para nivel de confianza 99% z= 2.58
                -El signo +/- significa que cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior
-Mientras mayor sea la confianza que queramos otorgar al intervalo, este será mas amplio, es decir el extremo inferior y el superior del intervalo estarás mas distanciados y por tanto, el intervalo será menos preciso
Se puede calcula intervalos de confianzas para cualquier parámetro: medias aritmeticas, proporciones, riesgos relativos, odds ratio…
 

Contraste de hipótesis
-Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los tests o contrastes de hipótesis
-Con los intervalos nos hacemos una idea de un parámetro de una población dando un par de números entre los que confiamos que esté el valor desconocido
-Con los contrastes (tests) de hipótesis la estrategia es la siguiente:
-Establecemos a priori una hipótesis acerca del valor del parámetro
-Realizamos la recogida de datos
-Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos
-Son herramientas estadísticas para responder a preguntas de investigación: permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos
-Sean cuales sean los deseos de los investigadores, el test de hipótesis siempre va a contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar, o lo que es lo mismo, la no que no establece relación entre las variables de estudio)

Errores de hipótesis
-Con una misma muestra podemos aceptar o rechazar la hipótesis nula, todo depende de un error, al que llamamos α
-El error α es la probabilidad de equivocarnos al rechazar la hipótesis nula
-El error α más pequeño al que podemos rechazar H0 es el error p
-Habitualmente rechazamos H0 para un nivel α máximo del 5% (p<0,05)
-Es lo que llamamos “significación estadística”

No hay comentarios:

Publicar un comentario