Tema
9
Introducción a la
inferencia estadística. Intervalos de confianza y contraste de hipótesis
Inferencia
estadística
Al conjunto de procedimientos
estadísticos que permiten pasar de lo particular, la muestra, a lo general, la
población, le denominamos inferencia estadística.
Dos formas de inferencia estadística:
-Estimación
del valor en la población (parámetro) a partir de un valor de la muestra
(estimador).
-Contrate
de hipótesis, a partir de valores de la muestra, se concluye si hay diferencias
entre ellos en la población.
Las
dos formas de inferencia estadísticas:
-Estimaciones
pueden ser puntuales o a través de intervalos de confianza para aproximarnos a
valor de un parámetro.
-Pruebas
de hipótesis, miden el valor de una muestra difiere de la hipótesis nula
(aquellas que suponen que no hay diferencias) ¿el valor obtenido es diferente
al valore especificado por H0?
-Estadística
inferencial: extraer conclusiones y/o tomar decisiones concernientes a la
población basándose en los resultados de una muestra
-Ejemplo:
-Estimación:
estimar el peso promedio de la población usando el peso promedio de la muestra
-Prueba de
hipótesis: probar el peso promedio de la población es de 65kg
Extraer
conclusiones y/o tomar decisiones concernientes a una población basándose en los
resultados se una muestra.
Estimaciones
Proceso de utilizar información de una
muestra para extraer conclusiones acerca de toda la población.
Se utiliza la información recogida para
estimar un valor
Puede realizarse estimación puntual o
estimación por intervalos mediante el calculo de intervalos de confianza
Estimación de la población p:
-Estimación
puntual: consiste en considerar el valor del estadístico muestral como una
estimación del parámetro poblacional. “Si
la tensión sistólica de una muestra es de 125mmHg una estadística puntual es
considerar este calor como una aproximación a la sistólica media de la
población”. Genera normalmente mucha incertidumbre e imprecisión.
-Estimación
por intervalos: lo mas normal y aconsejable, nos da cierta fiabilidad a pesar
de que no tiene mucha precisión (en una horquilla estrecha de valores). Consiste
en calcular dos valores entre los cuales se encuentra el parámetro poblacional
que queremos estimar con una probabilidad determinada, habitualmente del 95%. “a partir de los datos de una muestra hemos
calculado que hay un 95% de probabilidad de asístola media de una población
este comprometida entre 120 y 130 mmHg (120 y 130 son los limites del intervalo
de confianza”. Se puede crear para cualquier parámetro de población
(cualquier medida). Se utiliza como indicador de la variabilidad de las
estimaciones. Cuanto mas estrecho sea ese intervalo, mejor, pero hay mayor
probabilidad de error.
Ejemplo inferencia y estimación:
Estudio
tiempos de curación de ulceras en muestras de 100 pacientes.
Media
del tiempo muestra 1=53,77 días (media de cuanto tardan en curar)àestimador puntual
Nueva
muestra, media del tiempo 2=57.08 dias
Si
seleccionaramos muchas muestras, cada una nos daría un valor distinto
Construimos
histogramas con los estimadores de la media de tratamiento calculados en 2oo
muestras distintas de 100 pacientes cada una
Error
estándar
Es la medida que trata de captar la
variabilidad de los valores del estimador (en este caso la media de los días de
curación de la ulcera)
El error estándar de cualquier estimador
mide el grado de variabilidad en los valores del estimador en las distintas
muestras de un determinado tamaño que pudiésemos tomas de una población.
Cuanto mas pequeño es el error estándar
de un estimador, mas nos podemos fiar del valor de una muestra concreta.
Si el lugar de variar el valor de la
media en las muestras entre 52 y 64 dias, cariara entre 20 y 90 días, seria
menos probable que al seleccionar una muestra y calcular su media, esta
estuviera cercana a 57.46, que es el valor de la media en la población.
Calculo
del error estándar
Depende de cada estimador:
-Error
estándar para una media: s/√n
-Erro
estándar para proporcionar: √p(1-p)/n
De ambas formulas se deduce que, mientras
mayor sea el tamaño de una muestra, menor será el error estándar.
Teorema
central del limite
Para estimadores que pueden ser
expresados como suma de valores muestrales, la distribuion de sus valores sigue
una distribución normal con media de la de la población y desviación típica
igual al error estándar del estimador de que se trate.
Si sigue una distribución normal, sigue
los principios básicos de esta:
Intervalos
de confianza
Son un medio de conocer el parámetro en
una población midiendo el error que tiene que ver con el azar (error aleatorio)
Se trata de un par de números tales que,
con un nivel de confianza determinados, podemos asegurar que el valor del
parámetro es mayor o menor que ambos números
Se calcula considerando que el estimador
muestral sigue una distribución normal, como establece la teoría central del
límite
Calculo:
-I.C.
de un parámetro=estimador +-Z (e. Estándar)
-Z
es un calor que depende del nivel de confianza 1-a con que se quiera dar el
intervalo
-Para
nivel de confianza 95% z=1.96
-Para
nivel de confianza 99% z= 2.58
-El
signo +/- significa que cuando se elija el signo negativo se conseguirá el
extremo inferior del intervalo y cuando se elija el positivo se tendrá el
extremo superior
-Mientras mayor sea la confianza que
queramos otorgar al intervalo, este será mas amplio, es decir el extremo
inferior y el superior del intervalo estarás mas distanciados y por tanto, el
intervalo será menos preciso
Se puede calcula intervalos de confianzas
para cualquier parámetro: medias aritmeticas, proporciones, riesgos relativos,
odds ratio…
Contraste
de hipótesis
-Para
controlar los errores aleatorios, además del cálculo de intervalos de
confianza, contamos con una segunda herramienta en el proceso de inferencia estadística:
los tests o contrastes de hipótesis
-Con
los intervalos nos hacemos una idea de un parámetro de una población dando un
par de números entre los que confiamos que esté el valor desconocido
-Con
los contrastes (tests) de hipótesis la estrategia es la siguiente:
-Establecemos a priori una hipótesis acerca del valor del parámetro
-Realizamos la recogida de datos
-Analizamos la coherencia de entre la hipótesis previa y los datos
obtenidos
-Son
herramientas estadísticas para responder a preguntas de investigación: permite
cuantificar la compatibilidad entre una hipótesis previamente establecida y los
resultados obtenidos
-Sean
cuales sean los deseos de los investigadores, el test de hipótesis siempre va a
contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar,
o lo que es lo mismo, la no que no establece relación entre las variables de estudio)
Errores de
hipótesis
-Con
una misma muestra podemos aceptar o rechazar la hipótesis nula, todo depende de
un error, al que llamamos α
-El
error α es la probabilidad de equivocarnos al rechazar la hipótesis nula
-El
error α más pequeño al que podemos rechazar H0 es el error p
-Habitualmente
rechazamos H0 para un nivel α máximo del 5% (p<0,05)
-Es
lo que llamamos “significación estadística”
No hay comentarios:
Publicar un comentario