Tema 7
Teoría de la probabilidad: conceptos
básicos. Distribución y reglas básica de la probabilidad. Teorema de Bayes. Distribución
de probabilidad discreta: binomial y de Poisson. Distribución de la
probabilidad continua
PROBABILIDAD
El concepto de probabilidad es muy frecuencia para
comunicarnos y entendernos
-Las
probabilidades de una operación son del 50%
-Un
paciente que ingresa en el hospital tiene un 15% de padecer una infección
nosocomial
-Durante
el invierno la probabilidad de enfermedades respiratorias es de un 13%. 13 de
cada 100 ciudadanos padece una enfermedad durante el invierno.
En todos estos ejemplos se está dando a la medida de
ocurrencia de un evento que es incierto: sobrevivir a la operación, tener una
infección…
Se expresa mediante un numero entre o y 1 (o y porcentaje)
En estos ejemplos, si no existe la certeza de que ocurran
los hechos, existe una esperanza o miedo dimensionadas y razonables, de que el
echo anunciado se vea confirmado
Esta estimación sobre la probabilidad de ocurrencia del
evento nos ayuda a tomar decisiones.
Cuanto mas probable es que ocurra un evento, su medida de
ocurrencia estará mas próximo a 1 o al 100% y cuanto menos probable, mas se
aproxima al 0
Aunque el concepto es simple, ya que se usan de manera
intuitiva, su definición es complicada y tiene tres vértices:
-Enfoque
objetivo, cifra numérica en datos empíricos
-Enfoque
clásico o a priori: numero de casos favorables dividido por el número de casos
posibles
-Frecuencia
relativa o a posteriori: valor real del suceso
-Enfoque
subjetivo o personalistico, opinión o grado de creencia
Probabilidad
subjetiva o personalistica
La probabilidad mide la confianza que el individuo tiene
sobre la certeza de una proposición determinada
Por ejemplo: los
epidemiológicos s e basan en la experiencia para asignar que el próximo
invierno la epidemia de gripe tendrá una probabilidad de 0.0018 (180 caso por
100000 habita)
Este concepto de las probabilidades ha dado lugar al enfoque
de análisis de datos estadísticos llamado “estadística Bayesiana”
Probabilidades
clásicas o “a priori”
Data del siglo XVIII (Laplace, Pascal, Fermat) desarrollada
para resolver problemas relacionados con los juegos de azar (dados, monedas,
ruletas…)
Las probabilidades se calculan con un razonamiento
abstracto.
Ejemplo: no hay que
lanzar el dado para saber que la probabilidad “a priori” de que salga el 6 es
de 1/6=0,16
Definición: si un evento puede ocurrir de N formas, las
cuales se excluyen mutuamente y son igualmente probables, y si m de esos
eventos poseen características E, la probabilidad de ocurrencia de E es igual a
m/N
P(E)=m/N
Ejemplo: la
probabilidad “a priori” de que salga un As en una baraja de póker (52 cartas)
será:
P(As)=4/52=0.0769=7.7%
Ley de grandes grupos
La probabilidad a priori de que salga un numero de un dado
es P(A)=1/6=0,166=16,6%
Inicialmente esa probabilidad real puede no cumplirse, pero
si repetimos muchas veces el experimento, la frecuencia relativa de un suceso
A, cualquier, tiene a estabilizarse en torno al valor “a priori”
Dependiendo de las veces que lanzamos el dado saldrá más o
menos la probabilidad a priori, cuanto mayor sea la frecuencia de tirada más se
parecerá.
Probabilidad relativa
o “a posteriori”
Definición: si un suceso es repetido un gran numero de
veces, y si algún evento resultante, con la característica E, ocurre m veces,
la frecuencia relativa de la ocurrencia E, m/n, es aproximadamente igual a la
probabilidad de ocurrencia de E
P(frecuencia)=números de veces que se obtiene el resultado
que estudia/numero de repeticiones de experimento
P(f)=n/m
Dicho de otra forma, si el número de determinaciones (repeticiones
de un experimento aleatorio) es grande, podemos esperar que la probabilidad
observada se acerque a la probabilidad teórica.
Para ambos estudios
“a priori” y “postriores”
-Los
eventos deben ser mutuamente excluyentes
-La
frecuencia relativa de cada posible evento es un numero entre 0-1
-La suma
de todas las frecuencias deben ser igual a 1
Ejemplo: tipos de
sangre y frecuencias relativas en una unidad de hematología de un hospital que
tiene a 1000pacientes
Probabilidad teórica o
“a priori”:
Teóricamente: P(a
priori)=1/4=25%
Probabilidad relativa
o “a posteriori”:
Tipos de sangre
|
Número de individuos
|
Frecuencia relativa
|
0
|
326
|
32.6
|
A
|
480
|
48%
|
B
|
120
|
12%
|
AB
|
74
|
7.4%
|
Total
|
1000
|
100%120
|
Ejemplo2: Se pretende
comprobar en un grupo de 700mujeres embarazadas a término, si se han controlado
durante el embarazo “control prenatal” y si tiene relación con su grado de
instrucción:
Tabla de frecuencia
empírica, observada o “a posteriori”
Control
prenatal
|
Primaria
|
Secundaria
|
Superior
|
Total
|
SI
|
120
|
68
|
52
|
240
|
NO
|
300
|
142
|
18
|
460
|
Total
|
420
|
210
|
70
|
700
|
P(cp)=240/700=0.34=34%
P(cp)=120/700=0.17=17%
Tabla de frecuencia teórica,
esperada o “a priori”
Control
prenatal
|
Primaria
|
Secundaria
|
Superior
|
Total
|
SI
|
240x420/700=144
|
240x210/700=72
|
240x70/700=24
|
240
|
NO
|
460x420/700=276
|
460x210/700=138
|
460x70/700=46
|
460
|
Total
|
420
|
210
|
70
|
700
|
P=144/700=0.2=20%
probabilidad a priori de las 700 tiene estudios básicos primarios y esta
controlada prenatalmente
EVENTOS O SUCESOS
Cuando se realiza un experimento aleatorio diverso
resultados son posibles. El conjunto de todos los resultados posibles se llama
el espacio muestral (S)
Se llama suceso o evento a su subconjunto de dichos
resultados (las veces que salen la cara de la moneda, sale cara)
Se llama evento complementario de un suceso A, al formado
por los elementos que no están en A y se denomina Ac (resto de situaciones que
no es la cara deseada, ejemplo: cruz en lugar de cara)
Se llama evento unión de A y B, AuB, al formado por los
resultados experimentales que están en A o B (incluyendo todos los que están en
ambos) (suma de todos los resultados de AyB)
Se llama evento intersección de A y B, Au/B, al formado por
los elementos que están en A y B, (por ejemplo, que salga el 5-6 a la vez
jugando con dos dados, dos resultados a la vez no la suma de ambas)
Propiedades de
probabilidades
P(AuB) cuando dos sucesos (AyB) se excluyen mutuamente;
P(AuB)=P(A)+P(B);
P(AuB) cuando dos sucesos (AyB) no se excluyen mutuamente;
P(AuB)=P(A)+P(B)-P(Av/B)
Tengo 8 personas, 4h y 4m, 2rubios y 2 rubias, Mujeres o rubi@?
P(AuB)=4(mujeres)+4(rubios)-2(hombres morenos)=6 mujeres y/o rubios
P(Au/B) cuando AyB son eventos independientes (la ocurrencia
de uno no influye en la ocurrencia del otro) P(Au/B) = P(A)*P(B)
REGLAS BASICAS:
TEORIA DE LA PROBABILIDAD
La probabilidad siempre oscila entre 0 y 1
La probabilidad de un suceso contrario es igual a 1 menos la
probabilidad del suceso P(A’)=1-P(A)
La probabilidad de un suceso imposible es 0
La unión de A y B es: P(AuB)=P(A)+P(B)-P(Au/B)
La probabilidad condicionada de un suceso A a otro B se
expresa:
P(A/B)=P(Au/B)/P(B) SiP(B) ≠ 0
Un 15% de los
pacientes atendidos en la consulta de enfermería del cachorro padecen
hipertensión arterial, y el 25% padecen hiperlipemia, el 5% son hipertensos e
hiperlipemicos, cual es la probabilidad de P(A), P(B), P(A) o P(B),
probabilidad al azar no padezca ni A ni B
Teorema de Bayes
Expresa la probabilidad condicional de un evento aleatorio A
dado B en términos de la distribución de probabilidad condicional del evento B
dado A y la distribución de probabilidad marginal de solo A
En términos mas generales el teorema de Bayes que vincula la
probabilidad de A dado B con la probabilidad de B dado A
Por ejemplo, sabiendo la probabilidad de tener dolor de
cabeza fado que se tiene gripe, se podría saber (si se tiene algún dato más),
la probabilidad de tener gripe si se tiene un dolor de cabeza
P(A/B) = P(B/A) x
P(A/B) / P(B/A) x P(A) + P(B/A’) x P(A’)
Ejercicio:
En un principio
existen tres consultas de enfermería que se reparten los habitantes en 40% 25%
35%
La probabilidad de
pacientes diagnosticados en la primera visita dependiendo del consultorio es
del 80% 90% 95% (P(D/?)
¿Cuál es la
probabilidad de escoger un individuo al azar que se le ha diagnosticado un
problema de salud en la primera visita proceda de la consulta A? P(A/D)
P(A/D) = P(D/A) x P(A) / P(D/A) x P(A) + P(D/A’) x P(A’)
P(A)=0.4
P(B)=0.25
P(C)= 0.35
|
P(D/A)=0.8
P(D/B)=
0.9
P(D/C)=0.95
|
¿Cuál es el centro de
salud con mas probabilidad de ser seleccionado por los diagnosticados?
DISTRIBUCION DE
PROBABILIDAD EN VARIABLES DISCRETAS:
Distribución binomial
La distribución binomial es un modelo matemático de distribución
teórica de (la normal es con variables continuas):
-Cuando
se producen situaciones en las que solo existen dos posibles (cara/cruz,
sano/enfermo…)
-El
resultado contenido en cada prueba es independiente de los resultados obtenidos
anteriormente
-La
probabilidad del suceso A es constante, la representamos por p y no variable de una prueba a otra. La
probabilidad de A’ es 1-p y la
representamos por q
-El
experimento consta de un numero n de pruebas
Mediante esta distribución se resuelven los problemas que
plantean:
-Si al
hacer un experimento hay una probabilidad p de que ocurra un suceso ¿Cuál es la
probabilidad de que en N experimentos el suceso ocurra X veces?
-P: probabilidad de ocurrencia; q de no ocurrencia
-X:
número sucesos favorables
-N:
número total de ensayos
-Y…recordar
que por definición el factorial de un numero 0 es igual a 1.
Distribución de
Poisson
Poisson: médico militar francés que estudia en el s. XIX la
probabilidad de que un soldado muera en el campo de batalla por golpes de un
caballo
También se llama la distribución de probabilidad de casos
raros
Introducción: en esta clase describiremos el uso de la distribución
de poisson para obtener la probabilidad de ocurrencia de sucesos raros (eventos
que ocurren con poca frecuencia) cuyo resultado lo representa una variable discreta
Utilidad:
-La distribución
de Poisson se utiliza en situaciones donde los sucesos son impredecibles
o de ocurrencia aleatoria. En otras palabras, no se sabe el total de posibles resultados.
-Permite
determinar la probabilidad de ocurrencia de un suceso con resultado discreto
(variables discretas)
-Es muy útil
cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña
-Se utiliza
cuando la probabilidad del evento que nos interesa se distribuye dentro de un
segmento n dado como por ejemplo distancia, área, volumen o tiempo definido
Definición: se dice que la variable aleatoria discreta X, cuyos
valores posibles son 0,1,2…tienen distribución de Poisson con parámetro λ y se escribe X; o (λ), si su función de probabilidad es:
Donde:
-P(X=x):
es la probabilidad de ocurrencia cuando la variable discreta X toma un valor
finito x
-
λ: promedio de ocurrencias en un intervalo (tiempo, volumen, área…)
- e:
tiene un valor aproximado de 2,71828
- x: es
el número de ocurrencias
Ejemplo: el numero de
suicidios en la lima sigue una distribución poisson. Además, se ha calculado
que el promedio ocurre dos suicidios por semana. X: número de suicidios
El modelo de
probabilidad del número de suicidios será:
P(x)= e-2*2x
/ X!; x=0,1,2…
La probabilidad de que
la próxima semana ocurra un suicidio se calcula como:
P(x)= e-2*21
/ 1= 0,1353
DISTRIBUCIONES
NORMALES
La media de una serie estadística que sigue una distribución
normal, le restamos y le sumamos el valor de la desviación típica en esa serie
de valores se va a encontrar en el 68.26% de la población.
p(μ -
σ < X ≤ μ + σ) = 0.6826 = 68.26 %
p(μ -
2σ < X ≤ μ + 2σ) = 0.954 = 95.4 %
p(μ -
3σ < X ≤ μ + 3σ) = 0.997 = 99.7 %
Tipificación de
valores en una normal:
Extrapolando aparecen los principios básicos de
distribuciones normales y podemos tipificar los valores de una normal:
+- 1Sà
68.26% de las observaciones
+-2Sà95.45%
de las observaciones
+-1.95Sà95%
de las observaciones
+-3Sà
99.73% de las observaciones
+-2.58à99%
de las observaciones
Ejemplo:
X=25 S=2
95% 99%
25-+1.95*2 = A. 21.1 B.28.9,
entre los 21.1 y 28.9 es el 95%
28-+2.58*2= A. 19.84 B.30.16,
entre los 19.8 y 30.16 es el 99%
La típica de los valores se puede realizar si…
-Trabajamos
con una variable continua que:
-Sigue
una distribución normal (TLC)
-Y
tiene más de 100unidades (LGN)
-La
tipificación nos permite conocer si otro valor corresponde o no a esa
distribución de frecuencia.
Zx=x-x’ /
Sx
X’= media de la muestra
S= desviación típica de la muestra
Ejemplo:
En una muestra de 500
mujeres que reciben asistencia queremos saber como la pobreza afecta a su
autoestima. Medimos el autoestima con la escala de actitud de 20 puntos
(variable continua……..desviación típica 2
¿Qué porcentaje de las
destinatarias de la asistencia tiene puntuaciones de autoestima entre 5 y 8?
Para ello hay que transformar las puntuaciones en tipificadas (Z)
Z =x-x’ / S = 5-8 / 2 = -1.5DE
¿Qué porcentaje esta
entre 13 y 20?
13-8 / 2 = 2,5 corresponde a 0.62% se sitúan las mujeres entre 13-20
(mirado tabla)
¿Qué proporción de
mujeres se encuentra entre 4 y 10? (0,47 y 0,34 están sacado tabla)
4-8 / 2 = -2 ; 0,47= 47%
10-8 / 2= 1 ; 0,34= 34%
Sumamos los % de ambas; 47+34=81% de mujeres están entre 4-10
(HAY QUE PINTAR LA GRAFICA para ver la media)
¿Qué porcentaje de
mujeres se encuentra entre 4 y 5?
4-8/2= -2; 0.4772=47,72%
5-8/2= -1.5; 0.4332=43,32%
47.72-43.32=4.4% (en este se restan por que no están pegados a el 8)
¿Qué probabilidad hay que una puntuación de 10.5?
10.5-8/2=1.25; 39.44%
8=50%
50+39.44=89.44%
Primero miramos donde está el sombreado (central o alejado)
de nuestra gráfica, buscamos el valor Z, (ejemplo anterior) en nuestro caso 1.5
(no nos fijamos en el signo +/- solo en el número en si), buscamos en la tabla
la solución. En este caso nos da 43.32% que esta nuestras mujeres de 5-8
No hay comentarios:
Publicar un comentario