Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTADISTICA
CONTENIDO
UNIDAD I. ESTADISTICA DESCRIPTIVA Y DISTRIBUCIONES
MUESTRALES
UNIDAD II.ESTIMACIN DE PARMETROS
UNIDAD III. PRUEBAS DE HIPOTESS
UNIDAD IV. ANLISIS DE REGRESIN Y CORELACIN
1. Estadstica Descriptiva y
Distribuciones Muestrales
Muestreo
Existen dos clases de muestreo el probabilstico y no probabilstico, el
muestreo probabilstico es aquel mtodo en el que por medio de una tcnica
de muestreo es posible definir el nmero de muestras que se pueden formar
con n elementos u observaciones cada una, para luego elegir una de ellas
segn una funcin de probabilidad. Por otra parte, el muestreo no
probabilstico es aquel cuyas muestras se seleccionan por conveniencia o
bajo algn criterio para que los resultados favorezcan a un grupo, persona,
empresa o contexto.
Finito
Puede ser:
Infinito
Distribuciones Muestrales
Una distribucin muestral es una distribucin de probabilidad de un
Su forma funcional
Su Media
Su Desviacin Estndar
Ejemplo
Consideremos una poblacin conformada por 5 personas (N=5). La
Y la desviacin estndar es
o infinita?
Como cada una de estas muestras tiene la misma probabilidad de
escoger una muestra estara dada por:
posibles
Si X es la media
de una muestra aleatoria de
tamao n sacada de una poblacin distribuida
normalmente con media y desviacin x= y la
estandarizacin de zx es:
Ejemplo
Se realiz una prueba a un grupo de 80 aspirantes al cargo de
Solucin.
es=5.
Con base al enunciado debemos calcular P( x y esto lo lograremos
estandarizando la variable aleatoria x
> )
Ahora procedemos a sustituir los datos en la formula:
P)
P=(z >-4)
Grficamente queda
Para poder determinar el tamao de muestra requerido para que el
Ejemplo
La duracin de cierta marca de bombillas tiene una media de 900
Solucin
X: tiempo de duracin de las bombillas
=900
= 70
P(870X 925)=P
n = 36
t=
Distribucin t- student.
Teorema
Ejemplo
Se sabe que el 60%de los adultos de una zona del pas compran
0.04
Recordemos que como P es aproximadamente normal se requiere
estandarizar la variable aleatoria para poder utilizar las tablas de
probabilidades.
2. Estimacin de Parmetros
Qu es un estimador?
Estimador Puntual
Estimador Sesgado.
Estimador eficiente
Intervalo de Confianza
3. Pruebas de Hiptesis
Son
demasiados
...
Creo que la
edad media es
40 aos...
Gran
diferenci
a!
Muestra
aleatoria
X 20 aos
Bioestadstica.
Pruebas de hiptesis
Rechazo la
hiptesis
40
Qu es una hiptesis?
Una creencia sobre la poblacin,
Bioestadstica.
Pruebas de hiptesis
41
Identificacin de hiptesis
Hiptesis nula Ho
La que contrastamos
Los datos pueden refutarla
Hiptesis. Alternativa H1
Niega a H0
Los datos pueden mostrar evidencia a
favor
razn.
evidencia a favor.
H0 :
H1 :
p 0.5
p 0.5
, ,
Quin es H0?
Problema: La osteoporosis est relacionada con el
gnero?
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
Seleccionar la hiptesis nula
H 0 : p 0.5
p 0.5
p 0.5
Quin es H0?
Problema: El colesterol medio para la dieta mediterrnea
es 6 mmol/l?
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
Seleccionar la hiptesis nula
H0 : 6
Razonamiento bsico
Si supongo que H0 es cierta...
qu hace un
cientfico cuando su
teora no coincide
con sus
predicciones?
40
X 20
Pruebas de hiptesis
45
Razonamiento bsico
Si supongo que H0 es cierta...
Rechazo que H0
sea cierta.
40
X 20
Pruebas de hiptesis
46
Razonamiento bsico
Si supongo que H0 es cierta...
No hay evidencia contra H0
No se rechaza H0
El experimento no es
concluyente
40
X 38
El contraste no es
significativo
Nivel de significacin:
Nmero pequeo: 1% , 5%
Fijado de antemano por el
investigador
Es la probabilidad de rechazar H0
cuando es cierta
=0.05
=40
Reg. Crit.
Reg. Crit.
No
rechazo
H1: 40
Bilateral
Unilateral
Unilateral
H1: < 40
Bioestadstica.
Pruebas de hiptesis
49
H1: >40
Significacin: p
H0: = 40
Bioestadstica.
Pruebas de hiptesis
50
Significacin: p
No se rechaza
H0: = 40
H0: = 40
Bioestadstica.
Pruebas de hiptesis
X 43
51
Significacin: p
Es la probabilidad que tendra una regin crtica que comenzase
exactamente en el valor del estadstico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe an ms que la
nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra
ms extraa que la obtenida.
p es conocido despus de realizar el experimento aleatorio
El contraste es no significativo cuando p>
No se
rechaza
H0: =40
Bioestadstica.
Pruebas de hiptesis
X 43
52
Significacin : p
Se rechaza
H0: =40
Se acepta
H1: >40
Bioestadstica.
X 50
Pruebas de hiptesis
53
Significacin : p
El contraste es estadsticamente significativo cuando p
<
Es decir, si el resultado experimental discrepa ms de lo
tolerado a priori.
Se rechaza
H0: =40
Se acepta
H1: >40
Bioestadstica.
X 50
Pruebas de hiptesis
54
Bioestadstica.
Pruebas de hiptesis
55
Sobre p
Es conocido tras realizar el
experimento
Estadsticos de contrastea
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
Edad del
encuestado
259753,500
462319,500
-2,317
,021
Ejemplo
Problema: Est sesgada la moneda?
H0 :
H1 :
P=0.5
P=0.25
P=0.125
P=0.0625
P=0.03
P=0.015
No especulativa
H0: Hiptesis nula
(Ej.1) Es inocente
(Ej.2) El nuevo tratamiento no tiene efecto
(Ej.3) No hay nada que destacar
Especulativa
veredicto
Inocente
Inocente
Culpable
OK
Error
Menos grave
Culpable
Error
Muy grave
OK
No Rechazo H0
H0 cierta
H0 Falsa
Correcto
Error de tipo II
El tratamiento no tiene
efecto y as se decide.
Rechazo H0
Error de tipo I
Acepto H1
El tratamiento no tiene
efecto pero se decide
que s.
Probabilidad
Correcto
El tratamiento tiene efecto y el
experimento lo confirma.
Recuerda
lo que pasaba
con sensibilidad
y especificidad
tipos de error.
Para reducir , hay que aumentar el tamao muestral.
Bioestadstica.
Pruebas de hiptesis
62
Conclusiones
Las hiptesis no se plantean despus de observar los datos.
En ciencia, las hiptesis nula y alternativa no tienen el mismo papel:
H0 : Hiptesis cientficamente ms simple.
H1 : El peso de la prueba recae en ella.
error de tipo I
error de tipo II
de equivocarnos.
4. Anlisis de Regresin y
Correlacin
Altura Peso
en cm. en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
65
Mlaga.
Pesa 50 kg.
Mide 161 cm.
Pesa 76 kg.
rec
a
P
ue
q
e
es
p
el
me
u
oa
co
a
nt
ra
u
t
l
aa
l
n
10 kg.
10 cm.
Incorrelacin
230
180
130
80
30
140
150
160
170
180
190
200
Tema 3: Estadstica
bivariante
69
Bioestadstica. U.
Mlaga.
70
CovarianzadedosvariablesXeY
1
S xy ( xi x )( yi y )
n i
Tema 3: Estadstica
bivariante
71
Bioestadstica. U.
Mlaga.
Tema 3: Estadstica
bivariante
72
S xy
SxS y
Bioestadstica. U.
Mlaga.
Propiedadesder
Relacin
inversa
perfecta
-1
Tema 3: Estadstica
bivariante
Variables
incorreladas
73
Relacin
directa
casi
perfecta
+1
Bioestadstica. U.
Mlaga.
Correlaciones positivas
330
280
230
180
130
80
r=0,1
30
140 150 160 170 180 190 200
130
110
90
70
50
30
140 150 160 170 180 190 200
110
110
90
90
70
70
50
50
r=0,8
30
140 150 160 170 180 190 200
Tema 3: Estadstica
bivariante
74
r=0,4
r=0,99
30
140 150 160 170 180 190 200
Bioestadstica. U.
Mlaga.
Correlaciones negativas
80
80
60
60
40
40
20
20
r=-0,5
0
140 150 160 170 180 190 200
r=-0,7
0
140 150 160 170 180 190 200
80
80
60
60
40
40
20
20
r=-0,95
0
140 150 160 170 180 190 200
Tema 3: Estadstica
bivariante
75
r=-0,999
0
140 150 160 170 180 190 200
Bioestadstica. U.
Mlaga.
Regresin
Regresin
regresin. A la cantidad
e=Y- se le denomina residuo o error residual.
0 cm Extrapolacin salvaje!
b1=0,5 (En media el hijo gana 0,5 cm por cada cm del padre.)
180
b1=0,5
150
120
90
60
b0=85 cm
30
0
10
0
Tema 3: Estadstica
bivariante
30
20
50
40
70
60
80
90
80
110
100
130
150
170
190
210
120
140
160
180
200
220
Bioestadstica. U.
Mlaga.
preguntarse entonces:
funcin de los de X
Qu error cometemos con dicha aproximacin (residual).
180
b1=0,5
150
120
90
60
b0=85 cm
30
0
10
0
Tema 3: Estadstica
bivariante
30
20
50
40
70
60
81
SY
b1 r
SX
b0 y b1 x
82
Mlaga.
Cometi un
error de -30
en su ltima
prediccin
Hay
84
Bioestadstica. U.
Mlaga.
Interpretacin de la variabilidad en Y
Bioestad
stica. U.
Mlaga.
88
Bondad de un ajuste
Resumiendo: La dispersin del error residual
ser una fraccin de la dispersin original de Y.
Cuanto menor sea la dispersin del error
residual mejor ser el ajuste de regresin. Eso
hace que definamos como medida de bondad
de un ajuste de regresin,
o coeficiente de determinacin a:
S
R 1
S
2
2
e
2
Y
S e2
SY2
Descomposicin de la varianza
[0, 1]
Para el alumno astuto: por qu?
Se pueden considerar
otros tipos de modelos, en
funcin del aspecto que
presente el diagrama de
dispersin (regresin no
lineal)
Tema 3: Estadstica
bivariante
91
Incluso se puede
considerar el que una
variable dependa de varias
(regresin mltiple).
Bioestadstica. U.
Mlaga.
Modelos de
regresin
Simple
Lineal
No lineal
1 variable explicativa
Mltiple
Lineal
No lineal
2+ variables explicativas