Você está na página 1de 76

Inferencia Estadstica

Qu es estadstica?
La ciencia utiliza modelos para describir
fenmenos.
Un modelo es una explicacin terica del
fenmeno objeto de estudio. Esta explicacin
suele expresarse en forma verbal, muchas
veces mediante ecuaciones matemticas.
Existen modelos determinsticos y modelos
no determinsticos.

5
Inferencia Estadstica

Qu es estadstica?
Modelo determinstico: Es posible conocer un
valor preciso de la variable de inters a partir
de otras.
Modelo no determinstico: No es posible
determinar un valor preciso de la variable de
inters pues est presente la incertidumbre.

9
Inferencia Estadstica

No determinsticos

Duracin de la batera de litio de una laptop.


Cantidad de personas que compran con
tarjeta de crdito en una tienda en un perodo
determinado.
Promedio de notas en los estudios
universitarios (conocido el promedio de notas
en secundaria).

13
Inferencia Estadstica

Qu es estadstica?
La Estadstica nos ensea cmo realizar juicios
inteligentes y tomar decisiones en presencia de
incertidumbre.

Los mtodos estadsticos estn ideados para


permitir evaluar el grado de incertidumbre de
los resultados.

La Estadstica se ocupa de modelos y


fenmenos no determinsticos.
14
Inferencia Estadstica

Qu es estadstica?
Asociado a modelos no determinsticos est el
concepto de probabilidad.

Existe la Estadstica Descriptiva y la


Estadstica Inferencial.

15
Inferencia Estadstica

Qu es estadstica?
Estadstica Descriptiva:
Tcnicas para describir o representar conjuntos
de datos (grficos y clculo de medidas
numricas).

Estadstica Inferencial:
Mtodos para derivar conclusiones acerca de
un gran grupo de objetos al observar una parte
de ellos.
17
Inferencia Estadstica

Poblacin y muestra
MUESTRA:

En todas las ocasiones en que no es posible o conveniente realizar un


censo, lo que hacemos es trabajar con una muestra, entendiendo por tal
una parte representativa y adecuada de la poblacin.
Para que una muestra sea representativa, y por lo tanto til, debe de
reflejar las semejanzas y diferencias encontradas en la poblacin,
ejemplificar las caractersticas y tendencias de la misma. Cuando decimos
que una muestra es representativa indicamos que rene
aproximadamente las caractersticas de la poblacin que son importantes
para la investigacin.
Cuando decimos que una muestra es adecuada, nos referimos a que
contiene el nmero de unidades de estudio, tal que permita aplicar
pruebas estadsticas que den validez a la inferencia de los resultados a la
poblacin.
22
Inferencia Estadstica

Ventajas del muestreo


Costos reducidos.
Mayor rapidez para obtener resultados.
Mayor exactitud o mejor calidad de la informacin debido a los
siguientes factores:
a) Volumen de trabajo reducido.
b) Puede existir mayor supervisin en el trabajo.
c) Se puede dar ms entrenamiento al personal.
d) Menor probabilidad de cometer errores durante el
procesamiento de la informacin.
Factibilidad de hacer el estudio cuando la toma de datos implica
tcnicas destructivas, por ejemplo:
a) Pruebas de germinacin.
b) Anlisis de sangre.
c) Control de calidad.
34
Inferencia Estadstica

Desventajas del muestreo


Siempre est presente el error de muestreo producto de la
variabilidad intrnseca de los elementos del universo, existen
diferencias entre las medidas muestrales (estadsticos) y los
parmetros poblacionales llamada Error de Muestreo.
El trmino error no debe entenderse como sinnimo de
equivocacin.
Tambin suelen introducirse errores por otras vas, los cuales se
denominan errores sistemticos: Los cuales son:
- Imputables al observador.
- Imputables al mtodo de observacin o medicin.
- Imputables a lo observado (unidad de muestreo).

38
Inferencia Estadstica

Parmetro y estadstico
PARAMETRO: Son las medidas o datos que se obtienen sobre la
poblacin.

ESTADISTICO: Los datos o medidas que se obtienen sobre una


muestra y por lo tanto una estimacin de los parmetros.

ERROR MUESTRAL, de estimacin o standard: Es la diferencia


entre un estadstico y su parmetro correspondiente.

42
Inferencia Estadstica

Tipos de muestreo

PROBABILISTICO

NO PROBABILISTICO

43
Inferencia Estadstica

Muestreo probabilstico
Los mtodos de muestreo probabilstico son aquellos que se basan en el
principio de equiprobabilidad.

Es decir, aquellos en los que todos los individuos tienen la misma


probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamao n tienen la
misma probabilidad de ser elegidas.

Slo estos mtodos de muestreo probabilstico nos aseguran la


representatividad de la muestra extrada y son, por tanto, los ms
recomendables

47
Inferencia Estadstica

Muestreo no probabilstico
A veces, para estudios exploratorios, el muestreo probabilstico resulta
excesivamente costoso y se acude a mtodos no probabilstico, aun
siendo conscientes de que no sirven para realizar generalizaciones, pues
no se tiene certeza de que la muestra extrada sea representativa, ya que
no todos los sujetos de la poblacin tienen la misma probabilidad de se
elegidos.

En general se seleccionan a los sujetos siguiendo determinados criterios


procurando que la muestra sea representativa.

49
Inferencia Estadstica

Mtodos de muestreo probabilstico


MUESTREO ALEATORIO SIMPLE

MUESTREO ALEATORIO SISTEMTICO

MUESTREO ALEATORIO ESTRATIFICADO

MUESTREO ALEATORIO POR CONGLOMERADOS

50
Inferencia Estadstica

Mtodos de muestreo no probabilstico


MUESTREO POR CUOTAS

MUESTREO OPINTICO O INTENCIONAL

MUESTREO CASUAL O INCIDENTAL

BOLA DE NIEVE

51
Inferencia Estadstica

EJERCICIO 1
Decida, para cada uno de los problemas siguientes, si es apropiado un estudio
estadstico o no. En caso afirmativo explique la razn de su respuesta e
identifique la poblacin:
1. Se investigar la opinin de 50000 trabajadores que se vern afectados por
el cambio de la jornada laboral tradicional, de ocho horas diarias durante
cinco das a la semana, a la de diez horas diarias por espacio de cuatro das
a la semana.
2. Un despacho de arquitectos debe presentar una cotizacin para un proyecto
de cableado. Estn disponibles siete contratistas elctricos para la tarea. Se
pretende determinar el costo promedio estimado del proyecto y el tiempo
promedio proyectado que se requerira para que cualquiera de los
contratistas realice el proyecto.
3. Un sistema de cmputo est conectado a cierto nmero de terminales
distantes. A fin de decidir si se aumenta dicho nmero o no, es necesario
estudiar la variable aleatoria X, el tiempo por sesin de cada usuario en las
terminales actualmente instaladas.
55
Inferencia Estadstica

EJERCICIO 2
Se quiere estimar la cantidad de tiempo promedio que los profesores del INTEC
emplean calificando las tareas de cierta semana.
Describa una forma de obtener
a) Una muestra aleatoria simple
b) Una muestra sistemtica
c) Una muestra estratificada

56
Distribuciones muestrales de
medias y de proporciones

57
Inferencia Estadstica

Distribucin muestral de medias

Considere la poblacin 1, 3, 5, 7

Se desea obtener una muestra de tamao 2,


mediante muestreo aleatorio simple, sin
reemplazamiento y sin importar el orden.

a) Cuntas muestras posibles hay?


b) Encuentre la distribucin muestral de medias.
c) Calcule la media de la poblacin.
d) Calcule la media de todas las medias muestrales.
58
Inferencia Estadstica

Distribucin muestral de medias

Considere la poblacin 1, 3, 5, 7

Se desea obtener una muestra de tamao 2,


mediante muestreo aleatorio simple, con
reemplazamiento y se considera el orden.

a) Cuntas muestras posibles hay?


b) Encuentre la distribucin muestral de medias.
c) Calcule la media de todas las medias muestrales.

59
Inferencia Estadstica

EJERCICIO 1

Una marca particular de jabn para lavadora de platos se


vende en tres tamaos: 25 oz, 40 oz y 65 oz. El 20% de
todos los compradores seleccionan la caja de 25 oz, el 50%
seleccionan una caja de 40 oz y el 30% restante selecciona
una caja de 65 oz.
Sean X1 y X2 los tamaos de paquete seleccionados por dos
compradores independientemente seleccionados. Determine
la distribucin muestral de medias.

60
Inferencia Estadstica

Teorema del lmite central

Sea X1, X2, Xn es una muestra aleatoria de una


distribucin con media y varianza .
Entonces, si n es suficientemente grande, X tiene
aproximadamente una distribucin normal con
=
X

=
X n
61
Inferencia Estadstica

EJERCICIO 2

Se tiene un lote de 12 artculos, el cual tiene 4 defectuosos.


Se van a seleccionar 5 artculos al azar de ese lote sin
reemplazo. Genere la distribucin muestral de proporciones
para el nmero de piezas defectuosas.

62
Estimacin

63
Inferencia Estadstica

Estimacin

En Inferencia Estadstica, a travs de una muestra se trata


de:
Estimacin
puntual
Estimar un parmetro desconocido
(ESTIMACION)
Estimacin por
intervalos

Verificar si el parmetro es o no igual a cierto valor


(PRUEBA DE HIPOTESIS)
70
Inferencia Estadstica

Estimacin

Para estimar el parmetro poblacional se utiliza el


estadstico .

Parmetro Estimador
Ejemplos x
s
s
p p

72
Inferencia Estadstica

Estimacin

El estimador no tiene que ser nico.


Por ejemplo, en una distribucin simtrica, otro estimador
de es la mediana.
Otro estimador pudiera ser la media 10% recortada.
min + max
Y otro estimador podra ser
2

En general se cumple que = + error de estimacin


77
Inferencia Estadstica

Propiedades de un buen estimador

1. Ausencia de sesgo o imparcialidad, es decir, que sea


insesgado. Esto es E( ) =

2. Eficacia o eficiencia, esto significa que su varianza es


mnima.

3. Consistencia o coherencia. Un estimador es consistente


cuando su valor tiende a acercarse al correspondiente
valor del parmetro.

4. Suficiencia, o sea, que agota toda la informacin sobre


el parmetro contenida en la muestra.
82
Inferencia Estadstica

Propiedades de un buen estimador

La media muestral y la varianza corregida son


buenos estimadores de la media poblacional y la
varianza poblacional.

83
Intervalos de confianza para
la media poblacional

84
Inferencia Estadstica

La estimacin puntual, o sea, estimar un parmetro


a travs de un nico valor no es muy conveniente
pues con ella no se puede determinar el error de
muestreo, ni la precisin de la estimacin, ni la
confianza que merece tal estimacin.

85
Inferencia Estadstica

Existen otros mtodos para estimar parmetros


poblacionales, que son mucho ms precisos.
Por ejemplo,
Mtodo de los mnimos cuadrados
Mtodo de los momentos
Mtodo de la mxima verosimilitud
Mtodo de estimacin por intervalos de
confianza

90
Inferencia Estadstica

Algunos conceptos

= probabilidad de que el intervalo NO incluya al


verdadero valor del parmetro.

1 = probabilidad de que el intervalo incluya al


verdadero valor del parmetro
= nivel de confianza

Ejemplo: = 5% = 0.05
1 = 95% = 0.95

94
Inferencia Estadstica

Teorema del lmite central

Sea X1, X2, Xn es una muestra aleatoria de una


distribucin con media y varianza .
Entonces, si n es suficientemente grande, X tiene
aproximadamente una distribucin normal con
=
X

=
X n
96
Inferencia Estadstica

Tabla de la distribucin normal estndar

97
Inferencia Estadstica

Intervalo de confianza al 95%


(para la media siendo conocida)


x - 1.96 x + 1.96
n n

98
Inferencia Estadstica

Tabla de la distribucin normal estndar

99
Inferencia Estadstica

Algunos niveles de confianza

Nivel de confianza Normal z


estndar
95% 0.95 0.05 0.975 1.96
97% 0.97 0.03 0.985 2.17
99% 0.99 0.01 0.995 2.58
90% 0.90 0.10 0.959 1.65

100
Inferencia Estadstica

Ejercicio 1

Un grupo de investigadores en medicina desean estimar el


cambio medio de presin sangunea por paciente en un
sanatorio. Se ha seleccionado una muestra al azar de 30
pacientes y se hall una media de 5 puls/seg. Los
investigadores saben que, segn estudios anteriores, la
desviacin estndar de los cambios de presin sangunea
para todos los pacientes es de 3 puls/seg. Se desea estimar
el cambio medio de la presin sangunea por paciente con
un intervalo del 95% de confianza, suponiendo que la
variable aleatoria cambios de presin sangunea tiene una
distribucin normal.
101
Inferencia Estadstica

Intervalo de confianza al 95%


(para la media para desconocida)

s s
x - 1.96 x + 1.96
n n

Como generalmente la desviacin estndar poblacional es


desconocida, se sustituye por la desviacin estndar de la
muestra.

102
Inferencia Estadstica

Ejercicio 2

Los siguientes datos son los puntajes obtenidos para 45


personas en una escala de depresin (mayor puntaje
significa mayor depresin).
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20

Construir un intervalo de confianza para la depresin


promedio de la poblacin a un nivel de confianza del 95%.
103
Intervalos de confianza para
proporciones

104
Inferencia Estadstica

Intervalo de confianza al 95%


para la proporcin

p (1-p ) p (1-p )
p - 1.96 p p + 1.96
n n

105
Inferencia Estadstica

Ejercicio 1

En un estudio de prevalencia de factores de riesgo


en una cohorte de 412 mujeres mayores de 15
aos en cierta regin se encontr que el 17.6%
eran hipertensas. Determine un intervalo de
confianza al 95% para la proporcin de mujeres
hipertensas en la regin estudiada.

106
Inferencia Estadstica

Ejercicio 2

En cierta poblacin se seleccion aleatoriamente


una muestra de 300 personas a las que se les
someti a cierto test cultural. De ellas resultaron
aprobadas 225. Teniendo en cuenta esta
informacin estimar el porcentaje de personas de
esa poblacin que resultaran aprobados si se les
sometiera a dicho test cultural. Obtener con un
nivel de confianza del 97% un intervalo de
confianza para la proporcin.

107
Inferencia Estadstica

Ejercicio 3

Estamos interesados en conocer el consumo diario


medio de cigarrillos entre los alumnos de cierta
universidad. Seleccionada una muestra aleatoria de
100 alumnos se observ que fumaban una media
de 8 cigarrillos diarios. Si admitimos que la varianza
de dicho consumo es de 16 cigarrillos 2 en el
colectivo total, estime dicho consumo medio con un
nivel de confianza del 90%.

108
Inferencia Estadstica

Ejercicio 4

Tomada al azar una muestra de 120 estudiantes de


una universidad se encontr que 54 de ellos
hablaban ingls. Halle, con un nivel de confianza
del 90%, un intervalo para estimar la proporcin de
estudiantes que habla el idioma ingls entre los
estudiantes de esa universidad.

109
Inferencia Estadstica

Ejercicio 5

Un diseador industrial quiere determinar la


cantidad promedio de tiempo que tarda un adulto
en ensamblar un juguete fcil de ensamblar. Use
los datos siguientes (en minutos), una muestra
aleatoria, para construir un intervalo de confianza
del 95% para la media de la poblacin muestreada.
17 13 18 19 17 21 29 22 16 28 21 15
26 23 24 20 8 17 17 21 32 18 25 22
16 10 20 22 19 14 30 22 12 24 28 11

110
Intervalos de confianza para
la diferencia de medias y la
diferencia de proporciones

111
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias

Si x 1 y x 2 son los valores de las medias de muestras


aleatorias independientes de tamaos n y n de poblaciones
1 2

normales con las varianzas conocidas 12 y 22 entonces un


intervalo de confianza para la diferencia entre las dos
medias de las poblaciones es

112
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias

2 2
1 2
( x1 - x2 ) - z + 1 - 2
n1 n2

2 2
1 2
( x1 - x2 ) + z +
n1 n2
113
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias

En virtud del teorema del lmite central esta frmula puede


usarse tambin para muestras aleatorias independientes de
poblaciones no normales con varianzas conocidas cuando
los valores de n 1 y n2 son grandes (mayores que 30).

114
Inferencia Estadstica

Intervalo de confianza para la


diferencia de medias
2 2
Si las varianzas 1 y 2 son desconocidas, entonces se
sustituyen sus valores en la frmula por s 2y s 2 y se procede
1 2

como antes.

115
Inferencia Estadstica

Ejercicio 1

Construya un intervalo de confianza al 94% para la


diferencia entre las vidas medias de dos clases de
bombillos dado que una muestra aleatoria de 40
bombillos de la primera clase dur un promedio de
418 horas de uso continuo y 50 bombillos de la
segunda clase duraron en promedio 402 horas de
uso continuo. Las desviaciones estndar de las
poblaciones se sabe que son 1 = 26 y 2 =22 (en
horas).

116
Inferencia Estadstica

Intervalo de confianza para la


diferencia de proporciones

Si p1 y p2 son los valores de las proporciones de dos


muestras tamaos grandes n 1y n2 entonces un intervalo de
confianza para la diferencia de proporciones p p es
1 2

117
Inferencia Estadstica

Intervalo de confianza para la


diferencia de proporciones

p1 (1- p1) p2(1- p2)


( p1 - p2 ) - z + p 1 - p2
n1 n2

p1 (1- p1) p2(1- p2 )


( p1 - p2 ) + z +
n1 n2
118
Inferencia Estadstica

Ejercicio 2

Si 132 de 200 votantes hombres y 90 de 159


votantes mujeres estn a favor de cierto candidato
que hace campaa, encuentre un intervalo de
confianza del 99% para la diferencia entre las
proporciones reales de votantes hombres y
votantes mujeres que estn a favor del candidato.

119
Inferencia Estadstica

Ejercicio 3

Un estudio del crecimiento anual de ciertos cactus


mostr que 64 de ellos, seleccionados
aleatoriamente en una regin desrtica, crecieron
en promedio 52.80 mm con una desviacin
estndar de 4.5 mm. Construya un intervalo de
confianza del 99% para el verdadero promedio de
crecimiento anual de la clase dada de cactus.

120
Inferencia Estadstica

Ejercicio 4

Un estudio de dos clases de equipos de fotocopiado muestra


que 61 averas del equipo de la primera clase se llevaron en
promedio 80.7 minutos en ser reparados, con una
desviacin estndar de 19.4 minutos, mientras que 61
averas del equipo de segunda clase se llevaron en
promedio 88.1 minutos en ser reparados, con una
desviacin estndar de 18.8 minutos. Encuentre un intervalo
de confianza del 99% para la diferencia entre los verdaderos
promedios del tiempo que toma reparar las averas de las
dos clases de equipo de fotocopiado.

121
Inferencia Estadstica

Ejercicio 5
En una muestra aleatoria de 300 personas que
comen en una cafetera de una tienda
departamental solo 102 pidieron postre.
Si usamos 102/300 = 0.34 como una estimacin de
la verdadera proporcin correspondiente, con qu
confianza podemos afirmar que nuestro error es
menor que 0.05?

122
Lmites de confianza para la
varianza poblacional y para
el cociente de dos varianzas

123
Inferencia Estadstica

Intervalo de confianza para la


varianza poblacional
2
Si s es el valor de la varianza de una muestra
aleatoria de tamao n de una poblacin normal,
entonces un intervalo de confianza del (1-)100%
2
para es

124
Inferencia Estadstica

Intervalo de confianza para la


varianza poblacional
2
Si s es el valor de la varianza de una muestra
aleatoria de tamao n de una poblacin normal,
entonces un intervalo de confianza del (1-)100%
2
para es
2 2
(n-1) s 2
(n-1) s
< <
2 2
, n-1

1 - , n-1
2 2
125
Inferencia Estadstica

Distribucin
Prueba chi-cuadrado
chi-cuadrado de bondad de
ajuste

Si la variable aleatoria X tiene una distribucin normal estndar,


2
entonces la variable aleatoria X tiene una distribucin chi-cuadrado
126
Inferencia Estadstica

Tabla de la distribucin chi-cuadrado

127
Inferencia Estadstica

Ejercicio 1

En 16 corridas de prueba el consumo de gasolina


de un motor experimental tiene una desviacin
estndar de 2.2 galones. Construya un intervalo de
2
confianza del 99% para que mide la verdadera
variabilidad del consumo de gasolina del motor.

128
Inferencia Estadstica

Lmites de confianza para el cociente


de dos varianzas

129
Inferencia Estadstica

Lmites de confianza para el cociente


de dos varianzas

2 2
Si s 1 y s 2 son los valores de dos varianzas de

muestras aleatorias independientes de tamaos n 1

y n2 de poblaciones normales, entonces un


2
1
intervalo de confianza del (1-)100% para es
2
2

130
Inferencia Estadstica

Lmites de confianza para el cociente


de dos varianzas

2 2 2
s1 1 1 s1
< < F , n -1, n -1
2 2 2
s2 F , n -1, n -1 2 s2 2
2 1

1 2
2

131
Inferencia Estadstica

Tabla de la distribucin F

132
Inferencia Estadstica

Ejercicio 2

Se hizo un estudio para comparar los contenidos de nicotina


de dos marcas de cigarrillos. Diez cigarrillos de la marca 1
tuvieron un contenido promedio de 3.1 miligramos con una
desviacin estndar de 0.5 miligramos mientras que ocho
cigarrillos de la marca 2 tuvieron un contenido promedio de
nicotina de 2.7 miligramos con una desviacin estndar de
0.7 miligramos. Suponga que los dos conjuntos de datos
son muestras aleatorias independientes de poblaciones
normales. Encuentre un intervalo de confianza del 98% para
el cociente de las varianzas 2 y 2 .
1 2

133
Inferencia Estadstica

134
Inferencia Estadstica

135
Inferencia Estadstica

Ejercicio 3

Un estudio del crecimiento anual de ciertos cactus


mostr que 64 de ellos, seleccionados
aleatoriamente en una regin desrtica, crecieron
en promedio 52.80 mm con una desviacin
estndar de 4.5 mm. Construya un intervalo de
confianza del 99% para la desviacin estndar del
crecimiento anual de la clase de cactus dada.

136
Inferencia Estadstica

Ejercicio 4

Un estudio de dos clases de equipos de fotocopiado muestra


que 61 averas del equipo de la primera clase se llevaron en
promedio 80.7 minutos en ser reparados, con una
desviacin estndar de 19.4 minutos, mientras que 61
averas del equipo de segunda clase se llevaron en
promedio 88.1 minutos en ser reparados, con una
desviacin estndar de 18.8 minutos. Encuentre un intervalo
de confianza del 98% para la razn de las varianzas de las
poblaciones muestreadas.

137
Inferencia Estadstica

138

Você também pode gostar