Escolar Documentos
Profissional Documentos
Cultura Documentos
Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa
de otra. La estad´ ıstica, ciencia o rama de las Matem´ticas que se ocupa de
recoger datos, analizarlos y a organizarlos, y de realizar las predicciones que
sobre esos datos puedan deducirse, tiene dos vertientes b´sicas: a a) Estad´
ıstica descriptiva: B´sicamente se ocupa de la 1 parte, es decir, a partir de
ciertos datos, a analizarlos y organizarlos. Es aqu´ donde tiene sentido calcular
la media, mediana, moda, desviaci´n ı o o ıpica, etc. media, desviaci´n t´ b)
Estad´ ıstica inferencial: Se ocupa de predecir, sacar conclusiones, para una
poblaci´n tomando o como base una muestra (es decir , una parte) de dicha poblaci
´n. Como todas las predicciones, siempre o han de hacerse bajo un cierto grado de
fiabilidad o confianza. Ser´ esta ultima vertiente de la estad´ a ´ ıstica la que
estudiemos en este tema.
4.2.
Muestreos
Ya sabemos que una poblaci´n es el conjunto de individuos sobre los que hacemos
cierto estudio, y o que una muestra es un subconjunto de la poblaci´n. Es evidente
que los resultados de una determinada o encuesta tendr´n un mayor grado de
fiabilidad si dicha encuesta se realiza sobre la poblaci´n completa. a o Sin
embargo, en la mayor´ de las ocasiones esto no es posible, debido a m´ltiples
razones: ıa u * Imposibilidad material (Hacer una encuesta a los casi 41 millones
de espa˜ oles es imposible,hacer n un estudio sobre la fecha de caducidad de un
producto. Si lo hacemos con todos los productos ¿qu´ vene demos luego?) *
Imposibilidad temporal (Hacer un estudio sobre la duraci´n de una bombilla. ¿Cu
´nto debemos o a esperar para saberlo?). Por tanto, es habitual que tengamos que
manejarnos con muestras, de modo que es importante saber elegir bien una muestra
de la poblaci´n, una muestra que represente bien a dicha pbolaci´n. o o Hay muchas
maneras de elegir una muestra de una poblaci´n. o Antes de pasar a analizar dichas
formas de extracci´n de muestras, lo que si hemos de dejar claro o es que todas
las muestras han de cumplir varias condiciones indispensables. Es evidente que
para que el estudio a realizar sea fiable, hay que cuidar mucho la elecci´n de o la
muestra, para que represente en la medida de lo posible a la poblaci´n de la que
se extrae. Si la o muestra est´ mal elegida, diremos que no es representativa. a
En este caso, se pueden producir errores imprevistos e incontrolados. Dichos
errores se denominan sesgos y diremos que la muestra est´ sesgada. a Una de las
condiciones para que una muestra sea representativa es que el muestreo (o sistema
para elegir una muestra de una poblaci´n) que se haga sea aleatorio, es decir,
todas las personas de o
56
CAP´ ITULO 4. INFERENCIA ESTAD´ ISTICA
57
58
4.3.
59
4.4.
60
Ejemplo: Los pesos de los tornillos que fabrica cierta m´quina se distribuyen seg
´n una N (142 32; 8 5) a u (medidas en gr.). Se toman muestras de 25 tornillos.
Calcular: o a) Distribuci´n que siguen las medias de esas muestras. b)
Probabilidad de que una muestra elegida al azar de 25 tornillos tenga un peso
medio superior a 144’6 gr. c) La misma pregunta si la muestra es de 100 tornillos.
a) Como las muestras son de tama˜ o n=25 y la poblaci´n es normal N (142 32; 8 5),
las medias muesn o trales siguen una distribuci´n: o X −→ N b) Nos piden: p(X ≥
144 6) = p Z ≥ 144 6 − 144 32 17 = p(Z ≥ 1 34) = 1 − p(Z ≤ 1 34) = 0 0901 85 142
32; √ 25 = N (142 32; 1 7)
c) Si las muestras son de tama˜o n=100, las medias muestrales siguen una
distribuci´n: n o X −→ N y por tanto: p(X ≥ 144 6) = p Z ≥ 144 6 − 144 32 0 85 =
p(Z ≥ 2 68) = 1 − p(Z ≤ 2 68) = 0 0037 85 142 32; √ 100 = N (142 32; 0 85)
Ejercicio: Una m´quina ha fabricado piezas de precisi´n con un peso medio de 150
gr. y una desviaci´n a o o t´ ıpica de 20 gr. Calcular la probabilidad de que una
muestra de 80 piezas tenga un peso medio de m´s a de 155 gr. (Soluci´n: 0’0129) o
4.5.
Nos planteamos ahora determinar qu´ proporci´n de una poblaci´n posee un cierto
atributo, por e o o ejemplo si es fumador o no fumador, si tiene ordenador o no,
si tiene alergia o no,etc... El estudio de este tipo de proporciones es
equiparable al de una distribuci´n binomial (donde s´lo hay dos posibilidades). o
o Si la proporci´n ´xito es p y la de fracaso q, y se toma una muestra de la
poblaci´n de tama˜o n, al oe o n
CAP´ ITULO 4. INFERENCIA ESTAD´ ISTICA
61
igual que en el caso anterior, para cada muestra tendremos una proporci´n muestral
que denotaremos o por p y una desviaci´n t´ ˆ o ıpica muestral que denotaremos por
sp . ˆ Entonces,utilizando razonamientos similares a los del apartado anterior, se
verifica que p = p, y ˆ p·q por tanto: sp = ˆ n Conclusi´n: Las proporciones
muestrales de tama˜o n ≥ 30, extra´ o n ıdas de una poblaci´n en la que la o
probabilidad de ´xito es p, se ajustan a una normal e N p; p·q n
62
4.6.
Intervalos de probabilidad
63
4.6.1.
α 2
= zα 2
64
Figura 4.4: Buscamos el valor de z0 125 que deje en el intervalo (−z0 125 , z0 125
) al 0’75 de la poblaci´n o en la N(0;1) Se cumple que p(Z ≥ z0 125 ) = 0 125, es
decir p(Z ≤ z0 125 ) = 0 875,y si buscamos en la tabla, resulta que el valor es:
z0 125 = 1 15 Ejercicio: Encuentra el valor correspondiente que concentre el 88 %
de la poblaci´n. o Ejemplo:Calcular el intervalo de probabilidad con un nivel de
confianza del 95 % para la media de una muestra de 100 reci´n nacidos, sabiendo que
la poblaci´n de reci´n nacidos sigue una normal de e o e media µ=3100 gr. y
desviaci´n tipica σ=150 gr. o Como el nivel de confianza es 0’95, entonces 1 − α =
0 95 y por tanto α = 0 05 y en cada rama α fuera de la regi´n queda = 0 025. o 2 ´
Buscamos entonces z0 025 , que es el valor que deja a su derecha un area de 0’025,
es decir: p(Z ≥ z0 025 ) = 0 025 =⇒ p(Z ≤ z0 025 ) = 0 975 Buscando este valor
dentro de la tabla se obtiene que el valor de z0 025 = 1 96, y por tanto el
intervalo para la media muestral es: 150 150 , 3100 + 1 96 · √ 3100 − 1 96 · √ 100
100 = (3100 − 1 96 · 15, 3100 + 1 96 · 15) = (3070 6, 3129 4)
65
4.6.2.
4.7.
4.7.1.
66
1299 = 3 25 400
Por tanto tenemos una confianza del 95 % de que la nota media de la poblaci´n est´
comprendida o e entre 3’14 y 3’36. Ejercicio: De una variable estad´ ıstica
conocemos la desviaci´n t´ o ıpica, 8, pero desconocemos la media. Para estimarla,
extraemos una muestra de tama˜ o 60 cuya media es 37. Estimar la media poblacional
n con una confianza del 99 %.
CAP´ ITULO 4. INFERENCIA ESTAD´ ISTICA Error m´ximo admisible: a Hemos visto que
el intervalo de confianza para la media poblacional µ es: σ σ x − zα · √ , x + zα ·
√ 2 2 n n
67
se le llama error m´ximo admisible. Dicho error tiene las siguientes propiedades:
a a) El error es manor cuanto mayor sea el tama˜ o de la muestra (n), porque
dividimos por un n n´mero cada vez mayor. u b) El error es mayor al aumentar el
nivel de confianza, puesto que el valor z α aumenta, como se 2 observa en la tabla:
Confianza=1 − α 0’9 0’95 0’99 zα 2 1’645 1’96 2’575
Para reducir el error, por tanto, no hay que aumentarla confianza, sino el tama˜o
de la muestra elegida. n Si conocemos el error y el nivel de confianza, podemos
calcular el tama˜o de la muestra , usando n o la f´rmula del error. Ejercicio: Al
medir un tiempo de reacci´n, un psic´logo sabe que la desviaci´n t´ o o o ıpica
del mismo es 0’5 segundos. ¿Cu´l es el n´ mero de medidas que deber´ realizar para
que con una confianza del 99 %, a u a el error de estimaci´n no exceda de 0’1
segundos?. o
4.7.2.
68
Ejercicio: Determina el intervalo de confianza, con una significaci´n del 0’05 para
la proporci´n o o poblacional de fumadores entre los j´venes menores de 21 a˜ os,
a partir de una muestra de tama˜o o n n 900, cuando no se conocen valores de p
anteriores. Considera los dos casos anteriores (usando p y ˆ p=q=0’5). La proporci
´n de fumadores en la encuesta ha sido de p = 0 3. o ˆ El error m´ximo admisible
en este caso es: a E = zα · 2 o en caso de no conocer p: p·q ˆˆ n Ejercicio: Para
96 familias espa˜ olas elegidas al azar se ha determinado que la TV permanece enn
cendida en la casa una media de 217 minutos diarios, la desviaci´n t´ o ıpica de
la muestra fue de 40 minutos. a) Para una fiabilidad del 95 % ¿qu´ error se asume
cuando se da por bueno ese dato para el total e de las familias espa˜olas?. n b)
¿Qu´ tama˜o muestral ser´ necesario para reducir ese error a la mitad?. e n ıa E =
zα · 2 NOTA: Diferencia entre intervalos de probabilidad y de confianza En un
intervalo de probabilidad lo que conocemos es la media y desviaci´n t´pica
poblacionales, oı y damos el intervalo donde se encontrar´ (para un cierto nivel
de confianza) la media muestral o la a proporci´n muestral. o o Sin embargo, en un
intervalo de confianza entramos ya en el terreno de la estimaci´n, es decir NO
conocemos la media poblacional (y en ocasiones tampoco la desviaci´n t´ o ıpica
poblacional) ni la proporci´n poblacional , sino que s´lo conocemos, o podemos
calcular, la media muestral o la proporci´n o o o muestral, y de lo que se trata
es de dar un intervalo en el que se encuentre la media poblacional (o la o
proporci´n poblacional). p·q n