Escolar Documentos
Profissional Documentos
Cultura Documentos
= =
n
p p
N
n N
s e
Sociologa IV Juan Jos Torres
Errores de muestreo
Universos pequeos
Media
Proporcin
Universos grandes
Media
( o
2=
s
2
)
Proporcin
1
) 1 ( *
*
= =
n
p p
N
n N
s e
n N
n N
s e
2
*
o
= =
n
s e
2
o
= =
1
) 1 ( *
=
n
p p
s
n
p p
s
) 1 ( *
=
N
n
N
n N
=
1
como En muestras grandes n/N=0
Sociologa IV Juan Jos Torres
La estimacin
Con la estimacin de parmetros, deseamos
estimar el valor de un parmetro a travs de un
estadstico calculado en la muestra. Ej: edad
media de una poblacin o el % de abstencin
en una votacin.
Estimacin puntual: Se estima un parmetro
poblacional a travs de la media o la proporcin
calculados en la muestra. Un problema es que
no podemos establecer la probabilidad de que el
estimador sea igual al parmetro.
Sociologa IV Juan Jos Torres
La estimacin
Estimacin por intervalo: Dado que la
estimacin del parmetro poblacional depende
del error y del nivel de confianza, el valor
estimado no ser nico, sino que estar
comprendido en un intervalo cuyos lmites sern
el estimador nivel de confianza por error
tpico. El tamao de la muestra determina la
amplitud del intervalo.
Sociologa IV Juan Jos Torres
Intervalo de confianza
A partir de la estimacin del error de muestreo se pueden
determinar los intervalos de confianza, que son del tipo (p-ks,
p+ks).
El valor que se trata de estimar se encuentra dentro de ese
intervalo con una confianza medida en trminos de probabilidad.
Determinada por el valor que tome k.
As, para la proporcin a un nivel de confianza del 95,5% el
intervalo ser
Para le media ser
n
pq
p P
n
pq
p 2 2 + < <
n
x X
n
x
2 2
2 2
o o
+ < <
Sociologa IV Juan Jos Torres
Ejemplo
Supongamos que hacemos una encuesta para estimar el nivel de
parados. La muestra es de 1.000 entrevistas. con un margen de
error de 3,16% para un nivel de confianza del 95,5%=2 sigma y
para P=Q=50%.
Una vez realizada la encuesta el porcentaje de parados es del 12%.
Entre que valores oscilar el parmetro poblacional?
1000
88 * 12
2 12
1000
88 * 12
2 12 + < < P
) 06 , 14 ( 06 , 2 12 ) 94 , 9 ( 06 , 2 12 + < < P
Sociologa IV Juan Jos Torres
Significado del intervalo
Como P es un valor fijo, la probabilidad de encontrarse
entre 9,94 y 14,06 es 1 o 0. Es decir, o bien est dentro
de esos limites o no est. Lo que vara de muestra a
muestra es el estadstico p, dado que al no conocer P,
se construye el intervalo alrededor de p, la posicin del
intervalo en relacin al parmetro depende de la
localizacin del valor particular de p que se ha utilizado
a partir de la distribucin muestral. Dado que el 95,5%
de las proporciones p se encuentran dentro de 2
unidades de desviacion de la proporcin de la poblacin
y como hemos utilizado 2 sp para construir el intervalo
alrededor de p, cualquier p dentro de dichos lmites dar
lugar a un intervalo de confianza que incluir a P.
Sociologa IV Juan Jos Torres
Significado del intervalo
P
Z=+2 Z=-2
Sociologa IV Juan Jos Torres
Significado del intervalo
Las proporciones p1, p2, p3, p4 y p6 se encuentran
dentro del intervalo 2 sp, mientras que la proporcin
p5 se encuentra fuera de dicho intervalo. La
probabilidad del 95,5 por 100 utilizada en nuestro
ejemplo significa que si se realizara un gran nmero de
estimaciones por intervalo, tales como las que aparecen
en el grfico anterior, y cada una de ellas basada en una
muestra p, el 95,5 por 100 de los intervalos de
confianza incluiran el parmetro y slo el 4,5 por 100
de ellos lo dejaran fuera.
Sociologa IV Juan Jos Torres
Adems de servir como indicacin del grado de exactitud de una
estimacin, la colocacin de un intervalo de confianza alrededor de
una estimacin puede servir, implcitamente, para contrastar una
serie de hiptesis. En efecto, en un intervalo de confianza se
contiene una prueba implcita para cada posible valor del
parmetro, por ejemplo la media, que se desea contrastar. La
hiptesis alternativa se establece de forma que el valor del
parmetro que se desea estimar quede dentro del intervalo de
confianza para el nivel de probabilidad elegido. As, por ejemplo, si
establecemos un nivel de significacin del 0,05, sabemos que el
intervalo de confianza, en el caso de estimacin de una media,
tendr como lmites 1,96 error de la media. Pues bien, si la
media muestral queda dentro de dichos lmites se aceptar la
hiptesis, mientras que si se obtiene un valor que queda fuera se
rechazar la hiptesis.
Sociologa IV Juan Jos Torres
Estimacin de medias
De igual modo que se ha hecho con la estimacin de proporciones,
La estimacin puntual de medias puede transformarse fcilmente en
una estimacin por intervalo de tales parmetros. Cuando N es
suficientemente grande, la distribucin muestral apropiada es la
distribucin normal, y la frmula para las puntuaciones o valores
tpicos, puede ser transformada algebraicamente
para dar lugar a la siguiente expresin de los lmites de confianza:
en donde lc es el lmite de confianza (que sustituye a en la
frmula anterior), x es la media muestral, s
x
es el error tpico de la
media en la muestra y z es el valor o puntuacin tpica.
Sociologa IV Juan Jos Torres
PRUEBAS DE DECISION ESTADISTICA
Los dos grandes temas que estudia la estadstica inferencial son
1. la estimacin de los parmetros de la poblacin y
2. las pruebas estadsticas.
Los mtodos de la estadstica inferencial nos sealan los
procedimientos que hemos de seguir para poder extraer
conclusiones vlidas y fiables, a partir de la evidencia que
suministran las muestras. La lgica de tales procedimientos indica
las condiciones bajo las que se ha de obtener la evidencia
buscada, y las pruebas estadsticas determinan cul ha de ser el
tamao de las diferencias observadas para tener la seguridad de
que representan diferencias reales en la poblacin de la que
hemos obtenido la muestra. Igualmente, las pruebas estadsticas
nos permitirn saber si una muestra en la que se ha observado la
proporcin pn puede proceder de una poblacin en la que hay una
proporcin P.
Sociologa IV Juan Jos Torres
Problemas que trata de resolver la estadstica
inferencial en torno a las pruebas estadsticas.
1. Determinar, en trminos de probabilidad, si las
diferencias observadas entre dos muestras significan
que las poblaciones de las que se han obtenido las
muestras son realmente diferentes.
Al obtener dos grupos de valores por medio de
procedimientos aleatorios es muy probable que, por el
propio azar introducido en las operaciones, los valores
sean diferentes entre s. En tal caso, cmo podemos
determinar para cualquier caso que las diferencias
observadas se deben o no al azar? Es decir, como
determinar, en trminos probabilsticos, si las
diferencias observadas se encuentran dentro del
intervalo que se puede considerar debido al azar o si
son tan amplias que ello significa que las dos muestras
provienen probablemente de dos poblaciones
diferentes.
Sociologa IV Juan Jos Torres
2. Por otro lado, otro problema comn que se presenta en
la estadstica inferencial es el de determinar si es
probable que un valor obtenido a partir de una muestra,
por ejemplo una proporcin, pertenece realmente a una
poblacin. Esta prueba de comparacin de una
proporcin observada a una proporcin terica, y la
prueba de si las diferencias observadas en las muestras
re presentan realmente diferencias entre las respectivas
poblaciones, sirven de base para desarrollar los
fundamentos de las pruebas de decisin estadstica,
llamadas tambin pruebas de hiptesis.
Problemas que trata de resolver la estadstica
inferencial en torno a las pruebas estadsticas.
Sociologa IV Juan Jos Torres
EL USO DE LAS PRUEBAS DE
DECISIN ESTADSTICA
De una forma esquemtica, se puede afirmar que una parte
importante de la investigacin que se lleva a cabo en el campo de
la sociologa est relacionada con la determinacin de la
aceptabilidad o rechazo de las hiptesis que se deducen de las
teoras sociolgicas. Para contrastar tales hiptesis se obtiene
informacin emprica que nos ha de servir para tal fin, es decir,
para aceptar, rechazar o revisar las hiptesis.
Naturalmente, no podemos basarnos en procedimientos subjetivos
si queremos contrastar cientficamente una hiptesis. Necesitamos
criterios objetivos que, basndose en la informacin emprica
obtenida, por un lado, y en el margen de riesgo que deseamos
asumir en relacin a nuestra decisin, por otro, permitan obtener
conclusiones vlidas y fiables.
Sociologa IV Juan Jos Torres
Procedimientos a seguir
1. Formulacin de las hiptesis estadsticas, esto es, de la hiptesis
nula (H0 y de la hiptesis alternativa (H1).
2. Eleccin de una prueba estadstica (con su modelo estadstico
asociado) para contrastar H0
3. Especificacin de un nivel de significacin (o) y un tamao de la
muestra (n).
4. Encontrar (o asumir) la distribucin muestral de la prueba
estadstica en el supuesto de Ho.
5. En base a los puntos anteriores, definicin de la regin de rechazo
de la hiptesis nula.
6. Clculo del valor de la prueba estadstica, utilizando los datos
obtenidos a partir de la muestra. Si dicho valor se encuentra dentro
de la regin de rechazo, la decisin que se toma es la de rechazar
la hiptesis nula H0 si, por el contrario, dicho valor se encuentra
fuera de la regin de rechazo, la que se toma es que no se puede
rechazar H0 al nivel de significacin elegido.
Sociologa IV Juan Jos Torres
1. Formulacin de las hiptesis
estadsticas
La hiptesis nula (H0) es la hiptesis que se desea contrastar. Se
suele formular con el deliberado propsito de ser rechazada.
Cuando se consigue rechazarla, entonces se acepta la hiptesis
alternativa (H1 La hiptesis alternativa es la proposicin operacional
de la hiptesis de trabajo o hiptesis de la investigacin que desea
contrastar el investigador, es decir, la prediccin que ha sido
deducida de la teora sometida a la prueba de contrastacin.
Supongamos, por ejemplo, que se tiene una poblacin que contiene
una proporcin Pa desconocida de miembros que presentan una
determinada propiedad, y que slo se conoce la proporcin pb
observada en una muestra de n individuos procedente de dicha
poblacin. La hiptesis nula (H0 se establecera, en este caso, del
siguiente modo: la muestra procede de una poblacin cuya
proporcin pb es igual a la proporcin terica P, es decir, pa = P. La
diferencia entre la proporcin observada pa y la proporcin terica
P ser pequea, ya que se debe tan slo a las fluctuaciones
aleatorias introducidas por el procedimiento del muestreo.
Sociologa IV Juan Jos Torres
Hiptesis alternativa
La hiptesis alternativa (H1 se establecera, igualmente, de la
manera siguiente: la muestra procede de una poblacin cuya
proporcin pa es diferente de la proporcin terica P, esto es, pa=P.
En tal caso, la diferencia entre la proporcin observada pb y la
proporcin terica es demasiado grande como para que se deba tan
slo al azar.
La propia naturaleza de la hiptesis de la hiptesis de la
investigacin determina la forma en que se ha de formular H1. Si la
hiptesis de la investigacin seala que la proporcin pa de la
propiedad estudiada difiere de la proporcin terica, entonces la H1
establece que pa=P. Pero si la teora predice la direccin de la
diferencia, esto es, que una proporcin es mayor que otra, en tal
caso H1 puede ser pa>P, o bien pa<P (esto es, que pa es mayor
que P, o bien que pa es menor que P).
Sociologa IV Juan Jos Torres
Diferencias entre grupos
Supongamos, por ejemplo, que determinada teora sociolgica predice que
dos grupos sociales difieren en sus preferencias ideolgicas. Esta
prediccin sera nuestra hiptesis de investigacin, o hiptesis de
trabajo. Para contrastar esta hiptesis a travs de una investigacin
emprica formularamos la hiptesis de investigacin como la hiptesis
alternativa H1. Si medimos las preferencias ideolgicas de ambos grupos
mediante la aplicacin de una escala izquierda-derecha a cada uno de los
miembros de sendas muestras extradas de los dos grupos, la H1 sera tal
que 1=2 siendo 1 y 2 las medias de los valores de la escala izquierda-
derecha obtenidos en cada grupo. Por el contrario, H0 sera tal que 1=2
esto es, que las medias de los valores de la escala izquierda-derecha son
iguales en ambos grupos. Si los datos obtenidos nos permiten rechazar H0
entonces aceptaramos la H1 y ello significara una validacin estadstica de
la teora contrastada.
Tambin en este caso, la H1puede o no incluir la direccin de la diferencia,
esto es, que la H1, puede sealar que 1>2 o que 1<2 o simplemente
establecer que 1=2. Ello depender del detalle terico con que se
formule la hiptesis de investigacin.
Sociologa IV Juan Jos Torres
2. Eleccin de una prueba
estadstica
El campo de la estadstica inferencial se encuentra tan desarrollado
que, en los momentos actuales, se dispone de una gran variedad de
pruebas estadsticas alternativas para los diferentes diseos de
investigacin. Ms adelante estudiaremos algunos de los criterios
qu se siguen para elegir entre pruebas alternativas, que, pueden
ser del tipo paramtrico o del tipo no paramtrico. La propia
naturaleza de los datos obtenidos en la fase emprica de la
investigacin indicar si la prueba estadstica elegida ha de ser
paramtrica o no paramtrica.
Sociologa IV Juan Jos Torres
3. El nivel de significacin y el
tamao de la muestra
Antes de obtener los datos se especifica el conjunto de todas las
muestras posibles que pueden ocurrir cuando la hiptesis nula (H0)
es verdadera. A partir de dicho conjunto especificamos un
subconjunto de muestras que son tan extremas que, si H0 es
verdadera, la probabilidad de que la muestra que observamos se
encuentre entre ellas es muy pequea.
Si en la investigacin que se lleva a cabo observamos una muestra
que est incluida en dicho subconjunto, rechazamos la hiptesis
nula (H0).
Dicho en otras palabras, el procedimiento consiste en rechazar H0
en favor de H1 cuando la prueba estadstica d lugar a un valor
cuya probabilidad de que ocurra bajo H0 es igual o menor que una
probabilidad muy pequea que denominamos o o nivel de
significacin. Habitualmente, los valores que se utilizan para o son
0,05 y 0,01.
Sociologa IV Juan Jos Torres
El principio de la objetividad cientfica exige que el nivel de
significacin a se establezca con anterioridad a la obtencin
del resultado. Cuanto mayor sea la importancia, terica o
prctica, del resultado que se pretende obtener, mayor ha de
ser el cuidado que pongamos al establecer el nivel de
significacin. As, por ejemplo, si llevamos a cabo una
investigacin con el fin de probar la efectividad de varios
mensajes publicitarios para seleccionar el ms penetrante,
antes de lanzar una campaa publicitaria de mbito nacional,
habremos de ser muy exigentes, estableciendo un nivel de
significacin muy restrictivo, pues una equivocacin
significara una gran prdida para los responsables de la
campaa.
Sociologa IV Juan Jos Torres
Ahora bien, no se puede estar completamente seguro al aceptar o rechazar
la hiptesis nula, ya que nos estamos desenvolviendo en el campo de las
probabilidades, lo que equivale a decir que la decisin de elegir uno de los
dos tipos de hiptesis estadsticas, H0 o H1 comporta siempre un cierto
riesgo de equivocarse, esto es, de no seleccionar la hiptesis verdadera.
Como son dos las alternativas, dos sern tambin las posibilidades de
equivocarse al tomar la decisin, es decir, se pueden cometer dos tipos de
errores. El primero, llamado error Tipo 1, consiste en rechazar la hiptesis
nula (H0) cuando de hecho es verdadera. El segundo, llamado error Tipo
II, consiste en aceptar la hiptesis nula (H0) cuando de hecho es falsa.
La probabilidad de cometer un error Tipo 1 se llama riesgo o o riesgo de
primera especie, o simplemente riesgo de error. Al venir dado el error Tipo
1 por el valor de o, quiere ello decir que cuanto mayor sea o, ms
probable resultar rechazar una H0 que es verdadera, esto es, que ser
ms probable cometer el error Tipo 1. Vemos, pues, que el riesgo o es
conocido y, tal como se ha sealado anteriormente, se fija con antelacin o
a priori. De ah que habitualmente se utilice, al referirnos al contraste de
hiptesis, la siguiente frase: se rechaza la hiptesis nula con riesgo o.
Sociologa IV Juan Jos Torres
El error Tipo II se suele representar por |. El riesgo | es siempre
desconocido y vara en re1acin inversa al valor de o. El riesgo |
se de nomina tambin de segunda especie, y se produce cuando el
valor encontrado, debido a la influencia del azar y a pesar de ser
diferente del valor terico, cae dentro de la zona de no rechazo de
H0. En tal caso se acepta la H0 cuando en realidad es falsa, puesto
que s hay diferencia. Pero como, aparentemente, la diferencia
encontrada no es significativa, nada se opone a aceptar la hiptesis
nula. Tenemos, pues, que:
prob. (error Tipo I)= o
prob. (error Tipo II)= |
Sociologa IV Juan Jos Torres
De una forma ideal, los valores concretos de o y | deben ser establecidos
por el investigador antes de comenzar su investigacin, y tales valores
servirn para determinar el tamao n de la muestra que se ha de elegir
para calcular la prueba estadstica seleccionada.
En la prctica de la investigacin social, los valores de o y n se suelen
especificar con antelacin y, a continuacin, se determina | . Dada la
relacin inversa que existe entre o y | , para todo valor de n, un
incremento de o significar una disminucin de | . Con el fin de reducir la
posibilidad de cometer ambos tipos de errores se debe aumentar el tamao
de n.
Debe quedar claro que el uso de toda prueba de decisin estadstica
comporta el riesgo de cometer uno de los dos errores anteriormente
tipificados. Debe ser el investigador el que decida sobre el compromiso que
desea alcanzar, para optimizar el equilibrio entre las probabilidades de
cometer ambos tipos de errores. En este sentido, el concepto de potencia
es relevante para alcanzar dicha optimizacin.
Sociologa IV Juan Jos Torres
La potencia de una prueba de decisin estadstica se define como la
probabilidad de rechazar la hiptesis nula (H0) cuando de hecho es
falsa. Esto es:
Potencia= 1probabilidad de cometer el error Tipo II=1|
La potencia caracteriza la capacidad que tiene una prueba de
decisin estadstica de no equivocarse al rechazar la hiptesis nula
(H0) Si se aumenta el riesgo o, el intervalo 1 - o se har ms
estrecho, con lo que disminuir la zona de no rechazo de H0 lo cual
hace que la prueba estadstica ofrezca menos decisiones de no
rechazo de H0 y, consecuentemente, el riesgo | de equivocarse al
tomar una decisin de no rechazo de la hiptesis nula ser menor.
Sociologa IV Juan Jos Torres
Supongamos que px es la proporcin de una
determinada caracterstica o propiedad que estamos
estudiando, perteneciente a una poblacin de
distribucin normal, siendo p la proporcin terica.
Supongamos tambin que extraemos de dicha poblacin
una muestra cuya proporcin observada de la referida
caracterstica es p0. Cuando es verdadera la hiptesis
nula (px=p) la proporcin po observada en la muestra
estar dentro del intervalo de probabilidad 1-o. La
ilustracin grfica de este razonamiento es como sigue:
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Cuando la proporcin po observada en la muestra
pertenece al intervalo de probabilidad 1-o, se considera
que la diferencia entre p y po se debe a las fluctuaciones
aleatorias del proceso muestral y, por tanto, no se
rechaza la hiptesis nula. Por el contrario, si la
proporcin po no pertenece al intervalo de probabilidad
1-o, se considera que la diferencia entre p y po es
demasiado grande para que pueda ser explicada
nicamente por el azar y, en consecuencia, se rechaza
la hiptesis nula (y se acepta la hiptesis alternativa)
con riesgo o.
Sociologa IV Juan Jos Torres
4.Distribucin muestral
Existen diferentes distribuciones muestrales:
Distribucin normal: Apropiada para tcnicas
estadsticas inspiradas en el teorema del lmite central y
que se utiliza cuando se tratan muestras grandes.
Distribucin chi cuadrado: apropiada cuando tratamos
con varianzas y la tcnica de chi cuadrado.
Distribucin t de Student: apropiada para medias
pertenecientes a muestras de tamao reducido y de las
que se desconoce la varianza de la poblacin.
Sociologa IV Juan Jos Torres
5. La regin de rechazo
Es una regin de la distribucin muestral Es un
subconjunto de los valores posibles que son tan
extremos que cuando H0 es verdadera, la
probabilidad es muy pequea (o) de que la
muestra que observamos d lugar a un valor
que se encuentre entre ellos. As, pues, la
probabilidad asociada con la obtencin de
cualquier valor que se encuentre en la regin de
rechazo es igual o menor que o.
Sociologa IV Juan Jos Torres
Tal como se ha indicado anteriormente, la localizacin de la regin
de rechazo viene afectada por la propia naturaleza de H0, ya que la
hiptesis alternativa predice la direccin de la diferencia (por
ejemplo, en la estimacin de una proporcin, si p1>p0, o por el
contrario, p1<p0), entonces hay que utilizar una prueba estadstica
unilateral o de una cola; mientras que si la hiptesis alternativa no
indica la direccin de la diferencia que se predice, entonces hay que
utilizar una prueba estadstica bilateral o de dos colas.
Las pruebas estadsticas unilaterales y bilaterales difieren en la
localizacin de la regin de rechazo, pero no en su tamao. En una
prueba unilateral, la regin de rechazo se encuentra totalmente en
un extremo o cola de la distribucin muestral; mientras que, en una
prueba bilateral, la regin de rechazo se localiza a ambos extremos
de la distribucin muestral.
Sociologa IV Juan Jos Torres
El tamao de la regin de rechazo viene dado por el
nivel de significacin o. As, por ejemplo, si o=0,05, el
tamao de la regin de rechazo es el 5 por 100 del
espacio incluido bajo la curva de la distribucin
muestra!. Si la distribucin muestra! es del tipo normal,
las regiones de rechazo para sendas pruebas
unilaterales sern como sigue:
Sociologa IV Juan Jos Torres
Para el caso de una prueba bilateral o de dos colas, las regiones de
rechazo se distribuyen a ambos lados de la curva de la distribucin
muestral. Cuando el nivel de significacin es o=0,05, y para el
caso de una distribucin normal, las regiones de rechazo se
distribuyen del siguiente modo.
En el caso de la prueba bilateral, la suma de las regiones de
rechazo equivale a la regin de rechazo de una prueba unilateral,
para un mismo nivel de significacin o.
Sociologa IV Juan Jos Torres
6. Valor de la prueba estadstica
Una vez que se han pasado todas las fases descritas, el
investigador debe tomar una decisin. Si la prueba
estadstica da lugar a un valor que se encuentra en la
regin de rechazo, entonces se rechaza 1a hiptesis
nula (H0). Si es muy pequea la probabilidad asociada
con el hecho de que ocurra bajo la hiptesis nula un
valor determinado en la distribucin muestral, se puede
explicar de dos formas la obtencin de dicho valor:
primero, se puede explicar decidiendo que la hiptesis
nula es falsa o, segundo, se puede explicar decidiendo
que ha ocurrido un suceso extrao y poco probable. En
el proceso de decisin que venimos estudiando elegimos
la primera de estas explicaciones.
Sociologa IV Juan Jos Torres
Prueba para la media de una poblacin cuando
se conoce la desviacin poblacional
Problema. Supngase que un investigador est interesado en
verificar la propiedad de los procedimientos de muestreo empleados
en un estudio local, realizado por entrevistadores sin experiencia. El
investigador en cuestin sospecha que los ingresos
correspondientes de las familias de las clases media y superior
puedan haber sido subestimados, esto es, que hayan tenido mayor
probabilidad de aparecer en la muestra que los de las familias de
ingresos ms bajos. Se dispone de datos del censo que muestran
que el ingreso familiar medio de la localidad es de 7.500 y la
desviacin estndar de 1.500. Una encuesta ms reducida
comprende 100 familias, que se suponen seleccionadas al azar, y se
encuentra que el ingreso familiar medio de esta muestra es de
7.900. Tiene razn el investigador al sospechar que la muestra
estaba distorsionada?
Sociologa IV Juan Jos Torres
Nivel de medicin: escala de intervalo
Modelo: poblacin normal
= 7500
o= 1500
Hiptesis (nula): seleccin al azar.
Eleccin de un nivel de significacin
Supongamos, por ejemplo, que se decide por un nivel de .05. A
continuacin debera decidir servirse de una prueba de una sola cola, ya
que la direccin del sesgo se ha estimado. Si resultara que la media de la
muestra era inferior a 7500, difcilmente sospechar que los que
realizaron la encuesta hayan sobre- seleccionado los grupos de ingresos
medio y superior. Dada la eleccin del nivel de .05 y de una prueba de una
sola cola, la regin crtica se determina por la tabla normal. Como quiera
que solamente el 5 por ciento del rea de la curva normal se sita a la
derecha de una ordenada de 1.65 desviaciones estndar mayor que la
media, sabemos que, si el resultado supera la media en ms de 1.65
desviaciones estndar, la hiptesis ha de descartarse.
Sociologa IV Juan Jos Torres
La distribucin del muestro de las medias seria una normal con
media = y desviacin
En valores z
Rechazamos la hiptesis nula de que la muestra es debida al azar
n
o
67 , 2
150
7500 900 . 7
/
=
=
n
X
Z
o
150
100
500 . 1
= = =
n
x s
o
Sociologa IV Juan Jos Torres
Ejercicio prctico
En una consulta que realiz una revista espaola, se encontr que el 32
por 100 de las 300 mujeres casadas que respondieron a la encuesta
promovida por la revista afirmaba que mantena relaciones sexuales
extramatrimoniales. Dado que este porcentaje parece un tanto elevado,
dado el tipo de valores sociales predominantes en la sociedad espaola, el
socilogo que supervis la encuesta sospech que las mujeres que haban
respondido a la encuesta pertenecan a grupos sociales muy concretos -
sobre todo, clase media-media y media-alta, de tipo urbano-, por lo que
no podan considerarse representativas de la poblacin femenina
espaola. Para confirmar esta sospecha, el socilogo dispona de algunos
datos referentes a la situacin socioeconmica de las mujeres que haban
respondido a la encuesta y de los mismos datos referentes a la poblacin
en general. En concreto, saba que la media de los ingresos familiares de
las mujeres casadas que haban contestado a la encuesta era de 70.000
pesetas mensuales, mientras que la media mensual de los ingresos familia
res de las familias espaolas se situaba en 60.000 pesetas, con una
desviacin tpica de 20.000 pesetas. A partir de estos datos, cmo se
puede comprobar que las mujeres que haban respondido a la encuesta
constituyen una muestra sesgada y, por tanto, no representativa de la
poblacin femenina general?
Sociologa IV Juan Jos Torres
Prueba t de student
Similar a la prueba normal, para muestras pequeas.
Cuando no se conoce la desviacin tpica poblacional, se puede
sustituir por la muestral en muestras grandes. En muestras
pequeas se utiliza la distribucin t.
La distribucin t responde a la siguiente expresin:
Cuando n es suficientemente grande (>=100) t es
aproximadamente igual a z. Cuando n es pequeo, t se aleja
bastante de la distribucin normal.
La distribucin del muestro depende del tamao de la muestra. En
la tabla t los tamaos se calculan en trminos de grados de
libertad (n-1)
1
=
N
s
x
t
Sociologa IV Juan Jos Torres
Ejemplo distribucin t
Supongamos que un profesor universitario que cuenta con una
larga experiencia docente guarda datos sobre las calificaciones
obtenidas por los alumnos de su departamento a lo largo de los
ltimos aos. Para los diez ltimos aos, en su departamento el
porcentaje medio de los alumnos aprobados ha sido del 65 por 100,
mientras que en los dos ltimos aos, en los que se han impartido
20 cursos, la media de los alumnos aprobados no ha pasado del 57
por 100, con una desviacin tpica del 10 por 100. La pregunta que
se formula ahora el profesor es la siguiente: hasta qu punto cabe
hablar de un descenso significativo en el nivel acadmico de los
alumnos universitarios durante los dos ltimos aos si se supone
que los alumnos que siguen los cursos de su departamento
representan una muestra aleatoria de los alumnos de toda la
universidad?
Sociologa IV Juan Jos Torres
La hiptesis nula H0 es que =65%, mientras que la hiptesis alternativa H1
es que <65%
No hace falta conocer la desv. tpica poblacional porque conocemos la
muestral.
La distribucin muestral que se va a utilizar es la distribucin para t. Para el
presente ejemplo, como N=20 cursos, los grados de libertad df=N-1=20-
1=19; es decir, habr que mirar en la fila df= 19 para contrastar el valor de
t. El nivel de significacin lo vamos a fijar en 0,05, para una prueba
unilateral o de una sola cola. En la tabla se puede comprobar que para 19
grados de libertad es preciso obtener un valor t igual o superior a 1,729
para que exista significacin al nivel de 0,05 para una prueba unilateral o de
una sola cola.
Rechazamos la hiptesis nula. El nivel ha bajado
1
=
N
s
x
t
44 , 3
65 57
19
10
=
= t
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Ejercicio
Se est realizando una investigacin sobre
diversos temas relacionados con colegios
mayores. Se piensa que la edad media de las
personas que en ellos habitan es menor de 21
aos. Se ha tomado una muestra de 16
personas y ha dado una media de 20. (S=3).
Puede mantenerse la afirmacin, al 95% de
que la edad de las personas residentes en
colegios mayores es menor de 21?
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Prueba de dos medias
Aunque la prueba para la media de una
poblacin se utiliza alguna vez, la prueba de la
media para dos muestras es de uso mas
frecuente. Tenemos dos muestras aleatorias
que se diferencian en relacin a una variable y
comparamos sus medias en referencia otra
variable a fin de contrastar hasta que punto las
diferencias observadas pueden considerarse o
no significativas.
Sociologa IV Juan Jos Torres
El clculo del error tpico, que se usa para comparar las
medias, depende del tipo de distribucin muestral que
se genera al extraer dos muestras aleatorias. Si las
muestras provienen de una distribucin normal, el
teorema del limite central se podra enunciar de la
siguiente manera: si se extraen muestras aleatorias de
tamao n1 y n2 de dos poblaciones que se distribuyen
normalmente y que tienen como medias 1 y 2 y como
desviaciones tpicas o1 y o2, la distribucin muestralde la
diferencia entre las dos medias muestrales ser normal
con una media (1-2 ) y una varianza o1
2
/n1+o2
2
/n2.
Lo mismo sera si tomamos dos muestras
independientes pero que son parte de una muestra
global.
Sociologa IV Juan Jos Torres
El error tpico para la diferencia de medias ser
Dado que no conocemos las varianzas poblacionales, deberemos
sustituirlas por las varianzas muestrales, luego el error queda:
Para muestras pequeas(<30):
En valores z, el valor de la diferencia de medias ser:
-1 -1
Sociologa IV Juan Jos Torres
Ejemplo
Estudiamos dos muestras de 70 hombres y 70 mujeres
con respecto a su nivel de etnocentrismo (se refiere a la
tendencia a evaluar a todos los grupos de personas
usando nuestras propias normas culturales). Escala de 1
a 5 y obtenemos una media de etnocentrismo para los
hombres de 1,71 y para las mujeres de 1,54 con unas
desviaciones tpicas de 1,07 y 0,94 respectivamente.
Nuestra hiptesis de investigacin establece que las
mujeres difieren de los hombres en cuanto al nivel de
etnocentrismo. Comprobar esta hiptesis al nivel de
significacin del 0,05.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Diferencia de proporciones
El estudio inferencial de la diferencia entre dos proporciones
puede considerarse como un caso especial de una diferencia
entre dos medias.
Si se representasen todas las diferencias en una curva, se
distribuiran normalmente alrededor de la diferencia media de
cero y un error tpico:
en donde P es la proporcin
en la poblacin de la caracterstica que se est estudiando,
Q= 1- P, N1 es el nmero de casos en la primera muestra y N2
es el nmero de casos en la segunda muestra.
Este error es el error tpico de la diferencia entre proporciones.
Sociologa IV Juan Jos Torres
Pocas veces se conoce el valor verdadero de los parmetros P y Q. Lo
que suele ser ms frecuente es que slo se disponga de las
proporciones muestrales, P1 y P2 que son estimaciones de las
proporciones de las subpoblaciones de las muestras N1 y N2. Para
obtener una estimacin ms fiable de P, se pueden combinar las
estimaciones muestrales de acuerdo con la frmula:
q =1- p. Si se sustituyen los valores estimados de las proporciones en
la frmula del error tpico anterior, se obtiene la estimacin del error
tpico de la diferencia entre dos propor ciones mediante el clculo de
la siguiente expresin:
A partir de estas formulas se puede contrastar la hiptesis nula pues:
Sociologa IV Juan Jos Torres
Ejemplo
Se da una muestra de 250 padres y 120 madres, se obtuvo que el
45% de los padres estaban a favor de la enseanza pblica,
mientras que las madres estaban el 38%. Puede considerarse
significativa la diferencia en cuanto a la opinin de madres y madres
respecto al tipo de enseanza.
nc = 0,05.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Ejercicio
Una muestra de 300 votantes del distrito 1 y 200 del distrito 2 mostr que
el 56% y el 48% respectivamente estn a favor de un candidato dado en
las elecciones municipales. Al nivel de significacin 0,05 ensayar la
hiptesis de que hay diferencia entre los 2 distritos con respecto al
porcentaje de votos.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Ejercicio
Un grupo de jvenes se distribuye se distribuyen de la siguiente
manera, teniendo en cuenta si son estudiantes o trabajan y sus
preferencias polticas:
Si se seleccionan individuos al azar y P(A)= Probabilidad de elegir
un estudiante, P(B)= Probabilidad de elegir a un individuo de
izquierda y P(C)= probabilidad de elegir un trabajador se pide:
1. P(ABC)
2. P(A o B)
3. P(A o C)
Preferecia poltica Estudiantes Trabajadores
Izquierda 150 450
Derecha 250 350
Sociologa IV Juan Jos Torres
Ejercicio
Queremos hace una investigacin sobre el
consumo de drogas entre los jvenes de 14 a
21 aos de la comunidad de Madrid. Que
tamao tendra la muestra para nuestro estudio
si fijamos un margen de error global del 3%,
P=Q=50% y un nivel de confianza de :
1. 95,5%
2. 99,7%
K
2
PQ
n=
e
2
Sociologa IV Juan Jos Torres
Ejercicio
Hemos realizado una investigacin para conocer que
nmero de espaoles, de los 44 millones que somos,
poseen un animal domstico. Hemos realizado una
encuesta a 4.000 individuos y un 18% de ellos
declararon poseer uno.
Sabiendo que la muestra se ha tomado con un nivel de
confianza del 95,5%(dos sigma) y para P=Q=50%. Se
pide:
1. El margen de error global para la encuesta.
2. Cuantos espaoles poseen un animal domstico
(Estimar puntualmente y por intervalo)
K
2
PQ
n=
e
2
Sociologa IV Juan Jos Torres
Estimacin de medias
Se est estudiando la edad media de los
universitarios espaoles. Para ello se toma una
muestra de 400 alumnos y nos da una media de
edad de 23 aos con una desviacin tpica de
2,8. Estimar el intervalo de confianza al 95%
para la media de edad de la poblacin
universitaria espaola.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
De una muestra de 30 personas matriculadas en
un curso para mayores de 25 aos (acceso a la
universidad) en Madrid, la edad media era 33 y
la S = 4. Estimar el intervalo de la edad media
de las personas que estn matriculadas en dicho
curso en Madrid, nivel de confianza 95%.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Para estimar la proporcin de estudiantes de una
universidad que est a favor de la reinsercin
social del delincuente, se entrevist
aleatoriamente a 500 estudiantes. El 58% estaba
a favor. Hallar el intervalo de confianza en el cual
se hallar la proporcin poblacional universitaria
que se encuentra a favor. NC = 95%.
Estimacin de proporciones
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
200 votantes fueron seleccionados
aleatoriamente y 110 se mostraron favorables al
candidato A. Estimar la proporcin porcentual
de votantes al candidato A en dicha poblacin
usando un intervalo de confianza del 95%.
Si la poblacin consta de 100.000 personas,
calcular el intervalo para el nmero de personas
favorables al candidato A.
Sociologa IV Juan Jos Torres