Você está na página 1de 137

Estadstica Inferencial

Juan Jos Torres


Sociologa IV Juan Jos Torres
Estadstica Inferencial
Estudio de grupos pequeos (muestras), a fin de sacar
conclusiones respecto a grandes grupos de personas
(poblaciones)
La utilidad de la muestra viene de la imposibilidad de
acceder al total de la poblacin.
El objeto de la sociologa es el estudio de colectivos
humanos, desde su observacin, hasta el conocimiento
de sus caractersticas y leyes de distribucin, incluyendo
la interdependencia y conexiones entre ellos y dentro de
ellos as como del valor de la inferencia que se haga
acerca de ese colectivo, basndose en las muestras
observadas.
Sociologa IV Juan Jos Torres
Estadstica Inferencial
Vamos a hablar de estimaciones de valores de
las poblaciones (parmetros poblacionales) a
travs de datos obtenidos mediante muestras
(estadsticos o estimadores).
Tambien hablaremos de la fiabilidad o confianza
de estos estadsticos a la hora de estimar los
parmetros.

Sociologa IV Juan Jos Torres
Estadstica Inferencial
Tcnicas inferenciales:
Estimacin por parmetros para los distintos niveles
de medicin
Nominal y ordinal: porcentaje
Intervalo: medias
Pruebas de hiptesis para los diferentes niveles de
medicin. Las mismas, mediante anlisis univariable
o bivariable.


Sociologa IV Juan Jos Torres
Estadstica Inferencial
Elementos bsicos:
Teora de las probabilidades
Teora del muestreo
Sociologa IV Juan Jos Torres
Probabilidad
Fenmeno aleatorio: Un fenmeno es aleatorio si puede
dar lugar a varios resultados, sin que pueda ser posible
enunciar con certeza real cual va a ser el resultado del
fenmeno.
Espacio muestral :conjunto de los posibles resultados de
ese fenmeno. El suceso de un experimento aleatorio
ser un subconjunto del espacio muestral.
Caractersticas de un fenmeno aleatorio:
Probabilidad de repeticin indefinida de un fenmeno en
condiciones similares.
Imposibilidad de predecir exactamente el resultado de cada
experimento particular.
Sociologa IV Juan Jos Torres
Variable aleatorio
En una magnitud que puede aparecer en un
experimento aleatorio. Asigna un nmero al
resultado de cada experimento aleatorio. Los
valores que toma son nmeros reales.
Cada variable puede tomar diversos valores
dependiendo del azar. As pues, no basta con
conocer los posibles valores que puede tomar,
sino la probabilidad de que estos ocurran.
Sociologa IV Juan Jos Torres
Tipos de variables aleatorioas
Discreta: puede tomar determinado n de
valores.
Continua: Puede tomar un conjunto continuo de
valores.
Sociologa IV Juan Jos Torres
Probabilidad aprioristica
En una poblacin cada uno de sus elementos tiene las
mismas opciones de ser seleccionado en una muestra.
Todos tienen la misma probabilidad individual, son
equiprobables.
Probabilidad a priori de eleccin de un elemento con
una caracterstica determinada es igual a la frecuencia
relativa de esa caracterstica.

P(A)= a/n = casos favorables/casos posibles

La probabilidad al igual que la frecuencia relativa, oscila
entre 0 y 1. Si P=1 ocurrir seguro, si P=0 no ocurrir
nunca.
Sociologa IV Juan Jos Torres
Probabilidad emprica
Se basa en el supuesto de que la proporcin de
apariciones de los sucesos observada en el
pasado, persistir en el futuro. Son tan solo
estimaciones de las probabilidades
verdaderas,`pero cuanto sea mayor sea el
nmero de casos total observados ms precisa
ser la estimacin.
Apoyndonos en la experiencia previa, es
posible obtener buenas estimaciones de los
sucesos.
Sociologa IV Juan Jos Torres

Dos sucesos A y B se excluyen mutuamente si
no tienen elementos en comn. A y B no
pueden acontecer juntos.
Vamos a introducir los trminos unin () e
interseccin ().
A B : Ocurrencia de A B
A B : Ocurrencia de A y B
Sucesos que se excluyen mutuamente
Sociologa IV Juan Jos Torres
Propiedades de las probabilidades
1. La probabilidad oscila entre 0 y 1.
0 P(A) 1
2. Regla de la adicin.
a. Si los sucesos A y B son mutuamente excluyentes, la
probabilidad de obtener A o B es igual a la suma de
sus probabilidades. P(A o B) = P(AB)= P(A)+P(B)
P(AB C)= P(A)+P(B) +P(C)
b. Fenmenos no mutuamente excluyentes.
P(AB)= P(A)+P(B)-P(AB)
Sociologa IV Juan Jos Torres
Propiedades de las probabilidades
3. Regla de la multiplicacin
a. Fenmenos mutuamente excluyentes
P(AB)=0
Fenmenos no mutuamente excluyentes
1) Sucesos independientes
P(AB)= P(A) P(B) (
2) Sucesos independientes
P(AB)= P(A) P(B/A) *(probabilidad condicionada)

P(B/A)= P(BA)/ P(A)

Puede ampliarse a ms sucesos, A, B, C, D...
Sociologa IV Juan Jos Torres
Combinatoria
El anlisis combinatorio se utiliza para la
obtencin de probabilidades de sucesos
complejos cuando la enumeracin de los casos
es difcil y laboriosa. Se refiere a la forma en
que pueden asociarse un conjunto de
elementos.
Vamos a ver la variaciones, permutaciones y
combinaciones.
Sociologa IV Juan Jos Torres
Variaciones
Se refiere a los distintos grupos que pueden formarse
con m elementos tomados de n en n. Siendo n<m



Ej: V3,2 =3*2/1= 6 [(1,2) (2,1) (1,3) (3,1) (2,3) (3,2)]

Dos grupos son distintos si difieren en el orden o la
naturaleza de sus elementos

Vm,n =
m!
(m-n)!
Sociologa IV Juan Jos Torres
Permutaciones
Los grupos varan solo en el orden de los
elementos que lo integran. Puede considerarse
como un caso particular de las variaciones
cuando m=n.
Pmn= n!
P3 =6 [(123) (132) (312) (321) (231) (213)]

Sociologa IV Juan Jos Torres
Combinaciones
Cuando los grupos varan por la naturaleza de sus
elementos, sin tener en cuenta el orden.


Cm,n =
m

=
m!
=
Vmn
n n! (m-n)! Pmn
C3,2 =3 (1,2) (1,3) (2,3)
Sociologa IV Juan Jos Torres
Muestreo
La teora del muestreo es el estudio de las relaciones existentes
entre una poblacin y las muestras extradas de la misma.
Poblacin es el conjunto de casos o unidades que tienen en
comn una serie determinada de caractersticas (fumadores,
trabajadores del sector servicios, propietarios de olivares) sobre las
que se desea obtener cierta informacin. Esta informacin puede
consistir en la proporcin de personas con ingresos superiores a
una cantidad, la extensin media de cultivos dedicados al olivo, etc.
Estos valores que se pretenden conocer y que se expresarn
mediante medidas de frecuencia, tendencia central o variacin,
tales como proporciones, razones, medias, desviaciones tpicas, etc.
se les denomina valores verdaderos o parmetros.

Sociologa IV Juan Jos Torres
Muestreo
Normalmente dichos valores no se pueden calcular directamente
porque las poblaciones no son directamente asequibles. As hay que
recurrir al muestreo, que es un procedimiento por el que se
infieren los valores verdaderos de una poblacin, a travs de la
experiencia obtenida con un grupo que contiene un nmero menor
de casos que la poblacin. Una muestra ser el grupo de
elementos seleccionados con la intencin de estimar los valores
verdaderos de la poblacin. Deber procurarse que el nmero de
elementos sea lo suficientemente representativo para que puedan
realizarse generalizaciones seguras sobre la poblacin. Los valores
hallados en la muestra son llamados estadsticos o estimadores.
Los procedimientos de muestreo son unos medios para desarrollar
una adecuada validez externa.
Sociologa IV Juan Jos Torres
La muestra
Una muestra es simplemente, en general, una parte representativa de
un conjunto, poblacin. o universo, cuyas caractersticas debe reproducir
en pequeo lo ms exactamente posible.

De modo ms cientfico, se pueden definir las muestras como una parte de
un conjunto o poblacin debidamente elegida, que se somete a
observacin cientfica en representacin del conjunto, con el propsito de
obtener resultados vlidos, tambin para el universo total investigado.

Las muestras tienen un fundamento matemtico estadstico. Este consiste
en que obtenidos de una muestra, elegida correctamente y en proporcin.
Adecuada, unos determinados resultados, se puede hacer la inferencia o
generalizacin, fundada matemticamente, de que dichos resultados son
vlidos para el universo del que se ha extrado la muestra, dentro de unos
lmites de error y probabilidad, que se pueden determinar estadsticamente
en cada caso.
Sociologa IV Juan Jos Torres
Muestro y probabilidad
Al hablas de muestreo debemos mencionar la teora de las
probabilidades. Las muestras obtenidas son muestras
probabilsticas: en ellas cada elemento del universo tiene una
probabilidad igual e independiente de figurar en la muestra. En este
supuesto, las estimaciones son insesgadas y se pueden
calcular los errores de muestreo que permiten determinar la
precisin de las estimaciones.
Un estimador es insesgado si, en promedio, los valores del
estadstico obtenidos del muestreo realmente son iguales al
parmetro.
Sociologa IV Juan Jos Torres
Muestro y probabilidad
Para que el muestreo sea probabilstico, es necesario que se
respete la aleatoriedad:
- Al elegir y aplicar el mtodo de seleccin
- A la hora de recoger la informacin (evitar sesgos por
sustituciones)
La precisin de un estimador va ligado al tamao de la muestra.
(no se puede llegar a niveles de desagregacin grandes) y a los
procesos de seleccin y estimacin que se apliquen.
Caso especial del muestreo por cuotas: No es estrictamente
probabilstico per puede dar lugar a estimaciones muy precisas. La
cuota suele ser introducida, solamente en la ltima fase del
muestreo.
Sociologa IV Juan Jos Torres
La muestra, ventajas
Las muestras presentan las siguientes ventajas, en las ciencias
sociales:
1. Mediante ellas, con una muestra relativamente reducida con
relacin al universo, se pueden encuestar las grandes poblaciones y
ncleos humanos, que de otra manera seria muy difcil o
prcticamente imposible investigar.
2. En todo caso las muestras suponen una gran economa en las
encuestas y la posibilidad de mayor rapidez en su ejecucin.
3.- La adquisicin de unos datos ms comprensivos. A veces un
buen plan de muestreo obtiene unas mejores estimaciones de los
valores de la poblacin que un censo. (de hecho, hasta el ltimo
censo de poblacin, los datos de los censos, eran datos de una
muestra). Un censo produce mas errores no muestrales y de
mayor magnitud que el propio error de muestreo.
Sociologa IV Juan Jos Torres
Condiciones de las muestras
Las condiciones fundamentales de las muestras son cuatro:
1. Que comprendan parte del universo y no la totalidad de este.
2. Que su amplitud sea estadsticamente proporcionada a la
magnitud del universo. Esta condicin. Se halla en relacin con el
punto prctico de determinacin del tamao de la muestra y sirve
para decidir si, segn las unidades que comprende respecto al
universo, una muestra es o no admisible.
3. La ausencia de distorsin en la eleccin de los elementos de la
muestra. Si esta eleccin presenta alguna anomala, la muestra
resultar por este mismo hecho viciada.
4. Que sea representativa o reflejo fiel del universo, de tal modo
que reproduzca sus caractersticas bsicas en orden a la
investigacin.
Sociologa IV Juan Jos Torres
El Marco Muestral
Los elementos principales de la muestra, son la base y la unidad de la
misma.
La base de la muestra es, en todo caso, la poblacin de la que se obtiene o
saca la muestra. Esta poblacin puede no estar censada o puede estarlo.
En el primer caso, existe la base de la muestra en sentido real o material,
pero no en sentido formal, mientras que en el segundo caso hay base de la
muestra tanto material, la poblacin real a investigar, como formal, el
censo de todos los individuos que la componen. Precisamente con el
trmino de base de la muestra se suele designar de manera especfica este
censo o registro.
La importancia de la base de la muestra, tomada especficamente o en
sentido estricto, se deriva de que la muestra, operativamente, es el
resultado de la eleccin de unidades dentro de una poblacin o conjunto
previamente determinado de aqullas. Por ello, fundamento bsico de la
muestra, es la existencia de un registro de dicho conjunto, en el que
aparezcan individualizadas todas sus unidades, y permita realizar la
eleccin mediante un sorteo riguroso.
Sociologa IV Juan Jos Torres
El Marco Muestral
Esta puede consistir en un censo, un registro, una lista, un fichero,
un catlogo, un mapa, un plano, etc. Se debe dar normalmente un
nmero a cada ficha o elemento del catlogo,
En la base de la muestra deben figurar individualizadas todas las
unidades que forman la poblacin con expresin de su nmero en
el universo, nombre, domicilio en su caso, etc. Por ello, la base de
la muestra hace posible la identificacin de los elementos que se
hayan seleccionado mediante la muestra y su encuesta posterior.
La base de la muestra en este sentido estricto, no siempre existe.
Hay muchos universos que no estn censados o catalogados y que
es prcticamente imposible catalogar. Por ejemplo, no lo estn el
pblico que circula por las calles ni los asistentes a un espectculo.
La solucin que se adopta entonces es practicar la eleccin de la
muestra por algn procedimiento aleatorio imperfecto, como v.g.
encuestar uno de cada cinco que se encuentren por la calle
Sociologa IV Juan Jos Torres
El Marco Muestral
Lo ideal seria formar una base de muestra especfica para la encuesta. Pero esto no
es posible, por lo general, en las investigaciones sociales. Supondra casi tanta
dificultad como efectuar la encuesta a toda la poblacin.

Por eso, normalmente, se utilizan bases ya formadas. En este caso es preciso
asegurarse de que la base est actualizada, pues si no nos exponemos a dejar fuera
de la muestra, por ejemplo, a la poblacin ms joven de ella.

Adems hay que verificar si la poblacin que queremos encuestar (universo
terico) y aquella de la que se toma de hecho la muestra (universo de trabajo) o
a la que se refiere la base de la muestra, coinciden, porque podra haber
discrepancias ms o menos extensas entre ellas.

En el orden prctico, respecto a la base de la muestra, hay que buscarla, analizarla y
prepararla a efectos del muestreo si existe. Si no existe, y ello es posible, hay que
formarla. En este caso se debe cuidar, de modo especial, segn lo indicado, que no
resulte ordenada de alguna forma que pueda determinar una eleccin distorsionada
o no representativa de la muestra.
Sociologa IV Juan Jos Torres
La unidad muestral
La unidad de la muestra es cada uno de los elementos que comprende su base y
figuran, numerados e individualizados, en el registro de la misma cuando existe.

Las unidades de este registro representan y remiten a las unidades de observacin
que forman el universo a investigar.

Las unidades de la muestra no solo pueden ser simples, sino tambin colectivas,
como cuando estn constituidas por familias, grupos, sectores de ciudades, pueblos,
etc. El nmero de individuos que comprende la unidad de la muestra cuando es
colectiva se llama talla de la muestra.

Esta talla de las unidades de la base de la muestra o poblacin es lo que determina
lo que se suele llamar el nivel de agregacin en la investigacin. Este nivel puede
presentar grados de agregacin diversos, bien de carcter espacial, social,
econmico, segn los colectivos que se elijan como agregados.

As, por ejemplo, para estudiar las compras de TV en color se puede operar al nivel
de agregacin de individuos o de colectivos y, dentro de los colectivos,
especialmente, estos pueden ser municipios, distritos, regiones, naciones. Desde un
punto de vista social los agregados pueden ser familias, establecimientos de venta,
empresas, organismos y asociaciones determinados.
Sociologa IV Juan Jos Torres
Relacin Universo-Muestra
La muestra, como se ve, es una parte
reducida de una determinada poblacin o
universo, con relacin a la cual representa
cuantitativamente una fraccin.

Pero tambin la muestra tiene la misma
forma circular que el universo. Ello pretende
indicar que, cualitativamente, la muestra
debe tener las mismas caractersticas que la
poblacin que representa.

El universo est formado por toda la
poblacin o conjunto de unidades que se
quiere estudiar y que podran ser
observadas individualmente en el estudio
(el universo de trabajo).

Sin embargo, por razones de economa se
investiga en su representacin la muestra.

UNIVERSO TEORICO-----

UNIVERSO DE TRABAJO ----

MUESTRA ------------------------







el universo o poblacin forma parte tambin
de un conjunto ms amplio al que se llama
universo terico. Este universo hipottico
est constituido por todas las poblaciones
existentes en las que se podra tambin
efectuar la investigacin proyectada

Sociologa IV Juan Jos Torres
Universo del muestreo
Para realizar un buen diseo muestral, debe tenerse muy claro que
es lo que se est muestreando. Se evitan muchos problemas si se
conceptualizan claramente los objetos que han de servir como
base para las generalizaciones de una investigacin.
Aqu deberamos diferenciar entre lo que se denomina universo
general y universo de trabajo.
Universo general es la poblacin abstracta y terica a la que el
investigador desea generalizar sus resultados, en tanto que
universo de trabajo es la operacionalizacin concreta de ese
universo general del que se va a obtener una muestra. Es
importante realizar esta distincin, porque en la investigacin
sociolgica, raramente se pueden obtener muestras directamente
del universo general.
Sociologa IV Juan Jos Torres
Tipos de muestreo
Probabilstico
Aleatorio simple
Con reemplazamiento
Sin reemplazamiento
Sistemtico
Estratificado
Por conglomerados
Polietpico
No probabilstico
De conveniencia o
Accidental
Mas similar/diferente
Caso tpico
Caso crtico
Bola de nieve
Cuotas
Sociologa IV Juan Jos Torres
Muestreo no probabilstico
Es usado en muchas investigaciones.
En la seleccin de los individuos juega un papel
importante la subjetividad del investigador.
En muchas ocasiones, es el nico mtodo posible de
muestreo.
En ocasiones cuando el investigador est interesado en
un grupo concreto de la poblacin, es el mejor mtodo
(ej: madres con nios menores de 2 aos).
En estudios exploratorios, cuando el investigador debe
determinar si un problema existe o n (estudio piloto).
Problema: la subjetividad del investigador.
Sociologa IV Juan Jos Torres
Muestreo de conveniencia
Una muestra de conveniencia es un grupo de individuos
fcilmente accesibles y dispuestos a participar en un
estudio. Son voluntarios.
El caso tpico de los experimentos: asignamos los
individuos a un grupo de tratamiento y a otro de
control.
La generalizacin esta muy afectada por los sesgos en la
seleccin y el desconocimiento de la poblacin real.
Sociologa IV Juan Jos Torres
Mas similar/ mas diferente
Utilizado en estudios gubernamentales. Se utiliza para
comparar determinadas caractersticas sociales,
econmicas o polticas entre diferentes pases. La
seleccin de casos marca los mejores y los peores
para hacer comparaciones.
Estos estudios son tiles dado que se comparan pocos
casos, necesita pocos recursos y sirve a las necesidades
de comparacin. Pero su capacidad de generalizacin
queda limitada a los casos estudiados.
Sociologa IV Juan Jos Torres
Caso tpico
Cuando hay limitaciones de tiempo o presupuesto, el
investigador selecciona una muestra de individuos que,
a su juicio, son los ms tpicos o usuales. Aquellos que
son considerados nicos o especiales no se seleccionan.
Es importante que el investigador tenga un profundo
conocimiento de las caractersticas de la poblacin que
quiere analizar.
Su problema principal es el error producido por la
subjetividad del investigador. (son los casos los mas
tpicos, o los que le han sido mas fciles de contactar).
Todos y cada uno de los casos deben ser
cuidadosamente seleccionados.
Sociologa IV Juan Jos Torres
Caso crtico
El investigador selecciona aquellos casos que, por la
experiencia anterior, permitan hacer una generalizacin
a la poblacin.
La seleccin de determinados distritos electorales para
predecir el resultado de las elecciones es una de sus
aplicaciones ms comunes.
Sociologa IV Juan Jos Torres
Bola de nieve
Una vez seleccionados los primeros individuos para una
muestra, estos se ocupan a su vez de seleccionar a
otros individuos de la poblacin. Estos a su vez
seleccionan a otros, etc..
Se utiliza cuando no se puede disponer de un listado de
los individuos de una poblacin y es muy difcil su
confeccin por parte de los investigadores.
Se aplica en grupos de consumidores de drogas,
poblaciones marginales, inmigrantes o miembros de
elites polticas, econmicas o sociales.
Sociologa IV Juan Jos Torres
Muestreo aleatorio simple
Es el muestreo probabilstico ms sencillo. Se parte de
un listado (exhaustivo) de los elementos de la poblacin
y se seleccionan aleatoriamente n elementos de la
poblacin para formar con ellos la muestra. La seleccin
aleatoria se lleva a cabo de tal forma que:
- Cada elemento de la poblacin tenga idntica probabilidad de ser
incluido en la muestra
- Cada posible combinacin de n elementos tenga la misma
probabilidad de constituir la muestra.
De tal forma que si el numero de elementos de la
poblacin es M, la probabilidad de cada elemento dentro
de la muestra es 1/M. Y el numero posible de muestras
de tamao n es igual a M
n
.
Sociologa IV Juan Jos Torres
Muestreo aleatorio simple
En este muestreo la seleccin de los elementos de la muestra se
hace en una sola etapa, directamente y sin reemplazamiento.
Equivale a censar o utilizar el censo de la poblacin en estudio,
para sacar despus, al azar, los elementos que van a formar parte
de la muestra.
Inconveniente: En universos con gran nmero de elementos, es
muy costoso hacer una relacin individualizada.
Es el muestreo terico mas deseable, per de muy difcil realizacin
en la prctica, debido fundamentalmente a los altos costes de
tiempo y econmicos que conlleva su realizacin.
Se utiliza como prototipo para el calculo de los tamaos muestrales
y los errores de muestreo, y como patrn para medir la eficacia de
los muestreos estratificados y por conglomerados.
Sociologa IV Juan Jos Torres
Teorema del limite central
Si se extraen repetidas muestras aleatorias
simples de tamao N a partir de una poblacin
distribuida normalmente, de media y de
desviacin tpica o, las medias de tales muestras
se distribuyen normalmente con media y
desviacin tpica o/ \ N
Sociologa IV Juan Jos Torres
Teorema del limite central
Las medias de las muestras aleatorias simples extradas
de una poblacin que se distribuye normalmente, dan
lugar a una distribucin muestral que es tambin
normal, aunque el tamao N sea mas pequeo. Cada
una de las muestras tiene una media X, que variar
ligeramente de un muestra a otra, pero que tendern a
agruparse en torno a y con desviacin tpica o/\N. De
aqu que cuanto mayor sea N, menor ser la desviacin
tpica y mayor el agrupamiento de las medias
muestrales (estimadores) alrededor de la media
poblacional (parmetro).
Sociologa IV Juan Jos Torres
Teorema del limite central
Existe pues tres tipos de distribuciones:
1.- La de la poblacin
2.- La de los valores dentro de cada una de las
muestras
3.- La distribucin muestral de un estadstico. En ella
los casos, son las medias de las diferentes muestras.

Sociologa IV Juan Jos Torres
Ley de los grandes nmeros
La segunda parte del teorema del lmite central, establece que, al
extraer repetidas muestras aleatorias de tamao N de una
poblacin de cualquier forma, de media y con desviacin tpica o,
cuando N es suficientemente grande, la distribucin muestral de las
medias tiende a distribuirse normalmente con media y con
desviacin tpica o/ \ N.
Lo importante es que cuando N es grande, no tenemos que
preocuparnos de la normalidad de la poblacin. . Dado que la
distribucin de probabilidades suele ser conocido (distribucin
normal), en este tipo de muestras es posible proceder a la
inferencia estadstica, trasladando los datos muestrales a la
poblacin. Haciendo las correspondientes estimaciones en base a
los datos muestrales.
Sociologa IV Juan Jos Torres
Muestreo sistemtico
Similar al anterior pero difiere la forma de seleccin de
las unidades muestrales. Se halla el coeficiente de
elevacin N/n y se elige al azar un nmero no superior a
l que sirva de arranque de la seleccin. A partir de ah
se suma el coeficiente de elevacin para hacer la
seleccin.
Se simplifica la eleccin pero se introduce un sesgo al
elegir los elementos de forma peridica, caso de que el
universo est ordenado por criterios que puedan influir
en la seleccin sistemtica.
Se emplea en la seleccin de miembros de un club,
alumnos de una escuela, etc.
Sociologa IV Juan Jos Torres
Muestreo sistemtico
Tambin se le llama muestreo por conglomerados en una
etapa.
Problema: que el listado de la poblacin est repartido de
manera cclica, de tal forma que al hacer la seleccin el ciclo
coincida con la seleccin interval.
Si existe periodicidad, debe eliminarse del marco muestral,
cambiando el orden de los elementos o seleccionar otro tipo
de muestreo.
Ventaja sobre el muestreo aleatorio: (1) no se necesita un
marco muestral completo.(2) Si el marco est ordenado
respecto a una variable de estratificacin, la seleccin
sistemtica proporciona una muestra estratificada.
Sociologa IV Juan Jos Torres
Muestreo estratificado
La poblacin marco se subdivide en fracciones o
estratos mutuamente excluyentes y exhaustivos, de
tal forma que cada unidad solo pertenezca a uno de
los estratos. As pues cada estrato puede ser
tratado de forma independiente.
Se selecciona una muestra aleatoria, simple e
independiente en cada uno de los estratos.

Sociologa IV Juan Jos Torres
Muestreo estratificado
Con este mtodo:
- se pueden reducir las varianzas de las estimaciones muestrales. Es
tanto en cuanto cada estrato rena unidades homogneas entre s
y heterogneas en relacin a las de otros estratos, con ello
aumenta la precisin de las estimaciones y disminuye el error de
muestreo.
- Facilita la coordinacin del trabajo de campo. Cada Estrato puede
formar reas operativas distintas.
- Posibilita la utilizacin simultanea, en una misma muestra de
diversos mtodos de muestreo, en funcin de las necesidades del
diseo y de la informacin disponible de cada estrato.
- Facilita la estimacin por separado de los distintos estratos, siempre
que la muestra est adecuadamente dimensionada.
Sociologa IV Juan Jos Torres
Muestreo estratificado
Si se conoce la varianza por estrato (difcil, pero se
pueden conocer indicadores, como renta, tamao de
viviendas, tamao poblacional etc.), se pueden aplicar
fracciones de muestreo distintas en cada estrato, de
acuerdo con el valor de la varianza. En estratos ms
homogneos, se pueden utilizar fracciones muestrales
ms pequeas.
En general para estratificas se suele recurrir a variables
espaciales: CC.AA., Provincias, municipios, etc. o a
subdivisiones inherentes al universo del estudio
(especialidades mdicas, etc.).
Ejemplo de muestreo estratificado: pgs. 29-31
Rodrguez Osuna.
Sociologa IV Juan Jos Torres
Muestreo por conglomerados
Muestreo en el que la unidad muestral no son los
individuos, sino un conjunto de ellos que, bajo
determinados aspectos, se puede considerar que forman
una unidad. (Hospitales, secciones censales...)
Los conglomerados son definidos tambin como reas
o partes bien delimitadas del terreno, de modo que
todas las unidades correspondientes al rea son las que
constituyen el conglomerado. (muestreo por reas).
Si los conglomerados son muy grandes deberamos
recurrir al submuestreo.
Sociologa IV Juan Jos Torres
Muestreo polietpico
El submuestreo consiste en subdividir en unidades ms
pequeas las unidades de poblacin utilizadas en el
diseo muestral.

Se utiliza cuando el nmero de elementos del
conglomerado es elevado y, no solo por la dificultad de
entrevistar a todos y cada uno de los elementos del
mismo, sino , sobre todo por la necesidad de obtener
estimaciones ms precisas.


Sociologa IV Juan Jos Torres
Muestreo polietpico
Etapas del muestreo
La seleccin de las unidades ltimas a las que ha de aplicarse la
muestra, se realiza por etapas sucesivas. El muestreo polietpico
consiste en una jerarqua de diferentes tipos de unidades.
La importancia de la estructura del conglomerado: Cuando son
homogneos, basta con tomar en primera etapa, pocas unidades de
cada uno de ellos, por lo que hay que aumentar el nmero de
conglomerados seleccionados. Si, por el contrario, los
conglomerados de 1 etapa son heterogneos, se pueden tomar
mas elementos por conglomerado y, por consiguiente, se puede
tomar un nmero menor de conglomerados.
Interesa que las unidades primeras sean altamente heterogneas
respecto a las caractersticas en estudio.
Sociologa IV Juan Jos Torres
Muestreo polietpico
Tamao de los conglomerados y proporcionalidad

Los conglomerados no siempre tienen un tamao similar
y eso afecta al proceso de seleccin de la muestra, pues
no tienen la misma probabilidad de formar parte de ella.
La seleccin suele entonces hacerse de forma que cada
uno de ellos tenga probabilidad proporcional a su
tamao. (ejemplo muestra pg. 35-38)
A veces puede ser deseable que los tamaos de los
estratos sea desproporcionado.
Sociologa IV Juan Jos Torres
Muestreo polietpico
Seleccin ltima de las unidades de muestreo
El ltimo paso sera elegir, aleatoriamente y con probabilidades
iguales, a los individuos dentro de las secciones censales. Los
sistemas utilizados para ello son mltiples y variados.
1.- El que realiza el INE en las encuestas de la EPA, EPF, etc. La
seleccin de las unidades ltimas de muestreo se hace mediante
listados sobre la composicin de la seccin: viviendas, hogares,
individuos. Permite utilizar mtodos de seleccin ms rigurosos, ya
que se tiene mayor informacin sobre el marco muestra. Este
sistema solo puede ser utilizado por el INE y los servicios
estadsticos de las CCAA ya que solo ellos pueden disponer de los
listados completos del censo y padrn de habitantes.
Sociologa IV Juan Jos Torres
Muestreo polietpico
2.- Otros institutos se basan en las secciones censales como
unidades de segunda etapa, y a partir de ellas se hace la seleccin
de los elementos de la muestra, fundamentalmente de dos formas:
- Rutas aleatorias dentro de la seccin. Donde se elige
aleatoriamente el punto de partida y posteriormente se
siguen todas las instrucciones tanto en los desplazamientos
como en la seleccin de portales, pisos, puertas e individuo
a entrevistar (explicar el mtodo de kish).
- Conseguir un plano de la seccin, calcular
aproximadamente el numero de viviendas y a partir de ah
se fija la ruta y la frecuencia de seleccin de cada vivienda.
Se saca al azar un nmero aleatorio y se comienza la ruta
por ese punto.
En estos dos sistemas de eleccin se fija aproximadamente un
nmero de 10 entrevistas por seccin.
Sociologa IV Juan Jos Torres
Muestreo polietpico
Estos sistemas son aleatorios y no precisan un conocimiento
tan preciso del marco muestral, pero tienen dificultades
porque, la persona elegida aleatoriamente para ser
entrevistada impone una gran rigidez: est de viaje, no est
en casa y volver tarde. No quiere responder, etc. Debe
evitarse el recurso fcil de las sustituciones (aunque en la
realidad se practica) para ello se contempla la obligacin de
realizar hasta tres visitas al domicilio para hablar con la
persona seleccionada.
3.- Otra forma mas sencilla es, una vez elegidos los
municipios donde van a hacerse las entrevistas, se define el
numero de rutas, tantas como sean necesarias para que en
cada una de ellas haya de 8 a 10 entrevistas. Sobre mapas se
eligen aleatoriamente los puntos de partida y se procede a la
realizacin de igual forma que en las anteriores.
Sociologa IV Juan Jos Torres
Muestreo por cuotas
Para evitar las rigideces de los sistemas anteriores, se
recurre muchas veces al muestreo por cuotas.
El ms utilizado por los institutos de investigacin de
mercados y opinin. Se emplea en la ltima etapa y
consiste en proporcionar al entrevistador el perfil de la
persona que tiene que entrevistar en cada una de las
secciones en las que va a trabajar.
La seleccin aleatoria del ultimo estrato se deja, en
parte al criterio del entrevistador, siempre que recoja la
informacin de aquellos individuos que se le asignan. La
distribucin total de los individuos de la muestra,
reproduce la composicin del censo, y reflejan, por
tanto perfectamente el universo de la muestra.
Sociologa IV Juan Jos Torres
Muestreo por cuotas
A la hora de disear la muestra deben tenerse en
cuenta los criterios que se van a utilizar para la
clasificacin de los individuos. Lo mas usual es utilizar
cuotas de sexo y edad, que en la mayora de las veces
no tiene demasiado que ver con las variables de la
encuesta, pero que son fciles de obtener.
La seleccin por cuotas slo debe aplicarse en la
unidades ltimas del muestreo.
La composicin de las cuotas viene dada por el
conocimiento, normalmente de los censos de poblacin
de la proporcin de individuos que poseen las
caractersticas de cada categora de una variable. Ej
Sexo.
Sociologa IV Juan Jos Torres
Muestreo por cuotas
Para que el proceso se acerque ms a la aleatoriedad, se suelen dar
instrucciones concretas a los entrevistadores como:
Las entrevistas solo se harn en las viviendas.
Cuando en las viviendas hay ms de una persona que pueda ser entrevistada, se
selecciona a la ms joven.
Las entrevistas solo se pueden realizar en las secciones o reas previstas en la
muestra.
No se pueden hacer entrevistas a los amigos, primos, etc.
Se utiliza mucho porque agiliza y simplifica el trabajo de campo.
Sabes que las sustituciones no deformarn el diseo muestral.
En grandes investigaciones de carcter estatal, nunca se utiliza este
tipo de investigacin

Sociologa IV Juan Jos Torres
Tamao de la muestra
Universos pequeos
Media
NK
2
o
2

n=
Ne
2
+K
2
o
2

Proporcin
NK
2
P(1-P)
n=
(N-1)e
2
+K
2
P(1-P)
Total
N
2
K
2
o
2

n=
e
2
+NK
2
o
2



n= Tamao muestral
N= Tamao poblacional
K= Nivel de confianza
o
2=
Cuasivarianza poblacional
e= Eerror del muestreo
P= Proporcin
P(1-P)= Varianza
Sociologa IV Juan Jos Torres
Tamao de la muestra
Universos grandes
Media
NK
2
o
2

n=
Ne
2
+K
2
o
2

Proporcin
K
2
P(1-P)
n=
e
2

Total
N
2
K
2
o
2

n=
e
2
+NK
2
o
2



n= Tamao muestral
N= Tamao poblacional
K= Nivel de confianza
o
2=
Cuasivarianza poblacional
e= Eerror del muestreo
P= Proporcin
P(1-P)= Varianza
Sociologa IV Juan Jos Torres
Tamao de la muestra
Tamao de la muestra y precisin de los estimadores son conceptos
inseparables. Cuando uno vara, el otro tambin en el mismo
sentido.
A medida que aumenta la precisin del estimador,el intervalo de
confianza se hace menor, y por tanto, las diferencias entre los
parmetros poblacionales y los estimadores se hace menor. Esta
precisin se mide por el error de muestreo, que no es mas que la
desviacin tpica del estimador.
En funcin del objetivo de nuestra investigacin, admitiremos un
margen mayor o menor de error, y en funcin de ello el tamao de
la muestra variar.
Sociologa IV Juan Jos Torres
Factores que intervienen
Varianza poblacional
El conocimiento de la homogeneidad o heterogeneidad en el
aspecto que se quiere analizar, es determinante a la hora de
calcular el tamao de la muestra, cuanto mas homogneos son los
elementos de una poblacin, mayor es la precisin de sus
estimadores para un numero determinado de entrevistas.
Debera intentarse el conocimiento aproximado de la varianza: (1)
La experiencia en estudios que se repiten peridicamente o (2)
mediante estudios piloto. No obstante, como se suelen preguntar
muchas cosas, lo normal es tomar la opcin ms desfavorable
p=q=0,5 exige un tamao muestral mayor, pero garantiza que no
nos equivocaremos.
Sociologa IV Juan Jos Torres
Factores que intervienen
El tipo de muestreo
Tambin influye en el tamao de la muestra. En relacin al
muestreo aleatorio simple, el muestreo por conglomerados es
menos preciso y el estratificado lo es ms. De ah que siempre
que se pueda, sea deseable realizar un muestreo estratificado.
Nivel de confianza
A la hora de disear la muestra, se debe fijar el nivel de confianza,
de acuerdo con los objetivos de la investigacin. En general en
CC.SS. se utilza un nivel de confianza del 95,5% .
Sociologa IV Juan Jos Torres
Factores que intervienen
Afijacin de la muestra
Es la distribucin de la muestra entre los diferentes subconjuntos
en que se puede dividir el universo.
Tipos de afijacin
Simple: asignar a cada estrato un numero igual de entrevistas
Proporcional: de acuerdo con el peso relativo de la poblacin de
cada estrato.
Optima: tiene en cuenta la homo o heterogeneidad de la
poblacin bajo determinados aspectos.
Sociologa IV Juan Jos Torres
Afijacin
Simple
Se pretende que la muestra, para un determinado nivel de error,
sea representativa para cada uno de los estratos, y por tanto
puedan sacarse conclusiones a ese nivel. En la prctica, y para
conseguir este objetivo, se suele utilizar la proporcional,
cargando la muestra en los estratos en los que interesa obtener
estimaciones mas prximas a la realidad.
Optima
Estratos homogneos(o pequea) --> Muestra pequea
Estratos heterogneos(o grande) --> Muestra mayor
Sociologa IV Juan Jos Torres
Desagregacin
A veces es preciso disear muestras para estimas no solo la
poblacin tomada como un todo sino tambin de diferentes partes
del universo de estudio.
Segn analizamos grupos mas pequeos de la muestra, el grado de
error en las estimaciones aumenta. Para resolver esto se pueden
adoptar varias decisiones:
Aumentar el tamao de la muestra total, hasta que el de la submuestra
sea el adecuado. Es muy costoso y poco eficiente.
Afijacin no proporcional tratando cada subdivisin como si fuera un
universo diferente. Solo se incrementa la muestra en aquellas reas
que interesa estudiar. Ejemplo de la EPA.
Sociologa IV Juan Jos Torres
Ponderacin de la muestra
Las tcnicas de afijacin no proporcional hacen que las fracciones
de muestreo sean distintas y, por lo tanto, si se quieren tabular
conjuntamente las diferentes submuestras, hay que proceder a su
ponderacin, si no quieren deformarse las estimaciones. Se
pretende devolver a cada subpoblacin o estrato, la
proporcionalidad que tiene en la realidad con el objeto de poder
agregarlas.
Elevadores: otra forma de homogeneizar las sumbuestras, para
poder agregarlas es recurrir al sistema de elevadores (la inversa de
la fraccin de muestreo), con lo que se consigue trasladar los
resultados al universo total. Para utilizarlos hay que conocer el
tamao real del universo, sino se falsearan los datos del estudio.
Sociologa IV Juan Jos Torres
Estimaciones y errores de muestreo
En el diseo de la muestra se determinan el tamao de la misma,la
afijacin, el tipo de muestreo y el proceso de seleccin de los
individuos, conjugando las tcnicas de muestreo y el conocimiento
del universo. Posteriormente, y en base a la muestra diseada, se
realiza la recogida de la informacin mediante el trabajo de campo,
al que se le aplican los correspondientes controles para que no se
distorsione la muestra proyectada. Mas tarde se graba la
informacin, se somete a procesos de control y verificacin y,
finalmente se realiza la tabulacin que dar como resultado la
estimacin de los parmetros poblacionales.
Sociologa IV Juan Jos Torres
Estimaciones y errores de muestreo
Entre el diseo de la muestra y la estimacin de parmetros, est el
proceso de muestreo y tabulacin, pasandose de los supuestos a la
realidad de los datos y de la aproximacin a la concrecin de los
datos.
De la formula del tamao muestral, el tamao n y el nivel de
confianza K se mantienen invariables, pero seguramente los valores
reales de P no tiene porque ser 0,5, lo que supone que el error de
muestreo e ha variado y, por tanto el nivel de precisin de las
estimaciones. Por ello una vez realizada la encuesta, hay que pasar
de las aproximaciones efectuadas en el diseo a concreciones
individualizadas.
Hay que pasar de la estimacin puntual a la estimacin por
intervalo.
Sociologa IV Juan Jos Torres
La estimacin
Supongamos que siguiendo el procedimiento aleatorio
simple, hemos obtenido una muestra de n unidades. La
expresin es un estimador de la proporcin P.

a es el total de individuos que tiene una caracterstica.
El estimador ha sido calculado en base a las n unidades
de la muestra, en lugar de las N unidades que
constituyen la poblacin. As cometemos un error que
llamaremos error de muestreo. Este error debemos
procurar que sea lo ms pequeo posible. La
estimacin del error de muestreo se hace mediante la
frmula:
n
a
p =
1
) 1 ( *
*


= =
n
p p
N
n N
s e
Sociologa IV Juan Jos Torres
Errores de muestreo
Universos pequeos

Media





Proporcin

Universos grandes

Media


( o
2=
s
2
)



Proporcin

1
) 1 ( *
*


= =
n
p p
N
n N
s e
n N
n N
s e
2
*
o
= =
n
s e
2
o
= =
1
) 1 ( *

=
n
p p
s
n
p p
s
) 1 ( *
=
N
n
N
n N
=

1
como En muestras grandes n/N=0
Sociologa IV Juan Jos Torres
La estimacin
Con la estimacin de parmetros, deseamos
estimar el valor de un parmetro a travs de un
estadstico calculado en la muestra. Ej: edad
media de una poblacin o el % de abstencin
en una votacin.
Estimacin puntual: Se estima un parmetro
poblacional a travs de la media o la proporcin
calculados en la muestra. Un problema es que
no podemos establecer la probabilidad de que el
estimador sea igual al parmetro.
Sociologa IV Juan Jos Torres
La estimacin
Estimacin por intervalo: Dado que la
estimacin del parmetro poblacional depende
del error y del nivel de confianza, el valor
estimado no ser nico, sino que estar
comprendido en un intervalo cuyos lmites sern
el estimador nivel de confianza por error
tpico. El tamao de la muestra determina la
amplitud del intervalo.
Sociologa IV Juan Jos Torres
Intervalo de confianza
A partir de la estimacin del error de muestreo se pueden
determinar los intervalos de confianza, que son del tipo (p-ks,
p+ks).
El valor que se trata de estimar se encuentra dentro de ese
intervalo con una confianza medida en trminos de probabilidad.
Determinada por el valor que tome k.
As, para la proporcin a un nivel de confianza del 95,5% el
intervalo ser



Para le media ser
n
pq
p P
n
pq
p 2 2 + < <
n
x X
n
x
2 2
2 2
o o
+ < <
Sociologa IV Juan Jos Torres
Ejemplo
Supongamos que hacemos una encuesta para estimar el nivel de
parados. La muestra es de 1.000 entrevistas. con un margen de
error de 3,16% para un nivel de confianza del 95,5%=2 sigma y
para P=Q=50%.
Una vez realizada la encuesta el porcentaje de parados es del 12%.
Entre que valores oscilar el parmetro poblacional?



1000
88 * 12
2 12
1000
88 * 12
2 12 + < < P
) 06 , 14 ( 06 , 2 12 ) 94 , 9 ( 06 , 2 12 + < < P
Sociologa IV Juan Jos Torres
Significado del intervalo
Como P es un valor fijo, la probabilidad de encontrarse
entre 9,94 y 14,06 es 1 o 0. Es decir, o bien est dentro
de esos limites o no est. Lo que vara de muestra a
muestra es el estadstico p, dado que al no conocer P,
se construye el intervalo alrededor de p, la posicin del
intervalo en relacin al parmetro depende de la
localizacin del valor particular de p que se ha utilizado
a partir de la distribucin muestral. Dado que el 95,5%
de las proporciones p se encuentran dentro de 2
unidades de desviacion de la proporcin de la poblacin
y como hemos utilizado 2 sp para construir el intervalo
alrededor de p, cualquier p dentro de dichos lmites dar
lugar a un intervalo de confianza que incluir a P.
Sociologa IV Juan Jos Torres
Significado del intervalo
P
Z=+2 Z=-2
Sociologa IV Juan Jos Torres
Significado del intervalo
Las proporciones p1, p2, p3, p4 y p6 se encuentran
dentro del intervalo 2 sp, mientras que la proporcin
p5 se encuentra fuera de dicho intervalo. La
probabilidad del 95,5 por 100 utilizada en nuestro
ejemplo significa que si se realizara un gran nmero de
estimaciones por intervalo, tales como las que aparecen
en el grfico anterior, y cada una de ellas basada en una
muestra p, el 95,5 por 100 de los intervalos de
confianza incluiran el parmetro y slo el 4,5 por 100
de ellos lo dejaran fuera.
Sociologa IV Juan Jos Torres
Adems de servir como indicacin del grado de exactitud de una
estimacin, la colocacin de un intervalo de confianza alrededor de
una estimacin puede servir, implcitamente, para contrastar una
serie de hiptesis. En efecto, en un intervalo de confianza se
contiene una prueba implcita para cada posible valor del
parmetro, por ejemplo la media, que se desea contrastar. La
hiptesis alternativa se establece de forma que el valor del
parmetro que se desea estimar quede dentro del intervalo de
confianza para el nivel de probabilidad elegido. As, por ejemplo, si
establecemos un nivel de significacin del 0,05, sabemos que el
intervalo de confianza, en el caso de estimacin de una media,
tendr como lmites 1,96 error de la media. Pues bien, si la
media muestral queda dentro de dichos lmites se aceptar la
hiptesis, mientras que si se obtiene un valor que queda fuera se
rechazar la hiptesis.
Sociologa IV Juan Jos Torres
Estimacin de medias
De igual modo que se ha hecho con la estimacin de proporciones,
La estimacin puntual de medias puede transformarse fcilmente en
una estimacin por intervalo de tales parmetros. Cuando N es
suficientemente grande, la distribucin muestral apropiada es la
distribucin normal, y la frmula para las puntuaciones o valores
tpicos, puede ser transformada algebraicamente
para dar lugar a la siguiente expresin de los lmites de confianza:

en donde lc es el lmite de confianza (que sustituye a en la
frmula anterior), x es la media muestral, s
x
es el error tpico de la
media en la muestra y z es el valor o puntuacin tpica.
Sociologa IV Juan Jos Torres
PRUEBAS DE DECISION ESTADISTICA
Los dos grandes temas que estudia la estadstica inferencial son
1. la estimacin de los parmetros de la poblacin y
2. las pruebas estadsticas.

Los mtodos de la estadstica inferencial nos sealan los
procedimientos que hemos de seguir para poder extraer
conclusiones vlidas y fiables, a partir de la evidencia que
suministran las muestras. La lgica de tales procedimientos indica
las condiciones bajo las que se ha de obtener la evidencia
buscada, y las pruebas estadsticas determinan cul ha de ser el
tamao de las diferencias observadas para tener la seguridad de
que representan diferencias reales en la poblacin de la que
hemos obtenido la muestra. Igualmente, las pruebas estadsticas
nos permitirn saber si una muestra en la que se ha observado la
proporcin pn puede proceder de una poblacin en la que hay una
proporcin P.
Sociologa IV Juan Jos Torres
Problemas que trata de resolver la estadstica
inferencial en torno a las pruebas estadsticas.
1. Determinar, en trminos de probabilidad, si las
diferencias observadas entre dos muestras significan
que las poblaciones de las que se han obtenido las
muestras son realmente diferentes.

Al obtener dos grupos de valores por medio de
procedimientos aleatorios es muy probable que, por el
propio azar introducido en las operaciones, los valores
sean diferentes entre s. En tal caso, cmo podemos
determinar para cualquier caso que las diferencias
observadas se deben o no al azar? Es decir, como
determinar, en trminos probabilsticos, si las
diferencias observadas se encuentran dentro del
intervalo que se puede considerar debido al azar o si
son tan amplias que ello significa que las dos muestras
provienen probablemente de dos poblaciones
diferentes.
Sociologa IV Juan Jos Torres
2. Por otro lado, otro problema comn que se presenta en
la estadstica inferencial es el de determinar si es
probable que un valor obtenido a partir de una muestra,
por ejemplo una proporcin, pertenece realmente a una
poblacin. Esta prueba de comparacin de una
proporcin observada a una proporcin terica, y la
prueba de si las diferencias observadas en las muestras
re presentan realmente diferencias entre las respectivas
poblaciones, sirven de base para desarrollar los
fundamentos de las pruebas de decisin estadstica,
llamadas tambin pruebas de hiptesis.
Problemas que trata de resolver la estadstica
inferencial en torno a las pruebas estadsticas.
Sociologa IV Juan Jos Torres
EL USO DE LAS PRUEBAS DE
DECISIN ESTADSTICA
De una forma esquemtica, se puede afirmar que una parte
importante de la investigacin que se lleva a cabo en el campo de
la sociologa est relacionada con la determinacin de la
aceptabilidad o rechazo de las hiptesis que se deducen de las
teoras sociolgicas. Para contrastar tales hiptesis se obtiene
informacin emprica que nos ha de servir para tal fin, es decir,
para aceptar, rechazar o revisar las hiptesis.
Naturalmente, no podemos basarnos en procedimientos subjetivos
si queremos contrastar cientficamente una hiptesis. Necesitamos
criterios objetivos que, basndose en la informacin emprica
obtenida, por un lado, y en el margen de riesgo que deseamos
asumir en relacin a nuestra decisin, por otro, permitan obtener
conclusiones vlidas y fiables.
Sociologa IV Juan Jos Torres
Procedimientos a seguir
1. Formulacin de las hiptesis estadsticas, esto es, de la hiptesis
nula (H0 y de la hiptesis alternativa (H1).
2. Eleccin de una prueba estadstica (con su modelo estadstico
asociado) para contrastar H0
3. Especificacin de un nivel de significacin (o) y un tamao de la
muestra (n).
4. Encontrar (o asumir) la distribucin muestral de la prueba
estadstica en el supuesto de Ho.
5. En base a los puntos anteriores, definicin de la regin de rechazo
de la hiptesis nula.
6. Clculo del valor de la prueba estadstica, utilizando los datos
obtenidos a partir de la muestra. Si dicho valor se encuentra dentro
de la regin de rechazo, la decisin que se toma es la de rechazar
la hiptesis nula H0 si, por el contrario, dicho valor se encuentra
fuera de la regin de rechazo, la que se toma es que no se puede
rechazar H0 al nivel de significacin elegido.
Sociologa IV Juan Jos Torres
1. Formulacin de las hiptesis
estadsticas
La hiptesis nula (H0) es la hiptesis que se desea contrastar. Se
suele formular con el deliberado propsito de ser rechazada.
Cuando se consigue rechazarla, entonces se acepta la hiptesis
alternativa (H1 La hiptesis alternativa es la proposicin operacional
de la hiptesis de trabajo o hiptesis de la investigacin que desea
contrastar el investigador, es decir, la prediccin que ha sido
deducida de la teora sometida a la prueba de contrastacin.
Supongamos, por ejemplo, que se tiene una poblacin que contiene
una proporcin Pa desconocida de miembros que presentan una
determinada propiedad, y que slo se conoce la proporcin pb
observada en una muestra de n individuos procedente de dicha
poblacin. La hiptesis nula (H0 se establecera, en este caso, del
siguiente modo: la muestra procede de una poblacin cuya
proporcin pb es igual a la proporcin terica P, es decir, pa = P. La
diferencia entre la proporcin observada pa y la proporcin terica
P ser pequea, ya que se debe tan slo a las fluctuaciones
aleatorias introducidas por el procedimiento del muestreo.
Sociologa IV Juan Jos Torres
Hiptesis alternativa
La hiptesis alternativa (H1 se establecera, igualmente, de la
manera siguiente: la muestra procede de una poblacin cuya
proporcin pa es diferente de la proporcin terica P, esto es, pa=P.
En tal caso, la diferencia entre la proporcin observada pb y la
proporcin terica es demasiado grande como para que se deba tan
slo al azar.
La propia naturaleza de la hiptesis de la hiptesis de la
investigacin determina la forma en que se ha de formular H1. Si la
hiptesis de la investigacin seala que la proporcin pa de la
propiedad estudiada difiere de la proporcin terica, entonces la H1
establece que pa=P. Pero si la teora predice la direccin de la
diferencia, esto es, que una proporcin es mayor que otra, en tal
caso H1 puede ser pa>P, o bien pa<P (esto es, que pa es mayor
que P, o bien que pa es menor que P).
Sociologa IV Juan Jos Torres
Diferencias entre grupos
Supongamos, por ejemplo, que determinada teora sociolgica predice que
dos grupos sociales difieren en sus preferencias ideolgicas. Esta
prediccin sera nuestra hiptesis de investigacin, o hiptesis de
trabajo. Para contrastar esta hiptesis a travs de una investigacin
emprica formularamos la hiptesis de investigacin como la hiptesis
alternativa H1. Si medimos las preferencias ideolgicas de ambos grupos
mediante la aplicacin de una escala izquierda-derecha a cada uno de los
miembros de sendas muestras extradas de los dos grupos, la H1 sera tal
que 1=2 siendo 1 y 2 las medias de los valores de la escala izquierda-
derecha obtenidos en cada grupo. Por el contrario, H0 sera tal que 1=2
esto es, que las medias de los valores de la escala izquierda-derecha son
iguales en ambos grupos. Si los datos obtenidos nos permiten rechazar H0
entonces aceptaramos la H1 y ello significara una validacin estadstica de
la teora contrastada.
Tambin en este caso, la H1puede o no incluir la direccin de la diferencia,
esto es, que la H1, puede sealar que 1>2 o que 1<2 o simplemente
establecer que 1=2. Ello depender del detalle terico con que se
formule la hiptesis de investigacin.
Sociologa IV Juan Jos Torres
2. Eleccin de una prueba
estadstica
El campo de la estadstica inferencial se encuentra tan desarrollado
que, en los momentos actuales, se dispone de una gran variedad de
pruebas estadsticas alternativas para los diferentes diseos de
investigacin. Ms adelante estudiaremos algunos de los criterios
qu se siguen para elegir entre pruebas alternativas, que, pueden
ser del tipo paramtrico o del tipo no paramtrico. La propia
naturaleza de los datos obtenidos en la fase emprica de la
investigacin indicar si la prueba estadstica elegida ha de ser
paramtrica o no paramtrica.
Sociologa IV Juan Jos Torres
3. El nivel de significacin y el
tamao de la muestra
Antes de obtener los datos se especifica el conjunto de todas las
muestras posibles que pueden ocurrir cuando la hiptesis nula (H0)
es verdadera. A partir de dicho conjunto especificamos un
subconjunto de muestras que son tan extremas que, si H0 es
verdadera, la probabilidad de que la muestra que observamos se
encuentre entre ellas es muy pequea.
Si en la investigacin que se lleva a cabo observamos una muestra
que est incluida en dicho subconjunto, rechazamos la hiptesis
nula (H0).
Dicho en otras palabras, el procedimiento consiste en rechazar H0
en favor de H1 cuando la prueba estadstica d lugar a un valor
cuya probabilidad de que ocurra bajo H0 es igual o menor que una
probabilidad muy pequea que denominamos o o nivel de
significacin. Habitualmente, los valores que se utilizan para o son
0,05 y 0,01.
Sociologa IV Juan Jos Torres
El principio de la objetividad cientfica exige que el nivel de
significacin a se establezca con anterioridad a la obtencin
del resultado. Cuanto mayor sea la importancia, terica o
prctica, del resultado que se pretende obtener, mayor ha de
ser el cuidado que pongamos al establecer el nivel de
significacin. As, por ejemplo, si llevamos a cabo una
investigacin con el fin de probar la efectividad de varios
mensajes publicitarios para seleccionar el ms penetrante,
antes de lanzar una campaa publicitaria de mbito nacional,
habremos de ser muy exigentes, estableciendo un nivel de
significacin muy restrictivo, pues una equivocacin
significara una gran prdida para los responsables de la
campaa.
Sociologa IV Juan Jos Torres
Ahora bien, no se puede estar completamente seguro al aceptar o rechazar
la hiptesis nula, ya que nos estamos desenvolviendo en el campo de las
probabilidades, lo que equivale a decir que la decisin de elegir uno de los
dos tipos de hiptesis estadsticas, H0 o H1 comporta siempre un cierto
riesgo de equivocarse, esto es, de no seleccionar la hiptesis verdadera.
Como son dos las alternativas, dos sern tambin las posibilidades de
equivocarse al tomar la decisin, es decir, se pueden cometer dos tipos de
errores. El primero, llamado error Tipo 1, consiste en rechazar la hiptesis
nula (H0) cuando de hecho es verdadera. El segundo, llamado error Tipo
II, consiste en aceptar la hiptesis nula (H0) cuando de hecho es falsa.
La probabilidad de cometer un error Tipo 1 se llama riesgo o o riesgo de
primera especie, o simplemente riesgo de error. Al venir dado el error Tipo
1 por el valor de o, quiere ello decir que cuanto mayor sea o, ms
probable resultar rechazar una H0 que es verdadera, esto es, que ser
ms probable cometer el error Tipo 1. Vemos, pues, que el riesgo o es
conocido y, tal como se ha sealado anteriormente, se fija con antelacin o
a priori. De ah que habitualmente se utilice, al referirnos al contraste de
hiptesis, la siguiente frase: se rechaza la hiptesis nula con riesgo o.
Sociologa IV Juan Jos Torres
El error Tipo II se suele representar por |. El riesgo | es siempre
desconocido y vara en re1acin inversa al valor de o. El riesgo |
se de nomina tambin de segunda especie, y se produce cuando el
valor encontrado, debido a la influencia del azar y a pesar de ser
diferente del valor terico, cae dentro de la zona de no rechazo de
H0. En tal caso se acepta la H0 cuando en realidad es falsa, puesto
que s hay diferencia. Pero como, aparentemente, la diferencia
encontrada no es significativa, nada se opone a aceptar la hiptesis
nula. Tenemos, pues, que:

prob. (error Tipo I)= o
prob. (error Tipo II)= |
Sociologa IV Juan Jos Torres
De una forma ideal, los valores concretos de o y | deben ser establecidos
por el investigador antes de comenzar su investigacin, y tales valores
servirn para determinar el tamao n de la muestra que se ha de elegir
para calcular la prueba estadstica seleccionada.
En la prctica de la investigacin social, los valores de o y n se suelen
especificar con antelacin y, a continuacin, se determina | . Dada la
relacin inversa que existe entre o y | , para todo valor de n, un
incremento de o significar una disminucin de | . Con el fin de reducir la
posibilidad de cometer ambos tipos de errores se debe aumentar el tamao
de n.
Debe quedar claro que el uso de toda prueba de decisin estadstica
comporta el riesgo de cometer uno de los dos errores anteriormente
tipificados. Debe ser el investigador el que decida sobre el compromiso que
desea alcanzar, para optimizar el equilibrio entre las probabilidades de
cometer ambos tipos de errores. En este sentido, el concepto de potencia
es relevante para alcanzar dicha optimizacin.
Sociologa IV Juan Jos Torres
La potencia de una prueba de decisin estadstica se define como la
probabilidad de rechazar la hiptesis nula (H0) cuando de hecho es
falsa. Esto es:
Potencia= 1probabilidad de cometer el error Tipo II=1|
La potencia caracteriza la capacidad que tiene una prueba de
decisin estadstica de no equivocarse al rechazar la hiptesis nula
(H0) Si se aumenta el riesgo o, el intervalo 1 - o se har ms
estrecho, con lo que disminuir la zona de no rechazo de H0 lo cual
hace que la prueba estadstica ofrezca menos decisiones de no
rechazo de H0 y, consecuentemente, el riesgo | de equivocarse al
tomar una decisin de no rechazo de la hiptesis nula ser menor.
Sociologa IV Juan Jos Torres
Supongamos que px es la proporcin de una
determinada caracterstica o propiedad que estamos
estudiando, perteneciente a una poblacin de
distribucin normal, siendo p la proporcin terica.
Supongamos tambin que extraemos de dicha poblacin
una muestra cuya proporcin observada de la referida
caracterstica es p0. Cuando es verdadera la hiptesis
nula (px=p) la proporcin po observada en la muestra
estar dentro del intervalo de probabilidad 1-o. La
ilustracin grfica de este razonamiento es como sigue:
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Cuando la proporcin po observada en la muestra
pertenece al intervalo de probabilidad 1-o, se considera
que la diferencia entre p y po se debe a las fluctuaciones
aleatorias del proceso muestral y, por tanto, no se
rechaza la hiptesis nula. Por el contrario, si la
proporcin po no pertenece al intervalo de probabilidad
1-o, se considera que la diferencia entre p y po es
demasiado grande para que pueda ser explicada
nicamente por el azar y, en consecuencia, se rechaza
la hiptesis nula (y se acepta la hiptesis alternativa)
con riesgo o.
Sociologa IV Juan Jos Torres
4.Distribucin muestral
Existen diferentes distribuciones muestrales:
Distribucin normal: Apropiada para tcnicas
estadsticas inspiradas en el teorema del lmite central y
que se utiliza cuando se tratan muestras grandes.
Distribucin chi cuadrado: apropiada cuando tratamos
con varianzas y la tcnica de chi cuadrado.
Distribucin t de Student: apropiada para medias
pertenecientes a muestras de tamao reducido y de las
que se desconoce la varianza de la poblacin.
Sociologa IV Juan Jos Torres
5. La regin de rechazo
Es una regin de la distribucin muestral Es un
subconjunto de los valores posibles que son tan
extremos que cuando H0 es verdadera, la
probabilidad es muy pequea (o) de que la
muestra que observamos d lugar a un valor
que se encuentre entre ellos. As, pues, la
probabilidad asociada con la obtencin de
cualquier valor que se encuentre en la regin de
rechazo es igual o menor que o.
Sociologa IV Juan Jos Torres
Tal como se ha indicado anteriormente, la localizacin de la regin
de rechazo viene afectada por la propia naturaleza de H0, ya que la
hiptesis alternativa predice la direccin de la diferencia (por
ejemplo, en la estimacin de una proporcin, si p1>p0, o por el
contrario, p1<p0), entonces hay que utilizar una prueba estadstica
unilateral o de una cola; mientras que si la hiptesis alternativa no
indica la direccin de la diferencia que se predice, entonces hay que
utilizar una prueba estadstica bilateral o de dos colas.
Las pruebas estadsticas unilaterales y bilaterales difieren en la
localizacin de la regin de rechazo, pero no en su tamao. En una
prueba unilateral, la regin de rechazo se encuentra totalmente en
un extremo o cola de la distribucin muestral; mientras que, en una
prueba bilateral, la regin de rechazo se localiza a ambos extremos
de la distribucin muestral.
Sociologa IV Juan Jos Torres
El tamao de la regin de rechazo viene dado por el
nivel de significacin o. As, por ejemplo, si o=0,05, el
tamao de la regin de rechazo es el 5 por 100 del
espacio incluido bajo la curva de la distribucin
muestra!. Si la distribucin muestra! es del tipo normal,
las regiones de rechazo para sendas pruebas
unilaterales sern como sigue:
Sociologa IV Juan Jos Torres
Para el caso de una prueba bilateral o de dos colas, las regiones de
rechazo se distribuyen a ambos lados de la curva de la distribucin
muestral. Cuando el nivel de significacin es o=0,05, y para el
caso de una distribucin normal, las regiones de rechazo se
distribuyen del siguiente modo.
En el caso de la prueba bilateral, la suma de las regiones de
rechazo equivale a la regin de rechazo de una prueba unilateral,
para un mismo nivel de significacin o.
Sociologa IV Juan Jos Torres
6. Valor de la prueba estadstica
Una vez que se han pasado todas las fases descritas, el
investigador debe tomar una decisin. Si la prueba
estadstica da lugar a un valor que se encuentra en la
regin de rechazo, entonces se rechaza 1a hiptesis
nula (H0). Si es muy pequea la probabilidad asociada
con el hecho de que ocurra bajo la hiptesis nula un
valor determinado en la distribucin muestral, se puede
explicar de dos formas la obtencin de dicho valor:
primero, se puede explicar decidiendo que la hiptesis
nula es falsa o, segundo, se puede explicar decidiendo
que ha ocurrido un suceso extrao y poco probable. En
el proceso de decisin que venimos estudiando elegimos
la primera de estas explicaciones.
Sociologa IV Juan Jos Torres
Prueba para la media de una poblacin cuando
se conoce la desviacin poblacional
Problema. Supngase que un investigador est interesado en
verificar la propiedad de los procedimientos de muestreo empleados
en un estudio local, realizado por entrevistadores sin experiencia. El
investigador en cuestin sospecha que los ingresos
correspondientes de las familias de las clases media y superior
puedan haber sido subestimados, esto es, que hayan tenido mayor
probabilidad de aparecer en la muestra que los de las familias de
ingresos ms bajos. Se dispone de datos del censo que muestran
que el ingreso familiar medio de la localidad es de 7.500 y la
desviacin estndar de 1.500. Una encuesta ms reducida
comprende 100 familias, que se suponen seleccionadas al azar, y se
encuentra que el ingreso familiar medio de esta muestra es de
7.900. Tiene razn el investigador al sospechar que la muestra
estaba distorsionada?
Sociologa IV Juan Jos Torres
Nivel de medicin: escala de intervalo
Modelo: poblacin normal
= 7500
o= 1500
Hiptesis (nula): seleccin al azar.
Eleccin de un nivel de significacin
Supongamos, por ejemplo, que se decide por un nivel de .05. A
continuacin debera decidir servirse de una prueba de una sola cola, ya
que la direccin del sesgo se ha estimado. Si resultara que la media de la
muestra era inferior a 7500, difcilmente sospechar que los que
realizaron la encuesta hayan sobre- seleccionado los grupos de ingresos
medio y superior. Dada la eleccin del nivel de .05 y de una prueba de una
sola cola, la regin crtica se determina por la tabla normal. Como quiera
que solamente el 5 por ciento del rea de la curva normal se sita a la
derecha de una ordenada de 1.65 desviaciones estndar mayor que la
media, sabemos que, si el resultado supera la media en ms de 1.65
desviaciones estndar, la hiptesis ha de descartarse.
Sociologa IV Juan Jos Torres
La distribucin del muestro de las medias seria una normal con
media = y desviacin



En valores z



Rechazamos la hiptesis nula de que la muestra es debida al azar
n
o
67 , 2
150
7500 900 . 7
/
=

=
n
X
Z
o

150
100
500 . 1
= = =
n
x s
o
Sociologa IV Juan Jos Torres
Ejercicio prctico
En una consulta que realiz una revista espaola, se encontr que el 32
por 100 de las 300 mujeres casadas que respondieron a la encuesta
promovida por la revista afirmaba que mantena relaciones sexuales
extramatrimoniales. Dado que este porcentaje parece un tanto elevado,
dado el tipo de valores sociales predominantes en la sociedad espaola, el
socilogo que supervis la encuesta sospech que las mujeres que haban
respondido a la encuesta pertenecan a grupos sociales muy concretos -
sobre todo, clase media-media y media-alta, de tipo urbano-, por lo que
no podan considerarse representativas de la poblacin femenina
espaola. Para confirmar esta sospecha, el socilogo dispona de algunos
datos referentes a la situacin socioeconmica de las mujeres que haban
respondido a la encuesta y de los mismos datos referentes a la poblacin
en general. En concreto, saba que la media de los ingresos familiares de
las mujeres casadas que haban contestado a la encuesta era de 70.000
pesetas mensuales, mientras que la media mensual de los ingresos familia
res de las familias espaolas se situaba en 60.000 pesetas, con una
desviacin tpica de 20.000 pesetas. A partir de estos datos, cmo se
puede comprobar que las mujeres que haban respondido a la encuesta
constituyen una muestra sesgada y, por tanto, no representativa de la
poblacin femenina general?
Sociologa IV Juan Jos Torres
Prueba t de student
Similar a la prueba normal, para muestras pequeas.
Cuando no se conoce la desviacin tpica poblacional, se puede
sustituir por la muestral en muestras grandes. En muestras
pequeas se utiliza la distribucin t.
La distribucin t responde a la siguiente expresin:


Cuando n es suficientemente grande (>=100) t es
aproximadamente igual a z. Cuando n es pequeo, t se aleja
bastante de la distribucin normal.
La distribucin del muestro depende del tamao de la muestra. En
la tabla t los tamaos se calculan en trminos de grados de
libertad (n-1)



1

=
N
s
x
t

Sociologa IV Juan Jos Torres
Ejemplo distribucin t
Supongamos que un profesor universitario que cuenta con una
larga experiencia docente guarda datos sobre las calificaciones
obtenidas por los alumnos de su departamento a lo largo de los
ltimos aos. Para los diez ltimos aos, en su departamento el
porcentaje medio de los alumnos aprobados ha sido del 65 por 100,
mientras que en los dos ltimos aos, en los que se han impartido
20 cursos, la media de los alumnos aprobados no ha pasado del 57
por 100, con una desviacin tpica del 10 por 100. La pregunta que
se formula ahora el profesor es la siguiente: hasta qu punto cabe
hablar de un descenso significativo en el nivel acadmico de los
alumnos universitarios durante los dos ltimos aos si se supone
que los alumnos que siguen los cursos de su departamento
representan una muestra aleatoria de los alumnos de toda la
universidad?
Sociologa IV Juan Jos Torres
La hiptesis nula H0 es que =65%, mientras que la hiptesis alternativa H1
es que <65%
No hace falta conocer la desv. tpica poblacional porque conocemos la
muestral.
La distribucin muestral que se va a utilizar es la distribucin para t. Para el
presente ejemplo, como N=20 cursos, los grados de libertad df=N-1=20-
1=19; es decir, habr que mirar en la fila df= 19 para contrastar el valor de
t. El nivel de significacin lo vamos a fijar en 0,05, para una prueba
unilateral o de una sola cola. En la tabla se puede comprobar que para 19
grados de libertad es preciso obtener un valor t igual o superior a 1,729
para que exista significacin al nivel de 0,05 para una prueba unilateral o de
una sola cola.




Rechazamos la hiptesis nula. El nivel ha bajado
1

=
N
s
x
t

44 , 3
65 57
19
10
=

= t
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Ejercicio
Se est realizando una investigacin sobre
diversos temas relacionados con colegios
mayores. Se piensa que la edad media de las
personas que en ellos habitan es menor de 21
aos. Se ha tomado una muestra de 16
personas y ha dado una media de 20. (S=3).
Puede mantenerse la afirmacin, al 95% de
que la edad de las personas residentes en
colegios mayores es menor de 21?
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Prueba de dos medias
Aunque la prueba para la media de una
poblacin se utiliza alguna vez, la prueba de la
media para dos muestras es de uso mas
frecuente. Tenemos dos muestras aleatorias
que se diferencian en relacin a una variable y
comparamos sus medias en referencia otra
variable a fin de contrastar hasta que punto las
diferencias observadas pueden considerarse o
no significativas.
Sociologa IV Juan Jos Torres
El clculo del error tpico, que se usa para comparar las
medias, depende del tipo de distribucin muestral que
se genera al extraer dos muestras aleatorias. Si las
muestras provienen de una distribucin normal, el
teorema del limite central se podra enunciar de la
siguiente manera: si se extraen muestras aleatorias de
tamao n1 y n2 de dos poblaciones que se distribuyen
normalmente y que tienen como medias 1 y 2 y como
desviaciones tpicas o1 y o2, la distribucin muestralde la
diferencia entre las dos medias muestrales ser normal
con una media (1-2 ) y una varianza o1
2
/n1+o2
2
/n2.
Lo mismo sera si tomamos dos muestras
independientes pero que son parte de una muestra
global.
Sociologa IV Juan Jos Torres
El error tpico para la diferencia de medias ser


Dado que no conocemos las varianzas poblacionales, deberemos
sustituirlas por las varianzas muestrales, luego el error queda:



Para muestras pequeas(<30):


En valores z, el valor de la diferencia de medias ser:

-1 -1
Sociologa IV Juan Jos Torres
Ejemplo
Estudiamos dos muestras de 70 hombres y 70 mujeres
con respecto a su nivel de etnocentrismo (se refiere a la
tendencia a evaluar a todos los grupos de personas
usando nuestras propias normas culturales). Escala de 1
a 5 y obtenemos una media de etnocentrismo para los
hombres de 1,71 y para las mujeres de 1,54 con unas
desviaciones tpicas de 1,07 y 0,94 respectivamente.
Nuestra hiptesis de investigacin establece que las
mujeres difieren de los hombres en cuanto al nivel de
etnocentrismo. Comprobar esta hiptesis al nivel de
significacin del 0,05.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Diferencia de proporciones
El estudio inferencial de la diferencia entre dos proporciones
puede considerarse como un caso especial de una diferencia
entre dos medias.
Si se representasen todas las diferencias en una curva, se
distribuiran normalmente alrededor de la diferencia media de
cero y un error tpico:

en donde P es la proporcin
en la poblacin de la caracterstica que se est estudiando,
Q= 1- P, N1 es el nmero de casos en la primera muestra y N2
es el nmero de casos en la segunda muestra.
Este error es el error tpico de la diferencia entre proporciones.
Sociologa IV Juan Jos Torres
Pocas veces se conoce el valor verdadero de los parmetros P y Q. Lo
que suele ser ms frecuente es que slo se disponga de las
proporciones muestrales, P1 y P2 que son estimaciones de las
proporciones de las subpoblaciones de las muestras N1 y N2. Para
obtener una estimacin ms fiable de P, se pueden combinar las
estimaciones muestrales de acuerdo con la frmula:

q =1- p. Si se sustituyen los valores estimados de las proporciones en
la frmula del error tpico anterior, se obtiene la estimacin del error
tpico de la diferencia entre dos propor ciones mediante el clculo de
la siguiente expresin:


A partir de estas formulas se puede contrastar la hiptesis nula pues:

Sociologa IV Juan Jos Torres
Ejemplo
Se da una muestra de 250 padres y 120 madres, se obtuvo que el
45% de los padres estaban a favor de la enseanza pblica,
mientras que las madres estaban el 38%. Puede considerarse
significativa la diferencia en cuanto a la opinin de madres y madres
respecto al tipo de enseanza.
nc = 0,05.

Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Ejercicio
Una muestra de 300 votantes del distrito 1 y 200 del distrito 2 mostr que
el 56% y el 48% respectivamente estn a favor de un candidato dado en
las elecciones municipales. Al nivel de significacin 0,05 ensayar la
hiptesis de que hay diferencia entre los 2 distritos con respecto al
porcentaje de votos.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Ejercicio
Un grupo de jvenes se distribuye se distribuyen de la siguiente
manera, teniendo en cuenta si son estudiantes o trabajan y sus
preferencias polticas:




Si se seleccionan individuos al azar y P(A)= Probabilidad de elegir
un estudiante, P(B)= Probabilidad de elegir a un individuo de
izquierda y P(C)= probabilidad de elegir un trabajador se pide:
1. P(ABC)
2. P(A o B)
3. P(A o C)

Preferecia poltica Estudiantes Trabajadores
Izquierda 150 450
Derecha 250 350
Sociologa IV Juan Jos Torres
Ejercicio
Queremos hace una investigacin sobre el
consumo de drogas entre los jvenes de 14 a
21 aos de la comunidad de Madrid. Que
tamao tendra la muestra para nuestro estudio
si fijamos un margen de error global del 3%,
P=Q=50% y un nivel de confianza de :
1. 95,5%
2. 99,7%
K
2
PQ
n=
e
2


Sociologa IV Juan Jos Torres
Ejercicio
Hemos realizado una investigacin para conocer que
nmero de espaoles, de los 44 millones que somos,
poseen un animal domstico. Hemos realizado una
encuesta a 4.000 individuos y un 18% de ellos
declararon poseer uno.
Sabiendo que la muestra se ha tomado con un nivel de
confianza del 95,5%(dos sigma) y para P=Q=50%. Se
pide:
1. El margen de error global para la encuesta.
2. Cuantos espaoles poseen un animal domstico
(Estimar puntualmente y por intervalo)
K
2
PQ
n=
e
2


Sociologa IV Juan Jos Torres
Estimacin de medias
Se est estudiando la edad media de los
universitarios espaoles. Para ello se toma una
muestra de 400 alumnos y nos da una media de
edad de 23 aos con una desviacin tpica de
2,8. Estimar el intervalo de confianza al 95%
para la media de edad de la poblacin
universitaria espaola.
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
De una muestra de 30 personas matriculadas en
un curso para mayores de 25 aos (acceso a la
universidad) en Madrid, la edad media era 33 y
la S = 4. Estimar el intervalo de la edad media
de las personas que estn matriculadas en dicho
curso en Madrid, nivel de confianza 95%.

Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
Para estimar la proporcin de estudiantes de una
universidad que est a favor de la reinsercin
social del delincuente, se entrevist
aleatoriamente a 500 estudiantes. El 58% estaba
a favor. Hallar el intervalo de confianza en el cual
se hallar la proporcin poblacional universitaria
que se encuentra a favor. NC = 95%.

Estimacin de proporciones
Sociologa IV Juan Jos Torres
Sociologa IV Juan Jos Torres
200 votantes fueron seleccionados
aleatoriamente y 110 se mostraron favorables al
candidato A. Estimar la proporcin porcentual
de votantes al candidato A en dicha poblacin
usando un intervalo de confianza del 95%.
Si la poblacin consta de 100.000 personas,
calcular el intervalo para el nmero de personas
favorables al candidato A.
Sociologa IV Juan Jos Torres

Você também pode gostar