Você está na página 1de 9

1.

Selección de muestra

Se seleccionara una muestra probabilística, es decir, cuando la selección de los


elementos que intervienen en ella se hace a través de algún procedimiento aleatorio, o
sorteo, que le concede a cada uno de los elementos de la población, un cierto chance de
caer en ella. Existen diversos tipos de muestras probabilísticas: Muestra aleatoria simple,
Muestra Estratificada, muestra sistemática, muestra por conglomerados.

Se ha tomado la técnica muestreo aleatorio simple, si se selecciona un tamaño de


muestra n de una población de tamaño N de tal manera que cada muestra posible de
tamaño n tenga la misma probabilidad de ser seleccionada, el procedimiento de muestreo
se denomina muestreo aleatorio simple. A la muestra así obtenida se le denomina
muestra aleatoria simple.

Considerando muestreo aleatorio sin reposición, se obtiene la muestra unidad a unidad de


forma aleatoria sin reposición a la población de las unidades previamente seleccionadas,
teniendo presente además que el orden de colocación de los elementos en las muestras
no interviene, es decir, muestras con los mismos elementos colocados en orden distinto
se consideran iguales. De esta forma, las muestras con elementos repetidos son
imposibles. Bajo muestreo aleatorio con reposición, las unidades seleccionadas son
devueltas de nuevo a la población.

Las ventajas que tiene este procedimiento de muestreo son las siguientes:

 Sencillo y de fácil comprensión.


 Calculo rápido de medias y varianzas.
 Se basa en la teoría estadística, y por tanto existen paquetes informáticos para
analizar los datos

Sin embargo presenta desventajas este procedimiento de muestre, como son:

 Requiere que se posea de antemano un listado completo de toda la población.


 Si trabajamos con muestras pequeñas, es posible que no representen a la
población adecuadamente.

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la


población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.)
se eligen tantos sujetos como sea necesario para completar el tamaño de muestra
requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.

Las distribuciones estadísticas requieren de valores específicos que se conocen como


“parámetros”, para obtener sus resultados. A continuación, se describen las principales
medidas a considerar para el cálculo del tamaño de población.

 Error muestral de estimación: Medida de la variabilidad de las estimaciones de


muestras repetidas en torno al valor de la población. Este parámetro, otorga una
noción clara de hasta dónde y con qué probabilidad una estimación basada en
una muestra se aleja del valor que se hubiera obtenido por medio de un censo
completo. En efecto, siempre se comete un error, pero la naturaleza de la
fiscalización indicará hasta qué medida se cometerá, ya que los resultados se
someten a error muestral e intervalos de confianza que varían muestra a muestra.

 Nivel de confianza: Probabilidad de que el intervalo construido en torno a un


estadístico capte el verdadero valor del parámetro. En este sentido, se establece
que, a mayor valor del tamaño de intervalo, mayor es el tamaño de la muestra,
tanto para distribuciones Poisson como Normal.

 Error tolerable (materialidad): Se entiende como cantidad máxima de errores que


el fiscalizador está dispuesto a aceptar sin detección en la población en estudio.

 Precisión: Grado de exactitud con que se pueden conocer los parámetros


poblacionales, representa la cantidad o porcentaje aceptable de desviación en el
valor obtenido en el examen, respecto al verdadero promedio de la población. La
precisión en el muestreo es semejante a la tolerancia utilizada en control de
calidad

Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando


adecuadamente y justificando:
a. Fórmula a desarrollar

𝑍 2 𝑝𝑞𝑁
𝑛=
𝑁𝐸 2 + 𝑍 2 𝑝𝑞
b. Estimación de la proporción de mujeres

En este caso conocemos el tamaño de la población que es de 60.356 personas. Entre las
cuales hay 31969 mujeres.
31969
𝑝= = 0,53
60356

𝑞 = 1 − 0,53 = 0,47

𝑁 = 60356

c. Nivel de confiabilidad: Se determina con un nivel de confianza del 95%.


d. Error de estimación: El error de estimación se determina en 0,2.

Es decir:
𝐸 = 0,2
𝑍 = 1,96 (𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 95%)

1,962 (0,53)(0,47)60356
𝑛= = 23,9
60356(0,2)2 + 1,962 (0,53)(0,47)

Por lo tanto, la muestra para realizar un estudio con un nivel de confianza del 95% y
margen de error del 20% en una población de 60356 personas debe componerse de 24
mujeres

Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma


para los hombres y mujeres. Según los resultados, ¿Existen diferencias?
Histograma Escolaridad Hombres
6 120.00%
5 100.00%
Frecuencia

4 80.00%
3 60.00%
2 40.00%
Frecuencia
1 20.00%
% acumulado
0 0.00%

Resulta más frecuente encontrar hombres con una escolaridad entre 5 y 8 años. Solo hay
4 hombres que tienen escolaridad entre 14 y 17 años.

Histograma Escolaridad Mujeres


9 120.00%
8
100.00%
7
6 80.00%
Frecuencia

5
60.00%
4
3 40.00% Frecuencia

2 % acumulado
20.00%
1
0 0.00%

Mientras que hay solo dos mujeres con escolaridad entre 17 y 20 años. Se
observa ninguna con una escolaridad entre 13 y 17 años. Es más frecuente
encontrar mujeres con años de escolaridad entre 10 y 13 años.
2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95%
para estimar, la escolaridad promedio de los hombres y de las mujeres de forma
individual, en los niveles de estudio de Bachiller, Tecnólogo y Universitario.

Para hombres:

Media Desviación Estándar


8,9 5,4

Un intervalo de confianza al 95%

𝜎
𝑋̅ ± 𝑍1−𝛼 ( )
2 √𝑛

𝛼 = 0,05 𝑝𝑜𝑟 𝑡𝑎𝑙 𝑍0,975 = 1,96

5,4
8,9 ± (1,96) ∗
√24

[6,7; 11,06]
Con una confianza del 95%, se puede decir que los años promedio de escolaridad de los
hombres en que fueron encuestados esta entre 6,7 y 11,06 años.

Para mujeres:

Media Desviación Estándar


8,4 5,3

Un intervalo de confianza al 95%

𝜎
𝑋̅ ± 𝑍1−𝛼 ( )
2 √𝑛

𝛼 = 0,05 𝑝𝑜𝑟 𝑡𝑎𝑙 𝑍0,975 = 1,96

5,3
8,4 ± (1,96) ∗
√24
[7,9; 8,8]

Con una confianza del 95%, se puede decir que los años promedio de escolaridad de los
mujeres en que fueron encuestados esta entre 7,9 y 18,8años.

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para estimar la diferencia promedio de escolaridad para los hombres y mujeres, en
los niveles de estudio de Bachiller, Tecnólogo y Universitario.
.

Un intervalo de confianza para la diferencia de medias es:

𝜎𝐻 2 𝜎𝑀 2
(𝑋̅𝐻 − 𝑋̅𝑀 ) ± 𝑍1−𝛼 (√ + )
2 𝑛𝐻 𝑛𝑀

𝛼 = 0,05 𝑝𝑜𝑟 𝑡𝑎𝑙 𝑍0,975 = 1,96

5,42 5,32
(8,9 − 8,4) ± (1,96) (√ + )
24 24

0,5 ± 3,027
[−2,52; 3,52]

Con una confianza del 95% podemos decir que la diferencia de los años promedio de
escolaridad entre los hombres y mujeres se encuentra entre -2,5 y 3,5 años.
Diríamos que los hombres tienen mayores años de escolaridad si la diferencia entre los
años promedio de los hombres menos los años promedio de escolaridad de las mujeres
me da positiva. Sin embargo, el intervalo da positivo en una parte y negativo en otra, lo
que significa que no se puede afirmar con certeza si los hombres tienen mayores años de
escolaridad que las mujeres. Estadísticamente tienen los mismo años de escolaridad.

Prueba de hipótesis para dos variables nominales

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la
semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y


sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?
Asiste a Establecimiento Oficial
Mujer Hombre

16

12 12

Si No

A partir de la muestra obtenida, damos cuenta que 12 mujeres sí asisten a un


establecimiento oficial, mientras que solo 8 hombres lo hace. De igual forma se entiende
que 16 hombres no lo hacen mientras que 12 mujeres tampoco.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de hombres


y de mujeres que asisten a un establecimiento oficial.

Para los hombres, proporción de hombres que asiste a un establecimiento oficial.

8
𝑃𝐻 = = 0,34
24
𝛼 = 0,05 𝑍0,975 = 1,96

(0,34)(1 − 0,34)
0,34 ± (1,96)√ = 0,34 ± 0,097
24

𝐼. 𝐶 = [0,243; 0,437]

EL I.C PARA LA PROPORCION DE HOMBRES QUE ASISTEN A UN


ESTABLECIMIENTO OFICIAL ES (0,243; 0,437), ES DECIR, CON UNA CONFIANZA
DEL 95% LA PROPORCION DE HOMBRES QUE ASISTEN A UN ESTABLECIMIENTO
OFICIAL ESTA ENTRE 24,3% Y 43,7%.

Para las mujeres, proporción de mujeres que asiste a un establecimiento oficial.

12
𝑃𝑀 = = 0,5
24
𝛼 = 0,05 𝑍0,975 = 1,96

(0,5)(1 − 0,5)
0,5 ± (1,96)√ = 0,5 ± 0,2
24

𝐼. 𝐶 = [0,3; 0,7]

EL I.C PARA LA PROPORCION DE MUJERES QUE ASISTEN A UN


ESTABLECIMIENTO OFICIAL ES (0,3; 0,7), ES DECIR, CON UNA CONFIANZA DEL
95% LA PROPORCION DE MUEJRES QUE ASISTEN A UN ESTABLECIMIENTO
OFICIAL ESTA ENTRE 30% Y 70%.

3. Realice una prueba de hipótesis para determinar la afirmación del investigador.


Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

El investigador, cree que los hombres asisten más a un colegio oficial que las mujeres en
Colombia. Para esto se realiza entonces una prueba de hipótesis de la diferencia de
proporciones con una significancia del 5%.

𝐻𝑜 = 𝑃𝑀 − 𝑃𝐻 ≥ 0 La proporción de hombres que asisten a un


establecimiento oficial es la misma o menor que la proporción de mujeres que
hacen lo mismo.

,
𝐻𝑎 = 𝑃𝑀 − 𝑃𝐻 < 0 La proporción de hombres que asisten a un
establecimiento oficial es mayor que la proporción de mujeres que hacen lo
mismo.

𝐏𝐌 − 𝐏𝐇 = 0,5 − 0,34 = 0,16

𝛼 = 0,05 𝑍0,95 = 1,64

𝑛𝑀𝑃𝑀 + 𝑛𝐻𝑃𝐻 24(0,5) + 24(0,34)


𝑃= = = 0,42
𝑛𝑀 + 𝑛𝐻 48
1 1
𝑆𝑃 = √𝑃(1 − 𝑃) ( + )
𝑛𝑀 𝑛𝐻

1 1
𝑆𝑃 = √0,42(1 − 0,42) ( + ) = 0,14
24 24

0,16 − (0)
𝑍= = 1,14
0,14

POR TAL SE ACEPTA LA HIPOTESIS NULA, PORQUE EL VALOR DE LA Z


CALCULADA ES MENOR QUE EL VALOR CRITICIO. 1,14<1,64. EL INVESTIGADOR
NO PUEDE CONCLUIR CON UNA CONFIANZA DEL 95% QUE LA PROPORCIÓN DE
HOMBRES QUE ASISTEN A UN ESTABLECIMIENTO OFICIAL ES MAYOR QUE LA
PROPORCION DE MUJERES.

Você também pode gostar