Você está na página 1de 7

Realice un histograma y describa la información según la forma y la curtosis de los

datos.

El histograma anterior se realizó utilizando los datos del libro de Excel. El cual, quedo
descrito en la hoja cálculo de datos.
En este histograma se puede observar que existe una curva de asimetría positiva y
curtosis platicustica, lo que nos indica que la mayoría de los las edades se aglomeran por
encima del valor de la media aritmética y cuenta con una baja concentración.Además, en
el histograma se puede observar que la mayor cantidad de población es decir la moda, se
encuentran entre edades de 12 y 13 años con 2435 personas.
𝟐⁄
Calcule una nueva variable que sea el 𝑷𝟔𝟎𝟒𝟎𝒏𝒆𝒘 = 𝑷𝟔𝟎𝟒𝟎 𝟑

El cálculo de esta variable se encuentra realizado en el documento de Excel adjunto, el


cual muestra las columnas de todas las variables expuestas en el taller, además al lado
de la variable P6040 se encuentra el resultado de la variable nueva.
Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra,
utilizando la siguiente fórmula
𝑛0
𝑛= 𝑛
1 + 𝑁0
𝑍2𝑆 2
𝑛0 = 2
𝛿
Primero calculamos el valor de Z,
Teniendo en cuenta que el nivel de la confianza es de 95%
Podemos decir que 𝑍𝛼⁄2= 1,96 → 𝑍 2 = 3,8416,

La desviación estándar la calculamos en la columna de datos en Excel la cual es 4,5696


El margen de error absoluto para este problema será de 0,5
La cantidad de datos, es decir N = 60356
Luego hallamos el valor de 𝑛0
3,8416 ∙ 20,8812
𝑛0 = = 320,8688
0,25
Al tener el valor de 𝑛0 calculamos el valor de la muestra n.
320,8688
𝑛= = 319.1719 ≈ 319
320,8688
1+
60356
El tamaño de la muestra utilizando la formula dada debe ser de 319 datos
aproximadamente.
Teniendo en cuenta los resultados anteriores, realice una selección de elementos
para una muestra, utilizando el algoritmo del coordinado negativo.
Para generar esta muestra, primeramente, se generannúmeros aleatorios de 0 a 1 a cada
dato de la población, luego de este proceso se ordena de menor a mayor los datos según
el numero aleatorio generado y por último se escogen los 319 primeros datos en la lista.
De esta manera, estaríamos aplicando el algoritmo del coordinado negativo.
Este proceso fue realizado en el libro de Excel colocando la muestra en la hoja muestras y
el proceso de aleatorio en la hoja cálculo de datos.
Compara la media poblacional, con la media muestral y determine la variación
relativa
Utilizando las fórmulas de Excel calculamos las medias muestral y poblacional las cuales
son:
𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 (𝜇) = 9,2879
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 (𝑥̅ ) = 12,8159
Luego, para determinar la variación relativa de una media respecto a otra, se debe aplicar
una regla de tres. Para esto se divide la media poblacional por media muestral, se le resta
1, y ese resultado se multiplica por 100 para convertirlo a porcentaje, quedando la fórmula
de la siguiente manera:
𝜇
( ⁄𝑥̅ − 1) ∙ 100
= (9,2879⁄12,8159 − 1) ∙ 100 = 100 = −27,52%

Lo que nos indica que tenemos una variación relativa entre la media poblacional y la
media muestral de -27,52%.

Intervalo de confianza para dos variables numéricas


Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para
los hombres y mujeres. Según los resultados, ¿Existen diferencias?
Observando los histogramas de la escolaridad en hombres y mujeres, se ve que existe
una alta similitud en el nivel de escolaridad estando la mayoría de la población en los
grados 10 y 11.
Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice
lectura de resultados.

El estudio de la escolaridad tanto en los hombres como las mujeres podemos decir que es
cuantitativo discreto. Ya que se puede medir por números enteros y cuentan con valores
consecutivos entre los que no puede haber intermedio, ejemplo: 9, 10, 11.
Observando el histograma de la escolaridad de los hombres se puede apreciar que la
escolaridad donde se encuentra la mayor parte de la población es 10 – 11, la curva
asimétrica es negativa, ya que los datos se aglomeran en valores menores que la media.
Lo que se traduce que, la escolaridad en los hombres es de bajos niveles.
Por otra parte, se observa el histograma de la escolaridad de las mujeres es muy similar a
la escolaridad de los hombres. Siendo, la curva asimétrica negativa de igual manera, ya
que los datos se aglomeran en valores menores de la media.
Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y
determine, la escolaridad de los hombres y de las mujeres de forma individual.

Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95%
para la diferencia de los niveles de escolaridad para los hombres y mujeres
Utilizamos la fórmula de diferencia de media para una distribución normal:

𝜎12 𝜎22 𝜎12 𝜎22


̅̅̅
𝑋1 − ̅̅̅
𝑋2 − 𝑍𝛼⁄2 √ + ≤ 𝜇1 − 𝜇2 ≤ ̅̅̅
𝑋1 − ̅̅̅
𝑋2 + 𝑍𝛼⁄2 √ +
𝑛1 𝑛2 𝑛1 𝑛2

Los datos para realizar el proceso, se toma los sub índices 1 para hombres y sub índices
2 para mujeres.

𝑋̅1 = 7,7354
𝑋̅2 = 7,9908
𝑛1 = 370
𝑛2 = 370
𝑍𝛼⁄2 = 1,96
𝜎1 = 4,9702
𝜎2 = 4,9219
Reemplazando en la formula tenemos:

24,7028 24,2250
7,7354 − 7,9908 − 1,96√ + ≤ 𝜇1 − 𝜇2
370 370

24,7028 24,2250
≤ 7,7354 − 7,9908 + 1,96√ +
370 370

−0,9681 ≤ 𝜇1 − 𝜇2 ≤ 0,4573
Análisis de resultado:
Observando el resultado podemos deducir que la diferencia entre la media de la
escolaridad de los hombres y la media de la escolaridad de las mujeres, en un intervalo
de confianza de 95% se encuentra entre -0,9681 y 0,573. Lo que nos da a entender que
las dos poblaciones son muy similares.

Parte 2

Prueba de hipótesis para dos variables nominales


 Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y
sexo (P6020), realice un diagrama de barras comparativo para los hombres y
mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?

50
45
40
35
30
25
20
15
10
5
0
Asiste No asiste
Hombres 35 9
Mujeres 45 10

Realizando el grafico a partir de la muestra de los hombres y mujeres que asisten


a un establecimiento oficial, nos damos cuenta de que la muestra de mujeres
encuestada es mayor a la de hombres. Además, percatándonos que existen
personas encuestadas en la muestra que no cuentan con esta información.
Luego, analizando el grafico arrojado por los datos, podemos decir que existe
cierta diferencia en la muestra de hombres y mujeres. Ya que, al ser más
pequeña la muestra de hombres podemos notar entonces que proporcionalmente
existen más hombres que no asisten a un establecimiento oficial.

 Con un nivel de confianza del 95%, realice una estimación de los hombres que
asisten a unestablecimiento oficial.

Primero, para simplicidad del ejercicio, vamos a tomar como valor de la muestra el
total de hombre que respondieron Si o No. De esta manera P hace referencia a los
Sí y 1-P a los No.
decimos que P es la proporción de la muestra, es decir la cantidad de hombre que
asiste a un establecimiento oficial sobre el total de hombres en la muestra.
𝑥 35
𝑃= = = 0.7954
𝑛 44
Luego sabiendo que Z para 95% es:
𝑍𝛼⁄2 = 1.96
Conocidos los datos podemos aplicar la formula.
𝑃(1 − 𝑃) 𝑃(1 − 𝑃)
𝑃 − 𝑍√ ≤ 𝜋 ≤ 𝑃 + 𝑍√
𝑛 𝑛
Donde 𝜋, es la proporción de la población.
Reemplazando los valores en la fórmula:
0.7954 ∙ 0.2046 0.7954 ∙ 0.2046
0.7954 − 1.96√ ≤ 𝜋 ≤ 0.7954 + 1.96√
44 44
0.6762 ≤ 𝜋 ≤ 0.9145

Con este resultado podemos decir que, con un nivel de confianza del 95% los
hombres que asisten a un establecimiento oficial se encuentran entre el 67.62% y
91.45% de la población de hombres encuestados.

 Con un nivel de confianza del 95%, realice una estimación de las mujeres que
asisten a unestablecimiento oficial.
Primero, para simplicidad del ejercicio, vamos a tomar como valor de la muestra el
total de mujeres que respondieron Si o No. De esta manera P hace referencia a
los Sí y 1-P a los No.
decimos que P es la proporción de la muestra, es decir la cantidad de mujeres que
asiste a un establecimiento oficial sobre el total de mujeres en la muestra.
𝑥 45
𝑃= = = 0.8181
𝑛 55
Luego sabiendo que Z para 95% es:
𝑍𝛼⁄2 = 1.96
Conocidos los datos podemos aplicar la formula.
𝑃(1 − 𝑃) 𝑃(1 − 𝑃)
𝑃 − 𝑍√ ≤ 𝜋 ≤ 𝑃 + 𝑍√
𝑛 𝑛
Donde 𝜋, es la proporción de la población.
Reemplazando los valores en la fórmula:
0.8181 ∙ 0.1819 0.8181 ∙ 0.1819
0.8181 − 1.96√ ≤ 𝜋 ≤ 0.8181 + 1.96√
55 55
0.7161 ≤ 𝜋 ≤ 0.9200

Con este resultado podemos decir que, con un nivel de confianza del 95% las
mujeres que asisten a un establecimiento oficial se encuentran entre el 71.61% y
92% de la población de mujeres encuestadas.

 Realice una prueba de hipótesis para determinar la afirmación del investigador.


Utilice un nivel designificancia del 5%. ¿Qué se puede decir de lo anterior?
El investigador cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia. Por esto podemos decir que:
La hipótesis será
𝐻0 : 𝑃𝐻 > 𝑃𝑀 (los hombres asisten más a un colegio oficial que las mujeres en
Colombia).
𝐻1 : 𝑃𝐻 < 𝑃𝑀 (Los hombres asisten menos a un colegio oficial que las mujeres en
Colombia).
Entonces, se representa la hipótesis nula como 𝐻0 y la hipótesis alternativa como
𝐻1
Como es una prueba de hipótesis de dos colas se debe calcular
𝛼 0.05
= = 0.025
2 2
La lectura en la tabla para un área de 0.025 le corresponde a un valor 𝑍 = ±1.96
Calculando la proporción muestral se obtiene:
𝑥𝐻 + 𝑥𝑀 35 + 45
𝑃= = = 0.8080
𝑛𝐻 + 𝑛𝑀 44 + 55
Calculando el valor de prueba Z
𝑥𝐻 𝑥𝑀
𝑛𝐻 − 𝑛𝑀
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 =
1 1
√𝑃(1 − 𝑃) ( + )
𝑛𝐻 𝑛𝑀
35 45
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 44 − 55 = −0.2852
√0.8080(1 − 0.8080) ( 1 + 1 )
44 55

Luego, al ver que el resultado de la prueba nos indica que el valor -0.2852 se
encuentra en el intervalo dentro de -1.96 y 1.96, podemos decir que se acepta la
hipótesis nula. Lo que quiere decir que con un nivel de significancia de 5% se
acepta la afirmación del investigador, donde se plantea que los hombres asisten
más a colegios oficiales que las mujeres en Colombia.

Você também pode gostar