Você está na página 1de 13

INSTITUCIÓN UNIVERSITARIA POLITÉCNICO GRANCOLOMBIANO

ESTADÍSTICA II
MÓDULO PRUEBAS DE HIPÓTESIS

MUESTREO Y DISTRIBUCIONES MUESTRALES

INTEGRANTES:

PRESENTADO A:

MORENO RODRÍGUEZ SEBASTIÁN


ACTIVIDAD SEMANA 3

CONTEXTO

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE [1]. Esta encuesta se hace en las 13 ciudades
principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita
información sobre las condiciones de empleo de las personas (si trabajan, en qué
trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando
empleo), además de las características generales de la población como sexo, edad,
estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH
proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información


sobre las características generales de las personas que respondieron en un mes en
particular. Para este trabajo colaborativo, realice lo siguiente:

(semana 3) Selección de muestra


En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos
los elementos de una población), se selecciona una muestra, entendiendo por tal
una parte representativa de la población. En ese sentido, escoja un tipo de muestreo
y argumente la viabilidad de esta técnica para la base de datos dada. Úselo como
herramienta para elegir una muestra representativa.

SOLUCIÓN:
Tamaño de muestra: se utiliza la variable de edad (P6040) se realiza el siguiente
procedimiento.

Un histograma y describí la información según la forma y curtosis de los


datos propuestos en Excel por el profesor, realizamos una descripción
numérica y descripción como es la población.
Se tiene en cuanta la variable anterior mencionada se procede a realizar
el cálculo del tamaño de muestra, utilizando la formula.
𝑛0
𝑛= 𝑛
1+ 0
𝑁
n Z2 S2
0=
δ2

CONCEPTO RESPUESTA
Z Es el cantil de la distribución normal
estándar al nivel de significancia que se
establezca
S Desviación estándar de la variable
𝜹 Margen de error absoluto
RESULTADO Se calcula el tamaño de la muestra , se
utiliza un nivel de confianza del 95 % y
un margen de error de absoluto que no
supere el 0.5 %

DATOS:
P6040
“edad” CLASES
44 0
33 1
0 2
52 3
49 4
29 5
27 6
17 7
8 8
37 9
33 10
9 11
8 12
46 13
27 14
9 15
21 16
36 17
8 18
0 19
45 20
45 21
18 22
8 23
25 24
63 25
33 26
26 27
82 28
36 29
36 30
11 31
9 32
32 33
13 34
11 35
62 36
28 37
37 38
3 39
53 40
55 41
16 42
14 43
24 44
5 45
4 46
55 47
28 48
11 49
24 50
6 51
4 52
45 53
39 54
20 55
9 56
37 57
59 58
37 59
17 60
56 61
54 62
86 63
50 64
40 65
13 66
19 67
1 68
41 69
69 70
80 71
84 72
59 73
22 74
93 75
53 76
61 77
46 78
21 79
70 80
66 81
40 82
27 83
11 84
8 85
7 86
82 87
73 88
18 89
2 90
21 91
6 92
4 93
52 94
22 95
47 96
54 97
54 98
22 99
46 100
11 101
HISTOGRAMA:

Histograma DATOS P6040


1400
1200
1000
Frecuencia

800
600
400 Frecuencia

200
0

100
0
5

20

45

70

95
10
15

25
30
35
40

50
55
60
65

75
80
85
90
Clase

Clase Frecuencia
0 964
1 861
2 966
3 995
4 989
5 1044
6 1044
7 977
8 1103
9 1069
10 1102
11 1225
12 1123
13 1161
14 1140
15 1167
16 1164
17 1151
18 1162
19 1078
20 1139
21 1170
22 1132
23 1031
24 1018
25 1077
26 1016
27 1052
28 910
29 968
30 917
31 878
32 916
33 815
34 807
35 802
36 758
37 724
38 754
39 787
40 804
41 780
42 841
43 814
44 768
45 817
46 753
47 720
48 791
49 765
50 703
51 698
52 671
53 612
54 593
55 563
56 534
57 525
58 477
59 499
60 405
61 394
62 411
63 411
64 354
65 338
66 329
67 325
68 255
69 254
70 255
71 257
72 232
73 244
74 225
75 204
76 208
77 166
78 147
79 132
80 120
81 132
82 89
83 97
84 75
85 82
86 68
87 58
88 42
89 32
90 41
91 21
92 14
93 14
94 9
95 10
96 4
97 4
98 6
99 5
100 2
101 1
DESCRIPCIÓN DESCRIPCIÓN NUMÉRICA
Los datos presentan un sesgo a la derecha  Posee una mediana
donde predomina los valores más pequeños poblacional de 30,9
para la variable escogida que es P6040 en la  Mediana de 28
población. De acuerdo a la curtosis obtenida  Una moda de 11
MENOR A CERO dando como resultado poca  Desviación estándar
concentración alrededor de la medida siendo poblacional de 20,7
entonces platicurtrtica.

CURTOSIS - MEDIA 30,97


0,49818654 POBLACIONAL
MEDIANA 28
error
MODA 11
N S^2 Z absoluto
DESV. EST. 20,75
60356 20,88 1,96 0,05
CV% 67,01

Tamaño de la
n0 muestra
32088,59 20950,27
MEDIA
MUESTRAL 31,05
MEDIANA 28,00
MODA 17,00
DESV. EST. 20,63
CV% 66,45

n 370
Vmax 90
Vmin 0
r 90
ni 9
i 10
n 380
ni 9
r' 90
Vmax 90
Vmin 0
i'-1 9

Lim Lim
inf sup xi ni fi Ni Fi Asimetria Curtosis
-
1 0 9 4,5 55 15% 55 15% 1381966,1 40477060
2 10 19 14,5 63 17% 118 31% -452169,9 8722120,08
3 20 29 24,5 70 18% 188 50% -56114,0 521269,693
4 30 39 34,5 43 11% 231 61% 15,4 10,9594592
5 40 49 44,5 48 13% 279 74% 58975,8 631661,617
6 50 59 54,5 52 14% 331 87% 461930,6 9566826,25
7 60 69 64,5 22 6% 353 93% 637212,8 19569139
8 70 79 74,5 19 5% 372 98% 1281957,9 52189179,5
9 80 89 84,5 7 2% 379 100% 912835,2 46290355,1
379 100% 1462677,6 177967622

Media 33,79
Moda 22 Asimetria 0,381 Positiva
Mediana 31 Curtosis 2,141 Leptocurtica
Desv.
Estan. 21,64

RESULTADOS:
EDADES
22 5 55 2 51 45 63 21 63 20 59
0 26 67 42 18 15 24 20 27 36 29
31 57 24 14 25 2 38 49 10 36 3
5 17 42 81 29 18 64 61 22 71 5
6 57 0 19 11 2 75 13 65 1 62
54 35 21 45 70 71 19 34 1 5 31
8 1 42 90 29 49 22 18 42 68 49
27 4 16 19 5 51 62 5 39 55 54
73 8 78 7 53 42 14 8 59 22 13
15 49 19 27 19 1 24 56 35 65 31
29 46 31 87 15 32 71 75 39 72
68 27 25 44 8 5 2 36 17 52
43 24 7 37 75 31 39 66 54 29
41 12 80 25 32 56 40 25 50 5
17 10 22 20 59 36 38 52 44 1
41 22 3 33 40 9 19 6 48 47
38 58 50 22 15 52 53 48 25 20
6 20 20 59 10 51 83 25 38 66
11 40 45 17 39 13 48 67 76 54
14 38 45 32 29 55 45 22 23 18
37 18 45 48 80 10 21 57 10 9
60 14 21 13 9 13 14 86 56 27
13 15 44 40 68 52 7 33 14 51
43 54 26 48 14 48 54 55 36 23
1 59 6 54 65 50 6 17 12 15
59 7 27 46 22 27 20 25 67 8
47 21 19 11 39 4 1 47 21 28
76 25 3 53 40 47 55 50 46 24
0 54 4 71 37 15 51 48 16 83
47 1 10 62 22 10 42 2 31 52
56 37 53 25 53 26 13 36 76 14
37 29 21 48 19 28 16 38 58 74
18 70 31 22 5 18 10 31 19 9
21 33 35 75 22 18 53 50 72 22
69 23 51 55 1 25 4 22 66 41
46 9 55 32 22 41 36 22 45 29
3 16 6 25 73 18 36 9 18 64
DISTRIBUCIÓN DE EDADES

70
63

55
52
Frecuencia

48
43

22
19

7
Histograma
4.5 14.5 24.5 34.5 44.5
Edad 54.5 64.5 74.5 84.5

Pastel

5% 2%
14%
6%

14%
Media 33,5
17% Moda 45
Mediana 31

13%

18%
11%

09 10 19 20 29 30 39 40 49
50 59 60 69 70 79 80 89
En la gran encuesta integrada de hogares realizada por el DANE en la sección de
edades de la población se puede evidenciar lo siguiente:

La mayor cantidad de la población es población joven puesto que el 18% de la


población está situada entre el rango de edad de los 20 a los 29 años
También en el rango de entre 50 y 59 años con un 14% y entre 40 y 49 años un
13%, siendo la variación de un grupo de edad a otro de pocos puntos
porcentuales.
Sin embargo, también se encuentra una población significativa en otros grupos
de edades, como, por ejemplo, un 17% está ubicado en edades más maduras,
entre los 10 y los 19 años.
. Notamos también que a partir de los 69 años la cantidad de personas disminuye
significativamente al punto en que el rango de personas en edad de adulto mayor
es decir de 60 a 89 años representa dentro de la población total únicamente el
13%. Lo que puede llegar a pensar que la esperanza de vida de la población se
encuentra ubicada al rededor de entre los 70 a los 90 años
Únicamente el 2% de la población se encuentra en edades entre los 80 y 89
años.
que dentro de la población la mayor cantidad de las personas tiene 45 años de
edad, sin embargo, el promedio de edades de la población es de 33,5 años.
NOTA: La mayoría mayoría de la población son personas jóvenes en edad
estudiantil, seguido de adultos, jóvenes en etapa productiva, y la edad más alta es
de 89 años evento de poca concurrencia en los datos obtenidos

Você também pode gostar