Escolar Documentos
Profissional Documentos
Cultura Documentos
1 CUATRIMESTRE 2007
Otra forma de presentar los datos, adems de los vistos, es presentarlos en forma grfica.
La funcin de los grficos es la presentacin ilustrativa visual de los datos de los
cuadros correspondientes. Los grficos nos permiten acercarnos a los datos de una
formas ms intuitiva y directa. Existe una gran variedad de grficos, de los cuales slo
veremos los ms usuales.
Un buen grfico debe ser:
* Sencillo: destacar las relaciones entre los datos sin exponer todos los detalles del
cuadro original.
* Se debe adaptar al tipo de variable presentada (nominal, ordinal, intervalar)
En toda representacin grfica hay subyacente un sistema de referencia o sistema de
coordenadas. El ms usual en las representaciones grficas consiste en dos lneas o
dimensiones perpendiculares que forman el sistema de Coordenadas Cartesianas. La
linea o eje vertical se llama ordenada o eje de las Y, y la lnea o eje horizontal se
denomina abscisa o eje de las X. Ambos ejes dividen el plano en cuatro cuadrantes que
se cruzan en el origen o punto cero. Las puntuaciones que parten del origen hacia arriba
por el eje Y y la derecha por el eje X son positivas; las que parten del origen hacia abajo
por el eje Y y a la izquierda por el eje X son negativas. Por lo general en sociologa se
utiliza el cuadrante positivo (primer cuadrante: derecha, arrriba).
Podemos clasificar los grficos en funcin del nivel de medicin de la variable a la cual los
datos pertenecen, segn sean variables cualitativas o variables cuantitativas:
A. VARIABLES CUALITATIVAS:
1) Pictograma
2) Sector circular
3) Barras simples o bastones
4) Barras compuestas (superpuestas o adyacentes)
B. VARIABLES CUANTITATIVAS:
5) Histograma de Pearson Pirmide
6) Polgono de frecuencias
7) Grfico de concentracin (Lorentz- Gini)
8) Box- Plot o Diagrama de caja mltiple
C. VARIABLE CONTEXTUAL:
9) Grfico de tendencia
1) PICTOGRAMA
Es un grfico para variables cualitativas. Su nivel de ilustracin es muy simple,
consistente en un grfico de dibujos. Su aplicacin est condicionada por el hecho de que
los valores de la variable deben ser susceptibles de adecuarse a formas grficas
simblicas.
Ejemplo:
Distribucin por sexo de la poblacin de la Ciudad de Buenos Aires. Ao 2001
X
f
Varones
1.258.458
Mujeres
1.517.680
Total
2.776.138
Fuente: INDEC, Censo Nacional de Poblacin, Hogares y Viviendas 2001.
Varones
Mujeres
Varones
Mujeres
N2 / N1
Ejemplo:
Distribucin de la poblacin de 15 aos y ms segn mximo nivel educativo alcanzado.
Ciudad de Buenos Aires. Ao 2001
x
f
Primario incompleto
96.941
Primario completo
419.479
Secundario incompleto
389.333
Secundario completo
552.914
Sup. o universitario incompleto
347.489
Sup. o universitario completo
459.423
Total
2.265.579
Fuente: INDEC, Censo Nacional de Poblacin, Hogares y Viviendas 2001.
600000
500000
400000
300000
200000
100000
0
PI
PC
SI
SC
UI
UC
El mismo grfico (y todos los grficos de barras -simples o compuestos-) tambin puede
representarse con las barras ubicadas de forma horizontal:
UC
UI
SC
SI
PC
PI
-
100,000
200,000
300,000
400,000
500,000
600,000
1000000
900000
800000
700000
600000
Mujeres
500000
400000
Varones
300000
200000
100000
0
P
600000
500000
400000
Varones
300000
Mujeres
200000
100000
0
P
5) HISTOGRAMA DE PEARSON
Su tcnica de construccin es similar al grfico de barras. Sin embargo, al ser la variable
cuantitativa, el ancho de cada barra no es arbitrario sino que guarda proporcin con los
valores de la variable. De este modo, el ancho de cada barra est determinado por los
lmites reales inferior y superior de cada intervalo y la altura por la frecuencia
correspondiente. El rea del rectngulo resultante ser proporcional a la correspondiente
frecuencia (absoluta o relativa). Algunos software especficos para estadstica grafican la
Curva de Gauss superpuesta con el histograma
Esto es vlido slo para intervalos regulares; si se trabaja con intervalos irregulares la
tcnica es otra.
Este grfico, al igual que el de barras, es til para cuadros univariados y bivariados.
Ejemplo:
Ciudad de Buenos Aires. Poblacin por sexo segn edad agrupada. Ao 2001
Sexo
Edad
Total
Varones
Mujeres
0-9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99
Total
156,313
151,351
307,664
171,526
170,096
341,622
226,167
242,487
468,654
181,874
199,156
381,030
157,276
188,939
346,215
140,021
181,466
321,487
105,106
149,427
254,533
84,900
144,291
229,191
31,334
75,477
106,811
3,885
14,705
18,590
1,258,402
1,517,395
2,775,797
Fuente: INDEC, Censo Nacional de Poblacin, Hogares y Viviendas 2001.
500.000
450.000
400.000
350.000
300.000
Mujeres
250.000
Varones
200.000
150.000
100.000
50.000
0
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99
Las pirmides de edades son variaciones del histograma. Las barras en este caso no se
hacen verticalmente sino horizontalmente, y los segmentos de cada sexo no se
superponen sino que se representan a la izquierda (varones) y derecha (mujeres) de la
ordenada.
Ejemplo:
Ciudad de Buenos Aires. Poblacin por sexo segn edad en aos simples. Ao 2001
Sexo
Edad
Total
Varones
Mujeres
Total
1,258,458
1,517,680
2,776,138
0-4
80,279
77,328
157,607
5-9
76,034
74,023
150,057
10-14
81,594
79,703
161,297
15-19
89,932
90,393
180,325
20-24
113,660
120,636
234,296
25-29
112,507
121,851
234,358
30-34
97,062
104,543
201,605
35-39
84,812
94,613
179,425
40-44
81,800
95,036
176,836
45-49
75,476
93,903
169,379
50-54
75,156
95,630
170,786
55-59
64,865
85,836
150,701
60-64
54,896
76,125
131,021
65-69
50,210
73,302
123,512
70-74
47,777
77,635
125,412
75-79
37,123
66,656
103,779
80-84
21,112
46,633
67,745
85-89
10,222
28,844
39,066
90-94
3,274
12,099
15,373
95-99
611
2,606
3,217
100 y ms
56
285
341
Fuente: INDEC. Censo Nacional de Poblacin, Hogares y Viviendas 2001.
90
80
70
60
50
40
30
20
10
0
-6
-5
-4
-3
-2
-1
varones
mujeres
Cuando hay intervalos desiguales, se deben igualar para poder graficar. Una forma de
hacerlo es transformar toda la distribucin a mdulo 1 (uno) y dividir cada frecuencia por
el mdulo original. Luego se grafica esa nueva distribucin.
Ejemplo:
Sea la siguiente distribucin de edades:
x
5-14
15-24
25-34
35-39
40-42
43-44
45-49
50-54
55-64
65-74
Total
f
20
40
80
60
30
30
50
40
60
30
440
f
5
6
7
8
x
2
2
2
2
f
29
30
31
32
x
8
8
8
8
f
53
54
55
56
8
8
6
6
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
2
2
2
2
2
2
4
4
4
4
4
4
4
4
4
4
8
8
8
8
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
8
8
12
12
12
12
12
10
10
10
15
15
10
10
10
10
10
8
8
8
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
6
6
6
6
6
6
6
6
3
3
3
3
3
3
3
3
3
3
440
TOTAL
16
14
12
10
8
6
4
2
69
65
61
57
53
49
45
41
37
33
29
25
21
17
13
6) POLGONO DE FRECUENCIAS
Los polgonos de frecuencias son propios de un nivel de medicin por intervalos o razn.
El polgono de frecuencias (o porcentajes) es una figura que se cierra al unir los puntos
medios de cada intervalo, a una altura proporcional a la frecuencia (o porcentaje) de dicho
intervalo. La unin de tales puntos conforma un segmento rectilneo que, al prolongarse
por los extremos hasta cortar el eje X, constituye un polgono de frecuencias.
Se usa en los mismos casos que el histograma. Su tcnica de construccin es anloga,
con la diferencia que trabaja con los puntos medios de cada intervalo.
La forma de construir un polgono de frecuencias es la siguiente:
a. En el eje horizontal (X) se colocan las categoras o los intervalos
10
Ejemplo:
Distribucin por sexo y edad de la poblacin de 15 aos o ms de la Ciudad de
Aires. Ao 2001 (en miles de habitantes)
Edad (categora o Puntos Medios Varones
Mujeres
Total
intervalo)
15-19
17
89.932
90.393
20- 39
29,5
408.041
441.643
40- 59
49,5
297.297
370.405
60- 79
69,5
190.006
293.718
Buenos
180,325
849,684
667,702
483,724
900000
800000
700000
600000
500000
mujeres
varones
400000
300000
200000
100000
0
0
17
29.5
49.5
69.5
100
Nota: Observar que la suma de las reas de mujeres y varones representa el rea correspondiente
al total.
11
Concentracin de la tierra
100
Propietarios
80
60
40
20
0
0
10
20
30
40
50
60
70
80
90
100
Superficie
12
rango en el que debera concentrarse el 95 por ciento de los datos. Estos puntos se
encuentran graficados a una distancia de 1,5 veces la longitud de la caja hacia la abajo y
hacia arriba del primer y tercer cuartos, respectivamente. Cuando no se observan datos
inferiores o superiores a estos puntos, las barras representan al mnimo y mximo valor
del conjunto. Si en cambio, existen datos inferiores o superiores a dichos puntos, ellos se
ubican entre la barra y el crculo o asterisco que a su vez representan el mnimo o mximo
respectivamente. Estos valores son llamados valores extremos bajo la definicin de
hallarse en el 2,5 por ciento extremo de una distribucin normal con mediana y rango
intercuartos iguales a los calculados.
As, el boxplot brinda ideas claras respecto a los siguientes aspectos:
1. La posicin del conjunto de datos a travs de la mediana
2. La concentracin de conjunto de puntos a travs de la longitud de la caja
3. Los valores extremos bajo la hiptesis de una distribucin normal
4. Los valores mnimo y mximo
5. La longitud de las colas
Grfico 2.2 Evolucin del conjunto de las tasas jurisdiccionales de fecundidad adolescente
precoz. Aos censales entre 1960 y 2001
Chaco
Chaco
0
N=
23
23
23
23
23
1960
1970
1980
1991
2001
Ao
13
14
50
45
40
Tasa de
Actividad
35
30
Tasa de
Desocupacin
25
20
15
10
5
20
02
20
00
19
98
19
96
19
94
19
92
19
90
19
88
19
86
19
84
19
82
19
80
19
78
19
76
19
74
15