Você está na página 1de 40

CAPTULO 3

TABLAS Y GRFICOS
INTRODUCCIN
La recopilacin de informacin es de gran importancia para analizar
fenmenos o comportamientos en los campos educativo, social,
econmico, cientfico y poltico, entre otros. Igualmente es clave que los
resultados numricos de cualquier estudio se presenten de manera clara
y concisa, de tal forma que la persona que lea la informacin obtenga
rpidamente una sensacin apropiada en torno a las caractersticas
esenciales de los datos. Lo anterior es particularmente necesario cuando
el conjunto de datos es muy grande. En realidad, una presentacin
efectiva de los datos usualmente revela caractersticas importantes tales
como su rango de variacin, el grado de simetra, qu tan concentrados
o dispersos estn los datos, en dnde se concentra la mayor parte de los
datos, etctera. En este captulo se presentan algunas tcnicas para
graficar y tabular datos.
La manera de recopilar datos y presentar la informacin obtenida,
de algn colectivo a estudiar, es una de las actividades que se
desarrollan en el trabajo estadstico y como parte de esta labor es muy
importante la forma en que los datos se organizan para su descripcin,
anlisis, interpretacin y publicacin. Hay dos maneras bsicas de
presentar los datos que son de uso cotidiano en la estadstica: las tablas
y las grficas. Es con base en estas dos formas que se pueden presentar
y destacar diversas ideas que se desean expresar acerca de una
informacin recopilada en forma de datos.
En este captulo se har una descripcin de varias formas de
organizar datos en forma de tablas, as como de presentar estos datos en
diversas formas de representacin grfica. Adems se dar cuenta de
algunas caractersticas relevantes de la elaboracin de tablas y grficas
de datos y distribuciones de frecuencias. Por ejemplo veremos, que el
tipo de variable considerada en un anlisis de datos, se relaciona e

35

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

influye en la apropiada eleccin de la organizacin y presentacin de


los datos.
En la presentacin se hablar de tres tipos de variables: en primer
lugar, de variables categricas o de atributos haciendo referencia a
variables que pueden ubicarse en un nivel de medicin nominal u
ordinal, es decir, no numrico; en segundo lugar, de variables discretas
para hacer referencia a las que corresponden a mediciones ordinales
codificadas en forma numrica, o a las que provienen de conteos
naturales sobre variables numricas; y finalmente, de variables
continuas para referirse a aquellas que se pueden medir en escalas de
intervalo o de razn.
TABLAS Y DISTRIBUCIONES DE FRECUENCIAS
Buena parte de las tablas que se utilizan en estadsticas son conocidas
como tablas de distribuciones de frecuencias. La tablas de frecuencia
usualmente tienen dos columnas; una de ellas, la primera, muestra
todos los posibles valores que asume la variable y la segunda, para cada
valor de la variable, muestra el nmero de veces que se presenta dicho
valor, en el contexto en el que se est trabajando; tal nmero se
denomina frecuencia.
Respecto a los tipos de tablas que se utilizan, se pueden
mencionar al menos tres criterios para clasificarlas. De acuerdo al tipo
de variables involucradas, se puede tener tablas de atributos, de
variables discretas y de variables continuas. De acuerdo a la forma
como se organizan las frecuencias se tienen: tablas de frecuencias
absolutas, de frecuencias relativas, de frecuencias porcentuales, de
frecuencias acumuladas absolutas, de frecuencias acumuladas relativas
y de frecuencias acumuladas porcentuales. Finalmente, de acuerdo a la
cantidad de variables consideradas se tienen tablas de una variable,
tablas de dos variables y tablas multivariadas. En el segundo caso se
pueden reconocer dos formas de presentacin: en paralelo o en forma
cruzada. Las tablas cruzadas tambin son llamadas como tablas de
doble entrada, de contingencia o de correlacin.

36

TABLAS Y GRFICOS

En lo que sigue se presentar diversos esquemas y ejemplos de la


manera de organizar tablas.

Tabla para una variable de atributo


Este tipo de tabla se utiliza para representar informacin que provenga
de una variable nominal. La arreglo tabular se presenta en dos
columnas o filas, en una se indican las categoras o valores de la
variable y en la otra la frecuencia. El esquema general es de esta forma:

Categoras
de la variable A

Frecuencias
absolutas

A1

f1

A2

f2

Ak

fk
Total

Tabla 1. Esquema de tabla para una variable de atributo

En este esquema Ai representa el nombre con el que se reconoce la


categora i, es decir, el valor de la variable, fi representa la frecuencia
absoluta y N el nmero total de datos.
Ejemplo. En la Tabla 2 se presentan datos acerca del nmero de
incendios forestales ocurridos en diferentes regiones espaolas en el
ao 2004. Ntese que no se evidencia el uso de algn criterio para
decidir sobre el orden en que se presentan las regiones. Por ejemplo, se
podran haber ordenado de manera ascendente de acuerdo a la
frecuencia observada en cada regin.
37

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Regin

N de Incendios

Pas Vasco

124

Catalua

565

Galicia

10618

Andaluca

1055

Castilla La Mancha

1364

Navarra

261

Extremadura

1623

Madrid

379

Castilla y Len

1942

Ceuta

Melilla

0
Total

17.934

Tabla 2. Nmero de incendios forestales ocurridos


en diferentes regiones espaolas en el ao 2004.

Tabla para una variable discreta


Este tipo de tabla es similar a la tabla que se usa para una variable de
atributo. La diferencia con el caso anterior, es que los valores de la
variable, es decir los xi, son numricos. El esquema general de este tipo
de tabla se presenta en la Tabla 3.
Valores de la variable

Frecuencias absolutas

x1

f1

x2

f2

xk

fk

Total

Tabla 3. Esquema de tabla de una distribucin de


frecuencias absolutas de una variable discreta.

38

TABLAS Y GRFICOS

Ejemplo. En la Tabla 4 se presenta la frecuencia del nmero de


ausencias al trabajo en una empresa. Ntese que en este ejemplo se
organiz la informacin en filas y no en columnas.
Valor
Frecuencia

0
12

1
8

2
5

3
4

4
5

5
8

6
0

7
5

8
2

9
1

Tabla 4. Frecuencias del nmero de ausencias al trabajo en una empresa

Tabla para una variable continua


Cuando se quiere organizar la informacin de una variable continua o
medida en una escala de intervalo o razn, puede ser necesario, sobre
todo cuando la cantidad de datos es muy grande, reagrupar los valores
en algunas pocas categoras llamadas intervalos de clase. En la prctica
el nmero de estos intervalos suele oscilar entre cinco y veinte; sin
embargo, no hay un criterio nico o ms recomendable para determinar
el nmero de intervalos de clase. En general, el nmero de intervalos
que se usen depende del contexto del que surgen los datos, de la
experiencia de quien organiza la informacin, y/o de las intenciones de
lo que quiera hacer notar el analista de datos. En la Tabla 5 se presenta
un esquema general de este tipo de tabla.
Este tipo de tablas contiene elementos sobre los que es
conveniente hacer algunos comentarios. La columna titulada orden de
clase, es de uso opcional y se utiliza para numerar los intervalos de
clase. En general, los intervalos de clase son una particin del conjunto
en donde asume valores la variable. Esta particin es excluyente y
exhaustiva, es decir, la unin de todos los intervalos es precisamente el
conjunto de todos los valores que asume la variable y la interseccin
entre cualquier par de intervalos diferentes es vaca. Esto implica que
un valor cualquiera de los datos siempre se puede clasificar de manera
nica en alguno de los intervalos de clase que definen la particin. La
Tabla 5 presenta un esquema general de este tipo de tablas. Aunque la
convencin para la utilizacin de los intervalos de clase en este esquema
es la de utilizar un intervalo cerrado a la izquierda y abierto a la

39

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

derecha, tambin se presentan variaciones a esta convencin. Por


ejemplo, a veces se utilizan intervalos cerrados en ambos extremos,
como en el segundo ejemplo de este apartado. Finalmente, la marca de
clase es un valor representativo del intervalo de clase y corresponde a
su punto medio.
Orden de Clase

Intervalo [Li1, Li)

Marca de clase

Frecuencia absoluta

[L0, L1)

m1

f1

[L1, L2)

m2

f2

[Lk1, Lk]

mk

fk

Total

Tabla 5. Esquema de tabla para una variable continua

Ejemplo 1. En la Tabla 6 se presenta las temperaturas en grados


centgrados reportadas por cien estaciones meteorolgicas colombianas
a las doce del da el 23 de febrero de 2006.
Intervalo

Marca de clase

Frecuencias absolutas

[22,5; 25,5)

24

45

[25,5; 28,5 )

27

43

[28,5; 31,5)

30

11

[31,5; 34,5]

33

Total

100

Tabla 6. Temperaturas de cien estaciones meteorolgicas


de Colombia a las 12:00 el 23 de febrero de 2006.

Ejemplo 2. En la Tabla 7 se presenta un ejemplo hipottico de los


resultados obtenidos por cincuenta estudiantes de una institucin
universitaria en un curso de estadstica bsica

40

TABLAS Y GRFICOS

Intervalo de Clase
30 39
40 59
60 69
70 - 89
90 100
Total

Frecuencia ni
4
14
12
16
4
50

Frecuencia Relativa (fi)


0.08
0.28
0.24
0.32
0.08
1

Tabla 7. Calificaciones en un examen obtenidas por


cincuenta estudiantes de una institucin universitaria

Tablas para diferentes tipos de frecuencias


El hecho de que las frecuencias se puedan presentar en diferentes
formas puede causar confusin a los inexpertos. Aunque no se
acostumbra presentar, en trabajos prcticos, todos estos tipos de
frecuencias de manera simultnea, a manera de ilustracin se presenta
un esquema, en la Tabla 8, que recopila las diferentes formas de
presentar las frecuencias. Por ejemplo, si N=50, una frecuencia absoluta
de 25, corresponde a una frecuencia acumulada de 0.5 y a un porcentaje
del 50%. Por otra parte, las frecuencias acumuladas lo que hacen es
acumular el valor de las frecuencias absolutas, relativas o porcentuales.
Valores
variabl
e
x1
x2

xk
Total

Frecuencia
absoluta

Frecuencia
relativas

f1
f2

fk
N

fr1
fr2

frk
1

p1
p2

pk
100

Frecuencia
absoluta
acumulada
F1
F2

Fk

Frecuencias
relativa
acumulada
Fr1
Fr2

Frk

%
acumulado
P1
P2

Pk
100

Tabla 8. Esquema de tabla con todas las versiones de tipos de frecuencias

Tablas de doble entrada


Este tipo de tablas se utiliza con mucha frecuencia para organizar los
resultados del cruce de frecuencias de dos variables. Adems, cuando

41

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

estas tablas se utilizan para analizar relaciones de dependencia entre las


variables, se habla de tablas de contingencia. En estos casos es usual que
en la ltima fila y columna se presenten los resultados de las frecuencias
marginales correspondientes a cada variable.
Ejemplo 1. La Tabla 9 presenta los resultados de lanzar un par de dados
distinguibles (por ejemplo un dado rojo y uno azul al lanzarlos en 120
ocasiones. Adems, el ejemplo ilustra una manera manual y prctica de
hacer conteos de frecuencia.

Tabla 9. Tabla de doble entrada donde han registrado los resultados


del lanzamiento de un par de dados distinguibles en 120 ocasiones

42

TABLAS Y GRFICOS

Ejemplo 2. La Tabla 10 presenta los resultados de la intencin de


separacin de 66 parejas heterosexuales cruzada con el tipo de unin
bajo la que conviven. Ntese que en este ejemplo, puede ser de inters
establecer si el tipo de unin est relacionada con la intencin de
separacin en una relacin de pareja.

Tipo de unin

Intencin de
separacin

Civil

Libre

Religiosa

Total
general

no

17

12

36

si

10

11

30

Total
general

17

28

21

66

Tabla 10. Tabla de doble entrada donde han registrado los resultados
del lanzamiento de un par de dados distinguibles en 120 ocasiones

Comentarios acerca del uso de tablas


Las tablas de atributos son el tipo de tablas que se utilizan ms a
menudo para organizar la informacin de atributos, es decir, de
variables cualitativas de nivel nominal u ordinal. Este tipo de tablas se
puede organizar en orden ascendente o descendente de acuerdo a la
frecuencia de los valores o se acuerdo a algn orden impuesto al
atributo como por ejemplo el orden alfabtico. Tambin se pueden dar
casos en que las categoras de organizacin contengan a su vez
subcategoras sobre las cuales tambin se realizan conteos.
En cuanto a las tablas de variables discretas son las que se utilizan
ms a menudo para organizar la informacin de variables numricas
discretas o cuantitativas ordinales. No es recomendable su uso cuando
existen demasiados valores diferentes de la variable de observacin.
Este tipo de tablas, usualmente se presentan en orden ascendente de
acuerdo a los valores de la variable.
43

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Las tablas para variables continuas son las que se utilizan ms a


menudo para organizar la informacin de variables cuantitativas que se
miden en un nivel de intervalo o de razn. En general se debe sopesar,
para determinar el nmero de intervalos de clase a contemplar, el error
generado por el agrupamiento utilizado con las dificultades de clculo
posterior, especialmente si no se tiene a la mano un computador para
los clculos. La construccin de este tipo de tablas exige la generacin
de criterios de particin para realizar el proceso de agrupamiento por el
cual se generan los intervalos de clase; en general, es preferible que la
amplitud de las clases sea constante, aunque en ocasiones pueden verse
mejor algunas caractersticas de los datos si se utilizan clases de
diferente amplitud. Este tipo de tablas puede generar problemas de
clculo de estadsticas, como la media aritmtica, o de representacin
grfica cuando los intervalos extremos no se definen de manera
acotada.
Finalmente, respecto a las tablas de doble entrada, se puede decir
que son de uso frecuente cuando se consideran dos variables de tipo
categrico, aunque tambin las hay para organizar el cruce de dos
variables continuas. Este tipo de tablas es llamado como tabla de
contingencia, cuando se utilizan para analizar la relacin de
dependencia entre las dos variables categricas, o como tabla de
correlacin cunado las variables consideradas son continuas. En este
tipo de tablas se debe tener que las categoras de clasificacin sean
excluyentes y exhaustivas.
GRFICOS
La forma en que los datos se organizan para su descripcin, anlisis,
interpretacin y publicacin es de importancia fundamental en la
estadstica. La representacin grfica es una manera de presentar los
datos y que permite destacar algunas ideas que se desean expresar. Al
igual que en el caso del uso de representaciones tabulares, las
representaciones grficas son de tipos muy variados, segn se trate de
variables unidimensionales, bidimensionales, multidimensionales o de

44

TABLAS Y GRFICOS

conjuntos de datos observados a intervalos regulares de tiempo (como


en el caso de las series de tiempo o cronolgicas), de atributos, etctera.

Columnas
Un diagrama de bloques es una grfica que se emplea para representar
la distribucin de una variable discreta o nominal. Consta de una serie
de rectngulos, cada uno de los cuales representa una categora de la
variable. Las bases de los rectngulos estn sobre una misma recta y se
nombran con los valores que toma la variable cuya distribucin se
quiere representar. Las bases de todos los rectngulos tienen la misma
longitud y la altura de cada uno de ellos es proporcional al nmero de
observaciones de la muestra que estn incluidas en cada clase. Los
rectngulos que conforman la grfica estn separados entre s para
indicar que entre uno y otro valor de la variable no hay ms valores.
Ejemplo. En la Figura1 se muestra la calificacin promedio asignado a
un grupo de veinticinco trabajadores en cuanto a sus actitudes de
disponibilidad hacia el trabajo, iniciativa para realizar labores y
capacidad de cuestionamiento de su labor en una empresa de
produccin de flores.

Figura 1. Calificacin promedio asignada por veinticinco trabajadores a su actitud en


trminos de su disponibilidad, iniciativa y capacidad de cuestionamiento de su trabajo

45

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Circular
Un diagrama circular es una grfica que se emplea para representar la
distribucin de una variable categrica. Para construirlo se utiliza un
crculo: se divide en tantos sectores como categoras tenga la variable. El
tamao de cada sector (o sea del ngulo central correspondiente) debe
ser proporcional al nmero de observaciones de la muestra que estn
incluidas en cada clase. En otras palabras, el grfico debe presentar el
aporte de cada valor con respecto al total.
Ejemplo. La Figura 2 muestra la distribucin de las inscripciones de
estudiantes a diferentes carreras en una universidad. Para mayor
claridad, tambin se incluye la tabla de donde proviene la informacin.
Programas Diseo Electrnica Matemticas Qumica Biologa Fsica Total
Inscritos

250

150

350

200

150

100

1200

Porcentaje

21%

13%

29%

17%

13%

8%

100%

8%
13%

DISEO

21%

ELECTRONICA
MATEMATICAS

12%

17%

QUIMICA
BIOLOGIA

29%

FISICA

Figura 2. Distribuciones de las inscripciones de los


estudiantes a diferentes en una Universidad

46

TABLAS Y GRFICOS

Puntos
Un diagrama de puntos es una grfica que se emplea para dar una idea
aproximada de la forma de la distribucin de una variable cuantitativa
discreta. Sobre una misma recta (usualmente horizontal) se disponen en
orden ascendente los posibles valores de la variable y encima de cada
uno de esos valores se anotan tantos puntos como veces se repita el
valor.

Ejemplo. Cuarenta estudiantes universitarios participaron en un


estudio acerca del efecto del sueo sobre las puntuaciones en los
exmenes. La Figura 3 presenta los resultados de 20 de los estudiantes
que estuvieron voluntariamente despiertos estudiando toda la noche
anterior al examen (grupo experimental que no durmi). En la Figura 4
se presentan los resultados de los otros 20 estudiantes (grupo control)
que se acostaron a las 11 p.m. la noche anterior al examen. Las
puntuaciones en el examen se muestran en los siguientes grficos. Cada
punto representa la puntuacin de un estudiante particular. Por
ejemplo, los dos puntos encima del nmero 80 en el Grfico 4, indican
que dos estudiantes en el grupo control tuvieron una puntuacin de 80
en el examen.

30

40

50

60

70

80

90

100

90

100

Figura 3. Puntuaciones del grupo experimental

30

40

50

60

70

80

Figura 4. Puntuaciones del grupo control

47

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Barras
Un diagrama de barras es una grfica que se emplea para representar la
distribucin de una variable cuantitativa discreta o nominal. Sobre una
misma recta (usualmente vertical) se disponen en orden ascendente los
posibles valores de la variable y al lado de cada uno de esos valores se
trazan segmentos de recta cuya longitud es proporcional a la frecuencia
de cada valor de la variable. En realidad este tipo de grfico se puede
ver como equivalente al de columnas, salvo por la disposicin de las
barras en forma horizontal. Por lo tanto, las alturas de las barras deben
ser iguales y el largo de las mismas debe ser proporcional al nmero de
observaciones de la muestra que estn incluidas en cada clase.

Ejemplo. En la Figura 5 se muestran los resultados de una investigacin


en la que una muestra de 107 profesores respondi una prueba acerca
de la interpretacin y el razonamiento con probabilidades.

Utilizacin de razonamiento
combinatorio para calcular
probabilidades

26,9

Interpretacin de probabilidades

63,4

Utilizacin de razonamiento
proporcional para calcular
probabilidades

89,2

20

40

60

80

Porcentajes
Figura 5. Porcentaje de aciertos de profesores en una prueba acerca
de interpretacin y razonamiento con probabilidades

48

100

TABLAS Y GRFICOS

Histograma
Un histograma es una grfica que se emplea para representar la
distribucin de una variable cuantitativa continua. Est constituida por
rectngulos ubicados sobre una misma recta. Cada uno de los grupos en
que se clasifica la variable est representado por la base de un
rectngulo; y la altura del mismo es proporcional a la frecuencia del
correspondiente grupo de valores. Adems tales rectngulos son
adyacentes. Aunque el histograma es una forma tpica de visualizar el
comportamiento de una variable continua, tambin se puede utilizar
para una variable discreta cuando tiene un nmero muy elevado de
valores
Ejemplo. El histograma que se presenta en la Figura 6, representa el
nmero de visitas que ha tenido una pgina web de Internet,
dependiendo de la hora de la visita. Ntese que en este ejemplo las
frecuencias se han indicado, encima de los bloques que conforman el
histograma.

Figura 6. Porcentaje de aciertos de profesores en una prueba acerca


de interpretacin y razonamiento con probabilidades

49

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Polgono de frecuencias
Un polgono de frecuencias es un tipo de grfico que suaviza el
contorno de un histograma. Es una forma geomtrica obtenida de
segmentos de recta que unen los puntos medios de los intervalos de
clase adyacentes del histograma. Los polgonos de frecuencia son
especialmente tiles para comparar varias distribuciones en donde la
superposicin de histogramas causara confusin.
Ejemplo. El polgono de frecuencias que se muestra en la Figura 7
corresponde a la suavizacin que se realiz al histograma presentado en
la Figura 6.

Figura 7. Suavizacin de la grfica de la Figura 5, sobre el porcentaje de aciertos de


profesores en una prueba acerca de interpretacin y razonamiento con probabilidades

Tallo y hojas
El grfico de tallo y hojas es uno de los mtodos bsicos del anlisis
exploratorio de datos que aplica a variables numricas. La idea de la
construccin del mismo se basa en definir un tallo de valores que
represente el primer o primeros dgitos del cuerpo de datos, y a lado de
cada uno de estos valores se escriben los siguientes dgitos de cada

50

TABLAS Y GRFICOS

nmero, que semejan las hojas que se desprenden de un tallo. Una


ventaja de este grfico es la de permitir ver la forma de la distribucin
de los datos preservando toda o buena parte de la informacin
numrica.
Ejemplo. En la Figura 8 se presenta el grfico de tallo y hojas
correspondiente a las notas de veinte estudiantes en un examen.
Tambin se incluye el conjunto de datos para que se verifique la
construccin del grfico.
78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86

6
7
8
9
10

1
0
1
1
0

4
0
3
3

6
2
3
7

3
6

4
8

Figura 8. Grfico de tallos y hojas de las calificaciones


de veinte estudiantes en un examen

66+
77+
88+
99+
10-

1
6
0
6
1
6
1
7
0

4
0
7
3
8
3

2
8
3

Figura 9. Grfico de tallos y hojas extendido de las calificaciones


de veinte estudiantes en un examen

Por otra parte, en la Figura 9 se ilustra una manera de abrir el grfico


de tallo y hojas presentado en la Figura 8. La convencin utilizada

51

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

consiste en usar el signo - para colocar las hojas con valores entre 0
y 4 y el signo + para colocar las hojas" entre 5 y 9.

Grfico de caja (Boxplot)


El grfico de caja, conocido en la literatura inglesa como Boxplot, proviene
del anlisis exploratorio de datos y es muy apropiado para mostrar el
comportamiento de los datos cuando interesa presentarlos estratificados
por alguna variable cualitativa. Para su construccin es necesario
calcular los cuartiles (Q1, Q2 y Q3), el rango intercuartlico (RQ) y los
lmites que determinan la zona de anomalas (Q11,5RQ y Q3 + 1,5RQ).
Ejemplo 1. La Figura 10 ilustra la construccin del grfico de caja.
Orden:

10

11

12

13

14

15

16

17

18

19

20

Datos: 5 7 8 9 9 9 9 9 9 9 10 10 11 11 11 11 14 15 16 18
Q1

Q2

Q3

ltimos valores antes de entrar a la zona de anomalas

Zona de
anomalas

1,5RQ
Q3
RQ
Q2
Q1

1,5RQ
Zona de
anomalas

Figura 10. Grfico de caja donde Q1 es el primer cuartil, Q2 es la mediana,


Q3 es el tercer cuartil y RQ es el rango intercuartlico (Q3-Q1)

52

TABLAS Y GRFICOS

Ejemplo 2. En la Figura 11 se presentan los resultados obtenidos en


grado dcimo en un examen final de matemticas en cuatro cursos
dirigidos por diferentes profesores. Se puede observar, por ejemplo, que
en el cursos 1, hubo un estudiante con un puntaje que sobresale
respecto a los dems estudiantes de su curso, mientras que en el curso 2,
se identifica a un estudiante que obtuvo un puntaje significativamente
menor que loa puntajes obtenidos por los dems estudiantes del curso.
Asimismo, en cuanto a la homogeneidad de los resultados obtenidos, se
puede observar que el curso 4 es el ms heterogneo de los cuatro
cursos.

Figura 11. Resultados en examen de matemticas de los estudiantes


de cuatro cursos, del mismo nivel acadmico, en un colegio

Dispersin (Nube de puntos)


Este grfico muestra los puntos asociados con los datos, en un plano
bidimensional y se usa para representar los pares de valores (nube de
puntos) de una distribucin bivariante. Cada dato, representado por un
punto, nos indica una sola unidad de observacin sobre las cuales han
sido hechas dos mediciones, x y y. Los valores de cada una de las
53

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

mediciones son llevadas a escala sobre los ejes x y y respectivamente.


Los grficos de dispersin son tiles para analizar la correlacin entre
variables cuantitativas, ya que la nube de puntos que se genera permite
identificar tendencias o ausencias de correlacin

FILOSOFIA

Ejemplo. En la Figura 12 se ilustra el uso de este tipo de grfico.


10
9
8
7
6
5
4
3
2
1
0
0

10

MATEMATICAS

Figura 12. Resultados obtenidos en matemticas y estadstica por diez estudiantes

Pareto
El grfico de Pareto permite visualizar e identificar las principales
razones que generan o se atribuyen a un evento que se desee estudiar.
En particular, se utiliza en la supervisin de control de calidad cuando,
por ejemplo, se desea determinar las razones que provocan una mala
calidad en la elaboracin del algn producto textil. Ntese adems, que
este no es propiamente un grfico de frecuencias pues la suma de las
ocurrencias de los eventos es, en general, ms alta que el total de los
objetos o productos que se revisan.
Ejemplo. La Figura 13 muestra las razones atribuidas por treinta
consumidores para devolver las chaquetas vendidas en un almacn.

54

TABLAS Y GRFICOS

OCURRENCIAS

MOTIVOS DE DEVOLUCIN DE CHAQUETAS


35
30
25
20
15
10
5
0

29
22
12

TELA

COLOR

AJUSTES

BOTONES

MANGAS

FORRO

RAZONES

Figura 13. Razones para la devolucin de chaquetas en un almacn

Observe que en este grfico de Pareto la suma de las ocurrencias es


mucho mayor que 30, que es el nmero de chaquetas revisadas. Para su
elaboracin lo que se hace es contar el nmero de ocurrencias que se
atribuyen al fenmeno en cuestin y luego se muestran las ocurrencias
en columnas ordenadas de mayor a menor.

Figura 14. Ejemplo de pictograma que ilustra el crecimiento


de la poblacin de los Estados Unidos de 1930 a 1990

55

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Pictogramas
Los pictogramas usualmente consisten en dibujos icnicos cuyo tamao
suele representar cantidades o proporciones de la variable o variables
de las que se est informando.
Ejemplo. En la Figura 14 (pgina anterior), se muestra un ejemplo de la
manera como se utiliza el pictograma.

Perfiles
Los grficos de perfiles se pueden considerar como una extensin de los
grficos de columnas o de barras. Se usan para comparar resultados
atribuibles a los efectos de controlar u observar dos variables.
Ejemplo 1. En las Figura 15 y 16 y en la tabla que se presenta arriba de
stas, se compara los promedios de efecto de sueo (en horas) de tres
tipos de drogas somnferas en diferentes dosificaciones en una muestra
de 60 pacientes voluntarios
Dosis en miligramos
95
96
97
98
99

Droga 1
5
6
7
8
8

Droga 2
2
2
3
5
6

Droga 3
1
1
2
3
2

9
8
7
6
Drog a 1

5
4

Drog a 2

3
2

Drog a 3

1
0
95

96

97

98

99

Figura 15. Comparacin del efecto promedios de sueo (en horas) de tres tipos de
drogas somnferas en diferentes dosis, en una muestra de 60 pacientes voluntarios

56

TABLAS Y GRFICOS

99
98
Droga 1

97

Droga 2
Droga 3

96
95
0

10

Figura 16. Versin en presentacin de barras de los datos de la grfica de la Figura 14

Columnas o barras apiladas


Una variacin de la grfica de perfiles la aporta los grficos de
columnas o de barras apiladas, que permiten comparar entre categoras
el aporte de cada valor al total. Como se ver en los ejemplos este tipo
de grficas se puede presentar en versiones absolutas o porcentuales.
Ejemplo 1. Los datos presentados en la tabla siguiente muestran el
nmero de autos, camionetas y camperos vendidos durante los meses
de diciembre de los aos 1995 a 1999 en un concesionario de venta de
carros. En las Figuras 17 y 18, se muestra la versin de apilamiento
absoluta en columnas y barras respectivamente.
Ao

Autos

Camionetas

Camperos

95

96

97

98

99

57

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

18
16
14
12

Camperos

10

Camionetas

Autos

6
4
2
0
95

96

97

98

99

Figura 17. Nmero de autos, camionetas y camperos vendidos durante los meses de
diciembre de los aos 1995 a 1999 en un concesionario de venta de carros

99
98
Autos

97

Camionetas
Camperos

96
95
0

10

15

20

Figura 18. Versin presentada en barras de la Figura 17. Observe que en este caso se ha
hecho un manejo menos preciso de la escala numrica horizontal.

Ejemplo 2. Respecto a los mismos datos considerados en el ejemplo


anterior, en las Figuras 19 y 20, se muestra la versin de apilamiento
porcentual en columnas y barras respectivamente.

58

TABLAS Y GRFICOS

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

Camperos
Camionetas
Autos

95

96

97

98

99

Figura 19. Porcentaje de autos, camionetas y camperos vendidos durante los meses de
diciembre de los aos 1995 a 1999 en un concesionario de venta de carros

99
98
Autos

97

Camionetas
Camperos

96
95
0%

20%

40%

60%

80%

100%

Figura 20. Versin en barras de la Figura 18

Lneas
Este tipo de grficos se utiliza para presentar tendencias a lo largo del
tiempo o entre categoras. Cuando una de las variables es el tiempo y la
otra es por ejemplo, las ventas, el grfico tambin se conoce con el
nombre de series de tiempo. Por otra parte, y al igual que en los casos
de los grficos de columnas y barras, en los grficos de lneas se pueden
elaborar apilamientos absolutos y porcentuales.

59

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Ejemplo. Los datos de los ejemplos presentados en el apartado sobre


grficos de columnas o barras apiladas tambin se pueden utilizar para
representar las diferentes modalidades de los grficos de lneas.
9
8
7
6

Autos

Camionetas

Camperos

3
2
1
0
95

96

97

98

99

Figura 21. Nmero de autos, camionetas y camperos vendidos durante los meses de
diciembre de los aos 1995 a 1999 en un concesionario de venta de carros

18
16
14
12
10
8
6
4
2
0

Autos
Camionetas
Camperos

95

96

97

98

99

Figura 22. Versin apilada absoluta de grfico de lneas del nmero de autos,
camionetas y camperos vendidos durante diciembre en los aos 1995 a 1999

60

TABLAS Y GRFICOS

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

Camperos
Camionetas
Autos

95

96

97

98

99

Figura 23. Versin apilada porcentual de grfico de lneas del nmero de autos,
camionetas y camperos vendidos durante diciembre en los aos 1995 a 1999

En la Figura 21 se muestra una versin sin apilar del nmero de autos,


camionetas y camperos vendidos durante los meses de diciembre en los
aos 1995 a 1999 en un concesionario de venta de carros, mientras que
en las Figuras 22 y 23, se muestras las versiones apiladas absolutas y
porcentuales respectivamente de los mismos datos.

reas
En este tipo de grfico, como en los grficos de lnea, tambin se
presenta la tendencia de los valores de los datos a lo largo del tiempo o
entre categoras.
Ejemplo. El presupuesto de inversin del gobierno en miles de millones
de pesos en las reas de educacin y ciencia y tecnologa se presenta en
la siguiente tabla.
Aos
2001
2002
2003
2004
2005
2006

Educacin
250
200
250
270
220
350

Ciencia y tecnologa
200
150
180
150
200
250

61

Totales
450
350
430
420
420
600

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Obsrvese que en la Figura 24 se presentan los presupuestos sin realizar


apilamientos, mientras que en la Figura 25 y 26 respectivamente se
utilizan los apilamientos absolutos y porcentuales.

400
350
300
250

EDUCACIN

200

CIENCIA Y TEC.

150
100
50
0
2001

2002

2003

2004

2005

2006

Figura 24. Presupuesto de inversin de los aos 2001 a 2006, en educacin y


ciencia y tecnologa (versin sin apilamientos)

700
600
500
400

CIENCIA Y TEC.

300

EDUCACIN

200
100
0
2001

2002

2003

2004

2005

2006

Figura 25. Presupuesto de inversin de los aos 2001 a 2006, en educacin y


ciencia y tecnologa (versin con apilamientos absolutos)

62

TABLAS Y GRFICOS

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

CIENCIA Y TEC.
EDUCACIN

2001

2002

2003

2004

2005

2006

Figura 26. Presupuesto de inversin de los aos 2001 a 2006, en educacin y


ciencia y tecnologa (versin con apilamientos porcentuales)

Columnas en tres dimensiones


Los grficos columnas en tres dimensiones sirven para representar la
informacin que proviene de tablas de doble entrada ya que con base en
ellos se pueden comparar frecuencias entre categoras bivariantes. En
realidad, este tipo de grfico puede verse como extensin del
histograma aplicado a dos variables o como variacin de los grficos de
columnas (barras), o de perfiles para dos variables.
Ejemplo. La venta de carros en diciembre de 2008 (autos, camionetas y
camperos) en tres concesionarios diferentes se puede volver a utilizar
para ilustrar el uso de este tipo de grficos. Los datos que se
representan en la Figura 27 se organizaron en la siguiente tabla
C1

C2

C3

Autos

Camionetas

Camperos

63

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

Figura 27. Nmero de carros vendidos en tres concesionarios


diferentes en diciembre de 2008

Cotizaciones
Los grficos de cotizaciones, como lo indica su nombre, se utilizan en el
mercado burstil para analizar las fluctuaciones de los precios de las
acciones.
Ejemplo. Las Figuras 28, 29 y 30 ilustran la utilizacin de los grficos de
cotizaciones, en tres modalidades. Los datos que se tomaron para
elaborar estos grficos aparecen en la siguiente tabla.
Da
1
2
3
4
5
6
7

Volumen
200
250
300
250
300
150
200

Apertura
55
53
59
54
56
58
56

Mximo
58
60
62
56
54
56
60

64

Mnimo
52
52
56
54
57
59
52

Cierre
56
54
60
55
55
57
58

VALORES

TABLAS Y GRFICOS

64
62
60
58
56
54
52
50
48
46
1

DIAS

Figura 28. Fluctuaciones de los valores en miles de pesos de una accin durante una

VALORES

semana. Slo se indican los valores mximos y mnimos alcanzados


y el precio de cierre con una pequea marca rectangular

64
62
60
58
56
54
52
50
48
46
1

DIAS

Figura 29. Fluctuaciones de los valores (en miles de pesos) de una accin durante siete
das. Se indican los valores mximos y mnimos alcanzados y los precios de apertura
y cierre de la accin se representan con un rectngulo. Observe que el rectngulo
no est relleno cuando el precio de apertura es menor que el de cierre.

65

350

64
62
60
58
56
54
52
50
48
46

300

VENTAS

250
200
150
100
50
0
1

VALORES

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

DIAS

Figura 30. Fluctuaciones de los valores (en miles de pesos) de una accin durante siete
das. Este grfico contiene la informacin del grfico anterior, pero adems,
incluye la informacin de monto total de las ventas en millones de pesos

Comentarios acerca del uso de grficos


Para la elaboracin de grficas se pueden dar algunas recomendaciones.
La finalidad de las grficas es visualizar mejor la informacin. Por ello,
la mejor grfica suele ser la ms simple. Al presentar grficas siempre se
debe buscar sencillez y claridad, de tal manera que stas sean
comprensibles sin la ayuda de las descripciones de textos.
Toda grfica debe tener ttulo e indicar con claridad el contenido
de la misma. Las columnas, barras y lneas en los diversos grficos de
este tipo deben preservar en lo posible el nivel de frecuencia cero para
no generar grficos engaosos.
Las grficas no se deben ver como un sustituto de tablas u otros
medios de representacin estadstica, ms bien son un complemento del
anlisis de datos. En realidad, la grfica es considerada como el
principal medio de expresin de la estadstica por diferentes razones: es
ms llamativa y sugestiva, deja en la memoria una expresin ms
duradera que las tablas o el slo texto y requiere de un menor tiempo
de lectura. El grfico de Tallo y hojas y el de Caja son tpicos del anlisis
exploratorio de datos y aunque tambin se usan para estudiar una sola

66

TABLAS Y GRFICOS

variable, alcanzan su mayor potencia cuando se utilizan para abordar


anlisis de tipo multivariado, por ejemplo para comparar
distribuciones.
EJERCICIOS
1. La persona encargada de administrar un taller de carros, quiere
determinar los motivos que inducen con ms frecuencia a que los
clientes ingresen su automvil para revisin y mantenimiento.
Despus de recoger la informacin va a presentarla en un grfico.
a. Cul es la variable que se va a medir? De qu tipo es?
b. Qu tipo de diagrama es el ms adecuado? Por qu?
2. Un estudiante de derecho quiere determinar la proporcin de
estudiantes que hay en cada una de las carreras que conforman la
facultad de Humanidades para corroborar su afirmacin de que los
estudiantes de derecho son los que deciden en una votacin pues
son la mayora. Despus de que haya recogido la informacin va a
presentarla en un grfico.
a. Cul es la variable que se va a medir? De qu tipo es?
b. Qu tipo de diagrama es el ms adecuado? Por qu?
3. El administrador de un supermercado est interesado en determinar
si es necesario instalar ms cajas registradoras en el almacn para
darle una atencin ms rpida a la comunidad. Para el efecto, la
persona encargada de hacer la investigacin toma, un da
cualquiera, una muestra aleatoria de 50 compradores y anota el
tiempo que cada uno de ellos gasta haciendo cola para pagar sus
compras. Despus de que haya recogido la informacin va a
presentarla en un grfico.
a. Cul es la variable que se va a medir? De qu tipo es?
b. Qu tipo de diagrama es el ms adecuado? Por qu?

67

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

4. En el curso de estadstica se han realizado tres parciales. El profesor


del curso cree que, en general, sus alumnos van bien pues la
mayora de ellos han aprobado los tres parciales. El profesor quiere
presentar la informacin correspondiente en un diagrama.
a. Cul es la variable que se va a medir? De qu tipo es?
b. Qu tipo de diagrama es el ms adecuado? Por qu?
5. El lenguaje es la herramienta propia del hombre para comunicarse
con los otros miembros de una sociedad. Con el fin de comprobar el
cumplimiento de la funcin comunicativa de su peridico en toda la
sociedad cucutea, el director de un destacado diario de la capital
de Santander del Norte, adelant una investigacin que pretenda
medir el alcance de la informacin contenida en el peridico con
respecto al grado de comprensin que de sta lograba el lector. Para
tal efecto, se tom una muestra de cien suscriptores del diario a
quienes se pidi calificar tres tipos de escritos segn el grado de
dificultad de comprensin que presentaban. A continuacin se
especifica un poco ms el estudio a travs de cuatro tablas: la
primera presenta la muestra estratificada por nivel socioeconmico
de los suscriptores del peridico, la segunda indica los tipos de
textos sometidos a calificacin, la tercera indica la escala de
calificaciones para el grado de dificultad de comprensin del texto y
la ltima tabla presenta los resultados, de la calificacin general a
los tres textos, obtenidos segn el nivel socioeconmico.
Alto

20

Medio alto

30

Medio bajo

20

Bajo

30

Temas de inters general

Temas sociales y polticos

Temas especializados

68

TABLAS Y GRFICOS

Alto

Medio alto

Medio bajo

Bajo

+2

Muy difcil

+1

Difcil

No muy difcil

-1

Fcil

-2

Muy fcil

+1

+1

-1

-1

-1

+2

+1

+1

-1

-1

-1

+1

-1

-1

-2

+2

+2

+1

+1

+1

-1

-2

-2

+1

+1

+2

-1

-2

-1

+1

+1

-1

+1

+1

-1

-2

+2

+1

+1

+1

-1

-1

-1

-1

+1

-1

-2

+2

+2

+1

+1

+1

+2

-1

+1

+1

+1

+2

+1

+1

a. Cul es el problema de estudio?


b. Cul es la muestra de estudio?
c. Cules son las variables y de qu tipo son?
d. Elabore una tabla de frecuencias para las calificaciones dadas
y represente la informacin con un grfico apropiado.
e. Elabore tablas de frecuencias y represente en grficos
apropiados las calificaciones obtenidas segn los cuatro
niveles socioeconmicos considerados en el conjunto de
datos presentado.
f.

Compare los cuatro grficos y concluya sobre la relacin


entre el nivel socioeconmico y el grado de comprensin.

g. Puede concluir algo sobre la diferencia entre grado de


comprensin y el tipo de texto presentado? Explique su
respuesta.

69

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

6. La siguiente tabla muestra el nmero de hombres y mujeres en los


diferentes departamentos de una empresa. Contabilidad (C),
Estadstica (E), Servicios generales (G), Tesorera (T), Sistemas (S),
Ventas (V) y Direccin (D).
C E G T S V D
Hombres 30 35 35 20 25 40 10
Mujeres 40 20 30 25 30 50 20

a. Proponga un grfico apropiado para representar el nmero


de mujeres por departamento.
b. Proponga un grfico apropiado para representar el nmero
de mujeres y hombres por departamento.
c. En qu departamento hay mayor nmero de empleados?
Cul grfica muestra ms claramente este resultado?
d. En qu departamento hay mayor diferencia entre el nmero
de hombres y mujeres? Cul grfica muestra claramente
este resultado?
e. Para observar en qu departamento hay mayor porcentaje de
mujeres, qu tipo de grfico se puede utilizar?
7. La tabla que se muestra ms abajo se refiere al comercio de
Colombia en el grupo Andino entre los aos 1975 y 1979. Datos en
millones de pesos. Proponga un grfico en el que pueda comparar
las exportaciones y las importaciones por ao. Tendra sentido
presentar los datos en un grfico de columnas o barras
porcentuales? Explique.
Ao

Exportaciones

Importaciones

1975

80

55

1976

90

40

1977

90

55

1978

140

80

1979

160

90

70

TABLAS Y GRFICOS

8. En la siguiente tabla se muestran las razones por las cuales 30


computadores configurados en la universidad se encuentran en el
taller de mantenimiento. Las partes se compran a diferentes
proveedores. Las razones por las cuales cada computador entr al
taller se detallan en la siguiente tabla:
N R1 R2 R3 R4 R5 R6 R7 R8 R9 R10
1

2
3

16 x

x
x

N R1 R2 R3 R4 R5 R6 R7 R8 R9 R10

17

x
x

18
x

19

x
x

10

11

12

13

14
x

22

23
24 x

25

x
x

21

x
x

15 x

28

30 x

x
x

x
x

29
x

x
x

27 x

x
x

26

x
x

x
x

20 x

x
x

x
x

x
x
x

Donde las razones son:


R1 = Actualizar sistema operativo

R2 = Cambio de batera de la bios

R3 = Molesta la tarjeta de sonido

R4 = Molesta la tarjeta de video

R5 = Se desconfigura el teclado

R6 = Daada la tarjeta de red

R7 = Escasa memoria

R8 = Dao del disco duro

R9 = Dao en unidad de CD

R10 = Dao en la unidad 3 A

a. Represente grficamente esta informacin.


b. Sugiera en qu caso se deben tomar medidas correctivas?
9. El siguiente conjunto de datos corresponde al consumo en metros
cbicos de agua de 81 residencias de una ciudadela durante el
segundo semestre del ao 2006.

71

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

40.00
40.25
40.50
40.75
41.00
41.25
41.50
41.75
42.00

40.30
40.40
46.30
68.70
72.10
75.50
78.90
82.30
85.70

40.60
43.10
40.80
48.20
55.60
63.00
70.40
77.80
80.20

40.90
45.80
43.10
41.20
40.00
58.30
64.40
80.10
74.70

41.20
48.50
45.40
43.50
41.60
53.60
58.40
82.40
69.20

41.50
51.20
47.70
45.80
44.30
42.00
52.40
84.70
63.70

41.80
53.90
50.00
48.10
47.00
46.70
46.40
87.00
58.20

42.10
56.60
52.30
50.40
49.70
51.40
40.40
46.80
52.70

42.40
59.30
54.60
52.70
52.40
56.10
34.40
90.00
47.20

a. Elabore tablas de frecuencias relativas y acumuladas.


b. Represente de tres formas diferentes el conjunto de datos.
10. En un zoocriadero destinado a la cra de chigiros para exportacin
se ha descuidado la alimentacin de los animales y se ha presentado
un desarrollo inesperado en estos. Se han clasificado los animales en
diez grupos, teniendo en cuenta el peso en kilogramos. La siguiente
tabla muestra la cantidad de animales en cada categora de pesos:
Cantidad de Porcentaje Porcentaje Marca de la
Pesos
35.00 - 85.00
animales
de animales acumulado categora
35.00 - 40.00

20

40.10 - 45.00

25

45.10 - 50.00

30

50.10 - 55.00

10

55.10 - 60.00

15

60.10 - 65.00

20

65.10 - 70.00

25

70.10 - 75.00

35

75.10 - 80.00

10

80.10 - 85.00

10

a. Complete la tabla.
b. Estime cuntos animales pesan menos de 70.00 kilos.
c. Estime cuntos animales pesan menos de 58.00 kilos.

72

TABLAS Y GRFICOS

11. Indague como se elaboran los grficos de: anillos, burbujas, radial y
superficie y proponga cuatro conjuntos de datos con los cuales
tenga sentido la utilizacin de los mismos.
12. En el anlisis multivariado de datos existen algunos mtodos de
representacin grfica como los dispersogramas, las curvas de
Andrews y los rostros de Chernov. Investigue cual es la finalidad de
estos grficos y proponga conjuntos datos para los que tenga
sentido su utilizacin.

73

CURSO BSICO DE ESTADSTICA DESCRIPTIVA

74

Você também pode gostar