Escolar Documentos
Profissional Documentos
Cultura Documentos
A lo largo de su existencia el ser humano ha llevado a cabo anlisis de una gran cantidad
1.1 Estadstica
Qu entendemos por estadstica?
Como se explic, el ser humano tuvo la necesidad de crear una ciencia que redujera la
informacin a valores numricos para la mejor interpretacin de los fenmenos; se le
llam estadstica.
Definicin 1.1
La estadstica es una rama de las matemticas aplicadas que proporciona mtodos para reunir,
organizar, analizar e interpretar informacin, y usarla para obtener diversas conclusiones que
ayuden a tomar decisiones en la solucin de problemas y en el diseo de experimentos.
Carolingia tambin llamada Carlovingia, fue una dinasta de reyes francos que gobernaron un vasto territorio de Europa Occidental desde el siglo vii hasta el siglo x d. C.; su nombre fue tomado de su ms renombrado
miembro, Carlomagno.
20
E stadstica y probabilidad
Actualmente la estadstica es un mtodo efectivo para describir con precisin los valores
de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y una herramienta para
relacionar y analizar dichos datos. Por esta razn, la estadstica se divide en diferentes
ramas, entre las ms aplicadas y que analizaremos estn la estadstica descriptiva y la
inferencial.
La primera de ellas se aborda en la presente unidad y ser descrita ms adelante,
mientras que la segunda ser estudiada en las unidades 9 y 10. Por ahora se vern dos
conceptos fundamentales en el estudio de la estadstica.
Definicin 1.2
La poblacin es el conjunto que incluye el total de elementos o datos cuyo conocimiento es de
inters particular.
Ejemplo 1
1. Si el conjunto de datos de inters est constituido por todos los promedios de un grupo
de estudiantes de licenciatura de una universidad, cada uno de los estudiantes ser
un individuo estadstico, mientras que el conjunto de todos estos estudiantes ser
la poblacin y una muestra podra ser el conjunto de todos los estudiantes del tercer
cuatrimestre de ingeniera.
2. Si el conjunto de datos de inters est constituido por todos los promedios de los grupos
de licenciatura, cada uno de los grupos ser un individuo estadstico, mientras que el
conjunto de todos estos grupos ser la poblacin y una muestra podra ser el conjunto
de todos los grupos del tercer cuatrimestre de ingeniera.
21
Ejemplo 2
Qu es un caracter cuantitativo?
Definicin 1.5
Una variable estadstica es discreta slo cuando permite valores aislados, como nmeros enteros.
Por ejemplo, la variable nmero de hermanos toma los valores 0, 1, 2, 3, 4 y 5. Este tipo
de variables se caracterizan por obtenerse mediante un proceso de conteo (ver semejanza
con las variables aleatorias discretas en la unidad 5).
Definicin 1.6
Una variable estadstica es continua cuando admite todos los valores de un intervalo.
22
E stadstica y probabilidad
de variables se caracteriza por obtenerse mediante mediciones (ver semejanzas con las
variables aleatorias continuas en la unidad 7).
Las variable cualitativas pueden ser nominales si se trata de categorias (sexo, raza,
etc.) y ordinales si implican orden (clase social, grado de preferencia).
Cul es la finalidad
de la estadstica descriptiva?
23
Muestreo estratificado
En este tipo de muestreo se divide la poblacin en grupos que no se traslapen es decir,
que no tengan elementos en comn y se procede a realizar un muestreo aleatorio simple
en cada uno de los grupos.
Por ejemplo, la poblacin estudiantil de una universidad se puede dividir en grupos
formados por diferentes especialidades (ingeniera industrial, ingeniera en sistemas,
administracin, etc.) y despus de cada una de ellas se procede a seleccionar una muestra
aleatoria para llevar a cabo una entrevista y obtener la informacin deseada.
Adems de los dos tipos de muestreo mencionados, existe el muestreo sistemtico
y el muestreo por conglomerados. El problema de muestreo es ms complejo de lo que
parece; para un estudio ms detallado del tema, el estudiante puede consultar el libro
Elementos de muestreo, de Richard L. Scheaffer y William Mendenhall, de Grupo Editorial
Iberoamrica.
9173061
7392108
4757975
8122135
1321499
0746897
0015542
0195093
7996818
0559605
Al elegir sus tres ltimas cifras se obtienen los nmeros que formarn la muestra:
061, 897, 108, 542, 975, 093, 135, 818, 499 y 605. Despus se procede a seleccionar de la
poblacin a los individuos que les corresponden estos nmeros.
De forma similar que en el caso de las mil personas, primero se asigna un nmero
a cada elemento de la poblacin desde 000 hasta 649 y posteriormente se elige un bloque
de nmeros aleatorios donde las tres primeras cifras sean menores a 649.
24
E stadstica y probabilidad
Los nmeros que sintetizan los aspectos ms relevantes de una distribucin estadstica
pueden obtenerse tanto de una poblacin como de una muestra y por consiguiente deben
clasificarse: los primeros, obtenidos de la poblacin, reciben el nombre de parmetros y los
obtenidos de una muestra se llaman estadsticos o estimadores.
Los parmetros y estadsticos ms comunes de la estadstica descriptiva que se
estudiarn en esta unidad se dividen, a su vez, en dos tipos:
1. Medidas centrales: media, mediana, moda, media geomtrica, media armnica,
media ponderada.
2. Medidas de dispersin: rango, varianza, desviacin estndar, error estndar,
coeficiente de variacin, percentiles, rango intercuartil.
1.5.1 La media
Cuando una persona tiene en sus manos un conjunto de datos para analizarlos,
generalmente calcula, en primera instancia, un promedio de stos. Por ejemplo, dicha
persona tiene las cantidades mensuales que ha ganado en los ltimos seis meses (10 800,
9 700, 11 100, 8 950, 9 750 y 10 500) y desea conocer el valor que representa su salario
promedio. En este caso, obtendr su ingreso promedio al sumar las cantidades y dividir
entre el nmero de meses que trabaj
x=
x1 + x2 + + x n 1 n
= xi
n
n i = 1
25
Ejemplo 3
x1 + x2 + + x N 1 N
= xi
N
N i = 1
10.1
9.8
9.7
10.3
9.9
10.0
9.9
10.2
10.1
9.9
9.9
10.1
10.3
9.8
9.7
9.9
10.0
10.0
9.8
1
[10.1 + 10.1 + 9.8 + 9.7 + 10.3 + 9.9 + 10 + 9.9 + 10.2 + 10.1 + 9.9 +
20
9.9 + 10.1 + 10.3 + 9.8 + 9.7 + 9.9 + 10 + 10 + 9.8] = 9.975
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
Sueldo 2 000 2 200 2 500 2 200 1 800 25 000 2 400 2 300 2 800 2 400
1
[2 000 + 2 200 + 2 500 + 2 200 + 1 800 + 25 000 + 2 400 + 2 300 + 2 800 + 2 400] = 4 560
10
donde el estadstico no refleja la realidad de los datos, puesto que el sueldo de 25 000 es
mucho mayor a los dems e influye considerablemente en el valor promedio.
1.5.2 La mediana
Por lo expuesto al final de la subseccin es necesario presentar otro tipo de medida central en
la que valores muy extremosos, con respecto al resto, no tengan una influencia tan marcada
como en la media. A dicha medida se le conoce, debido a su naturaleza, como mediana.
Definicin 1.10
La mediana de un conjunto de datos es el valor medio de los datos cuando stos se han ordenado
en forma no decreciente en cuanto a su magnitud.
26
E stadstica y probabilidad
Clculo de la mediana
Dado el conjunto de datos muestrales x1, x2,. . ., xn, la mediana muestral o estadstico mediana
del conjunto se representa por x (x tilde) y se obtiene ordenando primero en forma no
decreciente estos n datos, los que se renombrarn segn su posicin por medio de tildes
de la siguiente forma
x1 x 2 x n
Posteriormente se localiza el punto medio de los datos ordenados, con dos casos:
1. Cuando la cantidad de observaciones es impar, el valor medio del
ordenamiento es el dato que se encuentre en la posicin (n + 1)/2.
2. Cuando la cantidad de datos es par, de tal manera que resultan dos datos
medios localizados en las posiciones n/2 y n/2 + 1, la mediana se considera el
promedio de stos.
Finalmente, se puede resumir el clculo de la mediana con las siguientes frmulas
x n + 1 , cuando la cantidad de datos es impar
2
x = x n + x n
+ 1
2
2
, cuando la cantidad de datos es par
2
De forma similar se define el parmetro mediana.
Dado el conjunto de datos poblacionales x1, x2,. . ., xN, la mediana poblacional o
parmetro mediana del conjunto es el parmetro representando por , y se calcula
x N + 1 , cuando la cantidad de datos es impar
2
= x N + x N
+ 1
2
2
, cuando la cantidad de datos es par
2
Ejemplo 5
Dado el conjunto muestral de datos del ejemplo anterior, referente al sueldo promedio,
se calcula su mediana.
La siguiente tabla muestra el conjunto de los diez datos
Dato
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
Sueldo 2 000 2 200 2 500 2 200 1 800 25 000 2 400 2 300 2 800 2 400
x5
x1
x2
x4
x8
x7
x10
x3
x9
x6
1 800 2 000 2 200 2 200 2 300 2 400 2 400 2 500 2 800 25 000
x1
~
x2
~
x3
~
x4
~
x5
~
~x6
x7
~
~x8
x9
~
x10
~
27
x 5 + x 6
2
2 300 + 2 400
2
= 2 350
En la mediana se puede observar que el valor $25 000, el cual sobresala con
respecto a todos los dems, a diferencia de la media, no influye en el resultado de la
mediana. Puesto que si en lugar de $25 000 se elige $5 000 o $100 000, el sueldo medio
de los diez trabajadores seguir siendo $2 350. Por lo cual se dice que la mediana es una
medida central insensible de los datos.
1.5.3 La moda
Para algunos estudios es necesario encontrar el valor central de un conjunto de datos,
en donde la medida de inters est basada en la repeticin de stos; por tanto, ninguna
de las dos medidas analizadas es conveniente en este caso. Debido a su naturaleza, a esta
medida se le da el nombre de moda y se define a continuacin.
Definicin 1.11
La moda de un conjunto de datos es el valor que se presenta en su distribucin con mayor
frecuencia.
10
10
10
10
28
E stadstica y probabilidad
Cundo se considera
a un conjunto de datos amodal?
Cundo se considera
a un conjunto de datos multimodal?
6, 7, 34, 4, 8
6, 3, 8, 9, 3, 8, 6 y 9
6, 7, 9, 4, 8, 6, 6, 8, 9, 6, 8, 6, 9, 3, 9 y 9
En esta serie estn los valores 6 y 9 como los de mayor frecuencia, ambos
se repiten cinco veces. Al conjunto de datos que tiene ms de una moda se le
llama
multimodal; bimodal si son dos modas, y trimodal si son tres, etctera.
MG = n x1 x2 x n
Ejemplo 7
10
10
10
10
MG = 20 5 8 9 9 8 10 9 5 10 5 6 5 10 10 8 9 7 9 5 9 = 7.5446868
Observacin
29
MA =
1
n
1
1
n i = 1 x i
1
11 1
1
+ + +
n x1 x2
xn
n
1 1
1
+ + +
x1 x2
xn
Si se viaja de una ciudad a otra recorriendo los primeros 100 km a 80 kmph, los siguientes
100 km a 100 kmph y finalmente otros 100 km a 120 kmph, se calcula la velocidad media
utilizando la media armnica y se compara con las medias aritmtica y geomtrica.
MA =
1 1
3 80
1
1
100
1
120
= 97.2973
300
= 100
Ahora se compara con la distancia total real recorrida las distancias que recorrera
el automvil con cada una de las velocidades promedio calculadas
30
E stadstica y probabilidad
En un conjunto de datos x , x ,. .
1 2
datos a las cantidades w , w ,. . .,
1
2
a)
b)
La media ponderada del conjunto de datos x1, x 2 ,. . ., xn, con pesos respectivos w1,
w2 ,. . ., wn, se simboliza por MP y se calcula con la siguiente frmula:
n
wi x i
MP =
i = 1
Ejemplo 9
Nota
Ejercicio 1
1. Calcula la media, mediana y moda del siguiente conjunto de datos
145
150
165
155
155
145
150
140
145
150
160
175
150
160
2. Calcula la media y mediana de los tiempos de llegada de seis aviones que aterrizan
en un aeropuerto. Los tiempos (en minutos) son
3.5
4.2
2.9
3.8
4.0
2.8
31
1.6.1 Rango
Es el primer valor que nos muestra cmo estn distribuidos (dispersos) los datos. El rango
de las observaciones est simbolizado por r para la muestra y R para la poblacin.
El rango es una medida de variacin de los datos que lo nico que muestra es el tamao
o longitud del intervalo en el que los datos se encuentran distribuidos y es:
Definicin 1.13
El rango es igual a el valor mayor menos el valor menor de los datos.
32
E stadstica y probabilidad
Por ejemplo, para los datos muestrales de los dos conjuntos de datos anteriores
en el primer conjunto su rango vale r1 = 20 12 = 8, es decir, los datos de este
conjunto estn distribuidos a lo largo de un intervalo de longitud 8
en el segundo conjunto su rango vale, r2 = 50 0 = 50, es decir, los datos de este
conjunto estn distribuidos a lo largo de un intervalo de longitud 50
Los elementos del segundo conjunto tienen una separacin mayor entre ellos, pero
el resultado no muestra el comportamiento de los datos con respecto a su media.
Si se tienen n datos muestrales, x1, x2,. . ., xn con valor medio igual a x , los cuadrados
de las desviaciones de cada uno de los datos con respecto a su valor medio sern ( x1 x )2,
( x2 x )2, etctera.
Al igual que en los valores medios, la varianza puede definirse con respecto a la
muestra o a la poblacin.
Respecto a la muestra
Definicin 1.15
s2 =
1 n
( x i x )2
n i = 1
Sobre la definicin anterior podemos decir que denota la intencin de una medida
variacional de un conjunto de datos, slo que ms adelante (unidades 9 y 10) se ver que
es conveniente definir el estadstico varianza dividiendo entre n 1 en lugar de n. Para
distinguirlas, se les asignan nombres diferentes, los cuales se justificarn hasta la unidad
9, cuando se analice el tema Estimadores puntuales. Mientras tanto se define
s2n =
1 n
( x i x )2
n i = 1
s2n 1 =
33
1 n
( x i x )2
n 1 i = 1
Respecto a la poblacin
De forma similar para poblaciones finitas se define el parmetro varianza poblacional, el
cual est representado por 2.
Dado el conjunto de datos poblacionales x1, x2,. . ., xn, con valor medio , se define
la varianza poblacional
Varianza poblacional
2 =
1 N
( x i )2
N i = 1
La varianza se calcula con los cuadrados de las desviaciones y, por tanto, no est en
las mismas unidades que los datos. Por consiguiente, se introduce una nueva medida de
dispersin de la siguiente forma:
Definicin 1.16
Se llama desviacin estndar de un conjunto de datos a la raz cuadrada positiva de la varianza,
es decir
= 2
Ejemplo 10
s = s2
Se calcula la varianza insesgada y la desviacin estndar de cada uno de los dos conjuntos
de la seccin 1.6:
Primer conjunto: 20, 12, 15, 16, 13 y 14. Anteriormente se encontr que x = 15.
s2n 1 =
=
1 n
( x i x )2 =
n 1 i = 1
1
(20 15)2 + (12 15)2 + (15 15)2 + (16 15)2 + (13 15)2 + (14 15)2
6 1
1
= [25 + 9 + 0 + 1 + 4 + 1] = 8
5
En las unidades 5 y 7 se presenta una definicin ms general, la cual se puede aplicar tanto a poblaciones
finitas como infinitas.
34
E stadstica y probabilidad
1 n
( x i x )2 =
n 1 i = 1
1
( 5 15)2 + ( 0 15)2 + ( 50 15)2 + (117 15)2 + (8 15)2 + (10 15)2
6 1
1
= [100 + 225 + 1225 + 4 + 49 + 25] = 325.6
5
Varianza sesgada
Varianza insesgada
Ejemplo 11
s2n =
1 n 2
xi x 2
n i = 1
s2n 1 =
1 n 2
n 2
xi
x
n 1 i = 1
n 1
Se calcula la varianza insesgada para los conjuntos de datos del ejemplo 10, empleando
las ltimas frmulas para la varianza, y se verifica que coincidan los resultados.
Primer conjunto: 20, 12, 15, 16, 13 y 14.
s2n 1 =
1 n 2
n 2
1 2
6
xi
x =
20 + 122 + 152 + 162 + 132 + 142
(15)2
n 1 i = 1
n 1
6 1
6 1
1
6
= [400 + 144 + 225 + 256 + 169 + 196 ] 225 = 278 270 = 8
5
5
1 n 2
n
1
6
x i n 1 x 2 = 6 1 52 + 02 + 502 + 172 + 82 + 102 6 1 (15)2
n 1 i = 1
1
6
= [25 + 0 + 2500 + 289 + 64 + 100 ] 225 = 595.6 270 = 325.66
5
5
En los clculos anteriores se observa que en ambos casos coinciden los resultados
con los del ejemplo 10.
35
Ejercicio 2
1. Calcula el rango y la varianza insesgada del siguiente conjunto de datos:
145
150
165
155
155
145
150
140
145
150
160
175
150
160
1.01
0.97
0.95
1.0
0.97
0.95
1.01
0.95
0.98
Calcula la varianza.
Qu es un intervalo de frecuencias
y qu condiciones debe cumplir?
Definicin 1.17
Dado un conjunto de datos, se llama intervalos de clase o clases de frecuencia o simplemente
clases a los intervalos que por parejas son ajenos o disjuntos y contienen todos los datos del
conjunto.
Con respecto a los intervalos de clase, no es un requisito que sean de igual longitud, sin
embargo, aqu habr restriccin a clases de igual longitud.
36
E stadstica y probabilidad
Recurdese que un intervalo de la forma [26,33) indica que se consideran todos los
valores que estn entre 26 y 33, incluyendo el 26 y excluyendo el 33.
fi = n
i = 1
Definicin 1.18
Se llama frecuencia relativa de una clase i al cociente de la cantidad de datos que se encuentran
en sta con respecto del total de datos en el conjunto y se simboliza por
fr =
donde
fi
n
Ejemplo 13
37
88
68
30
36
100
86
76
96 100
98
90
30
67
78
98
89
99
78
91
65
100
60
48
69
68
100
85
78
68
89
81
100 100
45
38
78
89
68
88
69
94
80
79
99
40
98
100
67
94
45
58
30
30
89
46
35
58
68
70
83
85
68
56
100
86
69
79
52
45
76
84
78
67
77
69
89
46
98
79
88
96
100
45
38
78
89
68
88
68
100
100
68
69
79
98
94
30
46
30
86
85
89
94
99
100
45
30
35
36
76
78
81
80
40
67
58
89
58
98
90
100 100
68
70
83
85
68
56
30
67
78
98
100
86
69
79
52
45
89
78
65
60
69
76
78
77
89
98
99
91
100
48
68
84
67
69
46
79
Finalmente, se calculan las frecuencias relativas por clase, dividiendo las frecuencias
entre la cantidad total de datos, en este caso 80, y se obtiene
Tabla 1.1
38
E stadstica y probabilidad
Definicin 1.20
Se llama frecuencia relativa acumulada a la funcin que representa la suma de las frecuencias
relativas por clase y se simboliza por F .
r
F( x) =
xi x
fi
i = 1
f1 f2
f
+ + + m = 1 y, por tanto, se tiene
n n
n
Fr =
Fi
n
Debido a que en las frecuencias por clase no es de inters el valor de cada elemento
sino slo la cantidad de estos en la clase, se acostumbra realizar el conteo por medio de
las barras como antiguamente se llevaba a cabo; es decir, se pone una barra vertical por
elemento contado y cada vez que se llega a cuatro barras la quinta se coloca en diagonal.
Por ejemplo, para contar ocho elementos:
39
Con esta forma de conteo se puede construir, a partir de la tabla 1.1, una tabla
similar que contenga las frecuencias acumuladas
Tabla 1.2
x=
fi x i
i = 1 n
donde
2 C
Md = L + l
40
E stadstica y probabilidad
2 C
40 34
6
Md = L + l
= 70 + 10
= 70 + 10 = 70 + 5 = 75
f
12
12
El valor promedio moda (Mo ), que se comparar con los valores numricos de la
media aritmtica x y la mediana Md, se calcula con la frmula:
donde
Con los datos del ejemplo 13, se calcula el valor promedio moda (Mo ).
El intervalo de clase modal es [90, 100] ya que la mayor frecuencia est en F7 = 19 con
L = 90, l = 10, d1 = 19 15 = 4 y d2 = 19 0 = 19.
d1
4
4
Mo = L + l
= 90 + 10
= 90 + 10 = 90 + 10(..1739) = 90 + 1.739
d
+
d
19
+
4
23
1 2
= 91.74 92
s2 =
1
fi ( x i x )2
n i = 1
Definicin 1.23
41
s =
fi ( x i x )2
n 1 i = 1
La desviacin estndar por clases de frecuencia seguir siendo la raz cuadrada positiva
de la varianza correspondiente.
Nota
Ejemplo 16
Se calcula la varianza sesgada de las clases de frecuencia con los datos del ejemplo 13.
Para realizar los clculos ms fcilmente se utilizar l
a tabla 1.2,
tan slo introduciendo algunas columnas:
Tabla 1.3
5 770
= 72.125 72
80
1
( 30 640 ) = 382.984 383
80
42
E stadstica y probabilidad
Ejercicio 3
1. En la siguiente tabla se dan los tiempos de llegada en minutos de 60 aviones a un
aeropuerto.
2.6
3.9
4.5
4.0
3.7
3.2
5.7
4.3
3.8
3.6
4.7
6.1
6.0
5.0
4.5
6.2
3.4
2.9
3.6
4.1
2.5
2.8
3.2
3.1
4.6
5.2
6.1
4.5
4.1
3.8
7.2
3.4
7.9
3.6
3.6
4.8
5.2
6.3
8.2
5.3
3.9
4.6
4.5
5.7
4.8
6.9
6.3
2.6
2.5
6.8
8.0
5.6
3.9
4.6
4.8
5.9
6.2
3.2
4.5
5.0
a) distribuye los datos en cinco clases de frecuencia
b) calcula su media y varianza sesgada por medio de las clases anteriores
2. Una mquina despachadora de refrescos de un centro comercial parece estar
fallando, puesto que el encargado ha recibido varias quejas en la ltima semana; l
decide registrar la cantidad de contenido en 40 vasos despachados por dicha
mquina y dividirlos en tres clases de igual longitud, si 70% o ms de los refrescos
despachados se encuentra en la clase media, el encargado seguir trabajando con la
mquina, en caso contrario la mandar reparar. Los valores (en mililitros) medidos son:
245.6 236.9 240.7 235.9 247.8 246.5 230.8 250.6 248.0 247.4
238.6 240.0 246.9 258.9 245.6 248.5 246.8 245.6 247.8 256.0
243.0 243.3 240.6 250.2 249.6 243.8 246.9 247.8 243.0 246.4
230.5 228.9 235.7 248.9 248.9 245.7 240.8 246.8 246.2 250.0
a) divide los valores en tres clases de frecuencia de igual longitud, calcula sus
frecuencias relativas e indica si el encargado tendr que reparar la mquina o no
b) calcula la cantidad de lquido promedio que despacha la mquina, empleando
las clases de frecuencia del inciso anterior
34.0
28.5
18.0
34.9
25.8
16.9
15.8
19.0
11.5
25.9
38.9
34.0
16.8
27.8
24.6
22.8
16.8
39.0
42.0
48.0
34.8
33.0
23.9
27.5
35.8
36.9
26.7
26.8
26.5
34.7
35.9
25.8
24.8
45.8
18.9
35.8
35.8
46.9
36.8
35.9
52.0
33.6
24.8
25.9
26.8
26.8
29.4
37.8
35.9
10.8
25.8
35.8
26.8
25.7
26.9
27.9
38.5
35.8
30.2
28.6
33.1
34.7
45.9
56.8
45.8
25.8
50.2
42.9
46.8
48.9
47.5
48.2
42.5
40.8
27.9
24.8
46.8
40.7
18.9
22.0
29.5
31.9
48.2
34.8
47.2
27.0
39.8
45.8
40.4
38.2
43
1.8 Grficas
Las grficas a las que se hace referencia en estadstica descriptiva deben mostrar la
distribucin de las frecuencias o frecuencias acumuladas del conjunto de datos, con lo
cual se podr entender e interpretar fcilmente su comportamiento.
Por tanto, es necesario introducir un nuevo mtodo grfico para la interpretacin
de datos, entre los grficos ms comunes estn
diagrama de barras
polgono de frecuencias
diagrama circular o de pastel
44
E stadstica y probabilidad
Se grafican los puntos medios de los intervalos (tercera columna) y se trazan los
rectngulos con sus bases iguales a la longitud de la clase y con las alturas correspondientes a su frecuencia, como se muestra en las siguientes figuras:
Figura 1.1
a) histogramas para las clases
de frecuencia y b) histogramas para
las frecuencias acumuladas.
F(x)
80
19
15
61
12
46
8
7
4
0
34
25
35
45
55
65
75
85
95
105
19
15
8
0
a)
Nota
25
35
45
55
65
75
85
95
105
b)
Para las frecuencias relativas el histograma es el mismo, slo se divide cada frecuencia
entre el total de datos.
45
Histogramas simtricos
Presentan la distribucin en forma de campana, es decir, la mitad izquierda es una imagen
reflejada de la mitad derecha. Como muestra la figura 1.2a, se cumple x = Md = Mo.
Histogramas sesgados
En una distribucin de datos
qu significa sesgo? Qu forma tienen
los histogramas sesgados?
Presentan una distribucin en la que alguna de las colas est ms alargada en comparacin
con la otra. Se llaman sesgados a la derecha o positivamente sesgados si la cola derecha es la
que est ms alargada. Como lo muestra la figura 1.2b, se cumple Mo < Md < x. Se les
llama sesgados a la izquierda o negativamente cuando la cola izquierda es la ms alargada.
Como lo muestra la figura 1.2c, se cumple x < Md < Mo.
Histogramas multimodales
Tienen en su distribucin ms de un pico (ver figura 1.2d). En caso de dos picos bimodal,
en caso de tres, trimodal etctera.
Figura 1.2
Histogramas para las clases de frecuencia
a) simtrico; b) sesgado a la derecha;
c) sesgado a la izquierda,
y d) multimodal (bimodal).
Ejemplo 18
a)
b)
c)
d)
Retomando los datos del ejemplo 13 y comparando los valores promedio calculados x =
72, Md = 75, Mo = 92, el modelo asociado con las 80 calificaciones de fsica experimental
es sesgado a la izquierda.
46
E stadstica y probabilidad
Se construye un polgono de frecuencias para las clases del ejemplo 13. Por medio de la
tabla 1.4, si se grafican los puntos obtenidos de la tercera y la cuarta columnas:
f
Figura 1.3
Polgono de frecuencias.
19
15
12
8
7
4
0
35
45
55
65
75
85
95
47
Definicin 1.26
A los polgonos de frecuencia que se elaboran con las frecuencias acumuladas o las frecuencias
relativas acumuladas se les llama ojivas.
Ejemplo 20
Figura 1.4
Ojiva de frecuencias relativas acumuladas.
Se construye la ojiva para las frecuencias relativas acumuladas del ejemplo 13.
1
0.7625
0.5750
0.4250
0.2375
0.1875
0.10
0
Definicin 1.28
Un diagrama circular es un grfico que divide en sectores un crculo, los cuales representan las
frecuencias relativas del conjunto de datos. Por su forma tambin se le suele llamar diagrama de pastel.
48
E stadstica y probabilidad
Como son 50 datos y se van a distribuir en siete clases, primero se calcula el rango
del conjunto r = 186.4 158.4 = 28
Se quieren obtener siete clases, por tanto, se divide el rango 28 entre siete y el resultado
es cuatro. Este valor ser la longitud de cada una de las clases de frecuencia. Es decir
[158.4,162.4), [162.4,166.4), [166.4,170.4), [170.4,174.4),
[174.4,178.4), [178.4,182.4), [182.4,186.4)
Figura 1.5
a) diagrama circular o de pastel
del ejemplo 21 en su forma plana;
b) representacin tridimensional.
Clase
Intervalo
[158.4, 162.4)
0.04
[162.4, 166.4)
0.10
[166.4, 170.4)
0.16
[170.4, 174.4)
12
0.24
[174.4, 178.4)
12
0.24
[178.4, 182.4)
0.18
[182.4, 186.4]
0.04
12
24%
12
24%
8
16%
5
10%
Conteo
9
18%
Frecuencia Frecuencia
fi
relativa
24%
16%
10%
24%
4% 4%
18%
2 2
4% 4%
a)
b)