Escolar Documentos
Profissional Documentos
Cultura Documentos
_________________________________________________________________________
Pamplona
Facultad de Estudios a Distancia
ESTADISTICA
BASICA
Rector
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
ESTADISTICA I
_________________________________________________________________________
Tabla de Contenido
Presentacin
Introduccin
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
ESTADISTICA I
_________________________________________________________________________
UNIDAD 3: Medidas de Dispersin
Ncleos Temticos y Problemticos
Proceso de Informacin
3.1 DESVIACIN ESTNDAR O TPICA
3.2 VARIANZA
3.3 COEFICIENTE DE VARIACIN
Proceso de Comprensin y Anlisis
ANEXO: Tablas
BIBLIOGRAFA GENERAL
_________________________________________________________________________
UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
ESTADISTICA BASICA
Presentacin
La educacin superior se ha convertido hoy da en prioridad para el gobierno
Nacional y para las universidades pblicas, brindando oportunidades de superacin
y desarrollo personal y social, sin que la poblacin tenga que abandonar su regin
para merecer de este servicio educativo; prueba de ello es el espritu de las
actuales polticas educativas que se refleja en el proyecto de decreto Estndares
de Calidad en Programas Acadmicos de Educacin Superior a Distancia de la
Presidencia de la Repblica, el cual define: Que la Educacin Superior a
Distancia es aquella que se caracteriza por disear ambientes de aprendizaje en
los cuales se hace uso de mediaciones pedaggicas que permiten crear una
ruptura espacio temporal en las relaciones inmediatas entre la institucin de
Educacin Superior y el estudiante, el profesor y el estudiante, y los estudiantes
entre s.
Introduccin
La importancia que tiene la matemtica en el desarrollo de los procesos
intelectuales del hombre es notoria a travs de su historia. Fue as como en la
antigedad el pensamiento matemtico contribuy a resolver problemas en tareas
econmicas y constructoras de diferentes pueblos, dio la base para revelar tos
misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad
de los fenmenos que lo suceden. Contrariamente a los griegos, los hombres de la
edad media utilizaron el contenido matemtico como una simple rutina para
disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la
matemtica en la edad moderna ayud a buscar explicaciones concretas de
problemas que se daban en ingeniera, construccin y otras actividades prcticas
del hombre.
Por tal motivo, gracias al medio, las personas estn rodeadas constantemente por
un conjunto de experiencias, que manejan y manipulan de una manera
sorprendente. Es decir, en cierta forma se est efectuando una serie de
operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante
unas representaciones significativas para l y as se obtiene una serie de
conclusiones razonables.
An cuando los tipos de problemas a los cuales puede aplicarse la Estadstica como
herramienta fundamental para el anlisis e interpretacin de resultados son
bastante heterogneos, en muchos casos los pasos de una investigacin
estadstica son los siguientes:
Primera etapa: formulacin del problema. Para investigar con xito un problema
dado, primero se tienen que crear conceptos precisos, formular preguntas claras e
No existe una frmula mgica ni nica en estadstica que tome en cuenta todas las
situaciones prcticas concebibles. Por lo cual es necesario adquirir conocimientos
generales de los mtodos ms importantes para hacer inferencias. En cada caso
prctico debe situarse con cuidado la naturaleza del problema especfico, para
estar seguros de que ser escogido el mtodo ms apropiado.
Con el apoyo del computador los clculos matemticos se hacen ms fciles, por lo
tanto se recomienda utilizar e integrar un software apropiado para tal fin. En la
actualidad existen varios paquetes estadsticos sencillos de manejar, tales como el
Statgraphics, Sas, Minitab, Spss.
Proceso de Informacin
1.1 DEFINICIN
Kendall y Stuart la estadstica es la rama del mtodo cientfico que traa de los
datos reunidos al contar o medir las propiedades de alguna poblacin.
Fraser la estadstica trata con mtodos para obtener conclusiones a partir de los
resultados de los experimentos o procesos."
1.1.1 Importancia
Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de
la vida:
1.1.2 Poblacin
Ejemplo
1.1.3 Muestra
Las muestras pueden ser de dos tipos: probabilstica o al azar, cuando cada uno de
los elementos tiene la misma probabilidad de ser escogido y no probalstica cuando
se seleccionan los datos con determinado criterio o conveniencia del investigador;
en estos casos, algunas unidades tienen mayor posibilidad que otras de ser
seleccionadas, por tal razn no se puede determina la validez, ni la confianza que
merecen dichos resultados.
Azar Simple
Este mtodo de seleccin permite que todos los elementos que constituyen la
poblacin tengan la misma posibilidad de ser incluidos en la muestra. Este mtodo
es de gran importancia cuando la poblacin no es grande o siendo grande, este se
concentra en un rea pequea. Tambin cuando las caractersticas que se
investiga presentan poca variabilidad o cuando la poblacin facilita su enumeracin
para su seleccin.
Ejemplo: en la fbrica T&T hay mil personas trabajando, 600 de las cuales son
obreros, 250 son tcnicos y 150 son profesionales Si se quiere seleccionar una
muestra aleatoria simple de 200 personas, en este caso, la probabilidad de
seleccin de cada persona es:
n 200
P= = = 0.2
N 1000
Lo cual indica que el 20% de los obreros corresponden a 120 de los tcnicos 50 y
30 profesionales.
Por Estratos
Por Conglomerado
Sistematizada
Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene
2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500 = 4.
Dato
Variables
rojo, anaranjado, amarillo, verde, azul, violeta y rosado. Puede ser posible
sustituir tales variables por entidades numricas de la siguiente manera:
denotando el rojo como 1, el anaranjado como 2 etc.
Ordinal: le asigna valores numricos a los sujetos, de tal forma que los valores
ms altos se le asignan a los individuos que tienen ms de la caracterstica que
se mide. Esto hace que necesariamente satisfaga la caracterstica de
diferenciacin pero en adicin introduce la posibilidad de ordenamiento.
Variable Continua: es la variable que puede tomar cualquier valor entre dos
valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm,
1.80.
40 17 26 10 26 21 18 27 16 38
22 33 24 20 28 14 30 25 29 37
28 28 33 22 25 29 29 29 21 32
19 35 23 28 22 15 34 13 16 26
24 20 31 29 18 19 11 23 20 24
28 11 34 39 10 25 17 21 34 18
1.2.2 Intervalos
1.2.3 Amplitud
A = R / m; donde A = amplitud
A = 30 / 6 = 5 miles de pesos
Otra manera de formar los intervalos de clase es tomar un dato como medida de
referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor
de la amplitud:
NMERO DE
INTERVALOS
INTERVALOS
1 5 - 10
2 10 - 15
3 15 - 20
4 20 - 25
5 25 - 30
6 30 - 35
7 35 - 40
abierto a izquierda y cerrado a derecha. Esto quiere decir, por ejemplo: que para
hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 -
25, van a estar los valores 21, 22, 23, 24 y 25. De igual manera los valores que
van a estar entre 25 - 30 son 26, 27, 28, 29 y 30.
Nmero de
Intervalos F
Establecimientos
5 - 10 / 2
10 - 15 ///// 5
15 - 20 //////////// 12
20 - 25 ///////////// 14
25 - 30 ////////////// 15
30 - 35 //////// 8
35 - 40 //// 4
TOTAL 60
Intervalos X
5 - 10 7,5
10 - 15 12,5
15 - 20 17,5
20 - 25 22,5
25 - 30 27,5
30 - 35 32,5
35 - 40 37,5
5+10 = 7,5
X=
2
Miles de pesos; esto quiere decir que el promedio del primer intervalo es de
$7500.
Intervalo Fr
5 10 0.0333
10 - 15 0.0833
15 - 20 0.2
20 - 25 0.2333
25 - 30 0.25
30 - 35 0.1333
35 - 40 0.0667
Fa
Intervalos F
5 - 10 2 2 60
10 - 15 5 7 58
15 - 20 12 19 53
20 - 25 14 33 41
25 - 30 15 48 27
30 - 35 8 56 12
35 - 40 4 60 4
Fra
Intervalo Fr
5 10 0.0333 0.0333 1
10 - 15 0.0833 0.1167 0.9666
15 - 20 0.2 0.3167 0.8833
20 - 25 0.2333 0.55 0.6833
25 - 30 0.25 0.8 0.45
30 - 35 0.1333 0.9333 0.2
35 - 40 0.0667 1 0.0667
Fa Fra
Intervalo F Fr
5 - 10 2 0,0333 2 60 0,0333 1
10 - 15 5 0,0833 7 58 0,1167 0,9666
15 - 20 12 0,2 19 53 0,3167 0,8833
20 - 25 14 0,2333 33 41 0,55 0,6833
25 - 30 15 0,25 48 27 0,8 0,45
30 - 35 8 0,1333 56 12 0,9333 0,2
35 - 40 4 0,0667 60 4 1 0,0667
Total 60 1,00
Realizar un inventario
Determinar la demanda de un producto
La posibilidad que llueva en una ciudad determinada
El porcentaje de desempleo en una ciudad especfica
68 93 71 78 82 79 83 57 88 77
84 60 59 66 75 60 71 73 78 85
75 73 85 72 94 95 79 80 62 75
82 88 75 63 77 75 62 65 76 76
68 79 61 78 69 61 67 75 53 63
90 73 65 95 74 89 97 71 74 72
62 93 75 62 68 78 78 65 86 81
88 76 87 74 60 96 85 76 67 73
Hallar:
La calificacin ms alta
La calificacin ms baja
El rango
Las cinco notas ms altas
Las cinco notas ms bajas
La dcima nota de mayor a menor
La tabla de frecuencias utilizando 7 intervalos
Comprobar que la amplitud de los intervalos es de 6.29
El nmero de estudiantes de 79 o ms
El nmero de estudiantes con calificaciones por debajo de 71
El porcentaje de estudiantes con calificaciones mayores de 65 pero no
superiores a 85.
Cul es el significado del 91.25%?
Cul es el significado del 33.75%?
Responder:
69 72 62 74 78 73 79 70 73 68
82 84 63 69 88 81 99 77 82 74
75 73 86 71 73 67 76 70 67 76
66 80 72 67 71 75 78 72 64 72
La siguiente tabla muestra una distribucin de frecuencia de los salarios
semanales de 65 empleados de la empresa P & R.
Los dimetros internos de los tubos fabricados por una empresa se miden con
precisin de milsima de pulgada. Si las marcas de clase de una distribucin
de frecuencias de esos dimetros vienen dadas por 0.321, 0.324, 0.327, 0.33,
0.333 y 0.336. Hallar la anchura del intervalo de clase y los lmites de clase.
Proceso de Informacin
Las medidas de centralizacin son valores que tienden a situarse en el centro del
conjunto de datos ordenados segn su magnitud. Las medidas de centralizacin
ms usadas son: Media aritmtica, mediana y moda.
X1 + X2 + X3 + Xn xi
X= = i=1
n
n
Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces,
respectivamente, es decir, que sus frecuencias respectivas son f 1, f2, f3,....fn, la
media aritmtica se puede calcular del modo siguiente:
n
En ocasiones, a cada uno de los nmeros x1, x2, x3,....xn, se les asigna un peso
determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media
aritmtica ponderada del modo siguiente:
n
Ejemplo
Hallar la media aritmtica de los siguientes datos que representan las edades
de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.
3*6+4*4+2*3+1*7 47
x= = 4,7
3+4+2+1 10
El promedio de edad de los 10 nios es de 4 aos, 7meses de 5aos.
111
X= = 5,55
20
2.1.2 Mediana
Ejemplo
304+332
Md = = 318
2
El puntaje de las pruebas que se encuentra en la mitad es de 318.
2.1.3 Moda
Ejemplo
Deporte N de Alumnos
Basket 10
Ftbol 18
Voleibol 5
Otros 4
Lo cual indica que los colores que pueden estar de moda son el gris, caf y
vinotinto.
Ejemplo
Intervalos F X X*F
5 - 10 2 7.5 15
10 - 15 5 12.5 62.5
15 - 20 12 17.5 210
20 - 25 14 22.5 315
25 - 30 15 27.5 412.5
30 - 35 8 32.5 260
35 - 40 4 37.5 150
40 - 0 0
Total 60 1425
1425
X= = 23,7 = 24
60
Las ventas promedio de los sesenta establecimientos son de $24000.
Intervalos F X X*F
10 - 19.6 10 14.8 148
19.6 - 29.2 3 24.4 73.2
29.2 - 38.8 7 34 238
38.8 - 48.4 7 43.6 305.2
48.4 - 58 5 53.2 266
58 - 67.6 8 62.8 502.4
Total 40 1532.8
1532.8
X= = 38.3 = 38
40
El puntaje promedio de los 40 alumnos es de 38.
2.2.2 Mediana
Para hallarla cuando los datos estn agrupados se siguen los siguientes pasos:
Ejemplo
Intervalos F
10 - 19.6 10
19.6 - 29.2 3
29.2 - 38.8 7
38.8 - 48.4 7
48.4 - 58 5
58 67.6 8
Total 40
2.2.3 Moda
Intervalos F
5 - 10 2
10 - 15 5
15 - 20 12
20 - 25 14
25 - 30 15
30 - 35 8
35 - 40 4
Total 60
Intervalo F
10-19.6 10
19.6-29.2 3
29.2-38.8 7
38.8-48.4 7
48.4-58 5
58-67.6 8
Total 40
Salarios F
540 - 607 6
607 - 674 19
674 - 741 36
741 - 808 24
808 - 875 26
875 - 942 19
942 - 1009 10
1009 - 1076 4
Total 144
De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y los
restantes sietes. Hallar la media aritmtica, la media y la moda.
Altura (m) F
1.60 - 1.63 5
1.63 - 1.66 18
1.66 - 1.69 42
1.69 - 1.72 27
1.72 - 1.75 8
Total 100
PESO (Lb) F
118 - 126 3
126 134 5
134 142 9
142 150 12
150 - 158 5
158 - 166 4
166 - 174 2
Total 40
Los tipos de reaccin de un individuo ante diversos estmulos, medidos por un
psiclogo, fueron: 0.53, 0.46, 0.5, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos
respectivamente. Determinar su tiempo medio de reaccin.
La siguiente tabla muestra la distribucin de cargas mximas en toneladas
cortas que soportan los cables producidos en cierta fbrica. Determinar la
carga mxima media, la carga mxima que se repite y la carga que ms se
repite.
Carga Mxima F
(Toneladas Cortas)
9.3 - 9.7 2
9.7 - 10.1 5
10.1 - 10.5 12
10.5 - 10.9 17
10.9 - 11.3 14
11.3 - 11.7 6
11.7 - 12.1 4
Total 60
Hallar la media, mediana y moda tanto para hombres como para mujeres,
estableciendo las respectivas conclusiones.
Proceso de Informacin
Las medidas de dispersin o variacin dan idea de la separacin de los datos
numricos alrededor de una medida de centralizacin. Las medidas de dispersin
ms utilizadas son:
Indica que tan dispersos estn los datos con respecto a la media aritmtica. Si los
datos no estn agrupados, la desviacin estndar de una serie de nmeros n. X 1,
x2, x3,.....xn est determinada por:
Ejemplo
X= 5.6
Intervalos F X (X-
x)2 F
5 10 2 7.5 544.5
10 - 15 5 12.5 661.25
15 - 20 12 17.5 507
20 - 25 14 22.5 31.5
25 - 30 15 27.5 183.75
30 - 35 8 32.5 578
35 - 40 4 37.5 729
Total 60 3235
3.2 VARIANZA
X = 4.7
18.1
S = = 1.81
2
10
Intervalos F X (X-
x) F
2
5 10 2 7.5 544.5
10 15 5 12.5 661.25
15 20 12 17.5 507
20 25 14 22.5 31.5
25 30 15 27.5 183.75
30 - 35 8 32.5 578
35 - 40 4 37.5 729
Total 60 3235
3235
S = = 53.9
2
60
S
La frmula que se utiliza es: cv = * 100
X
Ejemplo
X = 5.6 S = 1.34
Cv = 23.9%
X = 24 S = 7.3
7.3
Cv = *100
24
Cv = 30.42%. De aqu se puede decir que las ventas de los sesenta
establecimientos son homogneas.
Si el trabajador A produce por hora 40 tornillos en promedio, con desviacin de
5 tornillos y el trabajador B produce 180 tornillos en promedio con desviacin
de 15, cul de los trabajadores presenta menor variabilidad?
5
CVA = *100 = 12.5% para el operador A
40
15
CVB = *100 = 9.4% Para el operador B
180
Altura (m) F
1.60 1.63 5
1.63 1.66 18
1.66 1.69 42
1.69 1.72 27
1.72 1.75 8
Total 100
F X
4 70
9 74
16 78
28 82
45 86
66 90
85 94
72 98
54 102
38 106
27 110
18 114
11 118
5 122
2 126
Carga Mxima
F
(Toneladas Cortas)
9.3 - 9.7 2
9.7 10.1 5
10.1 - 10.5 12
10.5 - 10.9 17
Carga Mxima
F
(Toneladas Cortas)
10.9 - 11.3 14
11.3 - 11.7 6
11.7 - 12.1 4
Total 60
UNIDAD 4: Medidas de Ubicacin
Proceso de Informacin
4.1 CUARTILES, PERCENTILES, DECILES
Si un conjunto de datos est ordenado por magnitud, el valor central que divide al
conjunto en dos mitades iguales, es la mediana.
Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales, (cuartiles) esos valores denotados Q 1 Q2 y Q3, llamados
primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana.
Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman
deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana.
Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles,
denotados por P1 P2,.....P99. El P50 coincide con la mediana.
Si los datos no estn agrupados, se deben ordenar en forma ascendente o
Ejemplo
Al primer cuartil
Al tercer decil
Al percentil 80
12 8 5 10 11 4 6 3
3 4 5 6 8 10 11 12
n*p 8*1
Q1 = = = 2
q 4
n*p 8*3
D3 = = = 2.4 2
q 10
n*p 8 * 80
P80 = = = 6.4 6
q 100
El dato que est en el percentil 80 es 10, ya que este valor est en la sexta
posicin.
Ejemplo
Intervalos F n = 60
5 - 10 2 p=1
10 - 15 5 q=4
15 - 20 12 n*p = 60*1 = 15
20 - 25 14 q 4
25 - 30 15 Li= 15
30 - 35 8 Fa = 7
35 - 40 4 F (n*p)/q = 12
A=5
Total 60
Intervalo n = 60 F
5 - 10 p = 2 2
10 - 15 q = 4 5
15 - 20 n*p 12 = 60*2 = 30
20 - 25 q 14 4
25 - 30 Li= 20 15
30 - 35 Fa =819
F (n*p)/q = 14
A=5
35 - 40 4
Total 60
Intervalosn = 60F
5 - 10 p = 3 2
10 - 15 q = 4 5
15 - 20 n*p =1260*3 = 45
20 - 25 q 14 4
25 - 30 Li= 2515
30 - 35 Fa = 833
35 - 40 F (n*p)/q 4
= 15
Total A = 560
Intervalosn = 60F
5 - 10 p = 1 2
10 - 15 q = 105
15 - 20 n*p =1260*1 = 6
20 - 25 q 14 10
25 - 30 Li= 1015
30 - 35 Fa = 82
35 - 40 F (n*p)/q 4
=5
Total A = 560
Intervalos n=F 60
5 - 10 p=6 2
10 - 15 q = 105
15 - 20 n*p12= 60*6 = 36
20 - 25 q 14 10
25 - 30 Li= 15
25
30 - 35 Fa = 8 33
35 - 40 4 = 15
F (n*p)/q
Total A =60 5
Intervalo F n = 60
5 - 10 2 p = 12
10 - 15 5 q = 100
15 - 20 12 n*p = 60*12 = 7.2 = 7
q 100
20 - 25 14
Li= 10
25 - 30 15
Fa = 2
30 - 35 8
F (n*p)/q = 5
A=5
35 - 40 4
Total 60
60*12
-2
P12= 10+ 100 5 = 15.2 15
5
Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o
menos.
Intervalos n =F60
5 - 10 p =250
10 - 15 q =5100
15 - 20 n*p12= 60*50 = 30
20 - 25 14q 100
25 - 30 Li=1520
30 - 35 Fa8= 19
35 - 40 4 = 14
F (n*p)/q
Total A= 605
60*50
-19
P50= 20+ 100 5 = 23.9 24
14
El 50% de las ventas de los sesenta establecimientos es de $24000 o menos.
Intervalo n =F 60
5 - 10 p =2 80
10 - 15 q =5 100
15 - 20 n*p12 = 60*80 = 48
20 - 25 q14 100
25 - 30 Li=1525
30 - 35 Fa8= 33
35 - 40 F (n*p)/q
4 = 15
Total A= 605
Ordenar los datos de la muestra y obtener el valor mnimo, el mximo y los tres
cuartiles Q1, Q2, Q3, localizndolos en una recta numrica utilizando una escala
adecuada.
Dibujar un rectngulo cuyos extremos son Q1 y Q3.
Calcular unos limites admisibles superior e inferior que van a servir para
identificar los valores atpicos. Estos lmites se calculan con :
Q3 Q 1
Li = Q1-1.5
2
Considerar como valores atpicos los situados
Q3 fuera
Q1 del intervalo (li, Ls).
Li =desde
Dibujar una lnea que vaya Q3 +1.5
cada extremo del rectngulo central hasta el
valor ms alejado no atpico, es decir, que est
2 dentro del intervalo (l i, ls).
Identificar todos los datos que estn fuera del intervalo (l i, ls) marcndolos
como atpicos.
Ejemplo: Los siguientes datos muestran el nmero de das con aire contaminado
en 2001 y 2002 en varias ciudades colombianas:
2001 2002
A 248 221
B 208 171
C 113 131
D 128 89
E 106
F 118 101
G 60 33
H 79 63
I 55 56
2001 2002
J 47 54
K 88 55
L 47 69
M 58 59
N 82 48
O 33 16
Para 2001
15*2
Q2 = = 7.5 8 El 50% de ciudades tienen 82 das o menos de
4 contaminacin
15*3
Q3 = = 11.25 11 El 75% de ciudades tienen 113 das o
4 menos de contaminacin.
113 55
Li = 55 1,5 = 11,5
2
113 - 55
= 156,5
Ls = 113 + 1,5
2
Como todos los valores son superiores al lmite inferior, la lnea inferior del
diagrama de caja deber llegar hasta el valor mnimo y no hay atpicos en esta
direccin.
2001
Este diagrama de caja, muestra que la mayor parte de las observaciones son
menores que 113 y que el extremo superior de 248 est muy alejado del grupo
principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud
del diagrama completo (248 - 33 = 215).
Para 2002
14*1
El 25% de ciudades tienen 55
Q1= = 3.75 4
das o menos de contaminacin.
4
14*2
Q2= = 7 El 25% de ciudades tienen 59 das
o menos de contaminacin.
4
14*3
Q3= = 10.5 11 El 25% de ciudades tienen 101
das o menos de contaminacin.
4
101 - 55
Li = 55 1,5 = 20.5
2
101 - 55
Ls = 101 + 1,5 = 135.5
2002 2
Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de
datos.
2001
2002
Altura (m) F
1.60 - 1.63 5
1.63 - 1.66 18
1.66 - 1.69 42
1.69 - 1.72 27
1.72 - 1.75 8
Total 100
Salario F
540 - 607 6
607 - 674 19
674 - 741 36
741 - 808 24
808 - 875 26
875 942 19
942 - 1009 10
1009 - 1076 4
Total 144
Peso (Lb) F
118 - 126 3
5
126 - 134
134 - 142 9
142 - 150 12
150 - 158 5
158 - 166 4
166 174 2
Total 40
Las siguientes son diez medidas del dimetro de un cilindro: 3.88, 4.09, 3.92,
3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros. Hallar:
Proceso de Informacin
Una grfica estadstica es aquella en la cual se presentan los datos estadsticos en
trminos de magnitudes, para interpretarlos en forma visual.
Existen varios tipos de grficas para representar los datos estadsticos y al mismo
tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias.
5.1 HISTOGRAMA
Intervalo F
5 - 10 2
10 - 15 5
15 - 20 12
20 - 25 14
25 - 30 15
30 - 35 8
35 - 40 4
40 - 0
Total 60
Las ventas ms frecuentes de los sesenta establecimientos estn entre $25000 y
$30000; $20000 y $25000. Y la menos frecuente est en $10000.
Es una curva que se traza a partir de los puntos medios de cada clase de amplitud;
estos se unen por medio de una lnea recta, la cual se disea con base en los
datos del histograma.
5.3 OJIVAS
5.4 BARRAS
Aos Ventas
1987 6
1988 9
1989 15
1990 30
1991 50
1992 80
1993 110
1994 150
1995 130
1996 100
Segmentada
Agrupada
Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las diferencias en
las proporciones o porcentajes. Es efectiva para permitir las comparaciones
cuando los segmentos son relativamente grandes. El proceso para realizar el
diagrama consiste en una regla de tres para:
Conocer el ngulo de cada sector, entonces se debe relacionar los 360 que tiene
una circunferencia con el tamao de la muestra y con cada una de sus frecuencias
absolutas.
360 n
x Fi
As por ejemplo:
360 60
x 2 Donde 60 es la muestra de las ventas de los
establecimientos; 2 es la frecuencia absoluta
360*2 del primer intervalo.
x = = 12
60
360 60
x 5
360*35
x = = 18
60
Donde 60 es la muestra de las ventas de los establecimientos; 5 es la frecuencia
absoluta del segundo intervalo.
Y para conocer el porcentaje que corresponde a cada parte, relacionando 100%
con el tamao de la muestra con la frecuencia absoluta. 100 n
y Fi
Tallo y Hojas
Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos:
Ya que la mayor parte de las observaciones tienen el cero como primer dgito, se
puede alargar el tallo a dos categoras de O y dos de 1; en la que los segundos
dgitos del O al 4 quedarn en el rengln superior y los dgitos del 5 al 9 en el
inferior. Como es fcil de ordenar las observaciones en cualquier rengln, tambin
se puede presentar la grfica ordenada de tallo y hojas.
O 1,2,2,3,3,4,4,4,4
O 7,8
1 0,4
1 7,7
Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las
15 observaciones son de 4 o menos.
40 17 26 10 26 21 18 27 16 38
22 33 24 20 28 14 30 25 29 37
28 28 33 22 25 29 29 29 21 32
19 35 23 28 22 15 34 13 16 26
24 20 31 29 18 19 11 23 20 24
28 11 34 39 10 25 17 21 34 18
Presentacin de los Datos en Forma de Tallo y Hojas
10,0,1,1,3,4
15,6,6,7,7,8,8,8,9,9
20,0,0,1,1,1,,2,2,2,3,3,4,4,4
25,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,9
30,1,2,3,3,4,4,4
38,9
4O
4
Ciudad 2001
A 248
B 208
C 113
D 128
E 106
F 118
G 60
H 79
I 55
J 47
K 88
L 47
M 58
N 82
O 33
Para construir una grfica de tallo y hojas con los datos del 2001, los dgitos de las
centenas y decenas formarn el tallo y las unidades sern las hojas.
03 3 09 15
04 7.7 10 6 16
05 5.8 11 3.8 17
06 0 12 8 18
07 9 13 19
08 28 14 20 8
21 23
22 24 8
Como esta grfica es muy dispersa: hay que hacer que el tallo contenga las
centenas y las hojas los dems dgitos
0 33,47,47
0 55,58,60,79,82,88
1 06,13,18,28
1
2 08,48
2
POBLACIN
AO
(Millones)
1882 31.4
1892 39.8
1902 50.2
1912 62.9
1922 76
1932 92
1942 105.7
1952 122.8
1962 131.7
1972 151.1
1982 179.3
1992 203.3
2002 226.5
HOMBRES MUJERES
ESTADO CIVIL (% total) (% total)
Soltero 25.1 18.4
Casado 66.7 61.3
Viudo 2.4 12.4
Divorciado 5.8 7.9
19 24 26 31 18 17 22 21
24 19 18 19 21 32 31 26
28 27 22 17 19 21 22 24
30 19 26 27 28 21 24 26