Escolar Documentos
Profissional Documentos
Cultura Documentos
i1
18
46.6%
variable)
2. Mediana.
- Ordenamos los datos de menor a mayor
40 40 40 45 45 45 45 45 48 48 48 48 48 50 50 50 50 55
- Cmo el nmero de datos es par, entonces el valor de la mediana estar dado
por la semisuma de los datos centrales.
Luego. Me = 48%
3. Moda.
Existen varias modas, porque varios de los datos diferentes se repiten, por lo
tanto no tiene sentido considerar este indicador.
Indicadores de dispersin.
1. Longitud de recorrido.
LoR = 55 - 40 = 15%
2. Desviacin Media.
18
DeM
x
i 1
18
xi
xi
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
50
55
6.6
6.6
6.6
1.6
1.6
1.6
1.6
1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
3.4
8.4
56.8
3.15 %
Pgina 30
10 datos
Interpretacin.
Observando la columna de las desviaciones, xi , tenemos que 10 datos se alejan de la
media en menos de 3.15 o lo que es equivalente a que el 55% de los datos se aleja de
la media en menos de 3.15 lo que podramos interpretar como que los datos no estn
muy dispersos.
3. Varianza.
X
2
i1
(a)
X2
i1
2 X xi
i 1
X2
N X
N
(b)
Por lo tanto, el valor de la varianza puede ser obtenido a partir de las frmulas (a) o
(b).
Para el ejemplo utilizaremos las dos frmulas.
Clculos segn (a)
Clculos segn (b)
xi
( xi )
( xi ) 2
xi
xi2
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
-6.6
-6.6
-6.6
-1.6
-1.6
-1.6
-1.6
-1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
43.56
43.56
43.56
2.56
2.56
2.56
2.56
2.56
1.96
1.96
1.96
1.96
1.96
11.56
11.56
11.56
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
1600
1600
1600
2025
2025
2025
2025
2025
2304
2304
2304
2304
2304
2500
2500
2500
Pgina 31
50
55
840
3.4
8.4
11.56
70.56
270.08
50
55
840
X2
2500
3025
39470
270.08
15.004 % 2
18
X2
39470
(46.6) 2 21.217 % 2
18
X 3.874 %
X 4.6 %
15%<CoV<25%
25%<CoV
Tendencia Central
Me
Mo
LoR
Dispersin
DeM
2
CoV
Pgina 32
46.6%
48%
15%
3.15 %
21.21%
4.61%.
0.099
Interpretacin.
El CoV = 0.099 nos dice que la dispersin de los datos es baja, ahora observamos los
indicadores de tendencia central, como no existe mucha diferencia entre el valor de la
media y el valor de la mediana, se elige la media aritmtica como indicador de
tendencia central, luego concluimos que la mayora de los datos estn en torno a la
meda, es decir, en la mayora de los cursos el avance del Silabo est en torno al 46.6 %
a mitad del periodo acadmico, es decir hay un ligero atraso.
Calculo de los diferentes indicadores de Tendencia Central y Dispersin, cuando se
tiene ms de 30 datos.
Ejemplo
La profesora del curso de estadstica I, grupo 4 Sem. 2003 I, de la EAP de
Estadstica, FCM, generalmente, al finalizar el semestre obtiene el porcentaje de
asistencia de cada uno de sus alumnos, para posteriormente ver si hubo o no relacin
con la nota que obtuvieron. Los datos se dan a continuacin:
0.4
8
0.1
0.6
1
0.3
5
0.7
1
0.1
0.4
2
0.7
4
0.3
2
0
0.7
4
0.6
1
0.2
6
0.4
5
0.7
1
0.1
3
0.3
9
0.5
5
0.0
6
0.8
1
0.6
5
0.1
6
0.6
8
0.6
5
0.8
4
0.0
6
0.7
7
0.5
5
0.1
9
0.7
4
0.7
4
0.2
3
0.6
1
0.2
6
0.7
1
0.5
5
Cmo estos datos, son datos poblacionales y N > 30, entonces las frmulas a utilizar
para hallar los indicadores son los siguientes:
1. Clculo de la media aritmtica, la varianza y la desviacin estndar y el
coeficiente de variacin.
UE: El alumno del curso de Estadstica I del grupo 4 del Perodo Acadmico 2003-I, de
la EAPE de la FCM.
Conjunto de individuos: todos los alumnos del grupo 4, constituyen la poblacin de
individuos.
Variable: Porcentaje de asistencia a clases (X).
Tipo de variable cuantitativa continua.
Conjunto de datos, constituyen los datos poblacionales.
Previo al clculo de los indicadores de tendencia central y dispersin, se construye la
tabla de frecuencias y el polgono de frecuencias, dado qu, el observar el
comportamiento de la variable ayuda a visualizar la tendencia central
Xi
fi
6
4
'
X i 1 X 'i
Pgina 33
0.32
0.45
0.58
0.71
- 0.45 0.385
- 0.58 0.515
- 0.71 0.645
- 0.84 0.775
4
5
6
10
X i fi
i 1
Xi
fi
0
Xi
Xi
fi
Xif i
0.19
0.32
0.45
0.58
0.71
- 0.84
0.125
0.255
0.385
0.515
0.645
0.775
6
4
4
5
6
10
35
0.75
1.02
1.54
2.575
3.87
7.75
17.505
'
i 1
0.7
0.20
0.33
0.46
0.59
0.71
Luego:
0.48037
'
= 0.5%
= 0.0577222 %2
2
X
X
i 1
2
i i
N
X i f 2i
0.09375
0.2601
0.5929
1.326125
2.49615
6.00625
10.775275
= 0.2403 %
CoV =
2. Clculo de la mediana.
Procedimiento.
a. Se construye la tabla de frecuencias acumuladas ( absolutas o relativas)
'
X i 1
0.6
0.19
0.32
0.45
0.58
0.71
b.
'
Xi
- 0.19
- 0.32
- 0.45
- 0.58
- 0.71
- 0.84
Fi
6
10
14
19
25
35
Pgina 34
d.
`
Utilizando la frmula, Me X 3 A4
0.5N F3
, obtenemos el valor de
F4 F3
Me
0.5 %
0.541%
Mo1
0.125%
Mo2
0.775%
Dispersin
LoR
2
2
0.78%
0.0577% 0.24%
CoV
0.48
Interpretacin.
El coeficiente de Variacin, CoV, como es superior a 0.25 nos dice que los datos estn
muy dispersos, y al ver los valores de tendencia central la media y la mediana estos son
diferentes, aparentemente estn cerca el uno del otro, pero al observar la tabla de
frecuencias y el polgono de frecuencias vemos que hay dos valores frecuentes, 0125 y
0.775 en torno a los cuales se acumulan los datos es decir existen 2 modas, por lo que la
media aritmtica ni la mediana no son los adecuados para representar a los datos.
Del anlisis hecho al problema anterior concluimos, que no basta contar con los
indicadores, siempre es conveniente complementar el anlisis con la representacin
grfica de la distribucin de los datos o comportamiento de la variable.
PROPIEDADES DE LA MEDIA ARITMTICA Y LA VARIANZA
1. Si los datos asociados a una variable son todos iguales, entonces:
La media aritmtica es igual al valor que toma la variable, y la varianza es igual a
cero.
2
2. Sean la media, X , y la varianza, X , de la variable X, si se define una nueva
variable, digamos Y, donde Y = k + X, entonces:
2
2
La media aritmtica de Y es : Y X k y la varianza es Y X
2
3. Sean la media, X , y la varianza, X , de la variable X, si se define una nueva
variable, digamos Y, donde Y = k ( X) entonces:
2
2 2
La media aritmtica de Y es : Y k X , y la varianza es: Y k X
Ejemplo
Se tiene informacin respecto al peso de los alumnos ingresantes a la facultad de
Medicina de la Universidad AAA.
Medidas Resumen Alumnas
45 kg.
X
3 kg.
X
Alumnos
70 Kg.
6 kg.
Pgina 35
Posteriormente se supo que la balanza estaba malograda y que daba en exceso un peso
adicional de 3 kg. Al obtener los indicadores correctos, las autoridades concluyeron que
el peso de las alumnas es muy bajo. Es cierto lo que dicen las autoridades?
Solucin.
Sea la variable X: peso de la alumna.
2
Donde X = 45 kg. y X = 9 kg2
Sea la variable Y: peso correcto de la alumna, que est definida como:
Y = X - 3
Por propiedades de la media y la varianza, tenemos que:
Y X 3 = 45 - 3 = 42 kg.
Y2 X2 = 9
Y 3 kg
C0V = 0.1154
Si bien las alumnas han incrementado su peso pero la variabilidad de los pesos tambin
se ha incrementado, ya que el CoV = 0.11 > 0.071
DESVIACIN TIPICA O ESTANDAR.
La varianza se expresa en unidades que son el cuadrado de la unidad de la variable, que
no tiene significado real, por ello es preferible utilizar otra medida de dispersin y esta
es la desviacin tpica o estndar que se define como la raz cuadrada positiva de la
varianza.
Pgina 36
Nombre de la
categora
Muy malo
Malo
Regular
Bueno
Muy bueno
Porcentaje de
Unid. Estad.
2.5
13.5
68
13.5
2.5
Ejemplo.
El siguiente cuadro estadstico y grfica muestran
Porcentaje
de avance
40 - 43
43 - 46
46 - 49
49 - 52
52 - 55
Total
Cursos
3
5
5
4
1
18
Que, la distribucin de los datos es casi simtrica, por lo tanto, podemos aplicar las
propiedades de la desviacin estndar.
En este caso la variable es: Porcentaje de avance de los cursos, donde = 46.6 % y =
4.61 %
Porcentaje de avance
32.77
37.38
41.99
51.21
55.82
37.38
41.99
51.21
55.82
60.43
Nombre de la
Categora
Avance muy bajo
Avance bajo
Avance regular
Avance Alto
Avance muy alto
Porcentaje de
cursos
Ningn curso
16.6
77.7
5.5
Ningn curso
Pgina 37
Avance
regular
Avance bajo
Avance alto
Podemos observar que no hay ningn curso cuyo avance sea calificado como muy bajo
o muy alto, y en cuanto al porcentaje de cursos dentro de cada categora, difiere en
cuanto a lo establecido, debido a que el polgono es casi simtrico no es simtrico y
porque son pocos los datos.
VARIABLES ESTANDARIZADAS O TIPIFICADAS
Los datos de una variable pueden tomar varias apariencias numricas, dependiendo de
la unidad en la cual es medida. Por ejemplo si se registra el ingreso de los trabajadores
en soles o dlares, lo que da lugar a que, la media aritmtica y la varianza con cada una
de las unidades sea diferente, pero si se da en su forma estandarizada, las medias y las
varianzas sern iguales en una u otra unidad.
Una variable estandarizada se denota con Z y su definicin es:
X X
Z
X
Donde: X es la media y X es la desviacin estndar de X
xi X
Esta definicin indica que un dato, zi
, mide, en cunto, un dato xi se aleja de
X
su media en trminos de su desviacin estndar.
La media y varianza de Z son:
X X
0
Media de Z es: Z
X
Varianza de Z es:
Z2
X2
1
X2
Ejemplo
La nota media y la varianza del primer examen parcial del curso de clculo I de un
grupo de estudiantes es:
X = 10 puntos
X2 = 4 puntos2
Donde X: Nota de clculo I.
Un alumno obtuvo 11 de nota En unidades estndar a cuanto equivale su nota?
Lic. Mara A. Zacaras Daz
Pgina 38
Rpta.
Nota
x = 11 puntos
En unidades estndar:
z
x X 11 10
0.5
X
2
Ejemplo.
La siguiente tabla muestra informacin estadstica, respecto a las notas del primer
examen parcial del curso de Estadstica, de todos los alumnos del curso, los cuales
estn divididos en dos grupos
Grupo
Nota media
1
2
13
13
Varianza
9
4
Comparando estas notas estandarizadas, que la nota de Rosa es menor que la nota de
Juan, entonces Juan esta en mejor posicin.
Pgina 39
Definicin.
El percentil Pk, es un valor en el recorrido de la variable con posicin (tk/100)+0.5.
Cuando el valor de la posicin no es un nmero entero, el percentil se halla como el
promedio de los datos cuyas posiciones estn prximas a la posicin hallada.
Ejemplo.
Los siguientes datos corresponden a las notas del curso de Clculo I de 12 Alumnos:
12, 8, 11, 13, 9, 8, 12, 10, 14, 13, 15, 9.
Cul es el valor del percentil 30 (P30)?
Solucin.
1. Se ordenan los datos de menor a mayor.
8, 8, 9, 9, 10, 11, 12, 12, 13, 13, 14, 15.
2. Se halla la posicin de P 30 en el conjunto de datos. Como el total de datos, t = N =
12, entonces, la posicin del dato es: [12*30/100] + 0.5 = 4.1.
3. El valor del percentil 30 es: P30 = ( x(4) + x(5) )/2 = (9+10)/2 = 9.5
Podemos observar que debajo del valor 9.5 aproximadamente quedan el 30% de los
datos.
Calculo de Percentiles para datos agrupados
Para hallar el percentil Pk, contando con la tabla de frecuencias se sigue un
procedimiento similar para calcular la mediana. Se tiene en cuenta que debajo de P k
existe el k% de los datos aproximadamente.
1. Se ubica el intervalo [a, b) en donde esta el percentil Pk.
2. El valor del percentil es aproximadamente:
(k /100) H a
Pk a (b a)
Hb Ha
Ejemplo.
La siguiente tabla de frecuencias corresponde a los datos de la variable, tiempo que
emplearon (X) los alumnos ingresantes del 2002 del curso de Estadstica de la EAPE de
la UNMSM, en rendir una prueba en la que deban emplear a lo ms 30 minutos.
Xi-1 - X'i
"7 - 10
"10 - 13
"13 - 16
"16 - 19
"19 - 22
"22 - 25
"25 - 28
fi
1
4
5
7
9
11
3
40
Hi
0.025
0.125
0.25
0.425
0.65
0.925
1
Cul es el valor mximo necesario para que un alumno sea considerado en el percentil
10?
Solucin.
UO: Alumno del curso de Estadstica, ingresante a la EAPE de la UNMSM del ao
2002
Variable X: Tiempo que emplearon en rendir una prueba.
Pgina 40
Pgina 41
Indicadores de Apuntamiento
El coeficiente de curtosis, es una medida del apuntamiento o aplastamiento de la curva
de comportamiento de la variable o del polgono de frecuencias y est definido como:
k
Pgina 42
Definicin: Estadstica es la ciencia que proporciona mtodos por medio de los cuales
podemos recolectar, clasificar, presentar, resumir y analizar datos numricos relativos a
un conjunto de individuos u objetos, tambin nos permite extraer conclusiones vlidas y
efectuar decisiones lgicas basadas en dichos anlisis.
Dentro de la estadstica se puede considerar:
A. Estadstica Descriptiva.
Esta relacionada con la recoleccin, tabulacin, presentacin de datos y el clculo de
medidas resumen que permiten obtener informacin estadstica, a partir de sta se
obtendr conclusiones sea a nivel de la poblacin o la muestra. Se ha aplicado
estadstica descriptiva.
B. Estadstica Inferencial
Relacionada con el proceso de generalizar conclusiones respecto de la poblacin total,
s la informacin con la que se cuenta ha sido obtenida de una parte o muestra de la
poblacin. Esta generalizacin podr hacerse, s el tamao de muestra y la seleccin
de los individuos integrantes de la muestra han sido seleccionados utilizando mtodos
estadsticos.
Ejemplo.
1.
El propietario de una fabrica de corbatas, desde hace 2 aos cuenta con 50 trabajadores.
Posee informacin respecto de la produccin diaria de ellos, esta algo satisfecho, sin
embargo cree que s introduce algunas modificaciones, la produccin podra mejorar. Es as
que divide el grupo de trabajadores en dos, en el saln A ubica a 25 trabajadores, quienes
trabajan en las mismas condiciones de siempre, en el saln B ubica a los otros 25
trabajadores, en este ambiente establece nuevas condiciones de trabajo: Msica de
ambiente, alfombra y mejor iluminacin. Al da siguiente, despus de un mes de esta
modificacin, registro la produccin de cada trabajador y los resultados son los siguientes:
Saln A
12
24
28
26
32
a.
b.
c.
d.
e.
21
32
25
29
31
13
16
33
35
30
Saln B
16
18
26
45
40
18
20
30
59
30
36
45
46
51
56
41
45
48
51
52
40
44
49
53
55
44
42
50
54
52
47
48
49
54
59
12
24
21
32
Saln A
13 16
16 18
18
20
36
45
41
45
Saln B
40 44
44 42
47
48
Pgina 43
a.
b.
c.
d.
e.
f.
Solucin.
Considerando los datos poblacionales
1.a. En el saln A la produccin ms baja es de 12 corbatas y la produccin ms alta es de 59
corbatas, pero este ltimo dato es el nico, en realidad la produccin esta oscilando entre
12 y 45 corbatas.
En el saln B, la produccin de corbatas oscila entre 36 y 59 corbatas.
De la informacin anterior podramos concluir, que los trabajadores del saln B tienen una
produccin ms homognea y es mayor que la de los trabajadores del saln A.
1.b. Obtenemos las medidas resumen.
Tendencia Central
Saln
A
B
X
27.56 Corb.
48.44 Corb.
Dispersin
Med
LoR
28 Corb. 47 Corb. 105.29 Corb2.
49 Corb. 23 Corb. 29.21 Corb2.
2
X
X
10.26 Corb.
5.404 Corb.
CoV
0.370
0.112
Pgina 44
Media
A
B
2.c.
2.d.
2.e.
2.f.
19
43.2
Mediana
Moda
18
44
Long.
Recorrido
20
12
Varianza
33.77
12.62
Desv.
Estandar
5.81
3.56
Coef.
Variacin
0.31
0.082
Ejemplo.
En los siguientes enunciados identifique si en su contenido se encuentra, un estadgrafo,
un parmetro o un dato e indique el nombre, justifique su respuesta. Asimismo diga si se
esta utilizando Estadstica descriptiva o inferencial. Interprete la informacin que
proporciona cada enunciado.
a. De los 7 mil 108 docentes que obtuvieron nota aprobatoria en el ltimo examen
de la Carrera Pblica Magisterial (2012), 3 mil 122, es decir el 44%, recibi
antes capacitacin por parte del Ministerio de Educacin, lo que evidencia que
las clases de actualizacin, que se imparten de manera gratuita, han permitido
una mejora en el conocimiento de los maestros y la ms alta nota fue de 19
puntos.
b. Siete de cada diez mujeres no denuncia el maltrato que recibe de su pareja
debido a que siente vergenza, miedo a ms agresin, temor al divorcio, culpa, o
no sabe a dnde ir, inform el director del Instituto Guestalt de Lima, Manuel
Saravia Oliver, quien indic que "la violencia familiar es un grave problema de
salud pblica".
Solucin a
Lic. Mara A. Zacaras Daz
Pgina 45
3122
3986
Pgina 46
Maltrato
Mujeres
Si
No
30
70
Pgina 47