Você está na página 1de 54

I NOCIONES BASICAS DE ESTADISTICA

1.1 CONCEPTOS FUNDAMENTALES.

1.- Estadstica es el conjunto de tcnicas y procedimientos que


permiten recoger datos, presentarlos , ordenarlos y analizarlos,
de manera que a partir de ellos se puedan inferir conclusiones.
La Estadstica tiene dos ramas diferentes :
i) La Estadstica Descriptiva ( o Deductiva ) que se emplea en la
descripcin y anlisis de conjuntos de datos o poblacin.

ii) La Estadstica Inferencial (o Inductiva), llamada tambin Teora


de Muestras que desarrolla las tcnicas para calcular valores
llamados "parmetros" que se relacionan con una cierta poblacin,
en base a datos que entrega la Estadstica Descriptiva.
Nos permite obtener informacin y sacar conclusiones relativas a
una poblacin.
2.- Poblacin: es el conjunto de de cosas ,personas o situaciones, que
tienen alguna caracterstica comn y que permite agruparlas.
As, el concepto de poblacin no esta referido solo a poblacin
humana,sino que posee un alcance ms general .La poblacin
puede ser el conjunto de magnitudes que representan la estatura
de los estudiante de un colegio.
Una poblacin puede ser finita o infinita, en cuanto a la cantidad
de los elementos que la forman.
3.- Muestra es un subconjunto de una determinada poblacin,obtenido
en forma aleatoria y que es representativo de dicha poblacin.-

En Estadstica emplearemos el concepto matemtico de variable.


Una variable puede tomar cualquier valor obtenido de un conjunto
que constituye el dominio de la variable.
Se representa por un smbolo como x,y,H,M, etc.
Las variables pueden ser :
i) Variable Continua: es aquella que puede tomar cualquier valor
comprendido entre dos valores dados.
Ejm:
- La estatura de una persona designada por E es una
variable continua. E puede ser 1,73 cm. o 1,7328 cm.
ii) Variable Discreta: es aquella que solo puede tomar valores

enteros.
Ejm:
- El nmero de hermanos en una familia que podemos
denotar por h puede ser : 0,1,2,3,... pero no podra ser
h 2,56.
Observacin: Al referirnos a datos, usaremos la misma
denominacin de la respectiva variable: datos
continuos o datos discretos.
Ejm:
- El conjunto de nmeros que representan el peso real de
1000 estudiantes de Educacin Bsica de una ciudad es
un conjunto de datos continuos.

GUIA N1

Estadstica Descriptiva.

1.- Indica en cada caso si se trata de datos discretos o continuos.

i) Nmero promedio de personas que integran el grupo familiar,


en cierto sector de la ciudad.
ii) Longitud media de los tornillos producidos por una mquina,en
un da.
iii) Cantidad de profesores por colegio en una comuna determinada.

2 .- Describe dos ejemplos de variables continuas y dos de variables


discretas.

3 .- Especifica el dominio de cada una de las siguientes variables.

i) Nmero de vehculos que pueden estacionar en un piso de un


edificio de estacionamientos.
ii) Suma de los nmeros obtenidos al lanzar dos dados.
iii) Nmero de kilogramos de ropa que se pueden poner en una
lavadora cuya capacidad es de 5 kg.

1.2.- DISTRIBUCIONES DE FRECUENCIAS.

1.- FRECUENCIA ABSOLUTA: es el nmero de veces que se presenta

un cierto dato.
La denotaremos con la letra f .

Ejm:
- Al lanzar un dado diez veces, los resultados fueron
los siguientes:
Nmero obtenido frecuencia
1

El nmero 4 se obtuvo en tres lanzamientos su frecuencia es 3


f 3 .
Entre el dominio de la variable 1, 2, 3, 4, 5, 6 y el conjunto de las
respectivas frecuencias, se da una relacin funcional.
En general, la relaccin funcional o aplicacin que se da entre el
dominio y las respectivas frecuencias se denomina funcin de
distribucin de frecuencias.

2.ORDENACIN DE DATOS.
Cuando obtenemos los datos correspondientes a una variable que representa
cantidad,estos no necesariamente aparecen ordenados.
Ordenar datos numricos significa colocarlos en orden creciente o decreciente.
Ejm.
Los datos 4,8,5,6,4,5,6,6 se pueden ordenar as :

Ordenacin Creciente: 4,4 5,5,6,6,6,8

Ordenacin Decreciente: 8,6,6,6,5,5,4,4

Un importante elemento estadstico relacionado con un grupo de datos


es su rango o recorrido.
El rango de un conjunto de datos es la diferencia entre el mayor y el
menor de ellos.

Ejm:
- Si la estatura del alumno ms alto es 1,92 m.y la del menores
de 1,68 m. entonces el rango de estos datos es:
1,92 m 1,68 m 0,24m 24cm

3.- CLASE Y DISTRIBUCIN DE FRECUENCIAS.

En la ordenacin de datos muy numerosos,es usual presentarlos


agrupados y ordenados en clases o categoras.
Al determinar cuntos pertenecen a cada clase, establecemos la
frecuencia de clase.
Construimos as una tabla de datos que llamaremos distribucin o
tabla de frecuencias.
Ejm:
En un grupo de 50 alumnos de Educacin Media,se registraron
los siguientes puntajes en una prueba.

61 70 77 82 63 75 83 62 67 83
67 80 77 85 83 76 83 67 78 76
72 80 83 72 84 71 77 82 79 83
66 88 68 74 84 75 73 75 83 84
87 64 83 72 87 77 63 72 84 78

Para ordenarlos y agruparlos ,establecemos los intervalos que se usaran


para distribuirlos,determinando el rango de estos datos.

Rango

88 61 27

De acuerdo con el rango y teniendo en cuenta que la cantidad de datos


es pequea ,los agruparemos en solo 6 clases,representadas por los
respectivos intervalos,como en el siguiente cuadro:

Intervalos de puntajes frecuencia


60 64

65 69

70 74

75 79

12

80 84

16

85 89

El intervalo 60 64 es un smbolo para representar a la clase respectiva.


La clase la constituyen todos los datos que pertenecen a ella.
61, 62, 63, 63, 64
Los valores 60 y 64 son los lmites aparentes de la clase.
De hecho estamos suponiendo que los puntajes del test,cuyos
resultados estamos ordenando,han sido aproximados a nmeros
enteros.
As un puntaje 59,8 se ha aproximado a 60.
Los lmites reales de una clase se obtienen calculando el promedio
entre el lmite aparente superior de una clase y el lmite aparente
inferior de la clase siguiente.
Los lmites reales de la clase 60 64 son 59,5 y 64,5 , ya que la clase
representada incluye realmente puntajes que pueden ir desde 59,5
hasta 64,5, exclusive.
Este ltimo valor, aproximado a 65, pertenece a la clase siguiente,
representada por el intervalo 65 69.

Calculemos los lmites reales de la clase 70 74.

69 70
2

139
2

69, 5 lmite real inferior de la clase 70 74

74 75
2

149
2

74, 5 lmite real superior de la clase 70 74

Observacin: Los lmites aproximados a las centsimas tienen


lmites reales expresados con tres cifras decimales.

4. TAMAO O AMPLITUD DE UNA CLASE.


El tamao o amplitud de una clase corresponde a la diferencia

entre su lmite real superior y su lmite real inferior.

Ejm.
A continuacin presentamos los intervalos que representan a
las clases de a distribucin de frecuencias del ejemplo anterior
junto con los lmites reales respectivos.

puntajes

Lmites Reales

Intervalo inferior superior


60 64

59,5

64,5

65 69

64,5

69,5

70 74

69,5

74,5

75 79

74,5

79,5

80 84

79,5

84,5

85 89

84,5

89,5

Las clases que estamos considerando son de igual tamao.

64, 5

59, 5

5
todas las clases tienen tamao o amplitud 5

89, 5

84, 5

5. MARCA DE CLASE.
Es el punto medio de un intervalo de clase.
La marca de clase se obtiene calculando el promedio entre los
lmites aparentes inferior y superior de la clase.

Ejm.
En el intervalo 60 64 ,que representa a la primera clase de la
distribucin de frecuencias que hemos estado estudiando, la
marca de clase es 62

Intervalo Marca de clase


60 64

62

65 69

67

70 74

72

75 79

77

80 84

82

85 89

87

60 64
2

124
2

62

Al agrupar datos en clases, es conveniente que la marca de clase


coincida con la mayor cantidad de datos posibles.
Esto se debe al hecho de que la marca de clase representa a los datos
que en esa clase se agrupan.

Ejm.
Si los datos 4,3,4,5,5 los agrupamos en la clase 3 5 obtenemos:
Intervalo Marca de clase Frecuencia
35

Al agrupar los 5 datos ,pasan a ser considerados como si cada uno de


ellos fuera equivalente al dato 4, que es la marca de clase.
Podemos observar que los datos reales
suman 21, en cambio, al
agruparlos, su suma equivale a 5 4 20.

6. CONSTRUCCIN DE UNA DISTRIBUCIN DE FRECUENCIAS.

Una tabla o distribucin de frecuencias se pueden construir a travs


de los siguientes pasos:

1 Buscamos los datos mayor y menor, con el objeto de calcular el


rango.
2 Establecemos el nmero de intervalos que usaremos.
Habitualmente se emplean de 5 a 18 intervalos dependiendo del
rango y la cantidad de datos.El rango lo dividimos en un nmero
aproximado de intervalos de igual tamao.

3 Para completar la distribucin de frecuencias se cuentan los datos


que formaran cada clase, es decir, se establece la frecuencia de la
clase.

4 Debemos intentar la coincidencia de la marca de clase con algn


dato real. Con esto se evita lo que se llama error de agrupamiento,
pues no hay,necesariamente,una coincidencia total entre los datos
reales y los datos agrupados.

Ejm.
Consideremos los siguientes datos,expresados en metros,
correspondientes a las estaturas de 80 estudiantes de Cuarto
Ao de Educacin Media de un colegio.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88


1,92 1,75 1,84 1,86 1,73 1,84 1,87 1,83
1,81 1,77 1,73 1,75 1,78 1,77 1,67 1,83
1,83 1,72 1,71 1,85 1,84 1, 93 1,82 1,69
1,70 1,81 1, 66 1,76 1,75 1,80 1,79 1,84
1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79
1,87 1,79 1,77 1,67 1,74 1,75 1,78 1,77
1,74 1,73 1,83 1,76 1,83 1,77 1,75 1,77
1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76
1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
Estatura mayor 1,93 m.
Estatura menor 1,66 m.
Rango
1,93 1,66 m.
0,27 m
27 cm.

Formaremos 6 intervalos . Para calcular su tamao dividimos:

27 : 6

4, 5
5

Por lo tanto, los intervalos seran de tamao 5 cm.,es decir 0,05 m.

El valor 4,5 que resulta como tamao del intervalo , se aproxima al


impar ms cercano,de modo que las marcas de clase coincidan con
datos reales, a fin de disminuir el error de agrupamiento que puede
producirse.
La distribucin queda as:

Intervalo

frecuencia

1,65 1,69

1,70 1,74

12

1,75 1,79

30

1,80 1,84

22

1,85 1,89

1,90 1,94

7. Frecuencia Total : Es la suma de las frecuencias absolutas de todas


las clases.

Observacin: El tamao y la cantidad de intervalos dedeterminan


despus deadquirir experiencia al respecto.Lo
importante es que estos datos agrupados no se alejen de los datos
reales (no agrupados).
La distribucin que elijamos no es la nica que podemos hacer con
los datos de la muestra,pues podramos considerar otra amplitud y,
por lo tanto, distinta cantidad de intervalos.

Distribuciones de Frecuencias.

Gua N2

1.- Considerelos siguientes datos:


7

12 14

15

10

11 12

12

14 13 10

12 13 11

10

14 15 12

i) Ordnelos en forma creciente.


ii) Calcule el rango de los datos.

iii) Establece la frecuencia de los datos 8, 10 y 15.


iv) De todos los datos cul tiene mayor frecuencia.

2.- Si los datos del ejercicio anterior se agrupan en clases y una


de ellas es 10 12, cunto es la frecuencia de esta clase?

3.- Dado el siguiente conjunto de datos:


7

20 15 12

10

14 13

12 19 20 13

10 12 15 18

18 16

12 14 15

13 10 10

13 14 16 17 19

20 18 12 14 16 16

9
12

10 10 15

i) Calcule el rango.
ii) En cuntos intervalos de igual tamao se agruparan los datos si
el primero fuera 6 8?
iii) Encuentra la frecuencia de la clase 12 14.
iv) Construye la tabla de distribucin de frecuencias, considerando 5
intervalos iguales, a partir del 6 8.
v) Qu tamao tienen los intervalos de la distribucin anterior?
vi) Cules son las marcas de clase de la distribucin?
vii) Cul es la clase con menor frecuencia?

4.- Con los datos del ejemplo anterior( de los 80 estudiantes...)


construye la distribucin de frecuencias considerando 6
intervalos a partir de 1,66 1,70 .incluye las columnas:
Intervalo Frecuencia

7. FRECUENCIA RELATIVA :
Es el cuociente entre la frecuencia absoluta de la clase y
la frecuencia total.
La frecuencia relativa se puede expresar tambien en porcentaje,
para ello el valor del cuociente se multiplica por 100.
Ejm:
La distribucin de frecuencias de las estaturas de los 80 estudiantes,
se puede transformar en una distribucin de frecuencias relativas,
dividiendo la frecuencia absoluta de cada clase por la frecuencia
total.

Intervalo

Frec.Absoluta Frec.Relativa Frec.Relativa Porcentual

1,65 1,69

0,075

7,5

1,70 1,74

12

0,150

15,0

1,75 1,79

30

0,375

37,5

1,80 1,84

22

0,275

27,5

1,85 1,89

0,100

10,0

1,90 1,94

0,025

2,5

80

1,000

100,0%

Suma de las frecuencias absolutas:


6 12 30 22

80

Suma de las frecuencias relativas:

0, 075

0, 150

0, 375

0, 275

0, 100

0, 0250

1, 000

Suma de las frecuencias relativas porcentuales:

7, 5

15, 0

37, 5

27, 5

10, 0

2, 5

100%

Observacin
1.- La suma de las frecuencias relativas de una distribucin es 1.
2.- La suma de las frecuencias relativas porcentuales de una
distribucin es 100%.

Gua N3

Frecuencias Relativas

1.- La distribucin de frecuencias muestra la cantidad de colesterol


total de un grupo de pacientes cuya edad es de 50 a 60 aos.

Colesterol total (mg/dl) Frecuencia


170 179

180 189

190 199

12

200 209

16

210 219

35

220 229

37

230 239

11

240 249

i) Calcule las frecuencias relativas.


ii) Determina las frecuencias porcentuales.
iii) Identifica la clase con mayor frecuencia.
iv) Identifica la clase con menor frecuencia relativa porcentual.
v) Calcula la suma de las frecuencias relativas.
vi) Calcula la suma de las frecuencias porcentuales.
vii) Explica por qu la suma de las frecuencias relativas no es 1,
en este caso.

1.3.- HISTOGRAMA Y POLGONO DE FRECUENCIAS.

1.- HISTOGRAMA :Es una representacin grfica de una distribucin


de frecuencias. Est formado por rectngulos cuyas bases son
de la misma medida que el intervalo respectivo y cuyas superficies
son proporcionales a las cifras alcanzadas en las frecuencias de clases.
los intervalos suelen ser de igual tamao, con lo cul la altura de cada
rectngulo coincide numricamente con la frecuencia de la clase respectiva.

Ejm.
Contruya el histograma correespondiente a la distribucin de frecuencias
de los puntajes obtenidos por 50 alumnos de Educacin Media
Intervalo

60 64

65 69

70 74

75 79

12

80 84

16

85 89

Observacin:
Si observamos atentamente el histograma y la respectiva distribucin
de frecuencias que representa ,podramos visualisar mejor el
comportamiento de los datos graficados.
As:
Los puntos A y B corresponden a los valores 59,5 y 64,5 ,
respectivamente, que son los lmites reales del intervalo 60 64.
La marca de clase es 62.
Los lmites reales del intervalo siguiente son 64,5 y 69,5 , de modo
que, grficamente, los rectngulos se dibujan juntos.
La base AB es de tamao 5, la misma distancia que hay desde
una marca de clase hasta la siguiente: 67 62 5 ; 72 67 5, etc.
La clase de mayor frecuencia es la que corresponde al intervalo
80 84, cuya marca de clase es el puntaje 82.
Las dos primeras clases tienen igual frecuencia ( f 5 alumnos).

2.- POLGONOS DE FRECUENCIA.


Otra forma de representar una distribucin de frecuencias es
a travs del polgono de frecuencias.
POLGONO DE FRECUENCIA :Se obtiene al unir los puntos correspondientes
a los pares ordenados originados por cada marca de clase y su respectiva
frecuencia, incluidos dos intervalos de frecuencia cero, uno en cada
extremo de la distribucin.
Ejm:
i) Construya el polgono de frecuencias del ejemplo anterior.ii) Dibuje en un mismo sistema de ejes el polgono de frecuencias y
el histograma respectivo, que tiene uno de sus lados sobre el eje
horizontal.
Observacin:
Los vrtices del polgono de frecuencias corresponden a los puntos
medios de los lados superiores de los rectngulos del histograma.
El rea del polgono de frecuencias es igual a la suma de las reas
de los rectngulos que forman el histograma.

3.- HISTOGRAMA Y POLGONO DE FRECUENCIAS RELATIVAS.


Ejm.
Si en una distribucin de los puntajes de una prueba administrada
a 50 alumnos, cuyo histograma realizamos anteriormente ,consideramos
las frecuencias relativas porcentuales ,tendremos la siguiente tabla de
frecuencias.

Puntaje Frecuencia Absoluta Frecuencia Relativa Porcentual


60 64

10

65 69

10

70 74

16

75 79

12

24

80 84

16

32

85 89

50

100%

Dado que la frecuencia total de 50 alumnos corresponde al 100%, las


frecuencias de cada clase equivalen a los porcentajes que aparecen en
la tabla anterior.As, la frecuencia de12 alumnos equivale al 24% del total
de 50 alumnos.

12
50

100 24% de los alumnos.


Al dibujar el histograma y el correspondiente polgono de frecuencias
relativas porcentuales se obtiene la misma figura que si se consideraran
las frecuencias absolutas.Solo cambia la forma de expresar la graduacin
del eje vertical:de frecuencia absoluta a frecuencia relativa porcentual
(construir el grfico).

Gua N4

Histogramas y Polgonos de Frecuencias.

1.- Con los datos del ejercicio 3.iv) de la Gua N2 :


i) Dibuja el histograma y el polgono de frecuencias,en un solo grfico.
ii) Construye la tabla de distribucin y dibuja el polgono de frecuencias
relativas porcentuales.
2.- Un curso de 44 alumnos obtuvo las siguientes notas en las asignaturas
A,B y C:
i) Construye una tabla de distribucin de frecuencias relativas porcentuales
para las tres asignaturas,con intervalos de igual, tamao, comenzando
con el intervalo 2,1 2,5.
ii) Dibuja tres histogramas de frecuencias relativas porcentuales.
iii) Establece a que intervalos corresponde la mayor frecuencia en cada
asignatura.
iv) Dibuja los polgonos de frecuencias absolutas.

Asignatura A

Asignatura B

Asignatura C

5,0 2,8 2,4 68

6,7 5,6 6,0 5,3

2,2 4,4 4,6 5,3

6,2 5,7 5,9 3,7

5,1 5,8 5,3 2,5

3,1 4,3 5,1 2,9

3,8 3,3 2,2 2,7

5,8 4,1 4,1 2,8

5,5 2,3 4,7 5,8

5,1 5,5 4,3 4,3

4,5 6,6 4,3 2,6

4,2 5,8 6,0 6,8

3,7 3,9 3,0 7,0

6,2 3,3 3,0 5,0

3,2 5,6 2,8 6,9

2,7 3,2 3,4 4,2

2,1 4,8 5,4 3,5

4,8 3,9 5,8 2,4

4,3 4,8 4,9 5,3

2,5 3,4 5,4 7,0

2,6 5,1 5,0 5,6

5,7 4,0 4,0 4,1

6,3 4,4 2,4 4,5

5,5 3,0 5,7 2,8

4,5 5,0 4,6 5,3

5,2 3,8 6,3 4,0

3,5 5,8 3,4 6,2

5,3 5,6 6,0 5,3

4,6 6,4 4,7 5,0

3,7 4,1 6,3 7,0

4,5 4,1 4,8 4,9

5,5 3,8 3,1 3,2

2,8 5,8 5,8 4,5

4.- DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS.


La frecuencia acumulada de una clase es la suma de las frecuencias
que corresponden a todos lo datos menores que el lmite real superior
de esa clase.

Ejm:
Consideremos la siguiente tabla de frecuencias,correspondientes
a resultados de la P.S.U. de los alumnos de un liceo.
Puntaje

Frecuencia

350 399

400 449

450 499

500 549

20

550 599

31

600 649

80

650 699

42

700 749

10

750 799

800 849

2
212

Si queremos saber cuantos alumnos obtuvieronmenos de 499,5 puntos


(lmite real superior de la clase representada por el intervalo 450 499).
Para saberlo debemos sumar las frecuencias hasta dicho intervalo.
4 6 9 19 alumnos.
En la tabla anterior, la frecuencia acumulada de la clase 550 599 es:

4 6 9 20 31 70
Son todos los alumnos que obtuvieron menos de 599,5 puntos (lmite
real superior de dicha clase).
La frecuencia acumulada de una clase ,tambin puede ser relativa.

FRECUENCIA ACUMULADA RELATIVA : Es el cuociente entre la frecuencia


acumulada de la respectiva clase y la frecuencia total.

Ejm:
En la tabla anterior la frecuencia relativa acumulada de la
clase 550 599 es:
70
0, 3302
212
La frecuencia acumulada relativa tambin se puede escribir
en forma porcentual

Ejm:
La frecuencia acumulada porcentua lde la misma clase 550 599
es:
0, 3302 100 33, 02%

Ejm:
Si completamos la tabla anterior, en la que aparecen las frecuencias
absolutas de cada clase, obtenemos:
Puntaje

Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta

Acumulada Acumulada Acumulada


Relativa

Porcentual

350 399

0,0189

1,89

400 449

10

0,0472

4,72

450 499

19

0,0896

8,96

500 549

20

39

0,1840

18,40

550 599

31

70

0,3302

33,02

600 649

80

150

0,7075

70,75

650 699

42

192

0,9057

90,57

700 749

10

202

0,9528

95,28

750 799

210

0.9906

99,06

800 849

212

1,0000

100,00

Las tablas de frecuencias se nombran segn la frecuencia considerada.


As hablamos de una tabla de Frecuencias Acumuladas o simplemente
Distribucin Acumulada.
Si las frecuencias acumuladas fueran relativas o relativas porcentuales,
las tabla se nombraran as:
Tabla de frecuencias acumuladas relativas.
Tabla de frecuencias acumuladas relativas porcentuales.

Ejm:
La distribucin acumulada que corresponde a los datos anteriores
la podemos presentar de dos maneras:

Puntaje

Frecuencia
Acumulada

350 399

400 449

10

450 499

19

500 549

39

550 599

70

600 649 150


650 699 192
700 749 202
750 799 210
800 849

212

Puntaje

Frecuencia
Acumulada

Menor que 349,5

Menor que 399,5

Menor que 449,5

10

Menor que 499,5

19

Menor que 549,5

39

Menor que 599,5

70

Menor que 649,5 150


Menor que 699,5 192
Menor que 749,5 202
Menor que 799,5 210
Menor que 849,5 212

El grfico que representa las frecuencias acumuladas menores que


cada uno de los lmites reales superiores de las clases,se llama
poligonal de frecuencias acumuladas u ojivas.
Ejm:
i) Grafique mediante una poligonal de frecuencias acumuladas
la tabla de distribucin acumulada de la forma " menor que".
ii) Grafique las frecuencias acumuladas relativas .
iii) Grafique las frecuencias acumuladas porcentuales.
Observacin:
i) Si empleamos las frecuencias acumuladas relativas o las frecuencias

acumuladas porcentuales, la ojiva que se obtiene es la misma.Solo


cambia la forma de expresar la graduacin del eje vertical.
ii) Podemos observar que la frecuencia acumulada 150 de la ojiva de
frecuencias acumuladas, equivale a:
la frecuencia acumulada relativa 0,7075 de la ojiva de frecuencias
acumuladas relativas.
la frecuencia acumulada porcentual 70,75 de la ojiva de frecuencias
acumuladas porcentuales.
Resumiendo las tres ojivas construidas son iguales en su forma y
tamao. Se ha cambiado la graduacin del eje vertical de los grficos
manteniendo una equivalencia entre ellos.
La ojiva permite obtener de la lectura del grfico algunos antecedentes
acerca de la distribucinde datos.
Ejm:
Encontremos a partir de la distribucin de puntajes de P.S.U.de los
alumnos de un liceo de nuestro ejemplo anterior, cuntos alumnos
obtuvieron menos de 699,5 ptos. y cuntos entre 499,5 y 599,5 ptos.
Si leemos el grfico la frecuencia acumulada que corresponde a
699,5 puntos .Es aproximadamente 192 alumnos,es decir, el 91%.
De igual manera,a los puntajes 499,5 y 599,5 (del eje X)corresponden
de 19 a 70 alumnos respectivamente.

19 alumnos 9% de los alumnos; 70 alumnos


70 19 33% 9% 24% de los alumnos.

33% de los alumnos

El valor 192 se puede obtener directamente de la distribucin de


frecuencias acumuladas.
Si se trata de valores intermedios que no aparecen en la tabla, la
ojiva es una buena manera de obtenerlos.
A partir de la ojiva de frecuencias acumuladas, determinemos ahora
cuantos alumnos obtuvieron menos de 625 puntos.

Marcamos la abscisa 625 y levantamos una perpendicular


hasta intersectar a la ojiva .
Por ese punto,trazamos una paralela al eje horizontal,que
permite leer la respuesta en el eje vertical.
Aproximadamente 110 alumnos, es decir, el 52% del total
de 212, obtuvieron menos de 625 puntos.

Gua N5

Distribuciones de Frecuencias Acumuladas.

1.- Con los datos de la distribucin de notas de la Asignatura A (del


ejercicio 2 i) de la Gua N4 ):

i) Construye la ojiva porcentual.


ii) Basndote en la ojiva porcentual anterior, calcula qu porcentaje
de alumnos del curso obtuvo nota inferior a 4,0
iii) Calcula que porcentaje de alumnos obtuvo nota mayor que 6,0.
iv) Determina la cantidad de alumnos que tienen notas entre 5,0 y 6,0.
v) Encuentra la nota que separa la distribucin en dos grupos de
igual cantidad de alumnos.

1.4.- MEDIDAS DE TENDENCIA CENTRAL.


Medidas de Tendencia Central: Son los valores que habitualmente
se ubican en la parte central de la distribucin correspondiente.
Las Medidas de Tendencia Central nos dan una idea a cerca del
comportamiento de los datos a que se refieren.
Podemos decir que expresan el grado de centralizacin que los
datos presentan.
Ejm:
Supongamos que un alumno obtuvo las siguientes notas en
Matemtica:
4,2 ; 5,0 ; 3,8 ; 5,1 y 4,7.
El promedio de estas notas es 4,8.Si ordenamos estas notas
tenemos 3 notas bajo el promedio y otras 3 sobre el promedio.
El promedio se encuentra en la parte central de esta distribucin.
El promedio mismo no coincide con ninguno de los datos.
Lo que comunmente concemos como promedio es una medida de
tendencia central que se llama Media Aritmtica.
Las medidas de tendencia central son varias.
Estudiaremos la Media Aritmtica, la Mediana y la Moda.

1.- LA MEDIA ARITMTICA.


La Media Aritmtica de n datos numricos que expresan cantidades
es el cuociente entre la suma de todos los datos y la frecuencia total n.
Se denota por x.
Dados los datos x 1 , x 2 , x 3 , . . . x n , la media aritmtica de ellos es:

x 1 x 2 x 3 ... x n
n

Ejm:
Calculemos la media aritmtica de las siguientes marcas obtenidas
por un atleta en salto alto.
1,67 m, 1,65 m, 1,63 m, 1,63 m, 1,62 m.
x
x
x

1,67 1,65 1,63 1,63 1,62


5
8,2
5

1, 64 m

Usando la notacin de sumatoria


tendramos:
k n
x
x

para expresar la media aritmtica

xk
n
x 1 x 2 x 3 ... x n
n

Observacin:
La notacin de frmulas con el uso de sumatorias tiene sus ventajas
puesto que permite escribirlas de manera ms reducida.
2.- LA MEDIA ARITMTICA PONDERADA.
Ejm.
Calculemos la media aritmtica de las edades de un curso de Cuarto
Medio, si sabemos que hay 42 alumnos y 1 alumno tiene 16 aos,
4 alumnos tienen 17 aos, 35 alumnos tienen 18 aos, 2 alumnos
tienen 19 aos.
En este caso, primero debemos calcular la suma total de aos,para
lo cul es necesario ponderar cada edad por el nmero de alumnos
que la tienen.
Enseguida, la suma total de aos se divide por el total de alumnos.
x

16 1 17 4 18 35 19 2
1 4 35 2

16 68 630 38
42

752
42

x 17. 9
Entonces la media aritmtica de las edades es 17,9 aos.

Lo que calculamos se llama media aritmtica ponderada o simplemente


media ponderada.
En ella cada edad influye en mayor o menor medida, segn la
frecuencia con la que se presenta.
La edad 18 aos fue la que ms afect a la media ponderada ya que
corresponde a 35 alumnos de los 42 alumnos considerados.
Podemos observar que el valor x 17, 9 aos result muy cercano a
dicha edad.Si la mayora de los alumnos hubiese tenido 16 aos,
entonces x habra resultado ms cercano a esta edad.
En general si los datos x 1 , x 2 , x 3 , . . . x n se presentan con frecuencias
f 1 , f 2 , f 3 , . . . f n , entonces la media aritmtica ponderada de tales datos:
k n

fk xk
k 1

x
k n
fk
k 1

f 1 x 1 f 2 x 2 f 3 x 3 ... f n x n
f 1 f 2 f 3 ... f n

Buscando expresiones ms simples, es frecuente escribir la fmula anterior


como:
x

fx
f

3.-LA MEDIA ARITMTICA DE DATOS AGRUPADOS.

Ejm:
Consideremos la distribucin de frecuencias que corresponden a los
puntajes de 50 alumnos en una prueba,a la que hemos agregado dos
columnas para el clculo de la Media.

Intervalo Frecuencia. f

Marca de Clase. x

f x

60 64

62

310

65 69

67

335

70 74

72

576

75 79

12

77

924

80 84

16

82

1312

85 89

87

348

x
x

50

f x

3. 805

fx
f

3.805
50

x 76, 1 puntos.
Si calculamos la media a partir de los datos no agrupados que aparecen
en un ejemplo anterior obtenemos: 76,3 puntos.
La diferencia de 0,2 puntos entre los valores de ambas Medias Aritmticas
se deben al error de agrupamiento.
Si son pocos datos (50), como en este caso, la ventaja de agruparlos no se
aprecia. Sin embargo si se tratara de los puntajes de los alumnos que rindieron
la P.S.U. no sera prctico trabajar sin agrupacin.
Estudiaremos ahora un mtodo para calcular la media aritmtica de datos
agrupados, que llamaremos Mtodo Abreviado.
Ejm:
Disponemos los datos de la distribucin del ejemplo anterior de la
siguiente manera y agregamos dos columnas, e y f e .
Para ello elegimos como referencia una marca de clase,en este caso 77,
y en la columna e frente a dicha clase ponemos un cero.Completamos
esta columna con nmeros enteros colocados en forma decreciente en
el mismo orden que las marcas de clase y enseguida la columna de la
derecha con los productos f e .

Intervalo M.de C. Frec. Abs. f

f e

60 64

62

15

65 69

67

10

70 74

72

75 79

77

12

80 84

82

16

16

85 89

87

50

f e

Calculamos el tamao de los intervalos restando sus lmites reales:


t 79, 5 74, 5
t 5
La Media Aritmtica es x 77 509 5
x 76, 1 puntos.
El resultado no cambia si se toma como referencia otra marca de clase.
Este procedimiento exige que los intervalos sean de igual tamao.
El resultado es el mismo que obtuvimos en el ejemplo anterior.
En general,
Si m es la marca de clase elegida como referencia y t el tamao
de los intervalos, la media aritmtica de datos agrupados est dada
por la frmula:

Gua N6

fe
f

Media Aritmtica.

1.- Un alumno obtuvo las siguientes notas parciales en Biologa:


4,8 ; 2,5 ; 6,0 ; 3,9 y una quinta nota queno recuerda .Si su
promedio fu 4,6, calcula la nota que falta.

2.- Dos alumnos obtuvieron el mismo promedio semestral en Matemtica.


Significa que tuvieron las mismas notas?Justifica numericamente tu
respuesta.
3.- En la Universidad, un alumno obtuvo un 4,3 que se pondera en un 20%,
un 5,8 que vale un 30% y un 4,2 en el examen, que se considera como
el 50% de la nota final.Calcula su nota final.

4.- La media de las notas parciales de un alumno es 4,8 y se pondera en


un 60%.Qu nota debe sacar en el examen para obtener, exactamente,
un 4,0?

5.- Para calcular la media de sus notas, un alumno las ingresa a la


calculadora sin considerar la coma decimal.Qu debe hacer al
observar el resultado en el visor de su calculadora?

6.- Calcula,por los dos procedimientos aprendidos,la media aritmtica


de los puntajes en la P.S.U. de los 212 alumnos de un Liceo,
considerando la distribucin del ejemplo del punto 4.- Distribuciones
de frecuencias acumuladas: ojivas.
7.- Dos cursos, 4A y 4B lograron en la misma prueba una media de 5,0 y
5,6 respectivamente Cunto es la media entre ambos cursos ?

8.- En una oficina el jefe gana $1.400.000 y tres empleados ganan $860.000,
$920.000, $960.000 cada uno.La media aritmtica, es un valor representativo
de esos sueldos?

9.- En una muestra de control se midieron 10 clavos de una bolsa rotulada


Clavos de 2", con los siguientes resultados: 5 de 2,00" ; 3 de 1,99" y 2 de
2,05". Calcula la longitud media de la muestra.

4.- LA MEDIANA.

Ejm:
Consideremos una cantidad impar de datos numricos ordenados
segn su magnitud.
2 4 6 7 9 12 16
menores
mayores

El valor que se encuentra al centro, separando los datos en tres


menores y tres mayores que l, en este caso el 7 es la mediana de
dichos datos .La denotaremos por Me.

Me

Si el nmero de datos es par,la mediana es igual a la media aritmtica


de los dos valores centrales.
5 8 10 12 13 15

Me
Me

10 12
2

11

En general podemos afirmar que:


La mediana es el conjunto de datos numricos ordenados en forma
creciente o decreciente, es el dato que se encuentra al centro de
dicha ordenacin o la media aritmtica de los dos datos centrales.
Observacin : Si en un conjunto de datos hay un valor extremo que
se aleja de los otros y distorsiona la representatividad de la media
aritmtica, entonces la mediana nos da una mejor informacin a cerca
de esos datos.

5.- LA MEDIANA DE DATOS AGRUPADOS.


En una distribucin de frecuencias,los datos se presentan agrupados y
ordenados en clases.
Para obtener la mediana,calculamos un valor que separa al conjunto de
datos en dos grupos de igual cantidad de elementos.

Graficamente la mediana corresponde al valor representado en el eje X.


de modo que la perpendicular a dicho eje en el respectivo punto,separa
la regin determinada por el polgono de frecuencias en dos figuras de
igual rea.Lo mismo ocurre con el histograma.
Ejm.
Consideremos la distribucin de puntajes de la P.S.U.con las
columnas; frecuencia absoluta y frecuencia acumulada.

Puntaje

Frecuencia Frecuencia
absoluta

acumulada

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

212

Encontremos la mitad del total de los datos: 212

106.

La frecuencia acumulada 106 corresponde al intervalo: 600

649.

Al recorrer la columna de las frecuencias acumuladas,en la clase


550 599 llevamos solo 70 datos.
Para completar la mitad del total 106 , necesitamos 36 datos de la
clase siguiente, 600 649; esta ltima se llama "clase mediana", ya
que dentro de sus lmites est la mediana buscada.
Por lo tanto, tenemos que separar dicha clase de modo que 36 datos
se agreguen a los 70 anteriores, para completar 106 que es la mitad
del total.
En la clase mediana hay 80 puntajes; 36 de ellos los dejamos hacia la
parte superior de la columna.
Como el intervalo de la clase mediana es 600 649, su lmite real
inferior es 599, 5 y su tamao es 50 puntos.
Treinta y seis ochentavos de 50 es lo que tenemos que agregar al
lmite real inferior par obtener la mediana.

Me

599, 5

Me

599, 5

36
80

22, 5

50

Me

622 puntos.

Luego el puntaje 622 que pertenece a la clase mediana, es el que divide


la distribucin en la mitad.
El proceso que hemos ralizado se llama "interpolacin".se busca un valor
entre dos polos que en este caso son 599, 5 y 649, 5.
En general:

Me

Lim r . Inf. cm
N
2

f accam
f Acm
t

Lim r . Inf. cm

N
2

f accam
f Acm

lmite real inferior de la clase mediana.


mitad del total de datos.
frecuencia acumulada de la clase anterior a la mediana.
frecuencia Absoluta de la clase mediana.
tamao del intervalo.

Ejm:
Calcule la mediana de la siguiente distribucin

Puntaje f

Frecuencia
acumulada

60 64

65 69

10

70 74

18

75 79 12

30

80 84 16

46

85 89

50

Gua N7

Mediana

1.- Determina la mediana de los datos siguientes.

i) 3 4, 5 6 8, 2 9 12 14

ii) 12 15, 3 17 21 23 25, 1 26, 5 28 28 30


iii) 17 3, 8 4, 9 5, 6 12, 3 16 19, 5 21

2.- Explica, a travs de un ejemplo numrico de datos no agrupados, que


la media aritmtica y la mediana de un conjunto de datos no son
necesariamente iguales.

3.- Escribe cinco nmeros naturales cuya media aritmtica y madiana sean
iguales.

4.- Determina la mediana de la estaturas de los estudiantes de 4Ao Medio


de un colegio,considerando los datos agrupados que aparecen en la tabla
del ejemplo del punto 7( Frecuencia Relativa).

6.- LA MODA.
Otra medida de tendencia central de un conjunto de datos es la moda
que denotaremos por Mo.

La moda de un conjunto de datos es aquel que tiene mayor frecuencia.


Es decir, es el valor que ms se repite.
Dependiendo los datos, es posible que la moda no exista y tambien que
pueda haber ms de una.
Ejm:
Hallar la moda de los datos: 2 3 3 3 5 8.

Mo

Hallar la moda de los datos: 1 2 2 2 2 4 5 6 6 6 6 7.


Mo 1

y Mo 2

Hallar la moda de los siguientes datos: 5 7,2 8 9 10,5 12 14.

No existe moda.

7.- LA MODA DE UN CONJUNTO DE DATOS AGRUPADOS.


En una distribucin de frecuencias la "clase modal" es la que tiene mayor
frecuencia.Dicha frecuencia es la "frecuencia modal".
Si d 1 es la diferencia entre la frecuencia de la clase modal y la frecuencia
de la clase anterior, d 2 es la diferencia entre la frecuencia modal y la
frecuencia de la clase posterior y t es el tamao de los intervalos, el valor de
la Mo de la moda se obtiene sumando al "lmite real inferior de la clase modal"
el producto del tamao de los intervalos por la fraccin d 1d 1d 2 .

Entonces tenemos que la moda es:

Mo

Lim r Inf

d1
d1 d2

Ejm:
Calculemos la moda de la distribucin de frecuencias de
los puntajes de la P.S.U.
Puntaje

Frecuencia
Absoluta

350 399

400 449

450 499

500 549

20

550 599

31

600 649

80

650 699

42

700 749

10

750 799

800 849

Clase Modal: 600

649

Lmite Real inferior de la clase modal: 599, 5


Frecuencia Modal: 80

Tamao del intervalo: t

50

d1
d1

80
49

31

d2
d2

80
38

42

49
49 38

Mo

599, 5

Mo
Mo

627, 7
628 puntos.

50

Podemos estimar, que el valor ms repetido de los puntajes de la P.S.U.


en estudio es aproximadamente 628 puntos.
En general cuando se calcula la moda a partir de datos agrupados,
encontramos un valor aproximado.
Ejm:
En el caso de las estaturas de los 80 estudiantes de 4 Medio a partir
de los datos no agrupados, la moda es Mo 1, 77m
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88
1,92 1,75 1,84 1,86 1,73 1,84 1,87 1,83
1,81 1,77 1,73 1,75 1,78 1,77 1,67 1,83
1,83 1,72 1,71 1,85 1,84 1,93 1,82 1,69
1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84
1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79
1,87 1,79 1,77 1,67 1,74 1,75 1,78 1,77
1,74 1,73 1,83 1,76 1,83 1,77 1,75 1,77
1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,76
1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77
Calcule a partir de los datos agrupados:
Intervalo

Frecuencia

1,65 1,69

1,70 1,74

12

1,75 1,79

30

1,80 1,84

22

1,85 1,89

1,90 1,94

2
18
18 8

Mo

1, 745

Mo

1, 78m , difiere levemente del

0, 05

valor obtenido a partir de los datos


no agrupados.

Si observamos globalmente el conjunto de los 212 resultados de la


P.S.U. de los alumnos de un liceo.
Vimos que : Me 622 puntos.
Calculamos : Mo 627, 7 puntos.
Si calculamos la media aritmtica, obtenemos: x 613, 7 puntos.
Estas tres medidas de tendencia central nos dan informacin sobre
el comportamiento de los datos que, en este caso, son puntajes de
la P.S.U.
Observacin: Un polgono de frecuencias se transforma en una curva
de frecuencias al considerar intervalos muy pequeos y
una gran cantidad de datos.Los lados del polgono pasan a ser tan
pequeos que aparecen como una curva.
En este caso diremos que el polgono se ha suavizado.

Si observramos la situacin anterior en una curva de frecuencias


obtenida al suavizar el polgono de frecuencias.
Obsevaramos que:
La mediana Me divide a la curva en dos partes de igual rea; en
este caso, la mitad de los alumnos tienen resultados de 622 puntos
e inferiores (izquierda del eje).
Los valores dee mayor frecuencia son superiores a la mediana.
Me y x difieren en 8,3 puntos ,de modo que la curva es levemente
asimtrica.

GuaN8

Moda

1.- Determina la moda de los puntajes de una prueba

i) Ordenando los datos no agrupados.

61 70 77 82 63 77 83 62 67 83
67 80 77 85 83 75 83 67 78 76
72 80 83 72 84 71 77 82 79 83
66 88 68 74 84 75 73 75 83 84
87 64 83 72 87 77 63 72 84 78

ii) A partir de datos agrupados.


Intervalo Frecuencia
60 64

65 69

70 74

75 79

12

80 84

16

85 89

2.- Utilizando el histograma correspondiente a los mismos datos del ejercicio


anterior que aparece en el punto 3 ( Histograma),encuentra el valor
aproximado de la Mo, agregndole las lneas que correspondan

5.- PERCENTILES, DECILES Y CUARTILES.

Ahora estudiaremos otros valores tpicos que dividen a un conjunto de


datos numricos en una cierta cantidad de partes.
Para los procedimientos de clculo utilizaremos datos agrupados en una
tabla de distribucin de frecuencias.
6.- PERCENTILES.

Los percentiles de una distribucin de datos numricos son los 99 valores


que la dividen en 100 partes iguales.
Los percentiles se denotan P 1 , P 2 , P 3 , P 4 , . . . P 99 .
P 1 percentil uno ; P 2 percentil dos , etc.

Ejm:

En la distribucin de notas de un grupo de alumnos, el percentil P 46


es una nota de referencia que permite afirmar que el 46% de esos
alumnos obtuvo esa nota o una menor.
Si calculamos un percentil de una distribucin de distancias,logradas
en el lanzamiento de la jabalina, ese percentil es una distancia.
El clculo de los percentiles de una distribucin lo haremos en forma similar
a la que usamos para calcular la mediana.
Observacin:
La mediana equivale al percentil 50.
Me P 50
Ejm:
Consideremos la distribucin de frecuencia de los 212 puntajes de la
P.S.U., para calcular el percentil 45, es decir P 45 .
Puntaje

Frecuencia Frecuencia
absoluta

acumulada

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

212

El 45% de los datos es 95,4.


La frecuencia acumulada hasta la clase anterior es 70, de modo que nos
faltan 95, 4 70 25, 4 datos de los 80 que y tiene la clase 600 649;
entonces, debemos agregarlos a su lmite real inferior.

P 45

599, 5

25,4
80

P 45

599, 5

15, 9

50

615, 4 puntos.

P 45

Este valor significa que el 45% de los alumnos obtuvo puntajes menores
o iguales a 615,4 puntos.

Considerando la misma distribucin de puntajes, calcule P 8 .

Calculemos que porcetaje de los 212 alumnos tuvieron resultados entre


620 y 680 puntos.

620 corresponde a un percentil que desconocemos y que denotaremos


por P x .
Sea P x 620 puntos, donde x es un porcentaje desconocido

Px

599, 5

620

212
100

70

80

2,12x
80

599, 5

50

50

48, 48%

Repetimos el procedimiento para P y

Py

649, 5

680

649, 5

212
100

150

42

50

2,12y 150
42

50

680 puntos.

82, 84%

As la diferencia entre ambos porcentajes corresponde al nmero de


alumnos que tienen entre 620 y 680 puntos.

82, 84%

48, 49%

34, 35
34, 4% de los alumnos.

7.- DECILES.

Los deciles de una distribucin de datos numricos son los nueve valores
que la dividen en 10 partes iguales.
Los deciles se denotan: D 1 , D 2 , D 3 , . . . , D 9 .
Ejm:
Consideremos la misma distribucin anterior de los 212 puntajes
de la P.S.U. y calculemos D 3.
Puntaje

Frecuencia Frecuencia
absoluta

acumulada

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

212

Para calcular el tercer decil D 3 tengamos en cuenta que corresponde


al 30% inferior de los datos de la distribucin

30% de 212

63, 6

Esta cantidad de datos corresponde a la clase 550 599, ya que su


frecuencia acumulada es 70 y la de la clase anterior es 39.

En otras palabras, hasta el lmite real inferior de la clase 550 599


tenemos 39 datos , de modo que es necesario agregar 24,6 datos ms,
para completar los correspondientes al decil D 3 .

D3

549, 5

24,6
31

549, 5

39, 7

50

589, 2 puntos.

El 30% de los 212 alumnos tiene un puntaje igual o menor que


D 3 589, 2 puntos

Calculemos D 7 (el sptimo decil)

70% de 212 148, 4


El lmite real inferior de la clase 600 649 es 599,5.

D7

599, 5
599, 5

78,4
80

50

49

648, 5 puntos.

Como hemos calculado D 3 589, 2 y D 7 648, 5 puntos, podemos


concluir que el 40% de los alumnos obtuvo entre 589,2 y 648,5 puntos.

8.- CUARTILES.

Los cuartiles de una distribucinde datos numricos son los 3 valores


que la dividen en 4 partes iguales.

Los cuartiles se denotan Q 1 , Q 2 y Q 3 .

Q 1 es el primer cuartil y corresponde al 25% inferior.


Q 2 es el segundo cuartil y corresponde al 50% inferior.
Q 3 es el tercer cuartil y correspondeal 75% inferior.

Los cuartiles se calculan de la misma forma que los percentiles y


deciles.

Ejm:
Calcule el tercer cuartil Q 3 de la ditribucin del ejemplo
anterior.

75% de 212 159 , frecuencia acumulada que corresponde


al intervalo 650 699.

9
42

Q3

649, 5

50

Q3

649, 5

Q3

660, 2 puntos.

10, 71

El 75% de los 212 alumnos tiene un puntaje igual o inferior a 660,2


puntos, lo que significa tambin que el 255 de los alumnos tiene un
puntaje superior a los 660,2 puntos.

Un curso rindi una prueba de Matemtica, qu podemos decir


del resultado si sabemos que en la distribucin de notas Q 2 5, 8 y
Q 3 6, 5
Podemos afirmar que el 50% del curso obtuvo una calificacin superior
a 5,8 y el 25% mejor preparado logr notas superiores a 6,5.

Gua N8

Percentiles , Deciles y Cuartiles

1.- A partir de los datos entregados en esta distribucin de los puntajes


obtenidos por 50 alumnos, calcula :

Intervalo Frecuencia Frecuencia


absoluta

acumulada

60 64

65 69

10

70 74

18

75 79

12

30

80 84

16

46

85 89

50

i) P 10

ii) P 90

iii) Q 1

iv) Q 3

2.- En la misma distribucin calcula la diferencia x

Me

3.- De acuerdo con la distribucin de puntajes de la P.S.U., que se


indica:
Puntaje

Frecuencia Frecuencia
absoluta

acumulada

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

212

i) Calcula P 5 y P 95 .

ii) Determina a que percentil corresponde el valor 582,4 puntos.

iii) Qu porcentaje de los 212 alumnos obtuvieron entre 400 y 600

puntos.

4.- Qu significa que un alumno haya obtenido un puntaje superior


al noveno decil D 9 en un cuestionario de intereses cientficos.

5.- Explica cmo puede interpretarse el resultado de un alumno en el


examen de Matemtica si obtuvo una nota muy cercana a la
mediana de las notas del curso.

6.- MEDIDAS DE DISPERSION.

Estudiaremos ahora algunas de las llamadas medidas de dispersin:


rango, desviacin media, desviacin tpica o estndar.

Medidas de dispersin son valores tpicos de cada conjunto de datos


que expresan la forma en que ellos se alejan con respecto a cierto valor,
que generalmente , es la media aritmtica.
1.- RANGO.
El rango de un conjunto de datos numricos es la diferencia entre
el mayor y el menor de ellos.

Ejm:
Un alumno obtuvo las siguientes notas parciales en Matemtica:
2 ; 3,9 ; 5 ; 5,9 ; 6,2. Calculemos el rango.

Rango

6, 2
4, 2

Qu significado tiene el rango de notas 4,2 respecto de las notas


de otro alumno cuyo rango es 2,1?

En el primer caso las notas estan ms dispersas que en el segundo.

No sabemos en que caso son mejores; para determinarlo debemos


disponer de ms informacin .

2.- LA DESVIACIN MEDIA.

Ejm:
Consideremos las notas de Matemtica del ejemplo anterior:
2 ; 3,9 ; 5 ; 5,9 y 6,2.

Su media aritmtica es x 4, 6
Si calculamos la diferencia de una nota con la media aritmtica x 4, 6
tendremos la desviacin de esa nota conrespecto a x.
Las desviaciones de todas las notas con respecto a x se indican en la
siguiente tabla:
Nota Desviacin
x

2,0

2,6

3,9

0,7

5,0

0,4

5,9

1,3

6,2

1,6

Sumemos las desviaciones de todas las notas relativas a


su media aritmtica.
2, 6
0, 7 0, 4 1, 3 1, 6 0
En general,
La desviacin de un puntaje x con respecto a la media aritmtica x
esta dada por la diferencia
d x x

La suma de las desviaciones de todos los datos con respecto a su


media aritmtica es cero.

Ejm:
Calculemos ahora la media aritmtica de los valores absolutos
de las desviaciones del ejemplo anterior:

2,6

0,7

0,4
5

1,3

1,6

1, 32

El valor 1,32 es la desviacin media de todas las notas dadas.

En general,

La desviacin media de n datos numricos x 1 , x 2 , . . . x n es la media


aritmtica de los valores absolutos de las desviaciones de todos
los datos con respecto a x . La denotaremos por DM.
k n

DM

1
n

xk

k 1

7.- LA DESVIACION MEDIA DE DATOS AGRUPADOS.

Recordemos que los datos agrupados que pertenecen a una clase se


consideran iguales a la respectiva marca de clase.

Ejm:
El procedimiento de clculo, aplicado a la tabla de distribucin de
frecuencias de los puntajes de la P.S.U. con x 614 , es el siguiente:

Puntaje

Marca de

Desviacin

clase x

Frecuencia

350 399

375

239

956

400 449

425

189

1.134

450 499

475

139

1.251

500 549

525

89

20

1.780

550 599

575

39

31

1.209

600 649

625

11

80

880

650 699

675

61

42

2.562

700 749

725

111

10

1.110

750 799

775

161

1.288

800 849

825

211

422

212

12.592

Si
es:

DM

DM
DM

212 y

12. 592 , entonces la desviacin media

f x x
f

12.592
212

59, 396 puntos.

Podemos decir que los puntajes se desvan, en promedio, 59,4 puntos


con respecto a la media.Hay que considerar que algunos puntajes son
inferiores a ella y otros superiores.

Si los puntajes estuvieran ms agrupados en torno a x , es decir,menos


dispersos, el valor de DM sera menor.

8.- LA DESVIACION TIPICA O ESTANDAR.

Otra importante medida de dispersin es la desviacin tpica,que


denotaremos con la letra
s.
La desviacin tpica o estndar expresa el grado de dispersin de los

datos con respecto a x y corresponde a la raz cuadrada de la media


del cuadrado de las desviaciones de dichos datos con respecto a su
media aritmtica.

xk x
n

Ejm:
Calculemos la desviacin tpica de las siguientes notas de
Matemtica.
Notas : 2 ; 3,9 ; 5 ; 5,9 ; 6,2.

4, 6

2 4,6

3,9 4,6

5 4,6
5

6,76 0,49 0,16 1,69 2,56


5

11,66
5

2, 332

5,9 4,6

6,2 4,6

1, 53

En el ejemplo, la nota menor es 2 y se encuentra casi 1,7 desviaciones


tpicas por debajo de x, que es 4,6.Si de estas notas descartramos el 2, la nota ms alejada de x, entonces
la desviacin tpica sera
s 0, 9 ; este valor es menor que 1,53.
Las notas consideradas sin la nota 2 tendran una dispersin menor, es
decir, estaran ms centradas.

Calculemos la desviacin tpica s de las siguientes notas:


5,2 ; 4,9 ; 5,0 ; 5,1 ; 5,2 ; 5,3 ; 4,9 ; 5,2.

Calculamos x

5, 1 ;

0,16
8

0, 02 ;

0, 14.

9.- LA DESVIACION TIPICA DE DATOS AGRUPADOS.

En una distribucin de frecuencias en la que los intervalos son de


igual tamao, podemos aplicar el mtodo abreviado para el clculo
de la desviacin tpica, tal como lo hicimos en el clculo de la media
aritmtica.

La frmula para datos no agrupados


x x

s
, si
n
los datos tienen frecuencia f , se expresa:

fx x
n

Esta expresin se puede transformar en:

f e2
n

fe

La frmula anterior permite calcular la desviacin tpica de datos


agrupados en intervalos iguales,con un mtodo abreviado, como
veremos a continuacin.

Ejm:

Consideremos los puntajes de la P.S.U. correspondientes a


los 212 alumnos que venimos analizando y calculemos la desviacin
tpica.

Puntaje

Marcade

f e2

f e

clase x
350 399

375

20

100

400 449

425

24

96

450 499

475

27

81

500 549

525

20

40

80

550 599

575

31

31

31

600 649

625

80

650 699

675

42

42

42

700 749

725

10

20

40

750 799

775

24

72

800 849

825

212

f e

48

32
f e

574

Reemplazando los datos obtenidos en la tabla en la frmula tenemos:

48 2
212

574
212

50

50

50 1, 6298

81, 49

Entonces

2, 7075

0, 0513

81, 49 puntos.

La desviacin tpica podemos usarla como referencia para analizar como


se distribuyen los datos, en este caso,puntajes de la P.S.U.,en relacin a
la media aritmtica.

Si analizamos la columna de las frecuencias en la tabla de distribucin,


veremos que la mayora de los puntajes se distribuyen entre:
x 2s y x 2s, es decir entre 450, 7 y 776, 7.
Son pocos los alumnos que obtuvieron menos de 450,7 o ms de 776,7.

Si descartamos de la distribucin los puntajes de los dos intervalos


inferiores y de los dos superiores, que contienen los puntajes ms
alejados de x , el valor de la desviacin tpica disminuye .

Al hacer el nuevo clculo de s podemos usar la misma tabla de


distribucin, sin considerar las dos primeras y las dos ltimas filas.
El nuevo valor de n
f 212
s es ahora 59 puntos.
Podemos comprobar que el valor de
As los datos estan ms centrados, es decir, menos dispersos con
respecto a su media x.

10.- LA DESVIACIN TPICA EN UNA DISTRIBUCIN NORMAL.

Si consideramos una variable continua y establecemos las frecuencias


con las que se presenta cada dato aleatorio y suficientemente grande,
obtendremos una curva de frecuencias de forma acampanada y simtrica
con respecto a la media aritmtica.
La curva normal se conoce tambin como campana o curva de Gauss.

La forma en que se dispersan los datos considerados influyen en la


desviacin tpica.
La desviacin tpica es la medida de dispersin ms utilizada.Su valor,
siempre positivo, se mide en las mismas unidades que los datos.

11.- LA VARIANZA.

La varianza 2 se define como la media aritmtica de las diferencias


al cuadrado de cada dato respecto de la media de todos ellos .Es decir:

xk x
n

x2

k
2
o
x2
n
Para datos agrupados cualquiera de las tres expresiones siguientes:

i)

f k x 2k

fk

ii)

fk xk x

fk

iii)

xk

x 2frk

Este parmetro estadstico, al elevar al cuadrado las diferencias de los


datos respecto de la media, hace que los valores ms alejados de la
media tengan mayor contribucin.Como consecuencia, distingue mejor
que la amplitud la variabilidad de dos conjuntos de datos.

11.- COEFICIENTE DE VARIACIN CV

No siempre una mayor desviacin tpica indica mayor dispersin.La


naturaleza de los datos puede hacer que la comparacin absoluta
entre desviaciones tpicas carezca de sentido.

Por ejemplo, no parece lgico comparar directamente la desviacin


tpica de la estatura de 50 recien nacidos con la desviacin tpica de
la estatura de sus madres.Sin embargo,podramos estar interesados
en una comparacin relativa de ambas.

Para medir la dispersin relativa de dos conjuntos de datos,puede


utilizarse el coeficiente de variacin, que se define como:

Coeficiente de Variacin CV

El conjunto de datos con mayor coeficiente de variacin es el ms


heterogneo.

GuaN9

Medidas de Dispersin

1.- Un grupo de alumnos obtuvo las siguientes marcas en salto con garrocha
expresada en metros : 2,50 ; 2,80 ; 2,60 ; 3,00 ; 2,90.

i) Comprueba que la suma de las desviaciones de estos datos respecto a x


es 0.
ii) Calcula la desviacin media de los datos.

2.- Calcula las desviaciones tpicas de las notas de las tres asignaturas,
a partir determinadas en el ejercicio 2 i) de la Gua N4 Qu concluyes
respecto a la dispersin de las notas, en cada caso?

3.- La tabla de distribucin de frecuencias muestra la puntuacin obtenida


por 1800 alumnos de 5 a 8 Bsico en un cuestionario sociomtrico.

Puntaje Frecuencia
02

21

35

50

68

110

9 11

241

12 14

423

15 17

457

18 20

275

21 23

134

24 26 66
27 29 23
i) Calcula la desviacin tpica de la distribucin.
ii) A qu cantidad de puntos corresponden los valores de x s y
x s?
iii) Calcula qu porcentaje de alumnos obtuvo puntajes entre
x 2s y x 2s.
Compralo con el porcentaje respectivo de una distribucin normal.

4.- Una empresa ganadera tiene 3 tipos de vacas lecheras.Se tomaron tres
muestras de las distintas razas con 10 vacas por grupo.Cada vaca
produjo los siguientes litros de leche en un da:

Raza A Raza B Raza C


13,5

15

25,1

13,8

22,2

28,2

13,9

26,8

23,8

23,2

25

27,6

16,8

13,2

21,7

18,3

10,9

10,8

20,2

12,5

25

20,5

18,9

24,2

22,3

23,8

21,7

18,9

25,6

18,2

i) Calcula la media y la desviacin tpica de la produccin lechera de


cada grupo.

ii) Qu tipo de vaca produce ms leche?

iii) Qu vaca es ms fiable en la produccin?

Você também pode gostar