Você está na página 1de 45

Definicin de Estadstica La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para

poder hacer comparacione s y sacar conclusiones. Un estudio estadstico consta de las siguientes fases: Recogida de datos. Organizacin y representacin de datos. Anlisis de datos. Obtencin de conclusiones. Conceptos de Estadstica Poblacin Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo Un individuo o unidad estadstica es cada uno de los elementos que compone n la poblacin. Muestra Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo E l mu e s t r e o e s l a r e u n i n d e d a t o s q u e s e d e s e a e s t u d i a r , o b t e n i d o s d e una proporcin reducida y representativa de la poblacin. Valor Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanza mos una moneda al aire 5 veces obtene mos dos valores: cara y cruz. Dato

Un dato es cada uno de los valores que se ha obtenido al realizar un estudio e stadsti co. Si lanza mo s una mo neda al aire 5 veces obte ne mo s 5 datos: cara, cara, cruz, cara, cruz. Definicin de variable Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. Tipos de variable estadsticas Variable cualitativa Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemo s distinguir dos tipos: V a r i a b l e c u a l i t a t i v a n o mi n a l U n a v a r i a b l e c u a l i t a t i v a n o mi n a l p r e s e n t a m o d a l i d a d e s n o n u m r i c a s que no ad miten un criterio de orden . Por ejemp lo: El estado civil, con las siguientes mod alidades: soltero, casado,

separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no nmericas , en las que e xiste un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce. Variable cuantitativa Una variable cuantitativa es la que se e xpresa mediante un nmero , por t a n t o s e p u e d e n r e a l i z a r o p e r a c i o n e s a r i t m t i c a s c o n e l l a . P o d e m o s d i s t i n g u i r dos tipos: Variable discreta Una variable discreta es aquella que to ma valores aislados, es d ecir no admite valores inter me dios entre dos valores especficos. Por ejemplo:

El nmero de her ma nos de 5 amigo s: 2, 1, 0, 1, 3. Variable continua Una variable continua es aquella que puede tomar valores

c o mp r e n d i d o s e n t r e d o s n m e r o s . P o r e j e m p l o : La alt ura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero ta mbin se podra dar con tres decimales. Distribucin de frecuencias La distribucin de frecuencias o tabla de frecuencias es una

ordenacin en for ma d e tabla de los datos estadsticos , asigna ndo a cada dato su frecuencia correspondiente. Tipos de frecuencias Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un

determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de d atos, que se representa por N.

Para indicar resumida mente estas sumas se utiliza la letra griega (sigma ma ysc ula) que se lee suma o suma toria.

Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Frecuencia acum ulada L a f r e c u e n c i a a c u m u l a d a e s l a s u ma d e l a s f r e c u e n c i a s a b s o l u t a s d e todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Frecuencia relativa acumulada L a f r e c u e n c i a r e l a t i v a a c u mu l a d a e s e l c o c i e n t e e n t r e l a f r e c u e n c i a acumulada de un dete r minado valor y el nmero total de datos . Se puede expresar en tantos por ciento. Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes te mperaturas m ximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a ma yor, e n la segunda hace mos el rec uento y e n la tercera a nota mos la frecuencia absoluta. xi Recuento fi Fi ni Ni

27

0.032

0.032

28

II

0.065

0.097

29

0.194

0.290

30

16

0.226

0.516

31

24

0.258

0.774

32

III

27

0.097

0.871

33

III

30

0.097

0.968

34

31

0.032

31

Este tipo de tablas de frecuencias se utiliza con variables discretas. Distribucin de frecuencias agrupadas La distribucin de frecuencias agrupadas o tabla con datos agrupados se e mplea si las variables to ma n un n mero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma a mplitud deno minados clases. A cada clase se le asigna su frecuencia correspo ndiente . Lmites de la clase C a d a c l a s e e s t d e l i m i t a d a p o r e l l mi t e i n f e r i o r d e l a c l a s e y e l l m i t e superior de la clase. Amplitud de la clase La a mplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase L a ma r c a d e c l a s e e s e l p u n t o m e d i o d e c a d a i n t e r v a l o y e s e l v a l o r q u e representa a todo el intervalo para el clculo de algunos par metros . Construccin de una tabla de datos agrupados 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Se localizan los va lores menor y ma yor de la distribucin. En este caso son 3 y 48. 2 Se restan y se busca un nmero entero un poco ma yor que la diferencia y que sea divisible por el nmero de intervalo s quera mos establecer. Es conve nie nte que el nmero de inter valos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incre me nta mo s e l nmero hasta 50 : 5 = 10 intervalos. Se for man los intervalos teniendo prese nte q ue el lmite inferior de una clase pertenece al inter valo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo. ci fi Fi ni Ni

[0, 5)

2.5

0.025

0.025

[5, 10)

7.5

0.025

0.050

[10, 15)

12.5

0.075

0.125

[15, 20)

17.5

0.075

0.200

[20, 25)

22.5

11

0.075

0.275

[25, 30)

27.5

17

0.150

0.425

[30, 35)

32.5

24

0.175

0.600

[35, 40)

37.5

10

34

0.250

0.850

[40, 45)

42.5

38

0.100

0.950

[45, 50)

47.5

40

0.050

40

D i a g r a ma d e b a r r a s

Un diagra ma de barra s se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto . Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las

f r e c u e n c i a s a b s o l u t a s o r e l a t i v a s o a c u mu l a d a s . Los datos se representan media nte barras de una altura proporcional a la frecuencia. Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el siguiente resultado:

Grupo fi sanguneo

AB

20

Polgonos de frecuencia Un polgono de frec uencias se for ma uniendo los extre mos de las barras mediante seg me ntos. T ambin se puede re alizar trazando los puntos que representan las frecuencias y unindolos mediante seg mentos . Ejemplo Las te mperaturas e n un da de otoo de una ciudad ha n sufrido las siguientes variaciones:

Hora

Temperatura

12

12

14

15

11

18

12

21

10

24

U n d i a g r a ma d e s e c t o r e s s e p u e d e u t i l i z a r p a r a t o d o t i p o d e v a r i a b l e s , pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente.

El diagra ma circ ular se construye con la a yuda de un transportador de ngulos. Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 4 juegan al ftbol y el resto no practica ning n deporte.

Alumno s

ngulo

Baloncesto

12

144

Natacin

36

Ftbol

108

Sin deporte

72

Total

30

360

U n h i s t o g r a ma e s u n a r e p r e s e n t a c i n g r f i c a d e u n a v a r i a b l e e n f o r m a de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases.

En el eje abscisas se construyen unos rectngulos que tienen por base la a mp l i t u d d e l i n t e r v a l o , intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Polgono de frecuencia P a r a c o n s t r u i r e l p o l g o n o d e f r e c u e n c i a s e t o m a l a ma r c a d e c l a s e q u e coincide con el punto medio de cada rectngulo. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla: ci fi Fi y por altura, la frecuencia absoluta de cada

[50, 60)

55

[60, 70)

65

10

18

[70, 80)

75

16

34

[80, 90)

85

14

48

[90, 100)

95

10

58

[100, 110)

110

63

[110, 120)

115

65

65

H i s t o g r a ma y p o l g o n o d e f r e c u e n c i a s a c u m u l a d a s Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el h i s t o g r a ma de frecuencias acumuladas o su

correspondiente polgono.

H i s t o g r a ma s c o n i n t e r v a l o s d e a mp l i t u d d i f e r e n t e P a r a c o n s t r u i r u n h i s t o g r a ma s c o n i n t e r v a l o d e a m p l i t u d d i f e r e n t e t e n e m o s q u e c a l c u l a r l a s a l t u r a s d e l o s r e c t n g u l o s d e l h i s t o g r a ma .

hi es la altura del intervalo. fi es la frecuencia del intervalo. ai es la a mplitud del intervalo. Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresalie nte ) obtenidas por un grup o de 50 alumno s. fi hi

[0, 5)

15

[5, 7)

20

10

[7, 9)

12

[9, 10)

50

Definicin de parmetro estadstico Un par metro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica . L o s p a r me t r o s e s t a d s t i c o s s i r v e n p a r a s i n t e t i z a r l a i n f o r m a c i n d a d a por una tabla o por una grfica. T i p o s d e p a r me t r o s e s t a d s t i c o s Hay tres tipos par metros estadsticos : De centralizacin. De posicin De dispersin. Medidas de centralizacin Nos indican e n torno a qu valor (centro) se distribuye n los datos. La medidas de centralizacin son: Media aritmtica L a m e d i a e s e l v a l o r p r o me d i o d e l a d i s t r i b u c i n . Mediana L a me d i a n a e s l a p u n t a c i n d e l a e s c a l a q u e s e p a r a l a m i t a d s u p e r i o r de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales.

Moda L a m o d a e s e l v a l o r q u e m s s e r e p i t e e n u n a d i s t r i b u c i n . Medidas de posicin Las medidas de posicin dividen un co njunto de da tos en grupos co n el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn o r d e n a d o s d e me n o r a m a y o r . La medidas de po sici n son: Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales. Deciles Los deciles dividen la serie de datos en diez partes iguales. Percentiles Los percentiles dividen la serie de datos en cien partes iguales. Medidas de dispersin Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medida s de dispersin son: Rango o recorrido E l r a n g o e s l a d i f e r e n c i a e n t r e e l ma y o r y e l m e n o r d e l o s d a t o s d e u n a distribucin estadstica. Desviacin media L a d e s v i a c i n me d i a e s l a m e d i a a r i t m t i c a d e l o s v a l o r e s a b s o l u t o s d e l a s d e s v i a c i o n e s r e s p e c t o a l a me d i a . Varianza L a v a r i a n z a e s l a m e d i a a r i t m t i c a d e l c u a d r a d o d e l a s d e s v i a c i o n e s r e s p e c t o a l a me d i a .

Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. Definicin de moda La moda es el valor que tiene mayor frecuencia absoluta . Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. H a l l a r l a mo d a d e l a d i s t r i b u c i n : 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 S i e n u n g r u p o h a y d o s o v a r i a s p u n t u a c i o n e s c o n l a m i s ma f r e c u e n c i a y esa frecue ncia es la mxima, la distribuci n es bimo dal o multimodal, es d e c i r , t i e n e v a r i a s mo d a s . 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 S i d o s p u n t u a c i o n e s a d y a c e n t e s t i e n e n l a f r e c u e n c i a m x i ma , l a m o d a es el pro medio de las dos puntuacione s ad yace ntes. 0, 1, 3, 3, 5, 5, 7, 8Mo = 4 C l c u l o d e l a mo d a p a r a d a t o s a g r u p a d o s 1 Todos los intervalos tienen la misma amplitud.

Li es el lmite inferior de la clase modal. fi es la frecue ncia absoluta de la clase modal. fi--1 es la frecue ncia absoluta inmediata me nte inferior a la clase modal. fi-+1 es la frecue ncia absoluta inmediata me nte posterior a la clase mo dal. ai es la a mplitud de la clase. T a m b i n s e u t i l i z a o t r a f r mu l a d e l a m o d a q u e d a u n v a l o r a p r o x i m a d o de sta:

Ejemplo C a l c u l a r l a mo d a d e u n a d i s t r i b u c i n e s t a d s t i c a q u e v i e n e d a d a p o r l a siguiente tabla: fi

[60, 63)

[63, 66)

18

[66, 69)

42

[69, 72)

27

[72, 75)

100

2 Los intervalos tienen amplitudes distintas. En primer lugar tene mo s que hallar la s altura s.

La clase modal es la que tiene ma yor altura.

L a f r m u l a d e l a mo d a a p r o x i ma d a c u a n d o e x i s t e n d i s t i n t a s a m p l i t u d e s es:

Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda. fi hi

[0, 5)

15

[5, 7)

20

10

[7, 9)

12

[9, 10)

50

Definicin de mediana Es el valor que ocupa el lugar central de todos los datos cuando stos e s t n o r d e n a d o s d e m e n o r a ma y o r . La mediana se representa por M e. La mediana se puede hallar slo para variables cuantitativas. C l c u l o d e l a me d i a n a 1 O r d e n a mo s l o s d a t o s d e me n o r a ma y o r .

2 Si la serie tiene un n mero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 C l c u l o d e l a me d i a n a p a r a d a t o s a g r u p a d o s La mediana se encuentra en el intervalo donde la frecuencia acumulada l l e g a h a s t a l a m i t a d d e l a s u ma d e l a s f r e c u e n c i a s a b s o l u t a s . Es decir tene mos que b uscar el intervalo en el que se enc uentre .

Li es el lmite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase media na. ai es la a mplitud de la clase. La mediana es independiente de las a mplitudes de los intervalos. Ejemplo Calcular la mediana d e una distrib ucin estadstica que viene dada por la siguiente tabla: fi Fi

[60, 63)

[63, 66)

18

23

[66, 69)

42

65

[69, 72)

27

92

[72, 75)

100

100 100/2 = 50 Clase de la media na: [66, 69)

Definicin de m edia aritm tica La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos. e s e l s m b o l o d e l a m e d i a a r i t m t i c a .

Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

M e d i a a r i t m t i c a p a r a d a t o s a g r u p a d o s Si los datos vienen agrupados en una tabla de frecuencias, la expresin d e l a me d i a e s :

Ejercicio de media aritmtica En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media . xi fi xi fi

[10, 20)

15

15

[20, 30)

25

200

[30,40)

35

10

350

[40, 50)

45

405

[50, 60

55

440

[60,70)

65

260

[70, 80)

75

150

42

1 820

P r o p i e d a d e s d e l a m e d i a a r i t m t i c a 1 . L a s u ma d e l a s d e s v i a c i o n e s d e t o d a s l a s p u n t u a c i o n e s d e u n a d i s t r i b u c i n r e s p e c t o a l a me d i a d e l a m i s m a i g u a l a c e r o .

La suma de las desviac iones de los nmeros 8 , 3, 5, 12, 10 de su me dia aritmtica 7.6 es igual a 0: 8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 = = 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0

2 . L a s u ma d e l o s c u a d r a d o s d e l a s d e s v i a c i o n e s d e l o s v a l o r e s d e l a v a r i a b l e c o n r e s p e c t o a u n n m e r o c u a l q u i e r a s e h a c e m n i m a c u a n d o d i c h o n m e r o c o i n c i d e c o n l a me d i a a r i t m t i c a .

3 . S i a t o d o s l o s v a l o r e s d e l a v a r i a b l e s e l e s s u ma u n m i s m o n m e r o , l a m e d i a a r i t m t i c a q u e d a a u me n t a d a e n d i c h o n m e r o . 4. Si todos los va lores de la variable se multiplica n por un mismo nmero la media aritmtica queda multiplicada por dicho nmero. O b s e r v a c i o n e s s o b r e l a me d i a a r i t m t i c a 1 . L a me d i a s e p u e d e h a l l a r s l o p a r a v a r i a b l e s c u a n t i t a t i v a s . 2 . L a me d i a e s i n d e p e n d i e n t e d e l a s a m p l i t u d e s d e l o s i n t e r v a l o s . 3. La media es muy sensible a las puntuaciones extre ma s . Si te ne mos una distribucin con los siguientes pesos: 65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es igual a 7 4 kg, que es una medida de centralizacin poco representativa de la distribucin. 4. La media no se p uede calcular si hay un intervalo con una a mplitud indeterminada. xi fi

[60, 63)

61.5

[63, 66)

64.5

18

[66, 69)

67.5

42

[69, 72)

70.5

27

[72, )

100

En este caso no e s posible hallar la me dia porque no podemo s calc ular la marca de clase de ltimo inter valo. Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 deter mina n los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Clculo de los cuartiles 1 O r d e n a mo s l o s d a t o s d e me n o r a ma y o r . 2 Busca mos el lugar que ocupa cada cuartil mediante la expr esin . Nmero impar de datos 2, 5, 3, 6, 7, 4, 9

Nmero par de datos 2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados En primer lugar busca mo s la clase donde se encue ntra , en la tabla de las frecuencias acumuladas .

Li es el lmite inferior de la cla se donde se encuentra el cuartil. N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la a mplitud de la clase. Ejercicio de cuartiles Calcular los cuartiles de la distribucin de la tabla: fi Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65 Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana. Clculo de los deciles En primer lugar busca mo s la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase el decil.. ai es la a mplitud de la clase. Ejercicio de deciles Calcular los deciles de la distribucin de la tabla: fi Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65 Clculo del primer decil

Clculo del segundo decil

Clculo del tercer decil

Clculo del cuarto decil

Clculo del quinto decil

Clculo del sexto decil

Clculo del sptimo decil

Clculo del octavo decil

Clculo del noveno decil

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana. Clculo de los percentiles En primer lugar busca mo s la clase donde se encuentra

, en la tabla de las frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del percentil. ai es la a mplitud de la clase. Ejercicio de percentiles Calcular el percentil 35 y 60 de la distribucin de la tabla: fi Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65 Percentil 35

Percentil 60

D e s v i a c i n r e s p e c t o a l a me d i a L a d e s v i a c i n r e s p e c t o a l a me d i a e s l a d i f e r e n c i a e n v a l o r a b s o l u t o e n t r e c a d a v a l o r d e l a v a r i a b l e e s t a d s t i c a y l a me d i a a r i t m t i c a . Di = |x - x| Desviacin media La desviacin media es la media aritmtica de los valores absolutos de l a s d e s v i a c i o n e s r e s p e c t o a l a me d i a . L a d e s v i a c i n me d i a s e r e p r e s e n t a p o r

Ejemplo Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin d e l a d e s v i a c i n me d i a e s :

Ejemplo Calcular la desviacin media de la distribucin: xi fi xi fi |x - x| |x - x| fi

[10, 15)

12.5

37.5

9.286

27.858

[15, 20)

17.5

87.5

4.286

21.43

[20, 25)

22.5

157.5

0.714

4.998

[25, 30)

27.5

110

5.714

22.856

[30, 35)

32.5

65

10.714

21.428

21

457.5

98.57

L a v a r i a n z a e s l a me d i a a r i t m t i c a d e l c u a d r a d o d e l a s d e s v i a c i o n e s r e s p e c t o a l a me d i a d e u n a d i s t r i b u c i n e s t a d s t i c a . La varianza se representa por .

Varianza para datos agrupados

Para simplificar el clc ulo de la varianza va mos o utilizar la s siguie ntes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla: xi fi xi fi xi2 fi

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

Propiedades de la varianza 1 La varianza ser sie mpre un valor positivo o cero , en e l caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un n mero la varianza no vara. 3 Si todos los valores de la variable se multiplican por un nmero la v a r i a n z a q u e d a m u l t i p l i c a d a p o r e l c u a d r a d o d e d i c h o n me r o . 4 Si tene mos varias distribuciones con la misma media y co noce mos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo ta ma o:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza 1 La varianza , al igual que la media, es un ndice muy se nsible a las puntuaciones extremas. 2 En los casos que no se pueda hallar la media ta mpoco ser posible hallar la varianza. 3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado. La desviacin tpica es la raz cuadrada de la varianza . Es decir, la raz cuadrada de la media de los cuadrados de las

puntuaciones de desviacin. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo va mo s o utilizar las siguie nte s expresio nes que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla: xi fi xi fi xi2 fi

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60)

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

Propiedades de la desviacin tpica 1 La desviacin tpica ser sie mpre un valor positivo o cero , en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un n mero la desviacin tpica no vara. 3 Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4 Si tene mos varias distribuciones con la misma media y co noce mos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Si todas las muestras tienen el mismo ta ma o:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica 1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media ta mpoco ser posible hallar la desviacin tpica. 3 Cuanta ms pequea sea la desviacin tpica ma yor ser la

c o n c e n t r a c i n d e d a t o s a l r e d e d o r d e l a me d i a . Coeficiente de variacin El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media .

El coeficiente de variacin se suele expresar en porcentajes:

El coeficiente de variacin permite co mpara r las disper siones de dos distribucione s distintas, sie mpre que sus me dias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se co mpara n entre s. L a ma y o r d i s p e r s i n c o r r e s p o n d e r a l v a l o r d e l c o e f i c i e n t e d e v a r i a c i n mayor. Ejercicio Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 24. Cul de las dos presenta ma yor dispersin?

La primera distribuc in presenta ma yor dispersin. Puntuaciones tpicas Puntuaciones diferenciales Las puntuaciones diferenciales resultan de restarles a las puntuaciones d i r e c t a s l a me d i a a r i t m t i c a . xi = Xi X

Puntuaciones tpicas Las puntuaciones tpicas son el resultado de dividir las puntuaciones diferenciales entre la desviacin tpica . Este proceso se llama tipificacin. Las puntuaciones tpicas se representan por z.

Observaciones sobre puntuaciones tpicas L a m e d i a a r i t m t i c a d e l a s p u n t u a c i o n e s t p i c a s e s 0 . La desviacin tpica de las puntuaciones tpicas es 1. Las puntuaciones tpicas son adimensionales, es decir, son

independientes de las unidades utilizadas. L a s p u n t u a c i o n e s t p i c a s s e u t i l i z a n p a r a c o mp a r a r l a s p u n t u a c i o n e s obtenidas en distintas distribuciones. Ejemplo En una clase ha y 15 alumno s y 20 alumna s. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 52.4 kg. Las desviaciones tpicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de Jos es de 70 kg y el de Ana es 65 kg. Cul de ellos puede, dentro del grupo de alumnos de su sexo, considerarse ms grueso?

Jos es m s gr ueso resp ecto de su grupo que Ana respecto al suyo. Estadstica, Estadstica descriptiva, conceptos, definiciones, apuntes, frmulas, teora, ejemplos prcticos, ejercicios y problemas resueltos. 2 3 4 de ESO, 1 de Bachillerato. 1. Indica que variables son cualitativas y cuales cuantitativas: 1 Co mida Favorita. 2 Profesin que te gusta. 3 Nmero de goles marcados por tu equipo favorito en la ltima te mporada. 4 Nmero de alumnos d e tu Instituto. 5 El color de los ojos de tus co mpa eros de clase.

6 Coeficiente inte lectual de tus co mpaeros d e clase. 2. De las siguientes variables indica cules son discretas y cuales continuas. 1 Nmero de acciones vendidas cada da en la Bolsa. 2T emperaturas registra das cada hora en un observatorio. 3 Perodo de duracin de un automvil. 4 El dimetro de las ruedas de va rios coches. 5 Nmero de hijos de 50 fa milias. 6 Censo anual de los espaoles. 3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas. 1 La nacionalidad de una persona. 2 Nmero de litros de agua contenidos e n un depsito. 3 Nmero de libros en un e stante de librera. 4 Suma de puntos te nidos en el lanza mie nto de un par de dados. 5 La profesin de una persona. 6 El rea de las distintas baldosas de un edificio. 4. Las puntuaciones obtenidas por un grupo en una prue ba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribucin de frecuencias y dibuja el polgono de frecuencias. 5. El nmero de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribucin de frecue ncias y dibuja el diagrama de barras. 6. Las calificacio nes de 50 alumnos e n Mate m tica s han sido las siguientes:

5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. C o n s t r u i r l a t a b l a d e d i s t r i b u c i n d e f r e c u e n c i a s y d i b u j a e l d i a g r a ma de barras. 7. Los pesos de los 65 empleados de una fbrica viene n dados por la siguiente tabla: Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)

fi

10

16

14

10

1 Construir la tabla de frecuencias. 2 R e p r e s e n t a r e l h i s t o g r a ma y e l p o l g o n o d e f r e c u e n c i a s . 8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Construir la tabla de frecuencias. 2 Dibujar el histograma y el polgono de frecuencias . 9. Sea una distribucin estadstica que viene dada por la siguiente tabla: xi 61 64 67 70 73

fi

18 Calcular:

42

27

1 L a mo d a , me d i a n a y m e d i a . 2 E l r a n g o , d e s v i a c i n me d i a , v a r i a n z a y d e s v i a c i n t p i c a . 10.Calcular la media, la mediana y la mo da de la siguiente serie de nmeros: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. 11 Hallar la varianza y la desviacin tpica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5.

1 2 H a l l a r l a me d i a , m e d i a n a y mo d a d e l a s i g u i e n t e s e r i e d e n m e r o s : 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. 13. Hallar la desviaci n media, la varianza y la desviacin tpica de la series de nmeros siguientes: 2, 3, 6, 8, 11. 12, 6, 7, 3, 15, 10, 18, 5. 14 Se ha aplicado un te st a los e mpleados de una fbrica, obteni ndose la siguiente tabla: fi

[38, 44)

[44, 50)

[50, 56)

15

[56, 62)

25

[62, 68)

18

[68, 74)

[74, 80)

D i b u j a r e l h i s t o g r a ma y e l p o l g o n o d e f r e c u e n c i a s a c u m u l a d a s . 15. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: L a m o d a , l a m e d i a n a y l a me d i a . L a d e s v i a c i n me d i a , l a v a r i a n z a y l a d e s v i a c i n t p i c a . Los cuartiles 1 y 3.

Los deciles 2 y 7. Los percentiles 32 y 85. 16. Una distribucin estadstica viene dada por la siguiente tabla: [10, 15) [15, 20) [20, 25) [25, 30) [30, 35)

fi

3 Hallar:

La moda, mediana y media. El rango, desviacin media y varianza. Los cuartiles 1 y 3. Los deciles 3 y 6. Los percentiles 30 y 70. 17. Dada la distribucin estadstica: [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, )

fi

5 Calcular:

L a m e d i a n a y mo d a . Cuartil 2 y 3. Media. 1. A un conjunto de 5 nmeros cuya media es 7.31 se le aaden los nmeros 4.47 y 10.15. Cul e s la media del nuevo conjunto de nme ros? 2. Un dentista observa el nmero de caries en cada uno de los 100 nios de cierto colegio. La infor macin obtenida aparece resumida en la sig uiente tabla: N de caries fi ni

25

0.25

20

0.2

15

0.15

0.05

1. Completar la tabla obteniendo los valores d e x, y, z. 2 . H a c e r u n d i a g r a ma d e s e c t o r e s . 3. Calcular el nmero medio de caries. 3. Se tiene el siguiente conjunto de 26 datos: 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 Obtener su mediana y cuartiles. 4. Un pediatra obtuvo la siguie nte tabla sobr e los me ses de edad de 50 nio s de su consulta en el mo me nto de andar por primera vez: Meses Nios

10

11

12

16

13

11

14

15

1. Dibujar el polgono de frecuencias. 2 . C a l c u l a r l a m o d a , l a me d i a n a , l a m e d i a y l a v a r i a n z a . 5. Completar los datos que falta n en la siguie nte tabla estadstica: xi fi Fi ni

0.08

16

0.16

0.14

28

38

45

8 Calcular la media, med iana y moda de esta distribucin. 6. Considrense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1. Calcular su media y su varianza. 2. Si los todos los datos anteriores los multiplica mos por 3, cal se r la nueva media y desviacin tpica. 7. El resultado de lanzar dos dados 120 veces viene dado por la tabla: Sumas 2 3 4 5 6 7 8 9 10 11 12

Veces

11

20

19

16

13

11

1. Calcular la media y la desviacin tpica .

2. Hallar el porcentaje de valores co mprendidos en el intervalo (x , x + ). 8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla: [170, Altura 175) 180) 185) 190) 195) 2.00) [175, [180, [185, [190, [195,

N de 1 jugadores Calcular: 1 . L a me d i a . 2 . L a me d i a n a . 3. La desviacin tpica. 4. Cunto s jugadores se encue ntra n por encima de la media ms una desviacin tpica? 9. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla: 1 2 3 4 5 6 3 4 8 5 2

fi

32

35

33

35

Deter minar a y b sabie ndo que la puntuacin media es 3.6. 10. El histogra ma de la distribucin correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

1. Formar la tabla de la distribucin . 2. Si Andrs pesa 72 kg, cuntos alumnos ha y menos pesados que l? 3. Calcular la moda. 4 . H a l l a r l a me d i a n a . 5. A partir de que valores se encuentran el 25% de los alumnos ms pesados? 11. calcular: Edad Fi De esta distribucin de frecuencias absolutas acumula das ,

[0, 2)

[2, 4)

11

[4, 6)

24

[6, 8)

34

[8, 10)

40

1 . M e d i a a r i t m t i c a y d e s v i a c i n t p i c a . 2. Entre qu valores se encuentran las 10 edades centrales? 3. Representar el polgono de frecuencias absolutas acumuladas .

12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media e s de 1.60 m y la desviacin tpica es de 20 c m. Otra perso na B mide 1.80 m y vive en una ciudad donde la estatura media es de 1.70 m y la desviacin tpica e s de 15 c m. Cu l de la s dos ser ms a lta resp ecto a sus conciudadanos? 13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los siguie ntes resultados: para el primer test la media es 6 y la desviacin tpica 1.5. Para el segundo test la media es 4 y la desvia cin tpica 0.5. Un alumno obtie ne un 6 en el primero y un 5 en el segundo. En rela cin con el grupo, en cul de los dos tests obtuvo mejor puntuacin? 14 La asistencia de espectadores a las 4 salas de un cine un determinado da fue de 200, 500, 300 y 1000 personas. 1. Calcular la dispersin del nmero de asistentes. 2. Calcular el coeficiente de variacin. 3. Si el da del espectador acuden 50 personas ms a cada sala, qu efecto tendra sobre la dispersin?

Você também pode gostar