Você está na página 1de 19

31

TERCERA SEMANA

METODOS PARA EL ANLISIS DESCRIPTIVO DE DATOS


Despus de estudiar como construir todo tipo de distribucin de frecuencias para cualquier tipo de dato, nos damos cuenta, que stas, deben resumirse para propsitos descriptivos, de anlisis o de comparacin. Es aqu cuanto notamos que es necesario un anlisis de los datos obtenidos. Al igual que con anterioridad, este anlisis debe realizarse tomando en cuenta el tipo de variable que est bajo estudio, as, obtenemos: 1. 2. METODO PARA EL ANLISIS DESCRIPTIVO DE DATOS CUALITATIVOS. METODO PARA EL ANLISIS DESCRIPTIVO DE DATOS CUALITATIVOS.

METODO PARA EL ANLISIS DESCRIPTIVO DE DATOS CUALITATIVOS.


Muchas de las veces, valores obtenidos como las frecuencias absolutas relativas no son suficientes para la mayor parte de las necesidades a que se destinan los datos, en particular datos cualitativos, siendo necesario calcular las distribuciones de frecuencias relativas. La importancia de las frecuencias relativas radica en que ellas ponen ms fcilmente en evidencia, las relaciones que existen entre dos o ms cifras de los datos que se estudian, facilitando la comparacin de los diversos resultados. Se incluyen bajo esta denominacin: a) b) c) d) RAZONES INDICES PROPORCION PORCENTAJE DE CAMBIO DE ERROR e) TASAS BRUTA ESPECIFICAS 31 TASA =
Nmero de veces que ocurre un fenmeno

R= a / b I = (a / b) x 100 P = ( a / a + b) PORCENTAJE = P X 100 = ( a / a + b) X 100

x 10 n

Poblacin en la cual ocurri

32

METODO PARA EL ANLISIS DESCRIPTIVO DE DATOS CUANTITATIVOS.


A diferencia que en el anlisis de las variables cualitativas; en el anlisis de las cuantitativas se hace necesario un anlisis encontrar medidas en base a datos de muestras (subconjunto de una poblacin), llamadas estadgrafos o estadsticos, que nos permitirn hacer un anlisis ms profundo de nuestros datos. Estadsticamente, para facilitar el anlisis comparativo de variables cuantitativas, utilizamos las medidas de resumen (Estadgrafos). Definimos cuatro tipos de Estadgrafos: A) 1) 2) B) C) D) De Posicin o Tendencia Central. Estadgrafos de Tendencia Central. Estadgrafos de Localizacin. De Dispersin o Variabilidad. De Deformacin o Asimetra. De Apuntamiento o Kurtosis.

ESTADGRAFOS DE POSICIN O TENDENCIA CENTRAL


Hospital Barnes St. Louis, Missouri El Hospital Barnes del Centro Mdico de la Universidad de Washington, fue fundada en 1914 y es el principal centro de salud para los habitantes de St. Louis y reas vecinas. Tiene reconocimiento nacional como uno de los mejores en Estados Unidos. El programa de asilo del hospital mejora la calidad de vida para pacientes terminales y sus familias. Su equipo lo forma un director mdico, un coordinador, un supervisor de atencin, personal de atencin en el hogar y de internos, auxiliares de salud del hogar, trabajadores sociales, capellanes, dietistas, voluntarios capacitados, y profesionales de otros servicios auxiliares de acuerdo con las necesidades. A travs de las actividades coordinadas del personal del hospicio, a los pacientes y a sus familias se les proporciona la gua y el respaldo necesarios para manejar las tensiones creadas por enfermedades graves, separaciones y muertes. En el programa de coordinacin y administracin del asilo se cuenta con informes mensuales y resmenes trimestrales para supervisar los servicios. Los resmenes estadsticos de datos de funcionamiento se usan como base para planeacin y para implementar cambios de poltica. Por ejemplo, se renen datos acerca del tiempo que pasan los pacientes en el programa hospitalario. En una muestra de 67 registros de pacientes se vio que el tiempo en el programa iba de 1 a 185 das.

32

33 Una distribucin de frecuencias ayud a resumir y comunicar los datos de duracin de la estancia. Adems se usaron las siguientes cantidades numricas de la estadstica descriptiva para obtener informes valiosos acerca del tiempo que requieren los pacientes en el programa Promedio 35.7 das Mediana 17 das Moda 1 da
Al interpretar estas estadsticas se vio que el tiempo promedio que pasa un paciente en el programa es de 35.7 das, poco ms de un mes. Sin embargo, la mediana indica que la mitad de los pacientes estn 17 das o menos, y la otra mitad, 17 das o ms. La moda de un da es el valor ms frecuente en los datos, e indica que muchos de los pacientes tienen una estancia corta en el programa. Hay otros resmenes estadsticos acerca del programa hospitalario, que comprenden la cantidad de admisiones, la de das pasados en casa en funcin de la cantidad de das en la unidad hospitalaria, la cantidad de salidas de la unidad hospitalaria y la cantidad de muertes de pacientes en casa y en la unidad. Esos resmenes se elaboran de acuerdo con la edad del paciente y la cobertura del seguro mdico. En general la estadstica proporciona valiosas informaciones de los servicios hospitalarios, que les permiten planificar y estar preparados para atender segn la demanda que se es revelada; espacios, personal, medicina y programas.

Los estadsticos de posicin o de tendencia central, describen la posicin que ocupa una distribucin de frecuencias respecto a un valor de la variable. Son valores que de manera condensada representan en un solo valor a una serie de datos y describen resumidamente al conjunto de observaciones. Se distinguen dos tipos:

Los Estadgrafos de Tendencia Central


Sus valores tienden a ocupar posiciones centrales o intermedias entre el valor mximo y el valor mnimo que toma la variable en estudio; brindando informacin sobre el centro de la distribucin. Los ms frecuentes son: La Media Aritmtica. La Mediana. La Media Geomtrica, y La Media Armnica.

Los Estadgrafos de Localizacin


Como su nombre lo indica, son estadgrafos que sealan la localizacin de los valores ms frecuentes o de valores extremos. Entre ellos tenemos: Los Cuartiles. Los Deciles. Los Percentiles. La Moda. Para comprender mejor la aplicacin y utilidad de cada uno de ellos, sigamos la ilacin con los siguientes ejemplos:

33

34

ESTADGRAFOS DE POSICIN O TENDENCIA CENTRAL


Para DATOS NO AGRUPADOS Ejemplo 01: Durante los 12 meses del ao 2008, el departamento de polica de una conocida zona de la ciudad de Lima, registr: 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8, y 7 asaltos a mano armada. Ejemplo 02: El Gerente del Supermercado El Centro de la ciudad de Chiclayo, desea estudiar la concurrencia a su tienda durante los pasados cinco das. Para ello cuenta con la 7 siguiente informacin: El total de personas que entr al supermercado durante los cinco das anteriores son 295, 1002, 941, 768, y 1283.

Para VARIABLES CUANTITATIVAS CON POCAS CATEGORAS AGRUPADAS EN TABLA DE FRECUENCIA.

Ejemplo 03: La siguiente informacin corresponde al nmero de supervisores que laboran en las plantas de embotellamiento de la empresa Backus en el Per. Tabla N 04 Nmero de supervisores por planta de embotellamiento de la empresa Backus en el Per en Diciembre del 2008. N de Supervisores Xi 2 3 4 5 6 total
Fuente: Oficina de Control Interno.

Fi N de Plantas Embotelladoras 1 3 7 6 3 20

LA VARIABLE ES EL NUMERO DE SUPERVISORES Y LA UNIDAD DE ANALISIS ES UNA PLANTA DE EMBOTELLAMIENTO.

34

35 Para VARIABLES CUANTITATIVAS CON AGRUPADAS EN TABLA DE FRECUENCIA. MUCHAS CATEGORAS

Ejemplo 04: Un radar policiaco vigila la velocidad de los automviles que viajan en la Panamericana Sur del Departamento de Lambayeque. En la Tabla siguiente se presenta una distribucin de frecuencias de las velocidades registradas. Tabla N 05 Velocidades de automviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Frecuencia fi 10 40 150 175 75 15 10 475

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

LA MEDIA ARITMTICA
Se le conoce como simplemente media o promedio. Es el Estadgrafo de Posicin ms importante. Puede calcularse para datos agrupados o no agrupados, as tenemos: a) Para datos no Agrupados (Media Aritmtica Simple). M(X) =

Xi n

M(X) =

1 Xi n

Con el ejemplo 01: n = 12. Ya que la informacin se ha tomado por cada mes del ao 2008.

35

36

M(X) =

4 + 3 + 5 + 5 + 10 + 8 + 9 + 6 + 3 + 4 + 8 + 7 12

Xi n

M(X)

M(X) =

72 12

= 6

Interpretacin: En la zona conocida de la ciudad de Lima el ao 2008, ocurrieron en promedio 6 asaltos a mano armada mensuales. b) Para datos Agrupados en tablas de Frecuencias (Media Aritmtica Ponderada). b.1) Tablas sin intervalos (variables discretas). Xi fi M(X) = n Donde: Xi : Clase o valor tomado por la variable. fi : Frecuencia absoluta simple de la clase i. En el ejemplo 03: Tabla N 04
Nmero de supervisores por planta de embotellamiento de la empresa Backus en el Per en Diciembre del 2008.

N de Supervisores Xi 2 3 4 5 6 total

N de Plantas Embotelladoras fi 1 3 7 6 3 n = 20

X i * fi 2 9 28 30 18 Xi * fi = 87
87 20

Fuente: Oficina de Control Interno.

M(X) =

Xi n

fi

= 4.35

Interpretacin: Se espera que en cada planta embotelladora de la Backus del Per, existan 4 supervisores en promedio en el mes de Diciembre del 2008. (No puede ser 4.35 trabajadores pues es una variable discreta). b.2) Tablas con intervalos (variables continuas). Yi ni M(Y) = n 36

37 Donde: Yi : fi : Ejemplo 04: Tabla N 05 Velocidades de automviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

Marca de Clase del Intervalo i. Frecuencia absoluta simple de la clase i.

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Marcas de Clase Yi 47 52 57 62 67 72 77

Frecuencia fi 10 40 150 175 75 15 10 n = 475

Yi * fi 470 2080 8550 10850 5025 1080 770 Yi * fi = 28825

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

El clculo de las marcas de Clase es de la siguiente manera: Para 45 49: (45 + 49) / 2 = 47 la marca de clase es 47.

Con los datos ya calculados en la tabla, entonces procedamos a obtener el promedio. M(Y) = M(Y) =

Yi ni n
28 825 = 60.684 475

Interpretacin: La velocidad promedio de los automviles registrada en la Panamericana Sur del departamento de Lambayeque en el 2008 fue de 60.684 millas por hora.

LA MEDIANA O VALOR MEDIANO (Me)


Es aquel valor que no es superado, ni supera a ms de la mitad de las n observaciones, arregladas en magnitud de orden creciente o decreciente. Es el valor de la variable que divide al total de observaciones (n), en dos partes de igual tamao: 50% < Me < 50% Generalmente se usa cuando tenemos necesidad de tener un valor de localizacin y tenemos en nuestros datos, valores extremos. 37

38

a) Para datos no Agrupados. El lugar de la mediana se calcula con: Observemos el ejemplo 01:
n

+ 1 2

Durante los 12 meses de 2008, el departamento de polica de una conocida zona de la ciudad de Lima, registr: 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8, y 7 asaltos a mano armada. Primero debemos ordenar los datos en forma ascendente, esto sera: 3, 3, 4, 4, 5, 5, 6, 7, 8, 8, 9, 10. a.1) Nmero impar de observaciones. Me = Valor de la posicin (
n + 1 ) 2

Es decir. El valor que toma la variable en la posicin Mediana. a.2) Nmero par de observaciones. La mediana es el promedio de los dos valores centrales. Me =
Valor de la posicin (

+ 1 , es la 2

n n ) + Valor de la posicin ( ) + 1 2 2 2

Donde: n : Nmero de observaciones. El nmero de observaciones en nuestro ejemplo es par. Entonces ubiquemos los dos valores centrales en nuestra serie ordenada: 3, 3, 4, 4, 5, 5, 6, 7, 8, 8, 9, 10.
Valor de la posicin ( 12 12 ) + Valor de la posicin ( ) + 1 2 2 2

Me =

Me = Me =

Valor de la posicin (6) + Valor de la posicin (7) 2


5 +6 = 5.5 2

Interpretacin: El 50% de los meses ocurren menos de Me 6 asaltos, el otro 50% superan este nmero de asaltos. b) Para datos Agrupados.

38

39 El lugar de la mediana se calcula con: Absolutas acumuladas. b.1)


n y se trabaja con las Frecuencias 2

Para Variables Cuantitativas con pocas categoras agrupadas en tablas de frecuencia:


Se ubica a la menor frecuencia absoluta acumulada Ni que supere a n/2. Es decir:
n < Ni 2

Donde: Ni es el i simo valor de N.

Entonces la mediana se calcula como sigue: Yi Me = Yi-1 + Yi Si


n = Ni - 1 2

Si

n > Ni - 1 2

2 Donde: Yi : Clase o valor tomado por la variable en la posicin i; correspondiente a la Frecuencia absoluta acumulada Ni. En el ejemplo 03: Tabla N 04
Nmero de supervisores por planta de embotellamiento de la empresa Backus en el Per en Diciembre del 2008.

N de Supervisores Xi 2 X2=3 X3=4 5 6 total

N de Plantas Embotelladoras fi 1 3 7 6 3 n = 20

Fi 1 4 11 17 20

Fi-1 n/2 Fi

Fuente: Oficina de Control Interno.

Aqu, n = 20, entonces n/2 = 10. Luego la mayor frecuencia acumulada que supera a 10 es F3 = 11, entonces: i=3 i-1 = 2 Fi = F3 = 11 Fi-1 = F2 = 4

Ahora, como n/2 > Fj-1 es decir 10 > 4, entonces: Me = Yi = Y3 = 4 Me = 4

39

40 Interpretacin: El 50% de las plantas embotelladoras de la Backus del Per, tienen 4 o menos supervisores, y el otro 50% de las plantas tiene ms de 4 supervisores en el mes de Diciembre del 2008. b.2) Para Variables Cuantitativas con muchas categoras agrupadas en

Tablas de Frecuencia:
Se ubica a la menor frecuencia absoluta acumulada Fi que supere a n/2. Es decir:
n < Ni 2

Donde: Fi es el i simo valor de N.

Se ubica al Intervalo Mediano (IMe). El intervalo mediano es aquel que corresponde a Fi. Se llama intervalo mediano porque el valor de la Mediana est ubicado en ese intervalo. i) Si
n no coincide con algn Fi. 2

Se tiene: Fi-1 < Entonces: Me = Li + C


n 1 2 Fi 1 Fi Fi

n < Fi 2

Donde: n : Nmero total de datos u observaciones. Fi : Es la frecuencia absoluta acumulada inmediata superior a n/2. Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/2. Li : Extremo inferior del Intervalo Mediano. C : La amplitud del Intervalo mediano.
n coincide con algn Fi. 2

ii) Si

Se tiene: Fi-1 =
n < Fi 2

Entonces: Me = Li del Intervalo Mediano. Donde: Li : Extremo inferior del Intervalo Mediano. IMe: Es el intervalo que corresponde a Fi cuyo extremo inferior es Li.

40

41 Ejemplo 04: Tabla N 05 Velocidades de automviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Frecuencia fi 10 40 150 175 75 15 10 n = 475

Fi 10 50 200 375 450 465 475

Fi-1 n/2 Fi

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

Calculamos la posicin de n/2: Esta sera: n/2 = 475/2 = 237.5 De acuerdo a esto, observamos si coincide con alguna frecuencia absoluta acumulada, en nuestro caso no coincide, entonces ubicamos:

n : Fi : Fi-1 Li : C :

Nmero total de datos u observaciones.

475
Es la frecuencia absoluta acumulada inmediata superior a n/2. 375 : Es la frecuencia absoluta acumulada inmediata inferior a n/2.

200
Extremo inferior del Intervalo Mediano. 60 La amplitud del Intervalo mediano.

5 pues abarca 5 nmeros: (60, 61, 62, 63, 64, 65)


Entonces reemplazamos en: Me = Li + C
n 1 2 Fi 1 Fi Fi 237 .5 200

Me = 60 + 5 375 200 Me = 61.0715 Interpretacin: El 50% de las velocidades de automviles registradas en la Panamericana Sur del departamento de Lambayeque, superan los 61.072 millas por hora.

ESTADGRAFOS DE LOCALIZACION
41

42

LOS CUARTILES (Qi)


Se aplica mucho en la construccin de valores especiales (sobre todo en investigaciones psicolgicas para la construccin de baremos). Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.

Q1 corresponde al 25% de los datos. En otras palabras, el 25% de las observaciones


tienen valores inferiores o iguales a Q1, en tanto que el 75% restante tienen valores superiores a este cuartil. Q2 corresponde al 50% de los datos. Llamada tambin cuartila mediana pues coincide con la mediana. Q3 corresponde al 75% de los datos. Es un valor que supera a no ms del 75% de las n observaciones y que es superado por no ms del 25% de las n observaciones. a) Para datos no Agrupados. Los cuartiles toman los valores de la posicin calculadas por las frmulas correspondientes. Se calcula de la siguiente manera: Q1 = valor tomado por la posicin n/4

Q2 = Q3 =

valor tomado por la posicin n/2 valor tomado por la posicin 3n/4 Entonces en nuestro ejemplo sera 3, 3, 4, 4, 5, 5, 6, 7, 8, 8, 9, 10.

Q1 =

valor tomado por la posicin n/4 12/4 = 3 Y el valor ubicado en la posicin 3, es el 4. Por lo tanto: Q1 = 4 En el 25% de los meses ocurren menos de 4 asaltos a mano armada.

b) Para datos Agrupados en intervalos. El procedimiento que se emplea para calcular los cuartiles es similar al seguido para la Mediana, con la diferencia que en vez de considerar n/2 se reemplaza por: n/4 para Q1 n/2 para Q2 3n/4 para Q3 Si coincide con algn Ni, entonces toma el valor del lmite inferior del intervalo cuartil correspondiente. Si no coincide con algn Ni, el procedimiento es el siguiente:

42

43 As tenemos:

Q1 = Li + C

n 1 4 Fi 1 Fi Fi

Donde: n : Nmero total de datos u observaciones. Fi : Es la frecuencia absoluta acumulada inmediata superior a n/4. Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/4. IQ1 : Intervalo cuartil-uno que corresponde a Ni. Li : Extremo inferior del Intervalo Cuartil uno (IQ1). C : La amplitud del Intervalo cuartil-uno. Luego para:
n 1 2 Fi 1 Fi Fi

Q2 = Li + C

Donde: n : Nmero total de datos u observaciones. Fi : Es la frecuencia absoluta acumulada inmediata superior a n/2. Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/2. IQ2 : Intervalo cuartil-dos que corresponde a Ni. Li : Extremo inferior del Intervalo Cuartil dos (IQ2). C : La amplitud del Intervalo cuartil-dos. Ejemplo 04: Tabla N 05 Velocidades de automviles registradas en la Panamericana Sur del departamento de Lambayeque. 2008. Velocidad
(millas por hora)

45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 total

Frecuencia fi 10 40 150 175 75 15 10 n = 475

Fi 10 50 200 375 450 465 475

Fi-1 n/2 Fi

Fuente: Caseta de Control de la Panamericana Sur del Dpto. de Lambayeque.

Calculamos la posicin de n/2: Esta sera: n/2 = 475/2 = 237.5 Donde:

43

44

n : Fi :

Nmero total de datos u observaciones.

475
Es la frecuencia absoluta acumulada inmediata superior a n/2.

375 Fi-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/2. 200 IQ2 : Intervalo cuartil-dos que corresponde a Fi. 60 - 64 Li : Extremo inferior del Intervalo Cuartil dos (IQ2). 60 C : La amplitud del Intervalo cuartil-dos. 5
Luego reemplazamos en:

Q2 = 60 + 5 Q2 = 60 + 5 Q2 = 61.072
Y por ltimo tenemos:

237 .5 200 375 200 237 .5 200 375 200

Q3 = Li + C

3n 1 4 N i 1 N i N i

Donde: n : Nmero total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a 3n/4. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a 3n/4. IQ3 : Intervalo cuartil-tres que corresponde a Ni. Li : Extremo inferior del Intervalo Cuartil tres (IQ3). C : La amplitud del Intervalo cuartil-tres.

CUNTO ES......?

44

45

LOS DECILES (Di)


Estadgrafos de Localizacin; son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Lo primero que debe hacerse es ordenar los datos en forma ascendente o descendente.

D1 corresponde al 10% de los datos. En otras palabras, el 10% de las observaciones


tienen valores inferiores o iguales a D1, en tanto que el 90% restante tienen valores superiores a este Decil. D2 corresponde al 20% de los datos. D3 corresponde al 30% de los datos. Es un valor que supera a no ms del 30% de las n observaciones y que es superado por no ms del 70% de las n observaciones.

D9 corresponde al 90% de los datos. Es un valor que supera a no ms del 90% de las n observaciones y que es superado por no ms del 10% de las n observaciones.
a) Para datos no Agrupados. Los deciles toman los valores de la posicin calculadas por las frmulas correspondientes. Se calcula de la siguiente manera: D1 = valor tomado por la posicin n/10 D2 = valor tomado por la posicin 2n/10 D3 = valor tomado por la posicin 3n/10

D9 =

valor tomado por la posicin 9n/10

b) Para datos Agrupados en intervalos. El procedimiento que se emplea para calcular los deciles es similar al seguido para los cuartiles, considerando in/10 para cada decil i: n/10 para D1 2n/10 para D2 3n/10 para D3 4n/10 para D4 5n/10 para D5

9n/10

para D9

Si coincide con algn Ni, entonces toma el valor del lmite inferior del intervalo declico correspondiente. Si no coincide con algn Ni, el procedimiento es el siguiente:

45

46 As tenemos:

D1 = Li + C

n 1 1 N i 0 1 N i N i

Donde: n : Nmero total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a n/10. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/10. ID1 : Intervalo decl-uno que corresponde a Ni. Li : Extremo inferior del Intervalo Decil uno (ID1). C : La amplitud del Intervalo Decil-uno.

Hasta llegar al:

D9 = Li + C

9n 1 1 N i 0 1 N i N i

Donde: n : Nmero total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a 9n/10. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a 9n/10. ID9 : Intervalo decl-nueve que corresponde a Ni. Li : Extremo inferior del Intervalo Decil nueve (ID9). C : La amplitud del Intervalo Decil-nueve.

HALLE LOS VALORES DE LOS EJEMPLOS DADOS AL INICIO DE LA SEPARATA......?

46

47

LOS PERCENTILES O CENTILAS (Pi)


Estadgrafos de Localizacin; son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Los percentiles se aplican cuando existen numerosos valores de la variable con una alta frecuencia total. Lo primero que debe hacerse al igual que los casos anteriores es ordenar los datos en forma ascendente o descendente.

P1 corresponde al 1% de los datos. En otras palabras, el 1% de las observaciones


tienen valores inferiores o iguales a P1, en tanto que el 99% restante tienen valores superiores a este Percentil. P2 corresponde al 2% de los datos. P3 corresponde al 3% de los datos. Es un valor que supera a no ms del 3% de las n observaciones y que es superado por no ms del 97% de las n observaciones.

P99 corresponde al 99% de los datos. Es un valor que supera a no ms del 99% de las
n observaciones y que es superado por no ms del 1% de las n observaciones. a) Para datos no Agrupados. Los percentiles toman los valores de la posicin calculadas por las frmulas correspondientes. Se calcula de la siguiente manera: P1 = valor tomado por la posicin n/100

P62 = P83 = D99 =

valor tomado por la posicin 62n/100

valor tomado por la posicin 83n/100

valor tomado por la posicin 99n/100

b) Para datos Agrupados en intervalos. El procedimiento que se emplea para calcular los percentiles es similar al seguido para los casos anteriores, considerando in/100 para cada percentil i: n/100 para P1 2n/100 para P2 3n/100 para P3 4n/100 para P4 5n/100 para P5

99n/100

para P99

47

48

Si coincide con algn Ni, entonces toma el valor del lmite inferior del intervalo Percentil correspondiente. Si no coincide con algn Ni, el procedimiento es el siguiente: As tenemos:
n 1 1 0 N i 0 1 N i N i

P1 = Li + C

Donde: n : Nmero total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a n/100. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a n/100. IP1 : Intervalo percentil-uno que corresponde a Ni. Li : Extremo inferior del Intervalo Percentil uno (IP1). C : La amplitud del Intervalo Percentil-uno.

Hasta llegar al:

P99 = Li + C

9 9 n 1 1 0 N i 0 1 N i N i

Donde: n : Nmero total de datos u observaciones. Ni : Es la frecuencia absoluta acumulada inmediata superior a 99n/100. Ni-1 : Es la frecuencia absoluta acumulada inmediata inferior a 99n/100. IP99 : Intervalo percentil-noventa y nueve que corresponde a Ni. Li : Extremo inferior del Intervalo percentil-noventa y nueve (IP99). C : La amplitud del Intervalo percentil-noventa y nueve.

HALLE LOS VALORES DE LOS EJEMPLOS DADOS AL INICIO DE LA SEPARATA......?

48

49

LA MODA O VALOR MODAL (Mo)


Simplemente es el valor ms frecuente de una variable. Es el valor de la variable que le corresponde la mayor frecuencia absoluta (ni). Es tambin llamado Modo; Valor Modal o Promedio Tpico. La Moda no siempre existe y no siempre es nica, en general se tiene que: La distribucin que no tiene Moda se llama Amodal. La distribucin que tiene una moda se llama Unimodal. La distribucin que tiene dos modas se llama Bimodal. La distribucin que tiene ms de dos modas se llama Multimodal. a) Para datos no Agrupados. La moda est dada por los valores de la variable en estudio que ms se repiten en la distribucin. b) Para datos Agrupados en intervalos. b.1) Tablas sin intervalos (variables discretas). El valor se determina por el valor de la clase (Yi) que ms se repite. Mo = Valor de clase con mayor ni. b.2) Tablas con intervalos (variables contnuas). Cuando se tiene una tabla con intervalos, al igual que la mediana se determina el Intervalo Modal (IMo), que es el intervalo que corresponde a la mayor frecuencia ni . Para calcular la moda existen diversas frmulas tal como:

Mo = Li + C ni 1 + ni +1
Donde:

ni +1

ni : ni-1 : ni+1 : IMo : Li : C :

Es la mayor o ms alta frecuencia absoluta. Es la frecuencia absoluta inmediata inferior a ni. Es la frecuencia absoluta inmediata superior a ni. Intervalo modal, que corresponde a ni. Extremo inferior del Intervalo Modal (IMo). La amplitud del Intervalo Modal.

Interpretacin: La moda indica que el sueldo ms frecuente en los 20 trabajadores de una empresa es de Mo dlares. HALLE LA MODA DE LOS EJEMPLOS DADOS AL INICIO DE LA SEPARATA......? 49