Você está na página 1de 20

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA

ESTADSTICA GENERAL Parte III: Medidas de Posicin o Medidas de Tendencia Central


Una de las formas de resumir la informacin obtenida en los datos es mediante ciertos indicadores que puedan ser considerados representativos de los datos recolectados. Entre los indicadores ms utilizados, estn aquellos que se llaman medidas de posicin o tendencia central, estas medidas son conocidas como: la media o promedio (aritmtico, ponderado, geomtrico y armnico), la mediana y la moda. 1. La media o promedio Respecto al promedio, existen los siguientes diferente promedio: Media aritmtica simple Media aritmtica ponderada Media Geomtrica Media Armnica Media aritmtica simple Viene a ser como la suma de las observaciones dividida entre el nmero de observaciones. Si se obtiene el promedio de todas las observaciones de una poblacin de tamao N, sta se conoce como promedio poblacional. Media o promedio poblacional:

=
n

x
i =1

donde N es el tamao de la poblacin.

N
i

Media o promedio muestral:

x=

x
i =1

donde n es tamao de la muestra.

La principal desventaja de la media aritmtica es que se encuentra afectado por valores extremos, es decir, si en un conjunto de observaciones muy pequeo o muy grande, el valor promedio que dar influenciado por dichos valores, en estos casos no ser un valor representativo un valor representativo de la tendencia central de las observaciones. Ejemplo: A continuacin se muestra las notas de la primera prctica calificada de Estadstica General de 5 alumnos elegidos al azar de los grupos B y C. Grupo Notas de la primera prctica Promedio B 12 12 13 15 15 13.4 C 02 11 13 14 14 10.8
xB = 12 +12 +13 +15 +15 = 13.4 5 xC = 02 +11 +13 +14 +14 = 10.8 5

Propiedades de la media aritmtica simple:

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA a. La media aritmtica es el centro de gravedad o punto de equilibrio de un conjunto de observaciones. b. Para un conjunto de valores la media es nica c. Si la media o promedio sustituye el valor de cada observacin, la suma total no cambia. d. Si un valor de una observacin se modifica, la media cambia de valor. e. La suma de las desviaciones de las observaciones con respecto al promedio aritmtico es igual a cero.

( x
i =1

x) = 0

f. Las suma de los cuadrados de las desviaciones de las observaciones con respecto al promedio aritmtico es menor que la suma de los cuadrados de las desviaciones de las observaciones respecto a cualquier otro valor.

( xi x ) 2 ( xi c ) 2
i =1 i =1

donde c R

g. Si cada observacin de una muestra n se le suma una constante c, el promedio de las nuevas observaciones ser igual al promedio de las observaciones de la muestra original ms la constante. i, i =1,2,..., n Si y i = xi + c , entonces y = x + c h. Si cada observacin de una muestra n se le multiplica una constante c. el promedio de las nuevas observaciones ser igual al promedio de las observaciones de la muestra original por la constante.
y =cx i, i =1,2,..., n Si y i = cxi , entonces i. Si cada observacin de una muestra n se le multiplica una constante a y dr le suma o resta una constante b, el promedio de las nuevas observaciones ser igual a al promedio de las observaciones de la muestra original por la constante a ms o menos la constante b

Si yi = axi + b , entonces

y = ax +b i, i =1,2,..., n

Ejemplo: Los siguientes datos corresponden a los salarios mensuales (en nuevos soles) del mes de marzo del 2003 de 5 personas: 520, 535, 536, 543 y 540. Suponga que a partir del siguiente mes estas personas recibirn un aumento del 15% pero se les descontar, por el aporte a su gremio S/. 5 soles al mes. Cul es el salario promedio para el mes de abril de estas 5 personas?
520 + 535 + 536 + 543 + 540 2674 = = S / .534.8 5 5 dada a las condiciones, se estara obteniendo una nueva variable y i : x=

y i = ( xi + 0.15 xi ) 5 = 1.15 xi 5

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Entonces


y =1.15 x 5 =1.15(534.8) 5 = 610.02

Por lo tanto el nuevo salario promedio para el mes de abril sera de S/. 610.02 Media o promedio ponderado En ciertas ocasiones se asocia a las observaciones a pesos dependientes a la relevancia de cada nmero. En tal caso el promedio se obtiene de la siguiente manera:

xP =

w x
i =1 n

i i

w
i =1

w1 x1 + w2 x 2 + + wn x n w1 + w2 + + wn

Ejemplo: Un alumno desea obtener su promedio final del curso de Mtodos Estadsticos para la Investigacin I; las notas finales en el curso fueron: Examen Parcial 13, Examen Final 11, notas de prcticas 14 y trabajo encargado 15. Si se sabe que los pesos son 25%, 25%, 35% y 15%. Halle el promedio final:

xP =

w x
i =1 4 i

w
i =1

(0.25)(13) + (0.25)(11) + (0.35)(14) + (0.15)(15) = 13.15 0.25 + 0.25 + 0.35 + 0.15

Observacin: Si x1 , x 2 ,, x k son las medias de k grupos de valores y cada grupo tiene tamao n1 , n 2 , , n k respectivamente, entonces la media de los n = n1 + n2 + ... + nk , datos es:

xP =

n x
i =1 4

i i

n
i =1

n1 x1 + n 2 x 2 + ... + nk x k n1 + n2 + ... + n k

Ejemplo: A continuacin se muestra un cuadro donde se presenta los sueldos de trabajadores elegidos al azar de una empresa segn el cargo que se ocupan: a. Considerando que los promedios y los tamaos de muestra son Categora Tamao de muestra Promedio Obreros de planta 6 838.33 Empleados de oficina 4 1300.00 Gerentes 2 3850.00 Encuentre el sueldo promedio por trabajador. b. Confirme el resultado anterior si se conocen los valores originales con los cuales se obtuvo los promedios por cada categora de trabajador

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Categora Obreros de planta Empleados de oficina Gerentes Respuesta: Sueldos (en nuevos soles) 850, 820, 835, 845, 855, 825 1200, 1350, 1400, 1250 3800, 3900

2. Media Geomtrica La media geomtrica de un conjunto de n observaciones positivas x1 , x 2 , , x n esta dada por:
xG = n

x
i =1

= n x1 x 2 ... x n

Este promedio es utilizado en la elaboracin de nmeros ndices y para el clculo de tasas promedio de variacin. Ejemplo: La fbrica textil FabriTex ha experimentado los siguientes niveles de ingreso anuales (en millones de nuevos soles) por la venta de sus productos en los ltimos 4 aos: Ao 1999 2000 2001 2002 Ingreso 15.5 16.1 14.3 15.1 Tasa de cambio -16.1/15.5 = 1.04 14.3/16.1 = 0.89 15.1/14.3 = 1.06

Halle la tasa de promedio de crecimiento (o decrecimiento) anual.


xG = 3

x
i =1

= 3 (1.04)(0.89)(1.06) = 0.99

Entonces la tasa de crecimiento es: r = 0.99 1 = 0.01 1.00% Es decir la fbrica textil ha tenido un decrecimiento productivo del 1% en ese perodo de tiempo.

Ejemplo El crecimiento de la poblacin estudiantil con respecto al semestre anterior fue como sigue aumento el 10% en el segundo semestre ,aumento 20% en el tercero , y bajo el 15% en el cuarto .Encuentre la tasa de variacin promedio de los semestres

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA 3. Media armnica La media armnica de un conjunto de n observaciones diferentes de cero x1 , x 2 , , x n est dada por el recproco de la media aritmtica de los recprocos de las observaciones
xA = 1 = n = n 1 1 1 + + ... + x1 x 2 xn

x
i =1

1
i

x
i =1

1
i

Este promedio tiene la particularidad de que los valores extremos de las observaciones (valores muy pequeos o muy grandes) afectan al promedio armnico con menor intensidad que el promedio geomtrico y al promedio aritmtico. Este promedio es til para promediar razones que tienen unidades tales como: kilmetros/galn, costo/unidad, soles/litro, etc. Con frecuencia resulta difcil distinguir qu promedio utilizar. Como una referencia debe tenerse en cuenta que cuando una unidad de valor constante o unidad de evaluacin es igual a la unidad del numerador de una razn se usa el promedio armnico, y si es igual a la unidad del denominador se usa el promedio aritmtico.+ Ejemplo Si tres vehculos que recorrieron los 300 kilmetro y el rendimiento de cada uno fue de 50,45 y 60 kilmetro por galn respectivamente .Hallar el rendimiento promedio de los tres vehculos Ejemplo Una estacin de servicio auto motriz gasta $500 en latas de aceite que cuestan $10 la docena ; $500 en latas que cuestan $12.5 la docena ; $500 en latas que cuestan $20 la docena y $500 otras que cuestan $25 la docena. a.- Halle el costo promedio por docenas de las latas b.- En promedio Cuntas latas se compro? Ejemplo: Cada mes una fbrica compra 1000 galones de petrleo industrial para sus mquinas. Los precios en soles galn de los 4 ltimos meses fueron: S/.8.36, S/.8.45, S/.8.51, S/.8.62. Halle el precio promedio de petrleo en ese perodo. La unidad en estudio son soles/galn, dado que en este caso interesa hallar el precio promedio (S/.) es decir la unidad estudiada se va a analizar su numerador, adicionalmente los galones (1000) son constantes mes a mes, por lo tanto se debe utilizar un promedio armnico. 1 4 4 xA = 4 = 4 = = S / .8.484 / galn 1 1 1 1 1 1 + + + 8.36 8.45 8.51 8.62 i =1 x i i =1 x i 4 5

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Ejemplos varios 2. Mediana La mediana de un conjunto de n observaciones ordenadas de acuerdo a su magnitud (o valor) es aquel valor que ocupa la posicin central de dicho conjunto de observaciones. La mediana poblacional se simboliza como: Me y la mediana muestral como: me. Caractersticas. a. La mediana divide un conjunto de observaciones en dos partes iguales. El 50% con valores mayores a la mediana y el otro 50% con valores menores a la mediana. b. La mediana no es influenciada por valores extremos. Ejemplo: A continuacin se muestran las notas de la primera prctica de Estadstica General de 5 alumnos elegidos al azar de los grupos B y C. Hallar las medianas de cada grupo: Grupo B C 12 02 Notas de la primera prctica calificadas 12 13 15 15 11 13 14 14 Mediana 13 13

c. La suma de las desviaciones absolutas de las observaciones, con respecto a la mediana, es menor o igual a la suma de las desviaciones absolutas de las observaciones, con respecto a cualquier otro valor.

x
i =1

me xi c donde c R
i =1

Clculo de la mediana Si n es impar


me = x n +1
2

Si n es par me =

x n + x n
2

+1 2

Para el caso de la mediana y los percentiles x( i ) es conocida como estadstica de orden, es decir, es la variable x que es ordenada de acuerdo al valor que tome. El ndice i indica la posicin en la cual est ubicada la estadstica de orden x( i ) , dado el valor que haya tomado la variable x . Ejemplo: Sea la variable X los rendimientos de maz (en Tn/parcela) de siete parcelas de terreno: 1.56, 1.45, 1.82, 1.76, 1.62, 1.86, 1.64. Halle el redimiento mediano del maz.

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Supongamos que x1 = 1.56 , x 2 = 1.45 , x3 = 1.82 , x 4 = 1.76 , x5 =1.62 , x 6 = 1.86 , x7 = 1.64 , pero las estadsticas de orden son:
x(1) = 1.45 , x( 2 ) = 1.56 , x( 3 ) = 1.62 , x( 4 ) = 1.64 , x( 5 ) = 1.76 , x( 6 ) = 1.82 , x ( 7 ) = 1.86

Dado que n=7 es impar

me = x n+1 = x 7 +1 = x( 4 ) = 1.64
2 2

Tn/parcela

El 50% de las parcelas tienen un rendimiento inferior a 1.64 Tn/parcela y el otro 50% tienen un rendimiento mayor a 1.64 Tn/parcela. Ejemplo: En la Industria pesquera el peso (en Kg.) de 6 bonitos capturados son: 1.92, 2.03, 1.88, 2.01, 1.98, 1.85. Halle el peso mediano o medina de los peces mencionados Ordenando la informacin. Se tiene:
x (1) = 1.85 , x ( 2 ) = 1.88 , x ( 3 ) = 1.92 , x ( 4 ) = 1.98 , x( 5 ) = 2.01 , x ( 6 ) = 2.03

Dado que n=6 e par: x n + x n me =


2 +1 2

x 6 + x 6 =
2

+1 2

x( 3 ) + x( 4 ) 2

1.92 + 1.98 = 1.95kg 2

El 50% de estos peces tienen un peso inferior a 1.95 kg. y el otro 50% tiene un peso superior a 1.95 kg. 3. Moda. La moda es simplemente el valor o atributo que ocurre con ms frecuencia. La moda poblacional se denota como Mo y la muestral mo. Caractersticas: a. En un conjunto de observaciones no puede existir moda o pueden existir varias modas. Ejemplos: Sea X1: Peso de conservas (en gr.) producidas en el mes anterior: 200.3, 199.8, 201.1, 199.3, 200.1, 199.7, 198.9 (no hay moda) Sea X2: El nmero de cras nacidas de un grupo de conejos: 8, 7, 6, 7, 8, 9, 8, 8, 7, 8, 7, 6, 7 (existen 2 modas mo1= 7, mo2=8) b. No es afectada por valores extremos. c. Se aplica tanto a informacin cuantitativa como para informacin cualitativa. 7

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Ejemplo : Una empresa desea estimar el nmero de das en que sus empleados llegan tarde. Con tal fin selecciona aleatoriamente una muestra de 54 empleados y se registra su hora de ingreso en los ltimos 30 das. Los resultados son los siguientes # de empleados 8 9 13 13 5 4 2 # de das que llegaron tarde 0 1 2 3 4 5 6 a.- Calcule e interprete las medidas de tendencia central b.-La empresa pierde aproximadamente 8 soles por cada da que un empleado llega tarde, calcule el promedio para la perdida mensual de la empresa por empleado resp 2.3, 2, 2 y 3 b.- 552 Ejemplo La municipalidad de la Molina desea evaluar el nmero de personas que habitan en los hogares del distrito. Con tal fin selecciona aleatoriamente una muestra de 200 hogares y registra el numero de personas por hogar . Los resultados son los siguientes # de personas 3 4 5 6 7 8 9 # de hogares 11 42 53 43 31 14 6 a.- Calcule e interprete las medidas de tendencia central b.- Se sabe que el consumo de agua esta relacionado con el numero de integrantes del hogar. Se estima que se puede aproximarse mediante la siguiente funcin: 20 m 3 mas m3 por persona .Estime el consumo promedio de agua por persona 4. Usos de la media, mediana y moda. 1. La media se utiliza: a. Cuando no existan valores extremos. b. Cuando se tenga que calcular otros valores como la varianza 2. La mediana se utiliza: a. Cuando se desea conocer el valor de posicin central b. Cuando se tiene valores extremos que afecten a la media. 3. La moda se utiliza: a. Cuando se desea conocer el valor de la observacin ms frecuente. b. Cuando se analiza variables cualitativas 5. Otras medidas de tendencia central 5.1 Percentiles Un percentil Pp es un valor que divide a un conjunto ordenado de datos en dos partes, el p% de ellos con valores inferiores a Pp , y el (100 p )% con valores superiores a Pp . El percentil se calcula de la siguiente manera

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA


Pp = x n +1 = x ( E .d )
p 100

donde: n = Tamao de la muestra p = Percentil a estimar Si la expresin


n +1 p , que indica la ubicacin de la estadstica de orden, no resulta un 100

valor entero entonces el percentil a estimar ser obtenido mediante la siguiente frmula:
x( E .d ) = x( E ) + 0.d ( x( E +1) x( E ) )

5.2 Cuartiles Son medidas de tendencia que se definen en forma similar a los percentiles; el cuartil Qk es el valor que divide a un conjunto de datos en dos partes, el 100( k / 4) % de ellos con valores inferiores a un Qk y el resto con valores superiores a Qk . Numricamente se tiene que: Un cuartil es equivalente a
Qk = P k
100 4

donde k = 1, 2, 3, 4

Por lo tanto se puede deducir que:


P25 = Percentil 25 = primer cuartil = Q1 P 50 = Percentil 50 = segundo cuartil = Q2 =mediana (me o Me) P75 = Percentil 75 = tercer cuartil = Q3 P 100 = Percentil 100 = cuarto cuartil = Q4

Ejemplo: La informacin presentada a continuacin muestra la produccin de leche (en litros) de nueve vacas de la raza Brown Swiss seleccionadas al azar del establo: 20.6 22.4 21.7 22.3 20.9 21.5 21.9 21.6 22.1

a. Calcular el interpretar el P25 = Q1 Ordenando los datos:


x(1) = 20.6 x( 2 ) = 20.9 x( 3 ) = 21.5 x( 4 ) = 21.6 x ( 5 ) = 21.7 x( 6 ) = 21.9 x( 7 ) = 22.1 x( 8 ) = 22.3 x ( 9 ) = 22.4

Pp = x n +1 = x ( E .d )
p 100

entonces,

P25 = x 9+1

25 100

= x( 2.5 )

, por lo tanto E = 2 y d = 5
9 +1 25 = 2.5 no 100

Por lo tanto el ndice que define la posicin de orden del percentil 25,

es entero. Entonces el valor del percentil 25 ( P25 = Q1 ) se estima mediante: x( E .d ) = x( E ) + 0.d ( x( E +1) x( E ) )
x( 2.5 ) = x( 2 ) + 0.d ( x( 2+1) x( 2 ) ) = 20.9 + 0.5(21.5 20.9) = 21.2

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA El 25% de las vacas tienen una produccin menor a 21.2 litros y el otro 75% de las vacas tienen una produccin superior a los 21.2 litros. b. Calcular e interpretar c. Calcular e interpretar d. Calcular e interpretar e. Calcular e interpretar Salida en MINITAB:
Descriptive Statistics: Produccion
Variable Producci Variable Producci N 9 Minimum 20.600 Mean 21.667 Maximum 22.400 Median 21.700 Q1 21.200 TrMean 21.667 Q3 22.200 StDev 0.606 SE Mean 0.202

P50 = Q2 P75 = Q3 P20 P27

N= tamao de la muestra Mean = Media o promedio Median = Mediana Minimum = Valor u observacin mnima Maximum = Valor u observacin mxima

Q1 = Primer cuartil Q3 = Tercer cuartil

Medidas de dispersin o medidas de variabilidad


Cuando se dispone de informacin de una o varias variables es necesario conocer si los datos recolectados presentan una variabilidad significativa; es decir si las observaciones se encuentran (o no) muy dispersas respecto a la media aritmtica. Las medidas de variabilidad son indicadores que se utilizan para analizar el grado de heterogeneidad o variabilidad de un conjunto de observaciones. Las medidas de dispersin de mayor uso son: el rango, el rango intercuartlico, la varianza, la desviacin estndar y el coeficiente de variabilidad. 1. El Rango o Amplitud El rango o amplitud de una conjunto de observaciones es la diferencia entre la observacin de mayor valor y la observacin de menor valor
r = x max x min

Desventajas de rango: Est afectado por valores extremos No mide la variabilidad de los datos intermedios Ejemplo: Los tiempos de atencin (en minutos) en ventanilla de un banco de 5 clientes elegidos al azar fueron: 8, 5, 7, 3, 6. Calcular el rango:
r = 8 3 = 5minutos

10

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA 2. Rango Intercuartlico: El rango intercuartlico o intercuartil se define como la diferencia como la diferencia entre el percentil 75
ri = P75 P25 = Q3 Q1

El rango intercuartlico excluye el 25% superior y el 25% inferior de las observaciones, dando un rango del 50% de las observaciones centrales; a diferencia del rango o amplitud no se encuentra afectado por valores extremos. Ejemplos: Los dimetros (en centmetros) de 6 rboles de cedro elegidos al azar son: 68.3, 64.1, 65.2, 66.7, 62.9, 63.4. Hallar el rango intercuartil Ordenando la informacin: x (1) = 62.9 , x( 2 ) = 63.4 , x ( 3 ) = 64.1 , x( 4 ) = 65.2 , x( 5 ) = 66.7 , x ( 6 ) = 68.3
P75 = x 6 +1
75 100

= x ( 5.25 ) = 66.7 + 0.25(68.3 66.7) = 67.1

P25 = x 6+1

25 100

= x (1.75 ) = 62.9 + 0.75(63.4 62.9) = 63.275

ri = P75 P25 = Q3 Q1 = 67.1 63.275 = 3.825

3. La varianza La varianza de un conjunto de observaciones est definida por:


2 ( xi ) xi2 N 2 i =1 N N

Varianza Poblacional:

2 =
N

N
i

i =1

N
2 i

Varianza Muestral:

S2 =

(x
i =1

x)

n 1

x
i =1

nx 2

n 1

La varianza da como resultado de que las unidad de medida sea elevada al cuadrado. Por ejemplo si las unidades de las observaciones son minutos, la varianza ser expresada en minutos2. As mismo, se debe tener presente que la varianza es un valor numrico que siempre es positivo. Ejemplo: Los pesos (en gr.) de 8 conservas de atn elegidas al azar de un gran lote son: 256.3, 249.2, 250.1, 253.4, 251.7, 250.6, 252.3, 252.4 Hallar la varianza.
x= 2016 = 252 8

11

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA


S
2

( 256.3 =

+ 249.2 2 + ... + 252,4 2 ) 8( 252 ) 508066.2 508032 = = 4.886 gr 2 8 1 8 1


2

4. Desviacin Estndar La desviacin estndar de un conjunto de observaciones es igual a la raz cuadrado de la varianza. Desviacin estndar poblacional: = 2 Desviacin estndar muestral: S = S 2 La desviacin estndar, a diferencia de la varianza, se define con la misma magnitud de las unidades que tienen las observaciones. Ejemplo: La desviacin estndar muestral de los pesos de las conservas de atn es:
S = 4.886 = 2.21 gr.

5. Coeficiente de Variabilidad Es una medida de dispersin relativa, es decir no tiene unidades y est expresado en porcentajes; el coeficiente de variabilidad est definido como el cociente entre la desviacin estndar y la media aritmtica de un conjunto de observaciones. Coeficiente de variabilidad poblacional: C.V . = 100% Coeficiente de variabilidad muestral: C.V . =
S 100% x

De estas expresiones se deduce que el coeficiente de variabilidad no se puede definir si el promedio es igual a cero. Si el promedio es negativo, debe considerarse su valor absoluto para evaluar el coeficiente de variabilidad. Para comparar la variabilidad de dos o ms conjuntos de observaciones se debe tener en cuenta lo siguiente: Si las unidades de medida de dos o ms observaciones de dos o ms conjuntos de datos son la misma y sus promedios no son muy diferentes (o distantes), se debe a utilizar la varianza o la desviacin estndar. Si las unidades de medida de las observaciones de dos o ms conjuntos de datos son diferentes y/o si sus promedios son diferentes (distantes) se debe utilizar el coeficiente de variabilidad.

12

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Ejemplo: Un Ing. realiz un experimento en el cual evalu 2 tipos de fertilizantes obteniendo los siguientes resultados en rendimiento de camote en Tn./parcela.

n
x S

Fertilizante A 18 8.1 1.87

Fertilizante B 15 12.3 2.10

Con que tipo de fertilizante se obtienen resultados ms homogneos?


C.V . A = SA 1.87 100% = 100% = 23.1% x 8.1 C.V . B = SB 2.10 100% = 100% = 17.1% x 12.3

Con el fertilizante B se obtienen resultados ms homogneos. Ms homogeneidad indica que los datos estn menos dispersos y cerca de la media.

6. Transformacin de Datos 6.1 Si se hace la transformacin de y i = xi + k


y = x +k me y = me x + k

Ppy = Ppx + k
2 2 Sy = Sx

mo y = mo x + k

S y = Sx

6.2 Si se hace la transformacin de y i = k xi


y = kx me y = k me x

Ppy = kPpx
2 2 Sy = k 2Sx

mo y = k mo x

S y = k Sx

6.3 Si se hace la transformacin de y i = axi + b


y = ax + b me y = a me x + b

Ppy = aPpx + b
2 2 Sy = a2Sx

mo y = a mo x + b

Sy = a Sx

Ejemplo: A continuacin se presenta el peso (en gr.) de 10 pollos BB, que tienen 5 das de nacidos.

13

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA 11.7 12.4 13.2 9.8 11.7 10.3 11.6 12.1 10.7 12.6

Si se le da un alimento balanceado en cuya etiqueta dice que a la semana incrementarn su peso en un 15%, adems a cada pollo se le identifica con una placa que pesa 2 gr. Calcule: El nuevo peso promedio El nuevo peso mediano El nuevo peso modal El percentil 75 La nueva varianza del peso La nueva desviacin estndar del peso El nuevo coeficiente de variabilidad
N 10 Mean 11.610 SE Mean 0.337 StDev 1.065 Minimum 9.800 Q1 10.600 Median 11.700 Q3 12.450 Maximum 13.200

Descriptive Statistics: C3
Variable C3

Supngase que estos datos presentados en un diagrama de tallos y hojas


Stem-and-Leaf Display: C2 Stem-and-leaf of C2 Leaf Unit = 0.10 2 4 7 11 (5) 8 7 5 3 1 2 2 3 3 4 4 5 5 56 04 669 0334 55679 2 69 34 556 N = 24

Nota

Sum of squares (uncorrected) = 357.12 Sum of = 87.8 Standard deviation = 1.24967

14

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Corresponden a los gastos semanales ( decenas de soles ) de 24 familias del distrito de los Olivos en el mes de marzo, se sabe que en el mes de abril las familias incrementaron sus gastos semanales en un 15 % En que mes los gastos semanales son mas variables, es decir menos homogneos con respecto a la media

Si en el mes de Abril la transformacin hubiera sido Y = 1.15 X+5 En que mes los datos son mas homogneos?
Descriptive Statistics: C2
Variable C2 N 24 Mean 3.658 SE Mean 0.255 StDev 1.250 Minimum 1.500 Q1 2.675 Median 3.500 Q3 4.825 Maximum 5.600

MEDIDAS DE ASIMETRA Cuando se dispone de informacin de una o varias variables, adems de ser necesario resumirlas en indicadores que permitan conocer su tendencia y su dispersin, es necesario evaluar de qu forma estn dispersos los datos alrededor de las medidas de tendencia. 1. Simetra o asimetra de una distribucin de datos: 1.1 Distribucin simtrica. Cuando los datos de una distribucin o muestra se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media aritmtica, se dice que la distribucin es simtrica entonces se cumple que: Para una poblacin: Me Mo Para una muestra : x me mo 1.2 Distribucin asimtrica positiva o con sesgo a la derecha Cuando los datos por debajo de la media son ms frecuentes que aquellos que se encuentran por encima de la media. Si la distribucin es asimtrica positiva entonces se cumple que: Para una poblacin: > Me > Mo Para una muestra : x > me > mo 1.3 Distribucin asimtrica negativa o con sesgo a la izquierda 15

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA Cuando los datos por encima de la media son ms frecuentes que aquellos que se encuentran por debajo de la media. Si la distribucin es asimtrica negativa entonces se cumple que: Para una poblacin: < Me < Mo Para una muestra : x < me < mo

Distribucin simtrica
Media= Mediana = Moda

Distribucin asimtrica sesgo a la izquierda


Media Mediana Moda

Distribucin asimtrica sesgo a la derecha


Moda Mediana Media

2. Coeficiente de Asimetra de Pearson Se define como: 3( Me ) Para la poblacin: As = Para una muestra: as =

3 ( x me ) S

Observaciones: Si as=0 entonces la distribucin es simtrica. Si as<0 entonces la distribucin es asimtrica negativa o a la izquierda Si as>0 entonces la distribucin es asimtrica positiva o a la derecha 3. Diagrama de Cajas (Box Plot) Es una grfica que describe la distribucin de un conjunto de datos en referencia a los valores en los cuartiles como medidas de posicin y al valor del rango intercuartil como medida de referencia de la variabilidad. Constituye un medio relativamente sencillo para analizar el grado de asimetra de la distribucin. Con la ayuda de estos diagramas se puede determinar en forma grfica lo siguiente: Los valores extremos, valores atpicos, datos discordantes outliers. La variabilidad de dos o ms conjuntos de datos. La asimetra o simetra del 50% central de los datos.

16

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA

DIAGRAMA DE CAJAS Y SUS PARTES

Valor mximo de las observaciones

outlier (valor fuera de los lmites)

x( n 1)

L.S.

Q3 Q2=me Q1

Valor mnimo de las observaciones

L.I.

donde: Lmite Inferior : L.I . = Q1 1.5ri Lmite Superior: L.S . = Q3 +1.5ri Ejemplo: La empresa Hobbie maneja un sistema de atencin al cliente por turnos, el cual no es muy eficiente. Con la finalidad de mejorar su sistema de atencin se eligieron al azar 44 clientes y se registr el tiempo (en minutos) en que se demoraron en ser atendidos. Las observaciones y los resultados luego de ser procesados con el software estadstico MINITAB se presentan a continuacin: 10.2 19.8 21.4 25.0 25.3 13.4 19.9 22.0 25.1 25.4 13.5 20.0 22.0 25.1 25.5 15.6 20.1 22.3 25.1 25.8 15.8 20.3 22.5 25.1 17.0 20.3 23.1 25.2 17.5 20.8 23.2 25.3 17.7 21.0 23.4 25.3 17.9 21.0 24.5 25.3 19.2 21.4 24.9 25.3

Descriptive Statistics: Tiempo Esp


Variable Tiempo E Variable Tiempo E N 44 Mean 21.489 Median 22.000 TrMean 21.765 Q1 19.825 Q3 25.100 StDev 3.853 SE Mean 0.581

Minimum 10.200

Maximum 25.800

a. A travs del histograma verifique la simetra o asimetra del conjunto de datos.

17

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA

Distribucin del tiempo de espera por cliente


15

Num. clientes atendidos

10

0 10.2 12.5 Fuente: Hobbies Funny Games S.R.L. Elaborado por: G.F. Fecha: 10-02-05 14.8 17.1 19.4 21.7 24.0 26.3

Tiempo Espera

b. Halle el coeficiente de asimetra de Pearson

as =

3 ( x me ) 3 ( 21.489 22 ) = = 0.398 S 3.853

Los datos tienen una distribucin asimtrica negativa o tambin se puede decir que la distribucin de los datos tiene un sesgo a la izquierda. c. Presentar el Diagrama de Cajas (Box plot) e indique cada una de sus partes.
Q1 = 19.825 me = 22
xmax

ri = Q3 Q1 = 25.1 19.825 = 5.275

Q3 = 25.1

L.I . = Q1 1.5ri = 19.825 1.5(5.275) = 11.9125

L.S . = Q3 +1.5ri = 25.1 +1.5(5.275) = 33.0125 = max = 25.8

xmin = min = 10.2

18

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA


Diagrama de Cajas del Tiempo de Espera por cliente
LS=33.0125 max=25.8

25

Q3=25.1 me=22

Tiempo de Espera

20

Q1=19.825

15 13.4 min=10.2

LI=11.9125 10 Fuente: Hobbies Funny Games Elaborado por: G.F. Fecha:10-02-05

Otra forma de representar el grfico de cajas es:


Diagrama de Cajas del Tiempo de Espera por cliente

Q1=19.825

me=22

Q3=25.1

min=10.2

13.2

max=25.8

10

LI=11.9125

15

20

25

LS=33.0125

Fuente: Hobbies Funny Games Elaborado por: G.F. Fecha: 10-02-05

Tiempo de Espera

19

UNIVERSIDAD NACIONAL AGRARIA DEPARTAMENTO DE ESTADISTICA E INFORMATICA

Stem-and-Leaf Display: C5
Stem-and-leaf of C5 Leaf Unit = 0.10 2 7 (9) 9 6 1 1 1 1 2 3 4 5 6 7 8 56 04669 333455679 269 34556 6 N = 27

Coloque los valores correspondiente al siguiente diagrama de caja


Boxplot of C5
9 8 7 6 C5 5 4 3 2 1

Si existe un valor outliers Cul es su valor? Justifique en forma matemtica Que tipo de asimetra tiene el 50% de los datos Que tipo de asimetra tiene 100% de los datos
Variable C2 N 24 Mean 3.658 SE Mean 0.255 StDev 1.250 Minimum 1.500 Q1 2.675 Median 3.500 Q3 4.825 Maximum 5.600

20

Você também pode gostar