Você está na página 1de 21

ESTADSTICA PARA INGENIERA

Clase: Anlisis de Datos Bidimensionales

LORETTA GASCO CAMPOS


lgasco@pucp.edu.pe

ANLISIS DE DATOS BIVARIADOS


Objetivo: estudiar Y(horas), el tiempo que necesita el computador central
para procesar una cantidad, X, de ciertos trabajos especiales.
Metodologa: se procesaron en diferentes oportunidades, n = 25,
determinadas cantidades, x, de trabajos de este tipo, observndose el
tiempo empleado, y (horas), en cada oportunidad.
x

11

15

10

15

5,5 8

11

13

20

11

5,5 9,2 12

20

8,4 13

11

10

15

10

8,4 11

12

5,9 8,2 9,4 12

11

20

12

5,5 8,6

11

ORGANIZACIN DE DATOS BIDIMENSIONALES

Tablas de distribucin de frecuencias de datos


bidimensionales :
absolutas, relativas, porcentuales.

Representaciones grficas:
Diagrama de dispersin

TABLA DE DISTRIBUCIN DE FRECUENCIAS DE (X, Y)


y1

y2

...

yj

...

ym

x1

f11

f12

...

f1j

...

f1m

x2

f21

f22

...

f2j

...

f2m

...

...

...

...

...

xi

fi1

fi2

...

fij

...

fim

...

...

...

...

...

...

xn

fn1

fn2

...

fnj

...

fnm

fy

fx

TABLA DE DISTRIBUCIN DE FRECUENCIAS DE (X, Y)


[b1 , b2]

]b2 , b3]

...

]bj , bj+1]

...

]bm , bm+1]

X
[a1 , a2]

f11

f12

...

f1j

...

f1m

]a2 , a3]

f21

f22

...

f2j

...

f2m

...

...

...

...

...

]ai , ai+1]

fi1

fi2

...

fij

...

fim

...

...

...

...

...

...

]an, an+1]

fn1

fn2

...

fnj

...

fnm

fy

fx

REPRESENTACIN GRFICA:
DIAGRAMA DE DISPERSIN
Grfica en el plano X-Y de los datos bidimensionales (xi , yi), i = 1,,n

ANLISIS EXPLORATORIO DE DATOS BIDIMENSIONALES (X,Y)

MEDIDAS RESUMEN
PARMETROS : medidas resumen en la poblacin de la variable (X, Y)
ESTADSTICAS : medidas resumen en la muestra de la variable (X, Y)

MEDIDAS DE POSICIN:

MEDIDAS DE DISPERSIN: varianza X, varianza Y,


desviacin estndar X, desviacin estndar Y, rango X, rango Y,
rango intercuartil X, rango intercuartil Y

MEDIDAS DE POSICIN RELATIVAS: percentiles, cuartiles, quintiles, deciles


de cada variable X e Y.

MEDIDA DE COVARIACIN LINEAL: coeficiente de correlacin lineal

centro de masa= (media X, media Y)

8.0800
9.0000
7.00
2.00
15.00

10.7840
11.0000
11.00
5.50
20.00

Desviacin estndar
Varianza
Rango

3.90427
15.243
13.00

4.16590
17.355
14.50

Suma

202.00

269.60

5.0
9.0
10.5

8.3
11.0
12.0

Media
Mediana
Moda
Mnimo
Mximo

Percentiles

Sesgo
Curtosis

25
50
75

0.076
-0.447

1.083
0.996

EN CADA UNO DE LOS CONJUNTOS DE DATOS,


LA MEDIA VALE 3 Y LA DESVIACIN ESTNDAR 1
TANTO EN LA DIRECCIN HORIZONTAL COMO VERTICAL.

COEFICIENTE DE CORRELACIN LINEAL


Sean {(xi, yi), i=1,2,..,n} valores observados o medidos de la ocurrencia
simultnea de X e Y. Se define el Coeficiente de Correlacin Lineal de X
e Y, XY (si es poblacin) rXY (si es muestra), mediante

Poblacin:

XY = (1/n) i=1,,n zxi zyi


Muestra:

rXY = (1/(n-1)) i=1,,n zxi zyi


donde zxi es el dato xi estandarizado, y
zyi es el dato yi estandarizado

XY

EL COEFICIENTE DE CORRELACIN
MIDE LA INTENSIDAD DE LA AGRUPACIN
QUE EXISTE EN TORNO A UNA LNEA

REGRESIN LINEAL SIMPLE

datos {(xi, yi), i=1,,n} y = a + b x

MTODO DE CUADRADOS MNIMOS


Min a, b i=1,,n (yi - a b xi)2

a = b
b = r ( SY / SX )

DIAGRAMA DE DISPERSIN

CORRELACIN LINEAL

Y=a+bx

AJUSTE DE UNA
RECTA DE MNIMOS CUADRADOS

R2 = 0.81
81% de la VARIANZA de Y
es EXPLICADA por
la RELACIN LINEAL de Y con X

R2 COEFICIENTE DE
DETERMINACIN

X (litros)

1,65

1,03

0,74

0,61

0,53

0,45

Y (kg/cm2)

0,5

1,0

1,5

2,0

2,5

3,0

a) Dibujar el diagrama de dispersin correspondiente


b) Encontrar el coeficiente de correlacin
c) Encontrar la recta de regresin de Y sobre X
d) Cun bueno es el ajuste lineal?
e) Qu presin le corresponde a un volumen de 1 litro?

Você também pode gostar