Escolar Documentos
Profissional Documentos
Cultura Documentos
INFORME DE ANALISIS
BIDIMENSIONAL DE DATOS
TACNA PER
2012
INTRODUCCIN
Estadstica, disciplina que estudia cuantitativamente los fenmenos de masa o colectivos, o
sea, aquellos fenmenos cuyo estudio solo puede efectuarse a travs de una coleccin de
observaciones; es decir , La Estadstica es una disciplina que utiliza recursos matemticos
para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir
conclusiones respecto de ellos.
Sin embargo, al considerar dos variables de una poblacin o muestra, no podemos afirmar
que se trata de una variable bidimensional porque la relacin entre las variables puede no
ser estadstica.
ANALISIS BIDIMENSIONAL
1. Notacin:
2. Anlisis cualitativo:
Si dos atributos son dependientes, se pueden construir una serie de coeficientes que nos
midan el grado asociacin o dependencia entre los mismos.
a) Diagrama de dispersin
Como se puede ver en ambos diagramas, ninguna recta es capaz de pasar por
todos los puntos, y seguir siendo recta. De todas las rectas posibles, la recta de
regresin de y sobre x es aquella que minimiza un cierto error, considerando a X
como variable explicativa o independiente y a Y como la explicada o
dependiente.
b) Grfico QQ plot
3. Anlisis cuantitativo:
Las variables cuantitativas son las que pueden expresarse numricamente. Una primera
clasificacin, basada en el tipo de valores que puede tomar, permite distinguir entre
variables cuantitativas discretas que son, frecuentemente el resultado de contar y, por
tanto, toman slo valores enteros y continuas, que resultan de medir y pueden contener
cifras decimales.
a) Covarianza
Para las variables estadsticas bidimensionales se define la covarianza como
la media aritmtica de los productos de las desviaciones respecto de la media de
cada una de las variables componentes. Es decir:
Una covarianza positiva y alta indica que ambas variables crecen o decrecen
simultneamente, es decir, presentan una fuerte correlacin. Cuando mayor sea
la covarianza, ms estrecha es la relacin entre las variables.
La covarianza cero o prxima a cero indica que no existe relacin entre las
variables.
b) Coeficiente de correlacin
Si todos los puntos parecen estar cerca de una curva, la correlacin se dice no
lineal y una ecuacin no lineal es la apropiada para la regresin o estimacin,
una correlacin no lineal puede ser a veces positiva o negativa. Si no hay
ninguna relacin entre las variables (c) se dice que no hay correlacin entre
ellas, es decir no estn correlacionadas.
MINIMOS CUADRADOS
N X Y
XY X Y
Y* ei
1 240 25 6000 57600 625 34,10985915 82,98953382
2 236 31 7316 55696 961 31,73840376 0,545240107
3 290 45 13050 84100 2025 63,75305164 351,6769459
4 274 60 16440 75076 3600 54,26723005 32,86465133
5 301 65 19565 90601 4225 70,27455399 27,8209198
6 316 72 22752 99856 5184 79,16751174 51,3732245
7 300 80 24000 90000 6400 69,68169014 106,4675183
8 296 84 24864 87616 7056 67,31023474 278,5482644
9 267 75 20025 71289 5625 50,1171831 619,1545769
10 276 60 16560 76176 3600 55,45295775 20,67559326
11 288 50 14400 82944 2500 62,56732394 157,9376311
12 261 38 9918 68121 1444 46,56 73,2736
3345 685 194890 939075 43245 685 1803,3277
promedio 278,75 57,0833333 16240,8333 78256,25 3603,75 57,08333333 150,2773083
ANALISIS CUANTITATIVO
VARIABLE VALOR
COVARIANZA 328,8541667
D.E. DE (X) 23,5518046
D. E. DE (Y) 18,5807173
C.CORRELACION 0,751478714
C.CORRELACION 0,751478714
R 0,751465235
VARIANZA DE X 605,1136364
VARIANZA DE Y 376,6287879
POR MATRICES
12 3345 a 685
[ 3345 939075 ] [ b ] = [ 194890 ]
MATRIZ INVERSA
11,75680751 -0,041877934 a -108,177465
[ -0,041877934 0,000150235 ] [ b ] = [ 0,59286385 ]
GRAFICO DE DISPERCION
90
80
70
60
50
Series1
40 Linear (Series1)
30
20 y = 0.5929x - 108.18
R = 0.5647
10
0
0 100 200 300 400
MODELO NO LINEAL
PROCESO PRCTICO - MANUAL
Y=bx+na
XY = b x2 + a x
___________________________________
685 = b*3345 + 12*a (-278,75)
194890 = b *939075 + 3345*a
___________________________________
-190943,75 = 932418,75*b - 3345*a
194890 = 939075*b + 3345*a
___________________________________
3946,25 = 6656,25*b
b = 0,5928
a = -108,159
Y* = b x + a
Y* = (0,5928) x + (+108,159)
Y* = 34,113
Y* = 31,742
Y* = 63,753
Y* = 54,268
Y* = 70,274
Y* = 79,166
Y* = 69,681
Y* = 67,309
Y* = 50,118
Y* = 55,454
Y* = 62,567
Y* = 46,562
CALCULO DE LA COVARIANZA
Cxy = XY X Y
Cxy = 16240,8 (278,75) (57,08)
Cxy = 329,75
CALCULO DEL COEFICIENTE DE CORRELACION
SE = 180,3384 = 13,429
PROCESO PRCTICO - EXCEL
COVARIANZA
x1 x2 x3 x4
x1 -0,00836735 -0,00061224 0,000114286
x2 0,00122449 -4,28571E-05
x3 -1,42857E-06
x4
COEFICIENTE DE CORRELACION
x1 x2 x3 x4
x1 -0,23465763 -0,2136544 0,375340516
x2 0,777713771 -0,256173769
x3 -0,10625593
x4
PERCENTILES RANGO X1 X2 X3 X4
0,05 5 1,06 0,3 0,01 0,0013
0,1 10 1,12 0,3 0,01 0,0016
0,15 15 1,18 0,3 0,01 0,0019
0,2 20 1,2 0,32 0,01 0,0022
0,25 25 1,2 0,35 0,01 0,0025
0,3 30 1,2 0,38 0,01 0,0028
0,35 35 1,21 0,4 0,01 0,003
0,4 40 1,24 0,4 0,01 0,003
0,45 45 1,27 0,4 0,01 0,003
0,5 50 1,3 0,4 0,01 0,003
0,55 55 1,36 0,43 0,013 0,003
0,6 60 1,42 0,46 0,016 0,003
0,65 65 1,48 0,49 0,019 0,003
0,7 70 1,52 0,52 0,022 0,0032
0,75 75 1,55 0,55 0,025 0,0035
0,8 80 1,58 0,58 0,028 0,0038
0,85 85 1,62 0,61 0,031 0,0041
0,9 90 1,68 0,64 0,034 0,0044
0,95 95 1,74 0,67 0,037 0,0047
GRAFICOS DE DISPERCION
X1 X2
0.8
0.7
0.6
0.5
0.4
Series1
0.3
0.2
0.1
0
0 0.5 1 1.5 2
X1 X3
0.045
0.04
0.035
0.03
0.025
0.02 Series1
0.015
0.01
0.005
0
0 0.5 1 1.5 2
X1 X4
0.006
0.005
0.004
0.003
Series1
0.002
0.001
0
0 0.5 1 1.5 2
X2 X3
3.5
2.5
2
Series1
1.5
0.5
0
0 10 20 30 40 50 60 70
X2 X4
0.006
0.005
0.004
0.003
Series1
0.002
0.001
0
0 0.2 0.4 0.6 0.8
X3 X4
0.006
0.005
0.004
0.003
Series1
0.002
0.001
0
0 0.01 0.02 0.03 0.04 0.05
GRAFICOS QQ PLOT
X1 X2
0.8
0.7
0.6
0.5
0.4
Series1
0.3
0.2
0.1
0
0 0.5 1 1.5 2
X1 X3
0.04
0.035
0.03
0.025
0.02
Series1
0.015
0.01
0.005
0
0 0.5 1 1.5 2
X1 X4
0.005
0.0045
0.004
0.0035
0.003
0.0025
Series1
0.002
0.0015
0.001
0.0005
0
0 0.5 1 1.5 2
X2 X3
0.04
0.035
0.03
0.025
0.02
Series1
0.015
0.01
0.005
0
0 0.2 0.4 0.6 0.8
X2 X4
0.005
0.0045
0.004
0.0035
0.003
0.0025
Series1
0.002
0.0015
0.001
0.0005
0
0 0.2 0.4 0.6 0.8
X3 X4
0.005
0.0045
0.004
0.0035
0.003
0.0025
Series1
0.002
0.0015
0.001
0.0005
0
0 0.01 0.02 0.03 0.04
PROCESO PRCTICO - EXCEL
TABLA DE DATOS
N Y X1 X2 X1Y X2Y X1^2 X2^2 X1X2
1 0,46 8,4 3,7 3,864 1,702 70,56 13,69 31,08
2 0,35 9,3 3,6 3,255 1,26 86,49 12,96 33,48
3 0,41 7,7 2,8 3,157 1,148 59,29 7,84 21,56
4 0,43 9,8 4,2 4,214 1,806 96,04 17,64 41,16
5 0,4 7,3 2,5 2,92 1 53,29 6,25 18,25
6 0,33 8,5 3 2,805 0,99 72,25 9 25,5
7 0,38 9,5 2,5 3,61 0,95 90,25 6,25 23,75
8 0,49 7,4 3,8 3,626 1,862 54,76 14,44 28,12
9 0,42 7,8 4 3,276 1,68 60,84 16 31,2
3,67 75,7 30,1 30,727 12,398 643,77 104,07 254,1
COVARIANZA
x1 x2
x1 0,10283951
x2
COEFICIENTE DE CORRELACION
x1 x2
x1 0,18899957
x2
POR MATRICES
MATRIZ INVERSA
PERCENTILES RANGO X1 X2
0,05 5 7,34 2,5
0,1 10 7,38 2,5
0,15 15 7,46 2,56
0,2 20 7,58 2,68
0,25 25 7,7 2,8
0,3 30 7,74 2,88
0,35 35 7,78 2,96
0,4 40 7,92 3,12
0,45 45 8,16 3,36
0,5 50 8,4 3,6
0,55 55 8,44 3,64
0,6 60 8,48 3,68
0,65 65 8,66 3,72
0,7 70 9,3 3,76
0,75 75 9,3 3,8
0,8 80 9,38 3,88
0,85 85 9,46 3,96
0,9 90 9,56 4,04
0,95 95 9,68 4,12
GRAFICOS DE DISPERCION
4.5
3.5
2.5
2 Series1
1.5
0.5
0
0 2 4 6 8 10 12
GRAFICOS QQ PLOT
4.5
3.5
2.5
2 Series1
1.5
0.5
0
0 2 4 6 8 10 12
CONCLUSIONES
Es importante recordar que mientras mas fuerte sea la correlacin entre dos variables
mayor el poder predictivo existente entre ellas. El trmino "correlacin", se utiliza cuando
las variables involucradas en la relacin son de tipo intervalo (proporcional), es decir
cuantitativas en sentido estricto, pero adems la "correlacin", busca mediante la medida
de co-variacin de variables, predecir a partir del conocimiento de una de ellas el
comportamiento de la otra variable.
Cuando la nube de puntos del diagrama de dispersin permita deducir algn tipo de
dependencia entre las dos variables X, Y, concentrndose los puntos alrededor de una
cierta lnea (lnea de regresin) se plantean dos cuestiones:
a) Definir la lnea.