Você está na página 1de 5

)

DISTRIBUCIONES BIDIMENSIONALES


RESULTAN DE ESTUDIAR FENMENOS EN LOS QUE PARA CADA OBSERVACIN
SE OBTIENE UN PAR DE MEDIDAS Y, EN CONSECUENCIA, DOS VARIABLES.

Ejemplos.
Talla y peso de los soldados de un regimiento.
Calificaciones en Fsica y Matemticas de los alumnos de una clase.
Gastos de publicidad y ventas de una fbrica.
Etc.

Estas variables resultantes de la observacin de un fenmeno respecto de dos modalidades se
llaman variables estadsticas bidimensionales.

Los valores de una variable estadstica bidimensional son pares de nmeros reales de la forma (x
i
,
y
i
).
Representados en un sistema de ejes cartesianos se obtiene un conjunto de puntos llamado
diagrama de dispersin o nube de puntos.

Ejemplo: Nube de puntos de la distribucin dada por la tabla siguiente:

Notas de Matemticas y Fsica de 10 alumnos
Matemticas 5 6 2 9 4 5 1 3 7 7
Fsica 4 5 3 8 4 5 2 2 6 8
























Parmetros estadsticos.
Media de la variable X:
N
x n
x
i i

Media de la variable Y:
N
y n
y
i i

Notas de Matemticas
Notas
de
Fsica

)
Varianza de la variable X:
2
2
2
x
N
x n
s
i i
x



Varianza de la variable Y:
2
2
2
y
N
y n
s
i i
y



Covarianza: y x
N
y x n
s
i i i
xy
.



Correlacin.
Estudia la relacin o dependencia que existe entre dos variables que intervienen en una
distribucin bidimensional.

Coeficiente de correlacin lineal.
Es un nmero que mide el grado de dependencia entre las variables X e Y.
Se mide mediante la siguiente frmula:
y x
xy
s s
s
r
.

Su valor est comprendido entre 1 y 1.
Si r = -1 r = 1 todos los valores de la variable bidimensional se encuentran situados sobre
una recta.
Si 1< r < 0 se dice que las variables X e Y estn tambin en dependencia aleatoria. La
correlacin es negativa.
Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin en dependencia
aleatoria.

La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es tanto ms dbil a
medida que se aproxima a 0.

Recta de regresin.
Tenemos una distribucin bidimensional y representamos la nube de puntos correspondiente. La
recta que mejor se ajusta a esa nube de puntos recibe el nombre de recta de regresin. Su
ecuacin es la siguiente:
Recta de regresin de y sobre x: ) (
2
x x
s
s
y y
x
xy

Recta de regresin de x sobre y: ) (
2
y y
s
s
x x
y
xy

A partir de esta recta podemos calcular los valores de x conocidos los de y. La fiabilidad que
podemos conceder a los clculos obtenidos viene dada por el coeficiente de correlacin: si r es
muy pequeo no tiene sentido realizar ningn tipo de estimaciones.
Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores reales.
Si r = 1 o r = -1 , las estimaciones realizadas coincidirn con los valores reales.

Ejercicios resueltos.
1.- Una compaa de seguros considera que el nmero de vehculos (Y) que circulan por una
determinada autopista a ms de 120 kms/h, puede ponerse en funcin del nmero de accidentes
(X) que ocurren en ella.
Durante 5 das obtuvo los siguientes resultados:
X 5 7 2 1 9
Y 15 18 10 8 20
a) Calcula el coeficiente de correlacin lineal.
b) Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que circulaban por
la autopista a ms de 120 kms/h?
c) Es buena la prediccin?

)
Solucin:
Disponemos los clculos de la siguiente forma:
(Accidentes)
x
i

Vehculos
y
i


x
i
2


y
i
2


x
i
y
i
5
7
2
1
9
15
18
10
8
20
25
49
4
1
81
225
324
100
64
400
75
126
20
8
180
24 71 160 1113 409



8 , 4
5
24


N
x
x
i
; 2 , 14
5
71


N
y
y
i
; 96 , 8 8 , 4
5
160
2
2
2
2


x
N
x
s
i
x


96 , 20 2 , 14
5
1113
2
2
2
2


y
N
y
s
i
y
; 2 , 14 . 8 , 4
5
409
.

y x
N
y x
s
i i
xy
=13,64

a) 996 , 0
96 , 20 . 96 , 8
64 , 13
.

y x
xy
s s
s
r
b) Recta de regresin de y sobre x: ) (
2
x x
s
s
y y
x
xy

) 8 , 4 (
96 , 8
64 , 13
2 , 14 x y ; ) 8 , 4 ( 53 , 1 2 , 14 x y
Para x = 6, ) 8 , 4 6 ( 53 , 1 2 , 14 y , es decir, y = 16,04. Podemos suponer que ayer
circulaban 16 vehculos por la autopista a ms de 120 kms/h.
c) La prediccin hecha es buena ya que el coeficiente de correlacin est muy prximo a 1.
2.- Las calificaciones de 40 alumnos en psicologa evolutiva y en estadstica han sido las
siguientes:
X
calif. en psicol.
Y
calif. en estad.
Nmero
de alumnos.
3
4
5
6
6
7
7
8
10
2
5
5
6
7
6
7
9
10
4
6
12
4
5
4
2
1
2

Obtener la ecuacin de la recta de regresin de calificaciones de estadstica respecto de las
calificaciones de psicologa.
Cul ser la nota esperada en estadstica para un alumno que obtuvo un 4,5 en psicologa?

Solucin:
Se pide la recta de regresin de y sobre x:


)
) (
2
x x
s
s
y y
x
xy

Disponemos los datos de la siguiente forma:
x
i
y
i
n
i
n
i
x
i
n
i
y
i
n
i
x
i
2
n
i
y
i
2
n
i
x
i
y
i
3
4
5
6
6
7
7
8
10
2
5
5
6
7
6
7
9
10
4
6
12
4
5
4
2
1
2
12
24
60
24
30
28
14
8
20
8
30
60
24
35
24
14
9
20
36
96
300
144
180
196
98
64
200
16
150
300
144
245
144
98
81
200
24
120
300
144
210
168
98
72
200
40 220 224 1314 1378 1336

5 , 5
40
220


N
x n
x
i i
; 6 , 5
40
224


N
y n
y
i i


6 , 2 8 , 30 4 , 33 ) 6 , 5 ).( 3 , 5 (
40
1336
.

y x
N
y x n
s
i i i
xy


6 , 2 25 , 30 85 , 32 ) 6 , 5 (
40
1314
2
2
2
2


x
N
x n
s
i i
x


Sustituyendo en la ecuacin de la recta de regresin, resulta:
) 5 , 5 (
6 , 2
6 , 2
6 , 5 x y , es decir, 1 , 0 x y
Si un alumno que tiene una nota de 4,5 en psicologa, la nota esperada en estadstica ser:
y(4,5) = 4,5 + 0,1 = 4,6
Se sustituye en la recta de regresin.
La fiabilidad viene dada por el coeficiente de correlacin:
y x
xy
s s
s
r
.

6 , 2
xy
s ; 61 , 1 6 , 2
2

x x
s s
09 , 3 ) 6 , 5 (
40
1378
2
2
2
2


y
N
y n
s
i i
y
; 75 , 1 09 , 3
y
s

y resulta 92 , 0
) 75 , 1 ).( 61 , 1 (
6 , 2
r

La correlacin es positiva, es decir, a medida que aumenta la nota de estadstica aumenta tambin
la nota en psicologa. Su valor est prximo a 1 lo que indica que se trata de una correlacin fuerte,
las estimaciones realizadas estn cerca de los valores reales.




)
Tablas de doble entrada.
En las distribuciones bidimensionales, cuando hay pocos pares de valores, se procede como
hemos hecho, es decir, enumerndolos. Si algn par est repetido se pone dos veces, pero cuando
el nmero de datos es grande, se recurre a las tablas de doble entrada.
En cada casilla se pone la frecuencia correspondiente al par de valores que definen esa casilla.
Ejemplo:
x
y

0

1

2
0 2 1 0
1 3 4 1
2 0 5 3

Lo que indica el nmero de veces que est cada par. El par (0, 1) est 3 veces.
El par (1, 2) est 5 veces. Etc.

Ejercicios propuestos.

1.- Las notas obtenidas por 10 alumnos en Matemticas y en Msica son:
Alumnos Mat. Ms.
1
2
3
4
5
6
7
8
9
10
6
4
8
5
3,5
7
5
10
5
4
6,5
4,5
7
5
4
8
7
10
6
5

a) Calcula la covarianza, las varianzas y el coeficiente de correlacin.
b) Existe correlacin entre las dos variables?
c) Calcula la recta de regresin. Cul ser la nota esperada en Msica para un alumno que
hubiese obtenido un 8,3 en Matemticas?

(Soluc. 3,075; 3,76; 2,96; 0,92; y = 1,6 + 0,817x; 8,38)

2.- Cinco nias de 2, 3, 5, 7 y 8 aos de edad pesan respectivamente 14, 20, 30, 42 y 44 Kg. Halla
la ecuacin de la recta de regresin de la edad sobre el peso. Cul sera el peso aproximado de
una nia de 6 aos?.
( Sol. x = 0,192y-0,76; 35,2 Kg.)

3.- La tabla adjunta da el ndice de mortalidad de una muestra de poblacin en funcin del
consumo diario de cigarrillos:
Nmero de cigarrillos x 3 5 6 15 20
ndice de mortalidad y 0,2 0,3 0,4 0,5 0,7

a) Determina el coeficiente de correlacin e interpreta el resultado.
b) Halla la recta de regresin de y sobre x
c) Cul ser el ndice de mortalidad para un consumidor de 40 cigarrillos diarios?

Você também pode gostar