Você está na página 1de 27

DISTRIBUCIONES BIDIMENSIONALES

Aqu interesa el estudio estadstico descriptivo de dos caractersticas de inters medidas a


individuos que pertenezcan a una poblacin o muestra bajo estudio.
Los datos se recolectan de la forma (X,Y) donde X es una caracterstica de inters con n
modalidades, es decir, X1, X2, X3,X4,......Xn y la variable y (o caracterstica y) con una
modalidad de m categoras, es decir: Y1, Y2, Y3,Y4,......Ym
As por ejemplo:
Sea X : peso
Sea Y : estatura
Para un grupo de 20 personas
X : peso
X1
X2
X3

Y : estatura
Y1
Y2
Y3

Xn

Ym

Estos datos parece razonable resumirlos en una tabla de doble entrada . Debido a que dos
variables son continuas, se debe determinar los intervalos o clases para cada variable
(como se hacia en el caso unidimensional).
LOS TIPOS DE DATOS QUE SE PUEDEN ANALIZAR SON:
TIPO
Cualitativa / cualitativa
Cuantitativa / cualitativa

VARIABLES (x , y)
Categrica / categrica
Continua / categrica

Cuantitativa / cualitativa

Discreta /categrica

EJEMPLOS
Color cabello / sexo
Peso / color de ojos
Pulsacin por minuto /
estado civil

DISTRIBUCIONES BIDIMENSIONALES
Estos datos se pueden mostrar en una tabla de frecuencias de doble entrada.
Y

X1

...............

Total
marginal
de X
n1

X2

...............

n2

X3
.
.
.
Xn
Total
marginal
de Y

...............

n3
.
.
.
nn

Y1

Y2

Y3

...............

Ym

...............
...............

n1

n2

n3

nm

...............

X 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4
Y 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4
f 8 19 35 16 3 23 37 22 6 1 35 20 16 2 1 17 4 1 0 0 2 1 1 0 0
Y

31

66

83

85

Total
marginal
Y

19
0,029

27

0,029
23
0,085

87

0,114
35
0,129

142

0,243
17
0,062

163

0,305
2
0,007
0,312

n1 85

166

35
0,070

0,099
37
0,137
0,322
20
0,074
0,525
4
0,014
0,603
1
0,003
0,614

62

16
0,129

78

0,228
22
144

0,081

215

166

0,059

n2 81

11

170

0,007

244

261

0,003

n2 89

0,003

n3 74

0,903
0
0

266

0,966
0
265

n4 22

n5 4

0,985
0
0

270

0,892

0,981

n3 75

n4 24

n5 5

8+19+35+16+3=81

Explicacin
INTERPRETACIN DE UNA CELDA

n1 81

0,003
0,629
1

0,885
0
0,003

0,011
0,298
1

0,022

239

0,877
1
241

81

0,614
2

0,796
1
237

3
0,059

0,287
6

0,533
16

Total
marginal X

270

11

Existen 16 familias con 2 hijos hombres y 2 hijas


mujeres, que representan el 5,9% del total (270), 215
familias que tienen desde 0 hijos hasta 2 y desde 0
hasta 2 hijas y representan el 79,6% del total de la
poblacin.

a) Considerando el total de hijos (hombres y mujeres) que tiene cada familia cul es el
promedio de estos en las 270 familias? R.- 2,4 hijos.
b) Obtener las distribuciones marginales para cada variable.
c) En esta muestra de familias Cuntos hijos hombres hay?, hay ms hijos hombres
o ms hijas mujeres? R.- H = 323 M = 319
d) Cul es el promedio de hijos varones por familia? R.- 1,2.
e) Cul es el promedio de hijas por familia? R.- 1,2.
f)

Calcule la moda para cada distribucin marginal. Qu significa este valor?


R.- moda hijos: 0 moda hijas: 1

g) Calcule la varianza y desviacin tpica para cada distribucin marginal. En cul de


las variables (X o Y) los datos estn ms dispersos? R.- 0,9797 y 1,0351.
h) Cuntas familias tienen slo un hijo hombre, sin importar si tienen o no hijas
mujeres?. R.- 81
i) Obtener la distribucin condicional para el nmero de hijas en las familias que tienen
2 hijos hombres.
j)

Cul es la distribucin de los hijos hombres en las familias con una hija mujer?

k) Cul es el promedio de hijos hombres para las familias que tienen una hija mujer?
R.- 1,16.
l) Cul es el promedio de hijas en las familias que tienen 2 hijos hombres?
R.- 0,81.
m) Cul es el promedio de hijos hombres en las familias que no tienen hijas?
R.- 1,84.

DISTRIBUCIONES CONDICIONALES, MEDIAS Y


VARIANZAS CONDICIONALES.

DISTRIBUCIONES CONDICIONALES: Consiste en conocer la distribucin de una


variable, condicionando a la otra algn valor especifico que sta toma.
Es decir, la distribucin condicional de X dado que Y = yj
Distribucin
Distribucin
condicional
(H)
condicional (H)

H (x / y y j )

H (x / y y j )

H ( y / x xi )
Ejemplo:
Obtenga la distribucin condicional de x dado que y = 3 en el
ejemplo de las 270 familias.
Hay 16 familias con 3
Hayy16
familias con 3
hijos
0 hijas
hijos y 0 hijas

X1

X
0

H(x/y =3)
16

f14a

X2

f 24a

X3

f 34a

X4

f 44a

X5

4
Total

0
24

f 54a

X1

f ija

X2

fija

X3

fija

.
.
.
Total

.
.
.
n.j

Existen 24 familias
Existen
con
3 hijos24 familias
con 3 hijos

MEDIA CONDICIONAL :
n

M(x/y = yj)

i 1

* f ija

n. j
5

M(x/y = 3)

X * f
i 1

n.4

a
14

x1 * f14a x2 * f 24a x3 * f34a x4 * f 44a x5 * f54a

24

0*16 1*6 2*2 3*0 4*0 10

0, 42hijas
24
24

VARIANZA CONDICIONAL:
n

2 ( X / Y y j ) VAR( X / Y y j )

2
a
X
*
f
i ij

M ( X / Y y j )

i 1

n. j

0 *162 1*6 2 2 * 22 3*0 2 4 0 2 36 16 52

2,16
24
24
24

COEFICIENTE DE VARIACIN:

C.V .( X / Y y J )

M ( X / Y yJ )
VAR( X / Y yJ )

ANLISIS DE REGRESIN LINEAL SIMPLE


Es un mtodo estadstico que permite evaluar la relacin que existe entre dos
variables, una llamada variable independiente X y la otra llamada variable dependiente Y.
La variable dependiente es una funcin lineal y es una variable aleatoria , mientras
que la variable independiente toma valores especficos y f ( x ) . A la variable
dependiente Y se le llama VARIABLE RESPUESTA y a la variable X se le llama
VARIABLE PREDICTORA.
El modelo de regresin lineal simple se caracteriza por tener solamente una
variable independiente.
y b0 b1 X i
Donde: b0 Y b1 X
y
x

Pero :

scxy
b1

scx

Sean los siguiente datos:

X2

Y2

X *Y

Covarianza
Covarianza

n
( x ) 2
n

Pendiente
Pendiente

Indica el tipo de relacin entre


el tipo
relacin
lasIndica
variables,
esde
decir,
si el entre
las variables,
es decir,
si el
valor
de la relacin
es positiva
de la relacin
es positiva
esvalor
directamente
proporcional.
es directamente proporcional.

xy

x y

3
4
6
8
21

6
7
15
24
52

9
16
36
64
125

36
49
225
576
886

18
28
90
192
328

4,61
8,34
15,80
23,26
Es directamente
Es directamente
proporcional
por
proporcional
ser positiva por
ser positiva

21*52
4 55 3, 73
b1
(21) 2
14, 75
125
4
328

52
21
b0 y b1 * x b0
3, 73*
4 r 1 4

13 19,58 6,58

y 6,58 3, 73 X i

b1 0
cov 0

r 1
b1 0
cov 0

b1 0
r 1
cov 0

r 1
b1 0

1 r 1

cov 0

b1 0
cov 0
r 0

No hay ninguna
No hayentre
ninguna
relacin
las
relacin
entre las
variables
variables

Frmula del coeficiente de Correlacin

ei y1 yi
Error de
Error de
estimacin
estimacin

scxy
r
scx * scy

Coeficiente de correlacin
Es el grado que existe entre la relacin de las variables.
Coeficiente de determinacin
Indica en que porcentaje (%) la variable independiente explica a la variable dependiente.

( scxy ) 2
r
scx * scy
2

y b0 b1 X i
b y b x
0

scxy
b1

scx

OJO,
OJO,
Esto
Estoestaba
estaba
en
pizarra.
en pizarra.

x y

xy

n
2
x

n

PRUEBA DE HIPOTESIS PARA LA PENDIENTE POBLACIONAL


1.- Determinar las hiptesis.
Hiptesis nula
Hiptesis nula

H 0 : 1 0

v/s

H1 : 1 0

Hiptesis
Hiptesis
alternativa
alternativa

Pendiente de la
Pendiente de la
poblacin
poblacin

2.- Prueba de hiptesis o estadista.


T calculado
T calculado

b1 1
tc
Sbi

scxy
scy
Sb1

3.- determinar el nivel de significacin 1 I .C.

scx
n2
scx

Intervalo de
Intervalo de
confianza
confianza

4.- Regla de decisin : rechazar H 0 si y solo si tc tt

tc tt

Desarrollo
1.- H 0 1 0
2.-

tc

H11 0

b1 1
Sb1

scy y

( scxy ) 2
scx
n2
scx

scxy 14, 75

52
scy 886

scy
Sb1

scy 210

scxy xy

x y
n

scxy 55

scxy x

scxy 14, 75

1,568
0, 406
3,841

tc

3, 728 0
9,18
0, 406

3.- 0,05

Se dice que se
Se dice que se
trabaja con un 95%
trabaja con un 95%
de confianza.
de confianza.

4.- Regla de decisin.


95%
0,25

0,25

tt 4,303

tt 4,303
=

Intervalo de Confianza para

b1 tt * Sb1 1 b1 tt * Sb1

b1 tt * Sb , b1 tt * Sb 1 / b1 tt * Sb b1 tt * Sb
1
1
1
1

EXPERIMENTO
Es cualquier proceso planeado que da lugar a observaciones o a recoleccin de datos.
EXPERIMENTO ALEATORIO

Es aquel cuyos resultados no pueden predecirse antes de su realizacin y por lo tanto,


estn sujetos al azar.
Ejemplo:

Lanzamiento de moneda, lanzamiento de un dado.


ESPACIO MUESTRAL

Es el conjunto integrado por todos los resultados posibles de un experimento.


EVENTOS O SUCESOS

Corresponde a una sub-coleccin o subconjunto del

Diagrama de Venn, el cual


muestra un espacio
muestral y tres eventos.

S
EVENTO COMPLEMENTARIO
Si

es un evento contenido en un espacio muestral

E c (E complemento)
S pero no en E .

complementario denotado por


elementos que estn en

S,

entonces el evento

es el que contiene todos los

E es un evento de algn experimento como un evento E , ocurre o no


ocurre, entonces el S estar compuesto por los eventos de E y E c
Suponga que

S [E, E c ]
EVENTOS COMPUESTOS
Si E y F (como eventos), son eventos entonces la ocurrencia de E F se denota por E F
que ambos ocurran E F
EVENTOS MUTUAMENTE EXCLUYENTES.
Dos eventos son mutuamente excluyentes cuando no tienen resultados en comn
(elementos), es decir, E F
Ejemplo: suponga que un experimento consiste en examinar 3 fusibles, cada fusible puede
ser defectuoso (D) o no defectuoso (B).

a) Determine la cardinalidad del espacio muestral.(cuantos elementos tiene el espacio


muestral)

23 8

Cantidad de
Cantidad de
fusibles
fusibles

Sale bueno o
Sale
bueno o
malo
malo

b) Determine el espacio muestral.


B
B
D
B
B
D
D
D
D
B
D
D
B
E

c) Obtenga los siguientes eventos:

E1 que el primer fusible sea defectuoso


{DBD-DDD-DDB-DBB}
E2 que a lo mas un fusible sea defectuoso (mximo uno)
{BBD-BDB-BBB-DBB}
E3 que a lo menos un fusible sea defectuoso
E4 que a lo sumo dos fusibles sean defectuosos (mximo)
E5 que ningn fusible sea defectuoso.
Use el diagrama de Venn para ilustrar la siguiente informacin, sea el espacio muestral
1,2,3,4,5,6,7,8
A 1, 2,3,5

El evento

B 1, 2, 4, 6

C 1,3, 4, 7

2
5

1
3

CONCEPTO DE PROBABILIDAD
Si un experimento

tiene un espacio muestral S y un evento E

est definido en

E P E es un nmero real al que se le denomina la


E o simplemente la probabilidad de E .

S,

entonces la probabilidad de
probabilidad de un evento

Ocurre o no
ocurre

P E
0

Ocurre

0,5

La probabilidad satisface las siguientes propiedades.:


1) 0 P ( E ) 1

E S (para todo evento que pertenece al espacio muestral)

2) P( S ) 1
3) Para cualquier nmero finito k de eventos mutuamente excluyentes definidos en S

P ( Ei )
U

i
i 1
i 1
k

TEOREMAS DE PROBABILIDAD BSICA


TEOREMA 1
Si (fi) es un conjunto vaco entonces la probabilidad de
TEOREMA 2
Si A y B se definen en

es 0.

y si A B 0 entonces A y B se dice que son mutuamente

excluyentes y la probabilidad de que ocurra A o B es: P A B P A P B


TEOREMA 3
Si A y B se definen en

S y si

A B distinto de cero

1, 2,3, 4,5, 6
A 1,3,5
B 1, 6

P A B P A P B P A B
3 2

6 6

1
6

4
6

4
6

A B 1,3,5, 6
P A B

4
6

TEOREMA 4

Sea

E c el complemento de E en S , entonces la

P Ec 1 P E
P E 1 P E

4 2

6 6

PROBABILIDAD CONJUNTA, MARGINAL Y CONDICIONAL


SEXO
HABITO

A1
fumar

A2
no fumar

Total

B1

B2

hombres

mujeres

n11 2

n12 3

n11 n12 5

n21 5

n22 1

n21 n22 6

n11 n21 7 n12 n22 4

Total

n 11

Frmula general

P Ai B j

nij
n

Suponga que se elige una persona y


se quiere saber si sta fuma y sea hombre.
n
2
P A1 B1 11 .... 18%
n 11
Si fuma y sea mujer
n
3
P A1 B2 12 .... 27,3%
n 11
Que no fume y sea hombre
n
5
P A2 B1 21 .... 45,5%
n
11

AAesto
estoseselelellama
llama
PROBABILIDAD
PROBABILIDAD
CONJUNTA
CONJUNTA

Que no fume y sea mujer


n
1
P A2 B2 22 .... 9,1%
n
11
Suponga que se desea conocer la probabilidad de algn ai P Ai sin importar si es
hombre o mujer B j sin importar los Ai .
Ejemplo :
P A1

Probabilidad
Probabilidad
que sea
que sea
hombre
hombre

Probabilidad
Probabilidad
que sea
que sea
mujer
mujer

n11 n12 5
45,5%
n
11

P Ai

n n
6
P A2 21 22 54,5%
n
11
P B1

n11 n21 7
63, 6%
n
11

P B2

n12 n22 4
36, 4%
n
11

AAesto
estoseselelellama
llama
PROBABILIDAD
PROBABILIDAD
MARGINAL
MARGINAL

n
j 1

n
2

P Bj

n
i 1

Suponga que ahora que se elige aleatoriamente una persona y es mujer, cual es la
probabilidad de que no fume.
AAesto
estoseselelellama
llama
PROBABILIDAD
n22
1
PROBABILIDAD
P A2 / B2
25%
CONDICIONAL
CONDICIONAL
n12 n22 4
P B2 / A2

n22
1
16, 7%
n21 n22 6

P Ai / A j

nij
2

n
j 1

TEOREMA DE BAYES
El Teorema de Bayes nos permite calcular la
probabilidad de un evento que no se conoce a
partir de eventos anteriores, para entender este
teorema consideremos que un articulo es
manufacturado a travs de dos mquinas.
MQUINA
A

MQUINA
B

ij

Regla de la multiplicacin

P A / B * P A P A B

ij

ij

Se sabe que la Maq A produce el 40% de la produccin total y la Maq B el 60%, se


sabe tambin que la taza de efecto de la Maq A es de un 2% y la Maq B un 4%.
Obtenga la probabilidad de que el articulo sea defectuoso y venga de la Maq A.
La probabilidad de que venga de la Maq B sabiendo que es NO defectuoso.

P B / Dc ?

P A * P D / A P D A

0, 4*0, 02
0, 08
8%

P A * P D c / A P A D c

0, 4*0,98
0,392

ARTICULO

39,2%

P B * P D / B P B D
0,6

* 0,04
0,024
24%

P B * P DC / B P B D 2
0,6

0,96

0,57

TEOREMA DE
TEOREMA DE
BAYES
BAYES

57%

P B / D

P B DC
P D

P B / DC

P B / DC

P B DC

P A DC P B DC

0,57
0,392 0,57

= 0,592
= 59,2%

Distribucin de probabilidades: existen discretas y continuas, las discretas se encuentran


la Bernoulli, Poison, hipergeomtrica, multinomial y la geomtrica entre otras.

Entre las distribuciones continuas las ms importantes son La Normal, Uniforme,


Exponencial, entre otras.
DISTRIBUCIN BINOMIAL
En estadstica la Distribucin Binomial es una distribucin de probabilidad discreta del
nmero de xitos en una secuencia de n experimentos independientes, cada uno de los
cuales tiene probabilidad p de ocurrir. La distribucin Bernoulli es una distribucin
binomial con n 1 (el nmero de ensayos es igual a 1). Su distribucin de probabilidad
est dada por la siguiente funcin matemtica.

n
b n, p , q , x p x q n x
x

donde

n
n!

nc


x
n x !x!
x
Responde a
Responde a
combinatori
combinatori
a
a

4C2

4!
6
2!2!

2! 3*4
6
2! 2

p = probabilidad que ocurra (xito)


q = probabilidad que no ocurra
siempre que p q = 1-p

Por ejemplo:
La distribucin binomial se usa para encontrar la probabilidad de sacar 5 caras y 7 sellos
en 12 lanzamientos.
Sea x la variable aleatoria salga sello
n = 12
x=7
b = (12, 0.5, 0.5, x = 7) =

n
12

x

7

12C7 * 0,57 * 0,55


=
=

0,1933
19,33 %

Probabilidad de que a lo ms salgan dos sellos.

12C 0*0,50 *0,512

P ( x 2) P ( x 0) P ( x 1) P ( x 2)

12C1*0,51 *0,511
k 5 ; 400
12
2%C2*0,5
p 2 *0,510

= 0,00024 + 0,0029 + 0,016


= 0,0193

Probabilidad de que por lo menos salga un sello.

e 8 85
0, 092 9, 2%
5!
P x 2 1 P x 2

1 P x 0 P x 1

0,99976

99,98%

p 0
La

x E x n * p
= 12*0,5
=6
VAR x 2 x n * p * q
= 12*0,5*0,5
=3

x 3

CV x

x
6

x
3

Se tiene la siguiente informacin :

1, 732 , q 0,5
Calcular:

2
8
100

1 P x 1

1 0,00024

400*

P x 1 1 P x 1
1 P x 0

n 400 E x n * p

x0

e 5 *50
0, 0067
0!
e 5 *51
p 1
0, 0337
1!
e 5 *52
p 2
0, 0846
2!
e5 *53
p 3
0,140
3!
e 5 *54
p 4
0,1754
4!

f x, ,

1

1

*e 2
2

xi 2

a) P x 1
b) La probabilidad de que a lo ms salga un sello.
c) La probabilidad de que a lo menos salga un sello.
SOLUCIN:
Sabemos que

VAR x x n * p * q
2

1 11
a) P x 1; p 0,5; q 0,5; n 12 nC1 p q

= 12C1*0,51 *0,511
= 12C1*0,512

n* p*q
1,732
2
2

shi

nCr

1*0,

2 3
2 n * p * q
3 n* p*q
3 n *0,5*0,5
3

0,5

2,92*1003
shift

EN
Dos veces

0, 0029
2,9%

n 12

b) P x 1 P xi

0,0049

x 0

P x 0 P x 1
0, 002 0, 0029
0, 0049
0, 49%

10

12

c)c)

P x 1 P x
P x 1 P x

a)a)
==
==0,598
0,598
==59,8%
59,8%
b)b)
Ejercicio
:
Un fabricante de marcos para ventana sabe
por experiencia que un 5% de la produccin
==0,315
0,315
tendr algn tipo de defecto menor que requerir un ligero ajuste. Cual es la probabilidad
de que una muestra de 10 marcos para ventana
...
==31,5%
31,5%
a) ninguno necesite arreglo
0
b) por lo menos uno requerir ajustes de 1 a 10
de 3 a 10
c)c)c) mas de dos necesitarn arreglos
==0,0746
0,0746
==7,46%
7,46%

DISTRIBUCION DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA


DISCRETA POISSON

e x
f x,
x!
promedio de ocurrencias en un periodo de tiempo determinado
x es la variable aleatoria bajo estudio.

Ejemplo:
a) Si el 2% de los libros encuadernados en cierto taller tienen encuadernacin
defectuosa, obtener la probabilidad de que 5 de 400 libros encuadernados en este
taller tengan encuadernacin defectuosa.
k 5 ; 400 0, 02 =8

n 400 E x n * p
400*0, 02
2
400*
8
100

2% p

P x 5

e x
x!

e 8 85
0, 092 9, 2%
5!

b) probabilidad de que a lo ms dos (2) sean defectuosas.

P x 2 P x 0 P x 1 P x 2
e 8 *80 e 8 *81 e 8 *82

0!
1!
2!
0, 00033 0, 00268 0, 011
0, 01401
1, 4%

c) la probabilidad de que a lo menos 2 sean defectuosos.

P x 2 P x 2 P x 3 .........
P x 2 1 P x 2
1 P x 1

1 P x 0 P x 1
1 0, 00301
0, 99699
99, 7%

Ejercicio :
Suponga que estamos investigando la seguridad de un cruce peligroso, los archivos de
la polica indican una media de 5 accidentes por mes.
El nmero de accidentes est distribuido conforme a una distribucin de Poisson, se
pide calcular:
a) 5

x0

e 5 *50
0, 0067
0!
e 5 *51
p 1
0, 0337
1!
e 5 *52
p 2
0, 0846
2!
e 5 *53
p 3
0,140
3!
e 5 *54
p 4
0,1754
4!

p 0

p x

P x

0
1
2
3
4

0,0067
0,0337
0,0846
0,140
0,1754

0,0067
0,0404
0,1244
0,2644
0,4394

DISTRIBUCIN DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA


CONDICIONAL DE X
DISTRUBUCIN NORMAL

f x, , 2

1

1

*e 2
2

xi 2

x : N , 2
Z : N 0,1
Mide la desviacin de los datos respecto a la media.

Você também pode gostar