Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Analisis de Datos
1.1. Introduccion
. . . . . . . . . . . . . . . . . . .
1.2. Analisis
descriptivo de datos . . . . . . . . . . .
1.3. Analisis
inferencial . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . 10
13
2.1. Introduccion
. . . . . . . . . . . . . . . . . . . 13
de los datos
2.2. Presentacion
. . . . . . . . . . . . 14
. . . . . . 15
. 20
. . . . . . . . . . 21
J. L. DazBarrero
2.3.5. Polgonos de frecuencies
. . . . . . . . . 23
. . . . . . . . . 23
. . . . . . . . . . 24
2.4.1. Parametros
de posicion
2.4.2. La media aritmetica . . . . . . . . . . . . 24
2.4.3. La Mediana
. . . . . . . . . . . . . . . . 27
. . . . . . . . . 29
2.4.6. Parametros
de dispersion
2.4.7. Rango de un conjunto de datos . . . . . . 29
2.4.8. Rango intercuartlico . . . . . . . . . . . 30
2.4.9. Desviaciones respecto a la media . . . . . 30
tpica . . . . . 30
2.4.10.La varianza y la desviacion
media . . . . . . . . . . . . . 32
2.4.11.Desviacion
de Pearson
2.4.12.Coeficiente de variacion
. . . 32
2.4.13.Parametros
de simetra . . . . . . . . . . 33
2.4.14.Parametros
de forma . . . . . . . . . . . 34
2.4.15.Momentos muestrales . . . . . . . . . . . 34
de valores atpicos . 35
2.4.16.Box-plot y deteccion
2.4.17.T ransformaciones . . . . . . . . . . . . . 36
. . 37
45
Analisis
de Datos
57
4.1. Introduccion
. . . . . . . . . . . . . . . . . . . 57
axiomatica
4.2. Definicion
de probabilidad . . . . . . 59
4.3. Tecnicas de conteo. Combinatoria . . . . . . . . 62
. . . . . . . . 62
. . . . . . . . . . 63
. . . . . . . . 65
4.7. Formula
de Bayes
. . . . . . . . . . . . . . . . 72
85
J. L. DazBarrero
de Bernoulli . . . . . . . . . 89
5.2.1. Distribucion
Binomial . . . . . . . . . 90
5.2.2. La Distribucion
uniforme discreta . . . . . . 91
5.2.3. Distribucion
geometrica . . . . . . . . 91
5.2.4. La distribucion
de Poisson . . . . . . . . 92
5.2.5. La distribucion
5.2.6. Perodo de retorno . . . . . . . . . . . . . 94
5.3. Problemas . . . . . . . . . . . . . . . . . . . . . 94
101
6.1. Parametros
de una variable aleatoria continua . 103
6.2. Modelos probabilsticos continuos . . . . . . . . 104
uniforme continua
6.2.1. Distribucion
. . . . . 104
exponencial . . . . . . . . . 104
6.2.2. Distribucion
Normal
6.3. La Distribucion
. . . . . . . . . . . . . 105
Contrastes de Hipotesis
117
7.1. Introduccion
. . . . . . . . . . . . . . . . . . . 117
7.2. Muestreo . . . . . . . . . . . . . . . . . . . . . 118
de Parametros
7.3. Estimacion
. . . . . . . . . . . . 120
Puntual . . . . . 120
7.3.1. Metodos de Estimacion
7.3.2. Intervalo de probabilidad e intervalo de
confianza . . . . . . . . . . . . . . . . . 122
Analisis
de Datos
7.7. Analisis
de la Varianza . . . . . . . . . . . . . . 128
7.8. Test de Chi-cuadrado
. . . . . . . . . . . . . . 133
J. L. DazBarrero
Captulo 1
Analisis de Datos
1.1.
Introduccion
El analisis
de datos, tecnicas cuantitativas o estadstica es el
conjunto de metodos y procedimientos encargados de la ob de informacion
util
a partir de un conjunto de datos.
tencion
Consiste en la recopilacion,
presentacion,
analisis
y uso de
de probledatos para la toma de decisiones y la resolucion
1.2.
Los metodos descriptivos tienen por objeto organizar y resumir los datos disponibles de manera que sea posible perci
bir rapidamente
las caractersticas principales y las posibles
anomalas de los procesos de que provienen, sin intentar in alla de los propios datos.
ferir nada que vaya mas
7
J. L. DazBarrero
1.3.
Analisis inferencial
util
cion
de muestras de la misma. Hay dos
formas de abordar el problema:
de parametros
1. Estimacion
estadstica
2. Contraste de hipotesis
o decision
bio, la decision
en estable
cer hipotesis
sobre los parametros
poblacionales y a conti utilizar la informacion
contenida en las muestras
nuacion
Analisis
exploratorio de los datos (tabulacion,
sntesis,
de valores anomalos
de primeras
deteccion
y obtencion
conclusiones)
del problema
Modelacion
del modelo
Validacion
Toma de decisiones
Analisis
de Datos
decision
para que, juntamente con otras consideraciones, se este en
condiciones para tomarla.
estudiar. El numero
de elementos de que consta es el tama
no
o extension
de la muestra. Una muestra es aleatoria cuando
tiene la misma probabilidad
cada individuo de la poblacion
de ser incluido en ella.
su caracter
Segun
los datos se clasifican en cualitativos o
a su vez se clasifican
atributos y cuantitativos. Estos ultimos
el numero
depuracion
y presentacion
analtiRecogida, ordenacion,
ca (tablas) de los datos
grafica
Representacion
de estadsticos muestrales y obtencion
de
Evaluacion
10
J. L. DazBarrero
1.4.
Conjuntos de Datos
46,31
48,21
44,57
51,00
67,82
61,73
35,40
46,17
56,69
45,71
48,86
78,95
45,49
62,41
40,01
53,72
37,50
59,55
35,23
52,20
48,70
63,49
40,24
40,85
31,39
56,24
56,71
29,77
57,12
57,18
60,86
34,43
51,89
49,88
42,61
68,47
43,46
55,63
60,50
33,40
39,77
41,82
61,30
61,22
36,32
41,38
63,56
61,75
40,18
47,03
33,98
55,73
73,09
56,36
68,77
66,33
48,31
32,25
55,98
47,85
47,77
53,86
46,23
59,12
33,12
47,07
59,64
65,27
45,66
62,55
2,01
2,10
1,88
2,12
1,32
2,25
1,72
1,86
2,10
2,01
2,11
1,71
2,21
1,64
2,04
1,78
2,24
1,53
2,05
1,77
2,08
2,19
2,42
1,64
1,96
1,90
2,06
2,14
2,31
2,06
1,94
1,74
1,76
2,34
2,03
2,00
2,13
1,75
2,09
2,19
1,96
1,83
2,18
2,50
2,00
2,07
1,82
2,05
2,17
1,79
1,87
1,89
1,78
1,63
3. Los siguientes datos corresponden a porcentajes de basura reciclada obtenidos en 100 puntos seleccionados
Analisis
de Datos
11
25
52
29
36
45
34
33
27
47
47
12
34
37
47
45
22
39
37
47
36
27
29
32
27
55
22
45
36
39
28
45
55
54
46
32
47
27
48
57
25
56
36
30
38
25
39
28
55
28
36
27
49
37
42
23
25
46
34
24
31
34
44
29
53
40
41
40
33
29
43
38
47
38
41
30
29
44
47
25
42
34
61
43
34
31
44
48
35
55
48
12
J. L. DazBarrero
Captulo 2
Analisis exploratorio de
datos univariantes
2.1.
Introduccion
El Analisis
descriptivo de datos es la parte de la Estadstica
14
J. L. DazBarrero
2.2.
de los datos
Presentacion
Se trata basicamente
de establecer la forma de organizar los
Analisis
de Datos
15
2.2.1.
Distribuciones de frecuencias
es en
El resultado de observar una muestra o una poblacion
un conjunto de datos que recoge los valores que toma una
variable estadstica sobre los individuos observados. Estos
valores suelen registrarse en forma de listados o protocolos y
el tipo
pueden ser nominales, ordinales o numericos, segun
de variable observada. Una primera forma de sintetizar los
datos es analizar que valores aparecen y cuantas veces o en
aparecen.
que proporcion
Supongamos que se observa una determinada caracterstica X sobre n objetos o individuos. El valor n, como ya se
ha dicho, es el tama
no o extension
de la muestra. La muestra se denotara por Mx = {x1 , x2 , , xn } (es el conjunto
de valores observados sobre los n individuos), y por Dx =
{x1 , x2 , , xk } el conjunto de valores disitintos que aparecen en la muestra.
de
Se denomina frecuencia absoluta del valor xi al numero
veces ni que aparece el valor xi en el conjunto Mx , y se denota por fa (xi ) = ni .
ni
n
16
J. L. DazBarrero
i
X
fa (xk ) =
i
X
nk ;
k=1
k=1
i
X
i
X
nk
fr (xk ) =
k=1
k=1
xi
fa (xi ) fr (xi )
x1
n1
x2
..
.
n2
..
.
xk
nk
n1
n
n2
n
..
.
nk
n
Fa (xi )
n1
n1 + n2
..
.
n1 + n2 + + nk
Fr (xi )
n1
n
n1 + n2
n
..
.
n1 + n2 + + nk
n
Analisis
de Datos
17
xi
Cat
Esp
Ext
40
15
5
Total
60
66.66
25
8.33
40
55
60
66.66
91.66
100
2
Ejemplo 2.2.2 Durante 100 das se ha anotado el numero
de
resultados fueron
xi
ni
0
60
1 2
30 4
3 4 5
3 1 0
6
2
18
J. L. DazBarrero
xi
0
1
2
3
4
5
6
Total
0.60
0.30
0.04
0.03
0.01
0.00
0.02
60
90
94
97
98
98
100
0.60
0.90
0.94
0.97
0.98
0.98
1.00
es un numero
entre 5 i 20. Para determinarlo a veces se
utiliza la formula
de Sturges:
NUM = E
3
4
log n
log 2
.
Analisis
de Datos
19
92,6
88,4
84,0
81,3
79,4
77,0
73,6
68,8
65,0
55,9
35,0
92,3
87,7
83,2
81,2
79,4
77,0
72,4
68,5
64,7
55,6
33,8
92,0
87,7
83,2
81,1
79,3
75,9
71,9
68,1
62,2
54,9
32,1
92,0
87,3
83,0
81,1
79,2
75,8
71,5
68,1
61,8
48,9
91,9
87,3
82,4
81,0
78,9
75,6
71,2
68,0
61,4
48,8
91,8
87,0
82,4
81,0
78,8
75,3
70,7
67,7
61,2
46,7
91,5
85,8
82,0
80,9
77,6
74,9
70,7
67,7
60,0
43,6
90,4
85,1
81,9
80,4
77,3
74,4
70,6
66,8
60,0
42,6
89,4
84,9
81,7
79,8
77,1
73,9
69,9
65,8
59,2
39,1
20
J. L. DazBarrero
Solucion.
Los 104 datos de que disponemos los distribuiremos
en 10 clases. La correspondiente tabla de frecuencias es
Li Ls
xi
3037
3744
4451
5158
5865
6572
7279
7986
8693
93100
Total
33.5
40.5
47.5
54.5
61.5
68.5
75.5
82.5
89.5
96.5
2.885
3.846
2.885
2.885
9.615
17.308
17.308
26.923
15.385
0.962
3
7
10
13
23
41
59
87
103
104
2.885
6.731
9.616
12.501
22.116
39.424
56.732
83.655
99.04
100
cion
o variabilidad.
El diagrama de tallo y hojas es un procedimiento semigrafico
Analisis
de Datos
21
ii. Disponer los datos en una tabla a dos columnas separadas por una linea vertical de la forma siguiente:
a. Para datos con dos cifras, las decenas que son el tallo, a la izquierda de la linea vertical y las unidades
que son las hojas a la derecha.
b. Para datos con tres cifras las centenas y decenas
forman el tallo y las unidades las hojas.
utiles
para ordenar los datos y para hacernos una idea de la
simetra de la distribucion.
2.3.
Representaciones graficas
su area
sea proporcional a la frecuencia absoluta correspon
diente. Son utiles
para presentar resultados de encuestas,
procesos electorales, etc.
22
J. L. DazBarrero
rectangulo
de altura proporcional a la frecuencia observada.
Los rectangulos
tienen todos la misma amplitud de base.
2.3.4. Histogramas
El Histograma se construye para representar la medida de las
observaciones que estan agrupadas en clases en un eje horizontal, las frecuencias de clase en un eje vertical y se dibujan rectangulos con sus bases determinadas por los lmites
de clase y sus alturas proporcionales a las correspondientes
frecuencias de clase. La altura de las clases puede calcularse
mediante la expresion
altura =
frecuencia relativa
Ls Li
Analisis
de Datos
23
grafica
importante de la distribucion
de las variacion
mas
2.4.
numerica de datos
Descripcion
24
J. L. DazBarrero
contenida en los datos. Se llaman parametros cuando ha y estadsticos cuando los datos
cen referencia a la poblacion
corresponden a una muestra. Se clasifican en:
(media aritmetica, mediana,
Parametros de posicion
moda, centiles)
(rango del conjunto de daParametros de dispersion
tos, rango intercuartilico, desviaciones respecto a la me tpica o estandard,
cas, mesocuarticas,
leptocuarticas).
2.4.2.
La media aritmetica
comun
de tendencia central o localizacion
es
La medida mas
el promedio aritmetico ordinario o media aritmetica. Dado
que casi siempre, los datos con los que se trabaja corresponden a muestras, es por eso que a la media aritmetica tambien
se le conoce como media muestral.
n
Si los datos correspondientes a una muestra de tamano
son
Analisis
de Datos
25
x1 , x2 , , xk , con frecuencias f1 , f2 , , fk , f1 + f2 + +
fk = n, entonces la media muestral se define como
x=
x1 f1 + x2 f2 + + xk fk
f1 + f 2 + + fk
k
1X
xi fi .
i=1
poblacion.
Este promedio se conoce como la media poblacional y se acostumbra a representar per la letra griega .
Ejemplo 2.4.1 Determinar un valor aproximado de la media
aritmetica
de un conjunto de datos del que se dispone de la
siguiente informacion:
Li Ls
xi
3037
3744
4451
5158
5865
6572
7279
7986
8693
93100
Total
33.5
40.5
47.5
54.5
61.5
68.5
75.5
82.5
89.5
96.5
2.885
3.846
2.885
2.885
9.615
17.308
17.308
26.923
15.385
0.962
3
7
10
13
23
41
59
87
103
104
2.885
6.731
9.616
12.501
22.116
39.424
56.732
83.655
99.04
100
Solucion.
La media aritmetica es
x=
x1 f1 + x2 f2 + + xk fk
f1 + f2 + + fk
k
1X
i=1
xi fi =
7614
104
= 73,21
26
J. L. DazBarrero
donde se han tomado las marcas de clase como representantes de todos los elementos contenidos en ellas.
2
La media goza de la siguiente propiedad:
(i) x + y + + z = x + y + + z
(ii) ax = ax.
para el calculo
de estadsticos muy sensibles a los valores
extremos.
La media aritmetica, como ya se ha dicho, es muy sensible a
los valores extremos. Esta falta de robustez se remedia con la
media recortada que modera el efecto de los datos atpicos
en el calculo
de la media aritmetica suprimiendo los valores
extremos. La media recortada al por ciento es la media de
los datos que quedan despues de suprimir el /2 por cien grandes y el /2 por ciento de los mas
Analisis
de Datos
27
pequenos.
La media aritmetica ponderada es equivalente a
la media aritmetica, pero para observaciones ponderadas por
pesos w1 , w2 , , wk . Se define por
k
X
xp =
w i xi
i=1
k
X
.
wi
i=1
2.4.3. La Mediana
La mediana de un conjunto de datos es un valor que divide a la muestra en dos partes iguales cuando estos se ha
llan ordenados. Cuando la muestra consta de un numero
par
x( n+1 ) ,
n impar,
2
M eX = x
= x(n/2) + x(n/2+1)
, n par.
2
agrupados en clases, para calcular
Cuando los datos estan
la mediana se utilizan las expresiones:
(a)
n
x
= M eX = Li + c 2
Fi1
fi
28
J. L. DazBarrero
la clase mediana y fi la frecuencia absoluta de la clase
mediana
(b)
x
= M eX = Li + c(j/fi )
donde Li es el lmite inferior de la clase mediana, c es
2.4.4.
Los Percentiles
formula
nk
Fk1
100
xk = Li + c
fk
Algunos reciben nombres particulares. As x25 = qi = q1 =
peP0,25 es el cuartil inferior (el 25 % de los datos son mas
quenos
o iguales que e l). La mediana x
= x50 = P0,50 . El
centil x75 = qs = q3 = P0,75 es el cuartil superior (el 75 % de
los datos son inferiores o iguales a e l.)
Analisis
de Datos
29
2.4.5. La Moda
que presenta mayor frecuencia en la muesEs la observacion
de una observacion
con
tra. Cuando en la muestra hay mas
D1
D 1 + D2
2.4.6.
Parametros de dispersion
dan
Las medidas de variabilidad o parametros
de dispersion
una idea de hasta que punto los datos se dispersan o agrupan en torno a los valores centrales.
max{x1 , x2 , , xn } = x(n) .
30
J. L. DazBarrero
Este parametro
es muy sensible (poco robusto) a los valores
extremos de la muestra.
2.4.9.
Son las diferencias (errores) entre cada dato y su media aritmetica. Si los datos son
x1 , x 2 , , x n ,
entonces las desviaciones respecto a la media o errores absolutos son x1 x, x2 x, , xn x. Estas diferencias tienen
la propiedad de que su suma es zero.
tpica
2.4.10. La varianza y la desviacion
importantes de variabilidad. Si x1 , x2 , , xn ,
Son las medidas mas
es una muestra de n observaciones, entonces la varianza se
Analisis
de Datos
31
define como la media aritmetica de los cuadrados de las desviaciones respecto a la media. Es decir,
2
s =
n
1X
n
1X
(xk x) =
x2 x2 .
n k=1
n k=1 k
s2c
n
X
(xk x) =
n 1 k=1
n1
n
X
)
x2k
nx
k=1
v
u
n
u1 X
t
x2k x2 .
n k=1
cionando informacion
de observaciones que
caen en los siguientes intervalos:
(x 2s, x + 2s) contiene al menos el 75 % de los datos.
32
J. L. DazBarrero
(x 3s, x + 3s) contiene al menos el 88 % de los datos.
(x 4s, x + 4s) contiene al menos el 93 % de los datos.
media
2.4.11. Desviacion
Es la media aritmetica de los valores absolutos de las desviaciones respecto a la media, es decir,
d=
n
1X
n k=1
|xk x|.
de Pearson
2.4.12. Coeficiente de variacion
como una fraccion
de
Cuando se quiere expresar la variacion
la media se puede utilizar una medida porcentual de variabi mueslidad relativa, denominada coeficiente de variacion
tral, que se define por
Cv =
s
|x|
100,
x 6= 0
tpica)
e indica la magnitud promedio del error (desviacion
Analisis
de Datos
33
cuando
de forma no evidente en una primera aproximacion
grafica
de las frecuencias (diagramas de barras, histogramas,
polgonos de frecuencia). Indicadores numericos son la rela entre la media, mediana y moda:
cion
Mo x
x indica simetra.
Mo x
x indica simetra negativa (a la izquierda).
Mo x
x indica simetra positiva (a la derecha).
Otro indicador numerico es el coeficiente de asimetra que
se define a partir de las desviaciones respecto a la media x1
x, x2 x, , xn x, por
CasX =
n
X
(xk x)3 .
ns3X k=1
Este coeficiente, que es adimensional, vale cero para distribuciones simetricas alrededor de la media. Es negativo para
distribuciones asimetricas a la izquierda y positivo para distribuciones asimetricas a la derecha.
Si se detecta una asimetra junto con datos atpicos, es con de los
veniente estudiar la viabilidad de una transformacion
datos.
34
J. L. DazBarrero
CapX =
n
X
ns4X
k=1
(xk x)4 .
n
1X
n k=1
xrk .
n
1X
(xk x)r .
n k=1
Analisis
de Datos
35
Su construccion
de valores anomalos.
resistentes a la presencia de valores atpicos.
Las fases a seguir para construir un box-plot son:
Calculo
del rango intercuartilico Riq = q3 q1 .
Calculo
de los intervalos [f1 , f3 ] y [F1 , F3 ] con
f1 = q1 1,5Riq
f3 = q3 + 1,5Riq
F1 = q1 3Riq
F3 = q3 + 3Riq .
y
entonces los vaSi la asimetra en los datos es pequena,
lores observados en [F1 , f1 ] o en [f3 , F3 ] se consideran
como anomalias moderadas y los observados antes de
F1 y despues de F3 como anomalias extremas.
Este diagrama que puede servir para filtrar los datos de po
sibles errores, esta formado por una caja o rectangulo
horizontal o vertical, que presenta los tres cuartiles y los valo
res maximo
y mnimo de los datos. La arista izquierda del
rectangulo
corresponde al cuartil q1 y la derecha a q3 . Den
tro del rectangulo
se dibuja una linea que corresponde a la
mediana. Desde cualquier arista se extienden unas lineas o
bigotes que contienen todas las observaciones comprendidas entre cero y 1,5 veces el rango intercuartlico o barreras
interiores. Los valores en que finalizan los bigotes se llaman
adjuntos.
36
J. L. DazBarrero
2.4.17. Transformaciones
A veces a los datos es conveniente aplicarles transformaciones lineales de la forma yi = a + bxi . Se cumple que
y = a + bx y que s2y = b2 s2x . Una de las transformaciones
o estandariza importantes es la tipificacion
lineales mas
de una variable que para una serie de observaciones
cion
x1 , x2 , , xn , se define por
zi =
xi x
s
grandes. Es util
para asimetras a la izquierda. Para asimetras a la derecha se utilizan las transformaciones y = ln(x)
e y = 1/x que comprimen los valores grandes y expanden los
Analisis
de Datos
2.5.
37
221
154
228
131
180
178
157
151
175
201
183
153
174
154
190
76
101
142
149
200
186
174
199
115
193
167
171
163
87
176
121
120
181
160
194
184
165
145
160
150
181
168
158
208
133
135
172
171
237
170
180
167
176
158
156
229
158
148
150
118
143
141
110
133
123
146
169
158
135
149
38
J. L. DazBarrero
n
X
x=
xk fk w k
k=1
n
X
fk w k
k=1
En el caso que nos ocupa X = {55, 62, 72, 90, 120, 115} con
1750
pesos {2, 2, 3, 4, 4, 4} con lo que x =
= 92,10 pts.
2
19
Analisis
de Datos
39
cuartil, (5) segundo decil, (6) percentil x84 , (7) el rango, (8) el
rango intercartlico, (9) la varianza, (10) la desviacion
estandar,
(11) la desviacion
media, (12) el coeficiente de variacion
de
Pearson.
Problema 2.5 Comprobar que la varianza puede escribirse en
la forma
s =
n
1X
n k=1
x2k x2 .
Cuando
sera cero? Y negativa?
lo son sus desviaciones tpicas. Son necesariamente iguales los dos conjuntos
de datos? Y si las variables tuviesen 3 datos cada una?
Solucion.
La respuesta a la primera pregunta es afirmativa.
En efecto, sean X = {x1 , x2 } e Y = {y1 , y2 } los dos conjuntos de adtos. Entonces, si x = y resulta
x1 + x2
2
y1 + y2
2
x1 + x2 = y1 + y2 .
(2.1)
40
J. L. DazBarrero
x1 x2
x1 x2
Observese que x1 x =
, x2 x =
, e igual2
2
y1 y2
y1 y2
mente y1 y =
, y2 y =
.
2
2
Entonces,
Sx2 =
Sy2 =
=
=
(x1 x2 )2
4
(y1 y2 )2
4
(2.2)
tenido en una muestra de un determinado material se obtuvieron los siguientes resultados ( %): 10,02, 10,04, 9,98, 10,48. En
base a estos resultados, que dato se podra tomar como opti
mo? Porque?
Solucion.
La media aritmetica de las observaciones es x =
10,125. Las correspondientes desviaciones medias son
|x1 x| = 0,105, |x2 x| = 0,085,
|x3 x| = 0,170, |x4 x| = 0,335.
Analisis
de Datos
41
de
los datos no supere el 0,08 %, podra decirse que los resultados obtenidos en la volumetra anterior han sido satisfactorios?
Solucion.
Calculando los estadsticos: media, mediana, va
tpica y coeficiente de variacion
se obtiene
rianza, desviacion
x = 67,43 M = 67,43 s2 = 0,0017 s = 0,0415 CV = 0,06 %
42
J. L. DazBarrero
es inferior al 0,08 % se
Dado que el coeficiente de variacion
puede concluir que los resultados obtenidos son satisfactorios.
2
Clases
58.561.5
61.564.5
64.567.5
67.570.5
70.573.5
73.576.5
76.579.5
79.582.5
82.585.5
85.588.5
4
8
12
13
21
15
12
9
4
2
Calcular el numero
de datos. Hallar la media, la mediana, la
Analisis
de Datos
43
teniendose
los siguientes resultados:
3,58
4,27
4,45
4,58
4,70
3,80
4,28
4,50
4,60
4,72
4,01
4,30
4,50
4,61
4,78
4,01
4,32
4,50
4,61
4,78
4,05
4,33
4,50
4,62
4,80
4,05
4,35
4,51
4,62
5,07
4,12
4,35
4,52
4,65
5,20
4,18
4,41
4,52
4,70
5,26
4,20
4,42
4,52
4,70
5,41
4,21
4,45
4,57
4,70
5,48
tadsticos, representacion
y deteccion
grafica
de valores anoma
los)
(Observese
que todas las lluvias son mas
que la lluvia
acidas
5,4
5,9
6,0
6,2
2,1
8,3
8,6
8,0
Hacer un analisis
exploratorio de estos datos: escribir una ta
bla de frecuencias, calcular los estadsticos que se consideren
apropiados, dibujar el histograma y los polgonos de frecuencias ordinarias y acumuladas. Detectar los valores anomalos,
44
J. L. DazBarrero
Captulo 3
Analis exploratorio de
datos bivariantes
3.1.
Variables bidimensionales
De forma analoga
a como se hizo en el caso de datos univariantes se define la frecuencia absoluta del par (xi , yj ) como
el numero
de apariciones de (xi , yj ) en la muestra Mx,y . La
de apariciofrecuencia relativa de (xi , yj ) es la proporcion
46
J. L. DazBarrero
X\Y
x1
x2
..
.
y1
f11
f21
..
.
y2
f12
f22
..
.
...
...
...
..
.
yk
f1k
f2k
..
.
xh
fh1
fh2
...
fhk
Si se anade
a la tabla de doble entrada de una distribucion
bivariante una fila y una columna con los totales respectivos
se obtienen dos distribuciones unidimensionales: la formada
la primera y la ultima
fila por otro. Estas reciben el nombre
de distribuciones marginales de la X y la Y respectivamente.
X\Y
x1
x2
..
.
y1
f11
f21
..
.
y2
f12
f22
..
.
...
...
...
..
.
yk
f1k
f2k
..
.
xh
fh1
P
fi1
fh2
P
fi2
...
...
fhk
P
fik
P
P f1j
f2j
..
P.
fhj
N
Analisis
de Datos
3.2.
47
Ajuste mnimo-cuadratico
graficamente
en un sistema de ejes X-Y. A esta representa cartesiana de las parejas de valores que corresponden
cion
a una variable bidimensional se le denomina diagrama de
scattergram o nube de puntos. La observacion
dispersion,
proporciona una idea intuitiva de
de la nube de puntos solo
o dependencia entre las variables. A conla posible relacion
se presenta un procedimiento para hallar esta retinuacion
cuando sea lineal, i.e. cuando los puntos que resultan
lacion
estan aproximadamente situados alrededor de una recta. Si
se supone que los datos, en general de naturaleza diferente,
son
X : x1 x2 . . .
Y : y1 y2 . . .
xn
yn
Se llama variable control o variable independiente a la variable X y variable dependiente o variable respuesta a Y .
La variable control toma sus valores libremente, y posible de los experimenmente en una etapa previa a la realizacion
tos que conduciran a obtener los valores de la variable respuesta.
Un procedimiento de ajuste es el metodo de los mnimos
cuadrados (Legendre, pricipios del siglo XIX) y proporciona
los parametros
= a y = b de la recta y = + x para la
n h
X
i2
yi xi .
i=1
Siguiendo el procedimiento habitual para minimizar la fun L(, ) resultan las ecuaciones normales
cion
48
J. L. DazBarrero
= 0,
=0
=b=
Sxy
= a = y bx
2
SX
donde
Sxy =
n
1X
(xi x)(yi y)
i=1
es la covarianza muestral de X e Y y
Sx2
n
1X
(xi x)2
n i=1
es la varianza de X. La diferencia yi (a + bxi ) = ei se llama
1
n2
n
X
e2i
i=1
Analisis
de Datos
49
En particular,
yi ' yi = y + b(xi x),
i = 1, 2, , n.
De aqu resulta
yi y ' b(xi x),
i = 1, 2, , n,
o bien
yi y = b(xi x) + ei ,
i = 1, 2, , n
(3.1)
de y respecto a y es debida en
Esto significa que la variacion
de linealidad entre X e Y y en parte no.
parte a la relacion
total de yi y es igual
La diferencia yi y se llama variacion
explicada por el modelo b(xi x)
a la suma de la variacion
no explicada o residual ei ..
la variacion
mas
Como puede verse cuanto menor sea |i |, i.e., cuanto mayor
debida a la relacion
lineal mejor
sea la parte de la variacion
sera el ajuste. Ahora conviene tener en cuenta todos los datos
y definir:
Variabilidad total V T =
n
X
(yi y)2
i=1
Variabilidad explicada V E =
n
X
b2 (xi x)2
i=1
n
X
i=1
e2i .
50
J. L. DazBarrero
e2i
i=1
n
X
(yi y)
n
X
b2 (xi x)2 .
i=1
i=1
Dado que
VT=VE+VNE
resulta
n
X
(yi y) = b
i=1
n
X
(xi x) +
i=1
n
X
e2i
(3.2)
i=1
como el porcentaje
y definir el coeficiente de determinacion
de variabilidad explicado por el modelo, i.e.,
2
r =
VE
VT
2
b2 SX
SY2
2
Sxy
Sx2 Sy2
Sxy
Sx Sy
(determinacion)
El coeficiente de correlacion
sirve para dar
una medida de la dependencia funcional (lineal) entre las variables X e Y. El criterio que se acostumbra a utilizar es el
siguiente:
Si |r| < 0,5, entonces la dependencia se considera debil.
Analisis
de Datos
51
Y sobre X : y y =
X sobre Y : x x =
Sxy
Sx2
Sxy
Sy2
(x x).
(y y).
3.3.
52
J. L. DazBarrero
X/Y
50-100
10-30
6
30-50
1
50-100
0
100-250 250-1000
2
0
1
0
0
10
una recta que ajuste los datos y permita predecir los ingresos medios anuales en funcion
de emplea del numero
dos.
Problema 3.2 En un estudio sobre la relacion
existente entre
el tiempo que tarda un obrero de una autopista en realizar
una tarea en la ma
nana (X) y al final de la tarde (Y ), se han
obtenido los siguientes datos:
10
X
xk = 86,7,
k=1
10
X
x2k
= 771,35,
k=1
10
X
yk2
= 819,34,
k=1
10
X
yk = 88,8,
k=1
10
X
xk yk = 792,92.
k=1
1.5
23.0
1.5
24.5
2.0
25.0
2.5
30.0
2.5
33.5
3.0
40.0
3.5
40.5
3.5
47.0
4.0
49.0
Analisis
de Datos
53
Contenido de humedad
45
54
37
41
35
29
61
45
43
49
34
40
11
15
11
13
11
7
18
14
11
16
11
13
54
J. L. DazBarrero
X
Y
Z
0.2
3.4
25.6
0.5
6.5
29.5
0.7
11.0
29.0
1.2
13.5
31.2
2.3
22.0
31.5
2.4
25.8
33.2
2.9
33.5
33.4
3.0
34.6
32.6
a) Utilizar el metodo
de los mnimos cuadrados para obtener
-1.0
94
4.0
74
7.0
65
1.5
81
5.0
67
3.0
73
3.5 -3.0
79
97
-5.0 -0.5
107 86
-2.0 6.0
91
65
0.5
88
9.0
58
8.0
58
2.5
75
9.5
55
10.0
52
Analisis
de Datos
55
n
1X
n k=1
xk yk x y.
i2
yk (a + bxk ) = SSyy bSSxy .
k=0
4
1.5
6
1.4
8
1.1
10
1.1
12
0.9
de haber sido
tratado.
56
J. L. DazBarrero
Captulo 4
Conceptos Basicos de
Probabilidad
4.1.
Introduccion
teorica
de la ocurrencia de A. A esta medida la llamaremos
probabilidad.
57
58
J. L. DazBarrero
n
[
{ak },
k=1
n
X
fr ({ak }) = 1, resulta
k=1
si A = {a1 , a2 , , ah },
fr ({ak }) = 1/n, k = 1, 2 , n. Ademas,
entonces fr (A) = fr ({a1 })+fr ({a2 })+ +fr ({ah }) = h/n.
clasica de probabilidad o re
Llegandose
as a la definicion
gla de Laplace (1812) que enuncia:
La probabilidad de un suceso A es el cociente entre el numero
Nf (A)
Np
N (A)
N (E)
Analisis
de Datos
59
Aqu hay que suponer que existe el lmite de las frecuencias relativas, i.e., existe el lmite y es el mismo para cual de experimentos. En otras palabras, las
quier subsucesion
frecuencias relativas de un suceso se estabillizan alrededor
4.2.
axiomatica de probabiDefinicion
lidad
n
[
Ak ,
k=1
interseccion,
Ak .
k=1
numerable
A es una algebra cuando para cada sucesion
A1 , A 2 , , An , ,
60
J. L. DazBarrero
de sucesos de E, su union
Ak y su interseccion
k=1
Ak
k=1
A continuacion
de Kolmogorov que consta de tres axiomas:
n
h[
k=1
n
i
X
p[Ak ].
Ak =
k=1
h[
i
X
p
Ak =
p[Ak ].
k=1
k=1
Analisis
de Datos
61
numerable de sucesos
Demostracion.
Considerese la sucesion
el
disjuntos A1 , A2 , , An , , todos ellos igual al . Segun
tercer axioma de Kolmogorov
h[
i
X
p
Ak =
p[Ak ].
k=1
En nuestro caso,
Ak =
k=1
k=1
= . Por tanto,
k=1
p[] =
k=1
p[], es decir, la suma infinita de una cantidad constante de ocurre cuando p[] = 0. 2
be ser esa cantidad, lo cual solo
Teorema 4.2 La probabilidad de la union
de n sucesos disjuntos A1 , A2 , , An es igual a la suma de las probabilidades de cada uno de los sucesos Ai , i.e.,
n
n
i
h[
X
p[Ak ].
p
Ak =
k=1
k=1
numerable de suceDemostracion.
Considesere la suncesion
sos disjuntos A1 , A2 , , An , An+1 , An+2 , , siendo los su el tercer axioma de Kolmogorov
cesos An+k = , k 1. Segun
h[
i
X
p
Ak =
p[Ak ].
k=1
k=1
n
h[
i
h[
i
h [
i
h[
i
p
Ak = p
Ak + p
Ak = p
Ak .
k=1
k=1
k=n+1
k=1
X
k=1
p[Ak ] =
n
X
k=1
p[Ak ] +
X
k=n+1
p[Ak ] =
n
X
k=1
p[Ak ].
62
J. L. DazBarrero
Identificando, resulta
n
n
h[
i
X
p
Ak =
p[Ak ].
k=1
k=1
2
Teorema 4.3 La probabilidad de la union
de dos sucesos cualesquiera viene dada por
[
\
p[A1
A2 ] = p[A1 ] + p[A2 ] p[A1
A2 ].
Teorema 4.4 Si A1 A2 , entonces p[A1 ] p[A2 ].
Teorema 4.5 Si A S, entonces se verifica que p[A] 1.
Teorema 4.6 La probabilidad del suceso contrario A, es el
complemento a uno de la probabilidad de A, i.e., p[A] = 1
p[A].
4.3.
Analisis
de Datos
63
ocupado por por cualquiera de los n elementos de A, y as sucesivamente hasta el k-esimo que tambien puede ser ocupa
do por cualquier elemento de A. En consecuencia, el numero
de n elementos tomados de k
de variaciones con repeticion
en k es
VRkn = n n n = nk .
Nota 4.1 Observese
que cada variacion
con repeticion
de orden k es un elemento del producto cartesiano
Ak = {(a1 , a2 , , ak ) | ai A}.
Nota 4.2 Las variaciones con repeticion
de n elementos de orden k son tambien
de todas las aplicaciones que
las imagenes
4.3.2.
Variaciones ordinarias
64
J. L. DazBarrero
n!
(n k)!
4.3.3.
Permutaciones ordinarias
t1 , t2 , , tn , con
mentos de A, y de ordenes
de repeticion
t1 + t2 + + tn = m; a cada una de las secuencias de m
elementos que se pueden formar con t1 iguales a a, t2 iguales
Analisis
de Datos
65
n
z }|2 {
z }|
{
a1 a2 at1 b b b l l l .
m!
t1 !
l, se obtendran
Ptm1 ,t2 , ,tn =
m!
t1 !, t2 !, , tn !
permutaciones.
Nota 4.5 Las permutaciones con repeticion
son las imagenes
66
J. L. DazBarrero
Su numero
se representa por Ckn . Para calcularlo, supongamos formadas las combinaciones de orden k con los elementos de A de las que hay en total Ckn . Si en cada una de e stas
combinaciones permutamos sus elementos de todas las for
mas posibles resulta que el numero
de secuencias obtenidas
es igual al de variaciones ordinarias de orden k que se pueden formar con los elementos de A. Por otro lado, como cada
genera k! del total de las variaciones, se tiene
combinacion
que Vnk = Ckn k! de donde
Ckn
Vnk
k!
n!
k!(n k)!
n
k
Analisis
de Datos
67
ultimo
elemento y cada uno de los que le siguen en el orden
natural, obteniendose en total
n+21
2
= C2n+21 .
CRn =
2
A parir de las de orden 2 se obtiene las de orden 3, y as sucesivamente hasta que las de orden k se obtienen a partir de
facil
observar que tales combinaciones se pueden poner en
correspondencia biyectiva con las combinaciones ordinarias
de orden k de los elementos del conjunto {1, 2, , n + k 1}
siendo as su numero
n+k1
k
= Ckn+k1 .
CRn =
k
se citan dos formulas
de problemas.
ser utiles
para la resolucion
(a + b) =
n
X
n
k=0
ak bnk .
,
t
1 2
n
t1 +t2 ++tn =m
m!
t1 +t2 ++tn =m
t1 !t2 ! tn !
68
4.4.
J. L. DazBarrero
Probabilidad condicional
Analogamente,
si p[B] > 0 se define
p[A|B] =
p[A B]
p[B]
Analisis
de Datos
69
cion.
por
directa. Supongase
inspeccion
cierto para 2, 3, , n 1 y
veamoslo para n. En efecto,
h
i
p[A1 A2 An ] = p (A1 A2 An1 ) An
= p[A1 A2 An1 ]p[An |A1 A2 An1 ]
= p[A1 ]p[A2 |A1 ]p[A3 |A1 A2 ] p[An |A1 A2 An1 ].
2
4.5.
este ultimo
caso puede suceder:
de A desfavo(a) p[B] > p[B|A], en cuyo caso, la aparicion
de B.
rece la realizacion
de A favorece
(b) p[B] < p[B|A], en este caso, la aparicion
de B.
la realizacion
Se verifican las siguientes condiciones:
70
J. L. DazBarrero
1
4
y
p[A]p[B] = p[A]p[C] = p[B]p[C] =
1
4
En cambio,
p[A B C] = p[{1}] =
6= p[A]p[B]p[C] =
.
4
8
Analisis
de Datos
71
4.6.
n
X
p[Ak ]p[B|Ak ].
k=1
Demostracion.
Al ser A1 , A2 , , An un sistema completo de
suscesos se tiene que
n
h
[
i
p[B] = p[B E] = p B
Ak
k=1
n
n
h[
i
X
=p
(B Ak ) =
p[Ak ]p[B|Ak ].
k=1
k=1
72
4.7.
J. L. DazBarrero
Formula
de Bayes
p[Ak ]p[B|Ak ]
n
X
p[Ak ]p[B|Ak ]
k=1
A las probabilidades p[Ak ] se les llama probabilidades a priori y a las p[Ak |B] probabilidades a posteriori.
de probabilidad condicionada
Demostracion.
De la definicion
resulta
p[Ak B] = p[Ak ]p[B|Ak ] = p[B]p[Ak |B].
Por tanto,
p[Ak |B] =
p[Ak ]p[B|Ak ]
,
p[B]
la formula
pero segun
de las probabilidades totales,
p[B] =
n
X
p[Ak ]p[B|Ak ]
k=1
de donde
se deduce que
p[Ak |B] =
p[Ak ]p[B|Ak ]
n
X
p[Ak ]p[B|Ak ]
k=1
Analisis
de Datos
4.8.
73
Problemas de Probabilidad
aguas sobrepasen el umbral de un rio es 0,77, la probabilidad que se alcance el umbral es 0,08, y la probabilidad
que no se alcance el umbral es 0,05.
Solucion.
74
J. L. DazBarrero
un cierto a
no se definen como sigue:
A = 3 a 6 m3 /s, p[A] = 0,6;
B = 5 a 10 m3 /s, p[B] = 0,6;
C = A B,
p[C] = 0,7.
Calcular p[A B], p[A], p[B A], p[A B], p[A B], y definir
cada uno de los sucesos cuyas probabilidades se pide calcular.
Problema 4.3 Hallar la probabilidad de un suceso, sabiendo
que la suma de su cuadrado y la del cuadrado de la probabi5
lidad del suceso contrario es igual a .
9
el
Solucion.
Sea p[A] = p, entonces p[A] = 1 p. Segun
2
2
2
enunciado se tiene p + (1 p) = 5/9; 9p 9p + 2 = 0;
p = 1/3, p = 2/3.
2
Problema 4.4 En una reunion
hay mas
hombres que mujeres, mas
mujeres que beben que hombres que fuman, y mas
Analisis
de Datos
75
siendo
X1 = H B F ,
X2 = H B F ,
X3 = H B F,
X4 = H B F,
X5 = M
X6 = M
X7 = M
X8 = M
B F,
B F,
B F,
B F.
N (Xi ) >
8
X
N (Xi ),
x=5
i=1
76
sexo
hombre mujer
a favor
198
243
en contra
125
126
depende
147
161
J. L. DazBarrero
menor de 25
200
50
100
edad
25-50 myor de 50
180
61
111
90
159
49
es la probabilidad
que dentro de 100 a
nos: a) Continuen funcionando los tres. b)
No funcione ninguno de ellos. c) Funcione solamente el aeropuerto. d) Funcione exactamente uno de ellos.
Analisis
de Datos
77
Solucion.
Tenemos que P [P ] = 0,76, la P [A] = 1 P [A] =
por las caractersti1 0,18 = 0,82 y la P [D] = 0,4. Ademas,
cas del enunciado los sucesos P, A y D son independientes
y tambien lo son los sistemas que resultan de susutituir alguno de ellos por sus contrarios. Entonces:
a. P [P A D] = P [P ]P [A]P [D] = 0,76 0,82 0,4 =
0,2492.
b. P [P A D] = P [P ]P [A]P [D] = 0,24 0,18 0,6 =
0,0259.
c. P [P A D] = 0,24 0,82 0,6 = 0,1180.
d. P [P A D] + P [P A D] + P [P A D] = 0,0820 +
0,1180 + 0,0172 = 0,2172.
2
Problema 4.7 Justo despues
de ser puestos en circulacion,
Madrid-Barcelona salga puntual es 0,92, la de que llegue puntual es 0,93, y la de que salga y llegue puntual 0,84. Que es
78
J. L. DazBarrero
mas
probable: que llegue puntual un vuelo que ha salido puntual o que haya salido puntual un vuelo que ha llegado puntual.
Solucion.
Sean los sucesos A = { sale puntual} y B = { llega
puntual }. Entonces, p[A] = 0,92, p[B] = 0,93, y p[A B] =
0,84. A partir de aqu resulta que
p[B|A] =
p[A|B] =
p[A B]
p[A]
p[A B]
p[B]
= 0,91,
= 0,90.
{acierta el segund} y C = {acierta el tercero}. Las probabilidades de estos sucesos y sus contarrios son, respectivamente,
1
1
1
P [A] = , P [B] = , P [C] =
6
4
3
5
3
2
P [A] = , P [B] = , P [A] =
6
4
3
Analisis
de Datos
79
P [A X]
P [X]
P [A B C]
P [X]
6
31
= 0,1935
2
Problema 4.11 Se estudian tres tipos de defectos de las memorias montadas sobre los circuitos integrados: Defectos de
los circuitos de encuadracion
H1 : p[H1 ] = 0,1); de (Hipotesis
las (Hipotesis
H2 : p[H2 ] = 0,6), y defectos de las barras de
direccion
H3 : p[H3 ] = 0,3). La diagnosis se lleva a
(Hipotesis
80
J. L. DazBarrero
Solucion.
de las probabilidades totales
Aplicando la formula
se tiene
p[A] = p[H1 ]p[A|H1 ] + p[H2 ]p[A|H2 ] + p[H3 ]p[A|H3 ] = 0,25
Aplicando la formula
de Bayes, resulta
p[H1 |A] = 0,16,
de Bayes se obtiene
1, y p[6|T ] = 1/6. Aplicando la formula
p[T |6] =
p[T ]p[6|T ]
p[T ]p[6|T ] + p[T ]p[6|T ]
4
5
.
2
Analisis
de Datos
81
recinto B donde de los 4 coches que hay uno solo tiene combustible; y finalmente, la tercera conduce al recinto C donde
hay 7 coches cinco de los cuales tienen gasolina. Elige una
puerta y un coche. cual
es la probabilidad de escapar? Si se
sabe que ha escapado, determinar la probabilidad de que haya salido por la puerta A.
Solucion.
Denotaremos por G al suceso tener combustible.
3
5
p[F |B] =
1
4
p[F |C] =
5
7
As
p[F ] = p[A]p[F |A] + p[B]p[F |B] + p[C]p[F |C] = 0,5214.
p[A]p[F |A]
p[A]p[F |A] + p[B]p[F |B] + p[C]p[F |C]
= 0,3835.
2
82
J. L. DazBarrero
Prioris
p[V]=50/100
p[T]=40/100
p[A]=10/100
Verosimilitudes
p[t|V]=10/100
p[t|T]=3/100
p[t|A]=1/100
Posterioris
p[V|t]=(1/C) 50/10010/100
p[T|t]=(1/C) 40/1003/100
p[A|t]=(1/C) 10/1001/100
es la probabilidad que
donde C (constante de normalizacion)
un individuo llegue tarde. Es decir,
C = p[t] =
50
100
10
100
63
40
100
=
3
100
10
100
1
100
63
1000
937
.
1000
1000
1
En el segundo apartado nos piden p[V |t] =
p[V ]
C
50
.
2
p[t|V ] =
63
Problema 4.15 (Problema de los cumplea
nos) Hallar la probabilidad que en una reunion
de n personas todas tengan fecha de cumplea
nos diferente .
Solucion.
Puesto que hay n personas y 365 das en un ano,
Analisis
de Datos
83
de cumpleanos,
se tienen para la primera persona 365 posibilidades, para la segunda, 364; pra la tercera, 363 y as sucesivamente, hasta que para la n-esima se tienen 365 n + 1.
Por tanto, la probabilidad pedida es
p=
n
V365
VRn
365
.
2
lo que se
2
puede interpretar diciendo que a partir de 23 personas en
probable que dos coincidan en la fecha de
adelante es mas
nacimiento, a que todos tengan fechas de nacimiento distintas.
Problema 4.16 El gerente de una empresa que fabrica neumaticos
para maquinaria de construccion
tenga exito
si recibe un informe favorable.
Solucion.
con e xito} y F = {informe favorable}.
Sea E = {neumatico
Entonces,
Prioris
p[E]=40/100
p[E]=60/100
Verosimilitudes
p[F|E]=80/100
p[F|E]=30/100
Posterioris
p[E|F]=(1/C) 40/10080/100
p[E|F]=(1/C) 60/10030/100
84
J. L. DazBarrero
1
64
Entonces C = y p[E|F ] = (1/C) 40/100 80/100 =
.
2
100
2
Problema 4.17 Se dispone de tres urnas con las siguientes
composiciones: U1 (3B, 2N ), U2 (2B, 3N ) y U3 (1B, 4N ). Se lanza un dado, si sale 1 se elige la primera urna, si sale primo la
segunda y si sale 4 o 6 la tercera. A continuacion,
se extrae
una bola de la urna elegida. Hallar la probabilidad de que sea
blanca. Si ha resultado ser blanca, Cual
es la probabilidad
que hubiese salido primo en el lanzamiento del dado?
Captulo 5
Variables Aleatorias
Discretas
El concepto de variable aleatoria (v.a.) viene motivado por la
teorica
de las variables estadsticas anteriormente estudia del espacio de
das. Tienen la ventaja de obviar la descripcion
probabilidad. Distinguiremos entre variables aleatorias discretas y continuas.
5.1.
86
J. L. DazBarrero
y verifica:
1.
2.
lm FX (x) = 0.
lm FX (x) = 1.
x+
Analisis
de Datos
87
derecha)
de distribucion
goza de las siguientes propiedaLa funcion
des:
1. p[a < X b] = FX (b) FX (a).
2. p(x) = fX (x) = FX (x) lm FX (y).
yx
Los momentos ordinarios de una variable aleatoria, si existen, se definen como las esperanzas de potencias de la variable aleatoria, i.e.,
X
k = E(X k ) =
xki fX (xi )
xi Dx
88
J. L. DazBarrero
Son
X momentos destacados m0 = 1, m1 = 0, m2 = V ar(X) =
tpica o estandar
es la
(xi )2 fX (xi ). La desviacion
xi Dx
k
hX
j=0
kj
(1)
k
j
kj
k
X
j=0
kj
(1)
k
j
kj
j .
1
caracterstica como
y la funcion
X
X (t) = E(eitX ) =
eitxj p(xj ).
xj Dx
Se verifica
Analisis
de Datos
89
dk
dt
m
(t)
X
k
t=0
dk
dt
(t)
k X
5.2.
t=0
= k
= ik k .
de Bernoulli
5.2.1. Distribucion
Si un experimento aleatorio tiene dos resultados posibles
p, i.e., X
se llama distribucion
Ber(p). Su esperanza es E(X) = p, su varianza V ar(X) =
p(1 p) y mX (t) = E(etX ) = 1(1 p) + et p = 1 + p(et 1).
Ejemplo 5.2.1 La probabilidad anual que se produzca un tornado en Mallorca es 0,2. La variable aleatoria
(
0 si no se produce,
X=
1 si se produce
es una variable aleatoria de Bernoulli de parametro
p = 0,2
con funcion
de densidad
(
0,8 si x = 0,
fX (x) =
0,2 si x = 1.
90
J. L. DazBarrero
Binomial
5.2.2. La Distribucion
de repeticioEn el experimento que consiste en la realizacion
nes independientes de una prueba de Bernoulli, si n repre
senta el numero
de pruebas y X es la variable aleatoria que
Sus parametros
son:
1. = E(X) = np,
2. V ar(X) = 2 = np(1 p), =
3. mX (t) = [(1 p) + pet ]n .
p
np(1 p)
Analisis
de Datos
91
uniforme discreta
5.2.3. Distribucion
Una variable aleatoria que puede asumir n valores diferentes
1
n
, x = 1, 2, , n.
Sus parametros
son:
1. E[X] =
n+1
2
2. V ar(X) =
3. mX (t) =
n2 1
12
n
1X
n k=1
ekt .
geometrica
5.2.4. La distribucion
geometrica modela el numero
La distribucion
de fracasos
hasta el primer e xito. Existen dos versiones: (1) La que cuen
ta unicamente
el numero
de fracasos y (2) La que cuenta
el numero
de pruebas incluyendo la que constituye el primer
e xito. Puesto que modela unidades, en general de tiempo, que
hay que esperar hasta obtener el primer e xito, se denomina
tambien variable aleatoria discreta de tiempo de espera.
Se dice que la variable aleatoria X con Dx = {0, 1, 2, }
geometrica de parametro
Esta distribucion
de fracasos hasta el pri
mer e xito, sin incluirlo. Sus parametros
son:
92
J. L. DazBarrero
1. E(X) =
1p
p
2. V ar(X) =
3. mX (t) =
1p
p2
p
1
et (1
p)
tribucion
p cuando
fX (x) = p(1 p)x1 , x = 1, 2, 3,
Sus parametros
son
1. E(X) =
1
p
2. V ar(X) =
1p
p2
Modela el numero
de pruebas hasta alcanzar el primer e xito,
incluyendo e ste.
de Poisson
5.2.5. La distribucion
Una variable aleatoria X con Dx = {0, 1, 2, } se dice que
de Poisson de parametro
Sus parametros
son:
x e
x!
, x Dx , > 0.
Analisis
de Datos
93
1. E(X) = ,
2. V ar(X) = .
3. mX (t) = e(e
t 1)
e xitos, entonces se distribuye como una Binomial de parametros n y p, es decir, X B(n, p) con
n x
fX (x) = p[X = x] =
p (1 p)nx , x = 0, 1, 2, , n.
x
x e
x!
, x = 0, 1, 2, .
el numero
medio de e xitos por unidad de tiempo.
94
J. L. DazBarrero
ejemplo, si T = numero
de anos
que transcurren hasta la
de un suceso A, entonces T G(p) con p = p[A].
realizacion
1
Por tanto, = E(T ) = es el periodo de retorno de A.
p
5.3.
Problemas
a. Todos los a
nos.
b. Al menos dos a
nos.
c. Exactamente 4 a
nos.
d. Mas
nos.
de cuatro pero menos de ocho a
Analisis
de Datos
95
Solucion.
Sea X = numero
de hormigoneras en funciona
se distribuye segun
n = 13 y
de densidad es
p = 0,60. La correspondiente funcion
x
fX
x
fX
0
6.6e-06
7
0.1932
1
2
3
4
5
6
0.0001 0.0011 0.0063 0.0238 0.0643 0.1287
8
9
10
11
12
13
0.2173 0.1811 0.1086 0.0444 0.0113 0.0013
probable de maquinas
el numero
mas
en funcionamiento al
final del da y su probabilidad es 0,2173.
2
Problema 5.4 Calcular la probabilidad de que en una reunion
azar, la probabilidad
1
p=
365
96
J. L. DazBarrero
1 100k
365
Analisis
de Datos
97
10
0
0 10
p q
=1
3 10
8
' 0,999945.
2
98
J. L. DazBarrero
Solucion.
de veces que el conductor coge
(a) Sea X el numero
su coche antes de ser sancionado por primera vez, i.e., X =
{0, 1, 2, }. La probabilidad de ser sancionado por exceso
de velocidad es p = 0,001 y la de no ser sancionado es 1p =
de variables de
0,999. Por tanto, se trata de una repeticion
Bernoulli independientes hasta que se produzca la primera
geometrica de
sancion,
es decir, X sigue una distribucion
parametro
p = 0,001, i.e.,
X G(0,001).
La probabilidad pedida es p[X = 14] = (1p)14 p = 0,99914
0,001 = 0,00099.
(la
coge el coche sin recibir sancion
una vez mas
p[X 4 X 3]
p[X 3]
p[X 4]
p[X 3]
= 0,999.
2
generatiz de momentos)
Analisis
de Datos
99
geometrica de
variable aleatoria que sigue una distribucion
parametro p es
tX
mX (t) = E(e
)=
tx
e fX (x) =
x=0
=p
x=0
h
i
etx (1 p)x = p 1 + et (1 p) + e2t (1 p)2 + . . .
x=0
=p
si et (1 p) < 1.
1 et (1 p)
d
dt
1 et (1 p)
mX (t) = lm h
t0
, entonces
p(1 p)
i2 =
t
1 e (1 p)
Ahora es facil
obtener que V ar(X) =
1p
p2
1p
p
mX (t) = E(e
)=
tx
e fX (x) =
x=0
=e
x=0
X
(et )x
x=0
x!
= e(e
t 1)
(et )x
x!
d
dt
h
i
t
mX (t) = lm e(e 1) et = .
t0
E(X ) = lm
t0
d2
dt2
mX (t)
100
J. L. DazBarrero
h
(et 1)
= lm e
t0
2 2t (et 1)
e + e e
= + 2 .
h
i h
i h
i
1. Calcular p X 5 , p 6 X 9 , p 10 X .
2. Cuantos
tornados cabe esperar que se produzcan en un
a
no y cual
de tornados
es la desviacion
tpica del numero
observados?
h
Solucion.
1.- Dado que P X = x =
P [X 5] =
x e
x!
, entonces
5
X
8x e8
= 0,191.
x!
x=0
9
X
8x e8
p[6 X 9] =
= 0,526.
x!
x=6
9
X
8x e8
p[x 10] = 1 p[X < 10] = 1
= 0,283.
x!
x=0
(b) E(X) = 8, V ar(X) = 8 y X =
V ar(X) = 2,828.
2
Captulo 6
Variables Aleatorias
Continuas
Dado un espacio de probabilidad (E, S, p); una variable aleatoria X definida sobre S con Dx R (intervalo) se dice que
es una variable aleatoria continua.
de densidad de probabilidad de una variable
La funcion
fX : R
aleatoria continua X se define como una funcion
[0, 1] tal que para todo a, b R, con a < b,
Z b
p[a < X b] =
fX (x) dx.
a
de densidad verifica:
La funcion
1. fX (x) 0, para todo x R.
Z
2.
fX (x) dx = 1.
fX : R [0, 1]
Al igual que en el caso discreto toda funcion
de denque cumpla las dos condiciones anteriores es funcion
sidad de una variable aleatoria X, en este caso continua.
101
102
J. L. DazBarrero
FX (x) = p[X x] =
fX (x) dx,
lm FX (x) = 0,
lm FX (x) = 1,
x+
distribucion
0
fX (x) = FX
(x) =
dFX (x)
dx
Analisis
de Datos
6.1.
103
Z
E(X) = =
g(X) por
y la esperanza o valor esperado de la funcion
Z
E[g(X)] = g(X) =
que existe
La esperanza es un parametro
de centralizacion
siempre y cuando sea convergente la integral que la define.
La varianza de X se define por
V ar(X) =
2
X
1
k2
104
J. L. DazBarrero
6.2.
uniforme continua
6.2.1. Distribucion
uniforme continua o distribucion
rectanguLa distribucion
1
ba
I{a X b}.
Sus parametros
son
1. E(X) =
a+b
2. V ar(X) =
(b a)2
12
exponencial
6.2.2. Distribucion
Es util
para modelar tiempos entre sucesos de Poisson. Se
dice que la variable aleatoria X con Dx = R+ sigue una dis-
Analisis
de Datos
105
exponencial de parametro
tribucion
, ( > 0), i.e.,
X Exp() fX (X) = ex I{0 x}.
Sus parametros
son
1. E(X) =
2. V ar(X) =
6.3.
(perodo de retorno)
1
2
Normal
La Distribucion
de densidad
parametros
, 2 si tiene por funcion
1 x 2
.
fX (x) = e 2
2
importante y la mas
utilizada de las
Probablemente es la mas
distribuciones de probabilidad, entre otras, por las siguientes
razones:
de la inferencia estadstica al
1. Es basica
en la aplicacion
analisis
de datos, dado que gran cantidad de estadsti normal a medicos muestrales tienden a la distribucion
de la muestra.
da que aumenta el tamano
mera aproximacion.
3. Las variables aleatorias continuas que dependen de un
gran numero
de causas independientes, que suman sus
efectos y que ninguna de ellas es preponderante sobre
tambien sigue una distribucion
normal.
las demas,
106
J. L. DazBarrero
emprica o grafica
en problemas relacionados con el comercio
de la Binomial (aproximacion)
cuando el numero
de pruebas n crece indefinidamente. Posteriormente, Gauss (1808)
y Laplace (1812) presentan el modelo normal expresandolo
de densidad y lo utilizan para estudiar la
con una funcion
de los errores al realizar mediciones fsicas (Asdistribucion
tronoma).
La grafica
de fX (x) tiene forma de campana con un maximo
en x = . Las dos colas se extienden indefinidamente siendo y = 0 una asntota horizontal. Cualesquiera que sean los
y que esta integral no es resoluble por cuadraturas, se necesita aproximarla numericmente mediante tablas. Esto comportara hacer una tabla para cada pareja de valores , 2 .
Analisis
de Datos
107
X
V ar(Z) = V ar
6.4.
o
1n
1
E(X) = ( ) = 0.
X
V ar(X) =
2
= 1.
historica
La aparicion
de variables aleatorias normales en las
aplicaciones proviene del hecho que cuando se suman variables aleatorias, el resultado tiende a comportarse como una
variable aleatoria normal. Esto se justifica con el Teorema
importantes en
del Lmite Central que es uno de los mas
la Teora de la Probabilidad y con enormes consecuencias en
se enuncia una version
sencilla
Estadstica. A continuacion,
de este resultado:
Teorema del Lmite Central
Sean X1 , X2 , . . . , Xn variables aleatorias independientes e
identicamente distribuidas, con E(Xi ) = y V ar(Xi ) =
n
X
2 , i = 1, 2, . . . , n. Definimos Sn =
Xi . Entonces, la vai=1
riable Sn tipificada
Sn n
Sn E(Sn )
Zn = p
=
n
V ar(Sn )
108
J. L. DazBarrero
n+
En otras palabras,
lm p[a Zn b] = p[a Z b]
n+
X np
np(1 p)
cuya distri-
n+
Analisis
de Datos
6.5.
109
Problemas
2. Cual
es la probabilidad que el tiempo de atencion
del
siguiente pedido exceda los 33 minutos?
3. Cual
es la probabilidad que el tiempo en que un pedido
es atendido difiera en 2 minutos del tiempo anunciado?
4. Para cada a tal que 25 < a < a + 2 < 35, cual
es la
probabilidad que un pedido sea atendido en el intervalo
[a, a + 2]?
Problema 6.2 Un estudio realizado sobre la cantidad de Chapapote retirado diariamente por los equipos de limpieza (voluntarios, pescadores y ejercito),
revela que el 50 % de los equi
pos retiran mas
de 100 y menos de 200 teneladas, el 25 % mas
de 200 y menos de 300 y el resto no llega a las 100 toneladas. Con esta informacion
construir una funcion
de densidad
que modelice la distribucion
X (en cientos de toneladas) de los
residuos recogidos por los equipos de limpieza y, a partir de
ella, obtener:
1. La funcion
de distribucion
de X.
2. La media de residuos recogidos y su desviacion
tpica.
3. El porcentaje de equipos que recogen entre 50 y 150 toneladas diarias.
110
J. L. DazBarrero
el inforSolucion.
de toneladas recogidas, segun
El numero
me, oscila entre 0 y 300 toneladas diarias. Entonces, La fun de densidad es
cion
1/4, 0 x < 1;
1/2, 1 x < 2;
fX (x) =
1/4, 2 x < 3;
0,
en el resto.
0,
Z x
x/4,
x/2 1/4,
1. FX (x) =
fX (x) dx =
x/4
+ 1/4,
1, Z
x < 0;
0 x < 1;
1 x < 2;
2 x < 3.
x 3.
0 dx = 0. Para 0
En efecto, para x < 0, FX (x) =
Z 0
Z x
x
x < 1, FX (x) =
0 dx +
1/4 dx = . Para 1
4
Z
Z0 1
Z x
0
x < 2, FX (x) =
0 dx +
1/4 dx +
1/2 dx =
0
Z 0
Z1 1
x
1
. Para 2 x < 3, FX (x) =
0 dx +
1/4 dx +
2
4
0
Z 2
Z x
x 1
1/2 dx+
1/4 dx = + . Finalmente, para x 3,
1
Z 0 2
Z 1 4 4 Z 2
Z 3
FX (x) =
0 dx+
1/4 dx+
1/2 dx+
1/4 dx =
1.
3
2. E(X) =
xfX (x) dx = , i.e., 150 toneladas. E(X 2 ) =
2
Z
34
x2 fX (x) dx =
. Por tanto, V ar(X) = 0,5833 y
12
sX = 0,7638.
Z 1,5
3. P [0,5 X 1,5] =
fX (x) dx = FX (1,5)FX (0,5) =
0,5
Analisis
de Datos
111
2
lidades:
p(0 z 2,2)
p(z 1,37)
p(2,5 z 2,5)
p(0 z 1)
p(1,8 z)
p(1,4 z 2,5)
p(2,5 z 0) p(1,5 z 2)
p(1,5 z)
Problema 6.4 Hallar los valores aproximados de los siguientes percentiles de la distribucion
normal estandadrd:
a.
91 b.
9 c.
75 d .
95
Solucion.
a. Se ha de calcular el valor de a de forma que
112
J. L. DazBarrero
Solucion.
Tipificando la variable mediante la transformacion
x
z=
, se obtienen losisguientes resultados:
Analisis
de Datos
113
2. Cual
es la probabilidad que el pH se mayor que 6,10?
3. Que valor sera superado solamente por el 5 % de los posibles pH?
Problema 6.9 Para conocer el grado de concienciacion
de los
problemas medio ambientales que tienen los trabajadores de
las constructoras un inspector ha aplicado un test de ambientalizacion
a los 500 trabajadores de una empresa. Se supone
que las puntuaciones obtenidas se distribuyen se gun
una normal de media 80 y desviacion
tpica 12. (a) Que puntuacion
12
X 80
= 0,67; X = 71,96.
z = 0,67;
12
El 25 % de los trabajadores con menor conocimiento en am obtiene puntuaciones inferiores a 71,96.
bientalizacion
X 80
z = 0,75. z = 0,67;
(b) P [X x] = 0,75; p
12
X 80
= 0,67; X = 88,04
12
A partir de 88,04 se encuentra el 25 % de los trabajadores con
mejor conocimiento de los problemas ambientales.
(c) Teniendo en cuenta que en el intervalo ( , + ) se
114
J. L. DazBarrero
99.7 %
(44,116)
(43,121)
Se puede concluir que en la segunda empresa hay trabajadores con mejor conocimiento de los problemas ambientales
que en la primera, ya que los lmites inferiores de los inter
valos son muy proximos;
en cambio los superiores son sen altos en la segunda empresa.
siblemente mas
2
Problema 6.10 La vida de una hormigonera se distribuye normalmente con media 10000 horas. Por la experiencia acumulada, se sabe que el 50 % de ellas dura menos de 9190 horas o
mas
de 10810 horas. Se pide:
1. Cual
del tiempo de vida de
es la desviacion
estandard
las hormigoneras?
2. Cual
es el porcentaje de hormigoneras que funcionara mas
de 11500 horas?
3. Si una hormigonera lleva funcionando 12000 horas, cual
Solucion.
La vida de las hormigoneras X se distribuye segun
2
una N (10000, ). Tipificando, mediante el cambio de variax 10000
ble z =
se obtiene que Z N (0, 1). Entonces:
10810 10000
810
9190 10000
810
1. z1 =
=
, z2 =
=
.
Analisis
de Datos
115
el enunciado, tenemos
Segun
h
h
810 i
810 i
=p Z
p Z>
h
h
810 i
810 i
p Z>
+p Z
= 0,5
h
810 i
810
De donde
p Z
= 0,75;
= 0,675 y = 1200.
=
2
= 0,1278.
buye segun
una variable aleatoria normal. Cuando se encuentra afectado por la sombra de la Tierra, se tiene que en un 95 %
de los casos la temperatura es inferior a los 263 K, mientras
que supera los 253 K en el 40 % de las mediciones.
1. Calcular la media y la varianza de la temperatura en estas condiciones.
2. Cuando el satelite
recibe directamente la luz solar, la tem
peratura en su superfcie presenta la misma varianza que
en el caso anterior, pero su media se incrementa en 35 K.
Cual
es la probabilidad que la temperatura supere los
278 K?
Solucion.
(1) La variable aleatoria temperatura en la sombra
una normal X N (, 2 ). Ademas,
se distribuye segun
p[X < 263] = 0,95,
116
J. L. DazBarrero
o equivalentemente,
263
= 1,645,
253
= 0,255
Captulo 7
Inferencia Estadstica:
de Parametros.
Estimacion
Contrastes de Hipotesis
7.1.
Introduccion
representativa de la poblacion.
117
118
7.2.
J. L. DazBarrero
Muestreo
es elevado. Para
numero
de individuos de la poblacion
el tamanno
se selecciona aleatoriamente el primer elemento de la muestra
(ordeentre los k primeros elementos de la poblacion
criterio), el segundo entre los k
nados siguiendo algun
siguientes y as hasta completar la muestra.
3. Muestreo aleatorio estratificado. Se utiliza en poblaciones heterogeneas cuando los individuos de la pobla se agrupan en estratos (grupos de caractersticas
cion
homogeneas, como sexo, renta,...). Consiste en dividir
en estratos y mediante muestreo aleatorio
la poblacion
simple seleccionar una muestra representativa de cada uno de ellos. Puede ser constante (cuando se extrae
el mismo numero
de individuos de cada estrato) o pro
porcional (cuando el numero
de elementos que se se-
Analisis
de Datos
119
la poblacion.
6. Muestreo no aleatorio por cuotas. Se utiliza en en
cuestas de opinion.
Se basa en un buen conocimiento
El investigador selecciona, segun
su cride la poblacion.
terio, el numero
de estratos o individuos que considera
apropiados para su investigacion.
mas
7. Muestreo no aleatorio deliberado. Consiste en seleccionar la muestra a partir de un segmento concreto de
(por ejemplo, la guia telefonica)
la poblacion
o seleccionando deliberadamente los individuos que se conside apropiados para constituir la muestra objeto
ran mas
de estudio.
Finalmente, comentaremos que la representatividad de una
muestra no se halla solamente en el metodo de muestreo si
o de la muestra es fundamental. Los criterios
no que el taman
de una muestra son:
generales para seleccionar el tamano
120
J. L. DazBarrero
1. El objetivo perseguido.
investigada.
2. Las caractersticas de la poblacion
3. El grado de error que se pueda tolerar.
7.3.
de Parametros
Estimacion
i.e., un numero.
Puntual
7.3.1. Metodos de Estimacion
Dada una muestra aleatoria X1 , X2 , . . . , Xn , y una realiza de la misma x1 , x2 , . . . , xn , el metodo de los momencion
tos consiste en identificar los momentos muestrales con los
Analisis
de Datos
121
k = E(X ) =
n
1X
Xik = m0k , k = 1, 2, . . .
i=1
los parametros
que maximizan la funcion
L(1 , 2 ; x1 , x2 , . . . , xn ) =
n
Y
f (xk ; 1 , 2 ).
k=1
comodo
En la practica
es mas
maximizar el logaritmo de la
de verosimilitud, i.e.,
funcion
ln L(1 , 2 ; x1 , x2 , . . . , xn ) =
n
X
ln f (xk ; 1 , 2 ).
k=1
se hace la estimacion
es, obtener de en adecuado. Al intentar
tre todos los posibles, el que sea mas
122
J. L. DazBarrero
eficiente que 2 si
Se dice que el estimador 1 es mas
V ar(1 ) < V ar(2 ).
Un estimador es optimo
cuando es insesgado y de varianza
mnima. Finalmente, un estimador se dice que es suficien
toda
te para un parametro
, cuando utiliza en la estimacion
contenida en la muestra sobre el parametro
la informacion
.
7.3.2.
Analisis
de Datos
123
7.4.
de la Media Muestral
Distribucion
que se
Si se considera una caracterstica de una poblacion
una variable aleatoria de parametros
distribuye segun
y
7.5.
En lo que sigue, consideraremos muestras aleatorias procedentes de variables aleatorias normales o muestras grandes
de poblaciones cualesquiera.
124
J. L. DazBarrero
numeros
`1 , `2 tales que
p[`1 X `2 ] = 1 .
Para determinar los valores de `1 , `2 utilizaremos la me una normal de
dia muestral X (que se distribuye segun
2
parametros
y /n). Entonces, tipificando, resulta
Z=
/ n
`
(7.1)
p `1
2 = 1
/ n
de donde se deduce
h
i
=1
p x `2 x `1
n
n
y en consecuencia el intervalo
h
i
x `2 , x `1 .
n
n
(7.2)
unicos.
Entonces, de entre todos los posibles valores
tendremos que elegir aquellos que hagan mnima la longitud del in tervalo (7.2). Es decir, hemos de minimizar
(longitud del intervalo):
la funcion
L(`1 , `2 ) = x `1
x `2
= (`2 `1 )
n
n
n
Analisis
de Datos
125
i
x z/2 , x + z/2
n
n
donde x es la media muestral observada y z/2 es tal
7.6.
Contraste de Hipotesis
del analisis
de una muestra, si hay o no evidencia estadsti
ca suficiente para concluir si es o no razonable la hipotesis
126
J. L. DazBarrero
de densisdad
Dada una variable aleatoria X con funcion
fX (x) y una muestra aleatoria X1 , X2 , . . . , Xn , un contraste
de hipotesis
o test parmetrico sobre los parametros
de la
consta de las siguientes fases:
poblacion
1. Una hipotesis
nula o primaria que se representa por
tros de la poblacion.
Si se reduce a un unico
valor se
dice simple y en caso contrario compuesta.
2. Una hipotesis
alternativa que se representa por Ha o
H1 .
de la muestra
3. El test de prueba que es una funcion
de densidad conocida. Habitualaleatoria con funcion
La hipotesis
nula puede ser verdadera o falsa y por tanto son
posibles dos decisiones correctas:
1. No rechazarla cuando es correcta.
2. Rechazarla cuando es incorrecta.
Pero tambien son posibles dos decisiones incorrectas:
1. Rechazar H0 cuando es correcta.
2. No rechazarla cuando es incorrecta.
Analisis
de Datos
127
En este ultimo
caso, a (1) se le llama error de tipo I y a
(2) error de tipo II. La probabilidad de un error de tipo I se
representa por y la de un error de tipo II por . Se llama
7.6.1.
Hipotesis
nula :
H0 : = 0
Hipotesis
alternativa :
Test de prueba:
z=
HA : 6= 0
x 0
/ n
Hipotesis
nula :
H0 : = 0
Hipotesis
alternativa :
Test de prueba:
:
Regla de decision
z=
H A : > 0
x 0
/ n
Rechazo de H0 si z > z .
128
J. L. DazBarrero
Hipotesis
nula:
H0 : = 0
Hipotesis
alternativa:
Test de prueba:
:
Regla de decision
z=
H A : < 0
x 0
/ n
Rechazo de H0 si z < z .
7.7.
Analisis de la Varianza
A continuacion
1. Hipotesis
nula:
H0 : 1 = 2 = . . . = k .
Analisis
de Datos
129
2. Hipotesis
alternativa: H1 : Al menos dos medias son
diferentes.
3. Test de prueba: El estadstico de prueba que se utiliza
tiene en cuenta tanto la variabilidad entre los grupos
(muestras) como la variabilidad dentro de cada grupo (muestra). Se denotan por SST (sum of squares for
treatments) y SSE (sum of squares for error) respectivamente. Se definen por
SST =
k
X
nj (xj x)2 ,
j=1
nj
k X
X
(xij xj ) =
j=1 i=1
k
X
(nj 1)s2j .
j=1
M ST
M SE
Los calculos
anteriores se acostumbran a disponer en
130
J. L. DazBarrero
Tabla ANOVA
variabilidad
df
SS
e.m.
k-1
SST
d.c.m
n-k
SSE
Total
n-1
SS(Total)
MS
SST
MST=
k1
SSE
MSE=
nk
F-ratio
F=
M ST
M SE
22 20 18
15 17 12
19 16 17
16 14
13 15
16 15
19
16
18
Solucion.
son:
En este caso las hipotesis
1. H0 : 1 = 2 = 3
2. H1 : Al menos dos medias son diferentes.
Analisis
de Datos
131
3. Estadstico de prueba:
x1 =
x2 =
x3 =
x=
SST =
15 + 17 + . . . + 19
8
10 + 12 + . . . + 16
8
13 + 18 + . . . + 18
8
15 + 17 + . . . + 18
24
3
X
=
=
=
=
141
8
110
8
132
8
383
24
= 17,625
= 13,750
= 16,500
= 15,958
j=1
s21 = 7,125,
s22 = 5,643,
s23 = 3,714
El numero
de grados de libertad del numerador es 1 =
k 1 = 3 1 = 2 y los del denominador 2 = n k =
24 3 = 21, por tanto, F,1 ,2 = F0,05,2,21 = 3,47.
Rechazamos H0 si F > F,1 ,2 . Por
4. Regla de decision:
tanto, dado que 3,47 < 5,79, en base a los datos analiza
dos, rechazaremos la hipotesis
primaria al 5 % de nivel
de significacion.
2
132
J. L. DazBarrero
Analisis
de Datos
7.8.
133
Test de Chi-cuadrado
p1 + p2 + + pk = 1,
y que en el total de las n repeticiones las frecuencias observadas de cada uno de estos resultados ha sido:
O1 , O2 , , Ok ,
O1 + O2 + + Ok = n.
k
X
(Oi ei )2
i=1
ei
134
J. L. DazBarrero
Categora
Frecuencia
1
2
24 65
3
4
5
86 70 55
Solucion.
y fijado el nivel de sig Una vez hechas las hipotesis
se procedera a evaluar el estadstico de contraste:
nificacion
e1 = np1 = 300(0,1) = 30, e2 = np2 = 300(0,2) = 60
e3 = np3 = 300(0,3) = 90, e4 = np4 = 300(0,2) = 60,
e5 = np5 = 300(0,2) = 60.
2 =
5
X
(Oi ei )2
i=1
ei
(86 90)2
(24 30)2
30
(70 60)2
(65 60)2
60
(55 60)2
90
60
60
36
25
16
100
25
=
+
+
+
+
= 3,88.
30
60
90
60
60
El valor de 20,01,4 = 13,27. Dado que 3,88 < 13,27, en base a
Las hipotesis
a contrastar son:
Analisis
de Datos
135
1. H0 :
2. H1 :
3. Estdstico de contraste:
2 =
h X
k
X
(Oij eij )2
i=1 j=1
eij
eij =
P
P
( Fi ) ( Cj )
n
: .
4. Nivel de significacion
Rechazo de H0 si 2 > 2,(h1)(k1) ,
5. Regla de decision:
donde h es el numero
de filas de la matriz de contingen
cia y k el numero
de columnas.
Ejemplo 7.8.2 En un momento determinado el gobierno de
una Cominudad Autonoma
tiene dos opciones en poltica economi
Afiliacion
R.G.P
A
62
B
103
C
31
Totales
196
S.I.
90
85
29
204
Totales
152
188
60
400
Solucion.
a contrastar son:
Las hipotesis
1. H0 :
2. H1 :
136
J. L. DazBarrero
3. Estadstico de contraste:
h X
k
X
(Oij eij )2
i=1 j=1
eij
Afiliacion
R.G.P
A
62(74.48)
B
103(92.12)
C
31(29.40)
Totales
196
(103 92,12)2
92,12
eij
95,88
29,40
(85 95,88)
Totales
152
188
60
400
(62 74,48)2
(31 29,40)2
eij =
S.I.
90(77.52)
85(95.88)
29(30.60)
204
k
h X
X
(Oij eij )2
i=1 j=1
P
P
( Fi ) ( Cj )
74,48
(90 77,52)2
77,52
2
(29 30,60)
30,60
= 6,79
tre la afiliacion
2
7.9.
Problemas de inferencia
se
nalizacion
de las carreteras ha observado que el conntenido
de las bolsas medianas (33 kg.) se distribuye normalmente
con media 33,2 y desviacion
0,3. Se pide:
estandard
Analisis
de Datos
137
1. Hallar la probabilidad que una bolsa de pintura comprada por un cliente contenga menos de 33 kg.
2. Probabilidad de que si compra un paquete de 6 bolsas, la
media del contenido de estas
sea inferior a 33 kg.
Solucion.
El contenido de las bolsas de pintura es una v.a. X
esandard
0,3, i.e. X = N (33,2, 0,3).
x
de tipificacion
es z =
1. En este caso la ecuacion
=
33 33,2
= 0,667 y P [x < 33] = P [z < 0,667] =
0,3
0,2514.
2. X es una v.a. normalmentedistribuidacon media 33,2
estandard
y desviacion
/ n = 0,2/ 6 = 0,12. Por
x 33,2
tanto, X = N (33,2, 0,12), z =
= 1,667 y
0,12
P [x < 33] = P [z < 1,667] = 0,0485.
2
Problema 7.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria de
una distribucion
normal con funcion
de densidad de probabilidad
h 1 x 2 i
1
.
fX (x) = exp
2
2
Hallar por metodo
de la maxima
verosimilitud estimadores de
2
y . En una realizacion
de la muestra con n = 10 se han observado los valores: 26,3, 35,1, 23,0, 28,4, 31,6, 30,9, 25,2, 28,0,
27,3, 29,2. Utilizar los resultados anteriores para obtener estimaciones de los parametros
y 2.
138
J. L. DazBarrero
de verosimiSolucion.
En primer lugar definiremos la funcion
2
h 1 x 2 i
1
k
L(, ; x) =
exp
2
2
k=1
2
n
i
h
1 n
1 X
2
(xk ) .
exp 2
2 k=1
2
A continuacion
ln L(, 2 ; x) =
n
2
ln 2
n
2
n
1 X
ln 2
2 2
(xk )2 .
k=1
ln L(, 2 ; x)
2
=
n
2 2
n
1 X
(xk ) = 0
k=1
n
1 X
2 4
(xk )2 = 0.
k=1
y sustituyendo en la
Despejando de la primera ecuacion
segunda se obtienen los estimadores
b=
n
1X
n k=1
Xk ;
b2 =
n
1X
(Xk X)2 .
n k=1
Analisis
de Datos
139
1. Cual
es el nivel de confianza para el intervalo
x 2,58 , x + 2,58 .
n
n
2. Cual
es el nivel de confianza para el intervalo x1,645 .
n
3. Calcular un intervalo para la media al 95 % de confianza cuando n = 100 y x = 58,3 (Tomar = 3).
Solucion.
3
x z/2 = 58,3 1,96
= 58,3 0,588 o equin
100
valentemente (57,71, 58,89).
2
Problema 7.4 Un test de turbidez realizado sobre 16 muestras de aguas arenosas en el delta de un rio arrojo los siguientes resultados:
26,7 25,8 24,0 24,9 26,4 25,9 24,4 21,7
24,1 25,9 27,3 26,9 27,3 24,8 23,6 25,0
Suponiendo que el muestreo se llevo a cabo sobre una poblacion
normal, estimar intervalos al 90 %, 95 % y 99 % de nivel
de confianza para la media de turbidez .
140
J. L. DazBarrero
Solucion.
Se trata de obtener estimaciones de intervalos de
normal de varianza
confianza para la media de una poblacion
desconocida a partir de una muestra de 16 observaciones.
Las estimaciones las obtendremos al realizar los estimadores
S
S
`1 = X t/2,n1 y `2 = X +t/2,n1 sobre la muestra.
n
n
Teniendo en cuenta que x = 25,29 y s = 1,47, entonces:
1. Si 1 = 90 %, /2 = 0,05, t/2,15 = 1,753 y la estima1,47
del intervalo es 25,29 1,753
= 25,29 0,64,
cion
4
i.e., (24,65, 25,93).
2. Si 1 = 95 %, /2 = 0,025, t/2,15 = 2,131 y la estima1,47
del intervalo es 25,29 2,131
cion
= 25,29 0,78,
4
i.e., (24,51, 26,07).
3. Si 1 = 99 %, /2 = 0,005, t/2,15 = 2,947 y la estima1,47
del intervalo es 25,29 2,947
cion
= 25,29 1,08,
4
i.e., (24,21, 26,37).
2
Problema 7.5 Una compa
na que produce neumaticos
para
automoviles
de turismo esta considerando la posibilidad de in
torducir una cierta modificacion
no de sus productos.
en el dise
El gerente de la compa
na considera que la inversion
economi
ca que supone dicha modificacion
estara justificada solo
si
se aumentase la duracion
que ac promedio de los neumaticos
tualmente es de 20000 km. Se selecciona una muestra aleatoria de 16 prototipos del neumatico
modificado y se observa que
la duracion
promedio de los mismos es de 20758 km. Suponiendo que la vida media de los neumaticos
se distribuye normal
mente con desviacion
1500 km. (La del neumatico
estandard
Analisis
de Datos
141
Solucion.
Se realizara un test parametrico para la media que
consta de las siguientes fases:
1. Hipotesis
primaria H0 : = 20000.
2. Hipotesis
alternativa H1 : > 20000.
y cuantil que marca la zona de
3. Nivel de significacion
20758 20000
x 0
=
=
/ n
1500/ 16
2,02.
5. Como z = 2,02 < 2,33 = z0,01 , en base a los datos
contenidos en esta muestra, no se puede rechazar la
hipotesis
primaria y por tanto se recomienda continuar
tal y como se venia haciendo hasta ahora.
la produccion
2
zona 3 la mas
alejada del lugar donde se piensa instalar la
antena. La informacion
obtenida es
142
J. L. DazBarrero
Opinion
zona 1 zona 2
A favor
40
55
En contra
85
70
Indecisos
30
40
Total
155
165
zona 3 Total
60
155
50
205
40
110
150
470
Opinion
zona 1
A favor
51.12
En contra 67.61
Indecisos
36.28
Total
155
zona 2 zona 3
54.51 49.47
71.97 65.43
38.62 35.11
165
150
Total
155
205
110
470