Libro de Estadistica

Indice general
1. Analisis de Datos
1.1. Introduccion
. . . . . . . . . . . . . . . . . . .
1.2. Analisis
descriptivo de datos . . . . . . . . . . .
1.3. Analisis
inferencial . . . . . . . . . . . . . . . .
1.4. Conjuntos de Datos
. . . . . . . . . . . . . . . 10
2. Analisis exploratorio de datos univariantes
13
2.1. Introduccion
. . . . . . . . . . . . . . . . . . . 13
de los datos
2.2. Presentacion
. . . . . . . . . . . . 14
2.2.1. Distribuciones de frecuencias
. . . . . . 15
2.2.2. Diagramas de puntos y de tallo y hojas
. 20
2.3. Representaciones graficas

. . . . . . . . . . . . 21
2.3.1. Diagramas de sectores
. . . . . . . . . . 21
2.3.2. Diagrama de rectangulos

. . . . . . . . . 22
2.3.3. Diagrama de Pareto . . . . . . . . . . . . 22
2.3.4. Histogramas . . . . . . . . . . . . . . . . 22
1
J. L. DazBarrero
2.3.5. Polgonos de frecuencies
. . . . . . . . . 23
2.3.6. Diagramas de linea o cartas temporales . 23

numerica de datos
2.4. Descripcion
. . . . . . . . . 23
. . . . . . . . . . 24
2.4.1. Parametros
de posicion
2.4.2. La media aritmetica . . . . . . . . . . . . 24
2.4.3. La Mediana
. . . . . . . . . . . . . . . . 27
2.4.4. Los Percentiles . . . . . . . . . . . . . . . 28

2.4.5. La Moda . . . . . . . . . . . . . . . . . . 29
. . . . . . . . . 29
2.4.6. Parametros
de dispersion
2.4.7. Rango de un conjunto de datos . . . . . . 29
2.4.8. Rango intercuartlico . . . . . . . . . . . 30
2.4.9. Desviaciones respecto a la media . . . . . 30
tpica . . . . . 30
2.4.10.La varianza y la desviacion
media . . . . . . . . . . . . . 32
2.4.11.Desviacion
de Pearson
2.4.12.Coeficiente de variacion
. . . 32
2.4.13.Parametros
de simetra . . . . . . . . . . 33
2.4.14.Parametros
de forma . . . . . . . . . . . 34
2.4.15.Momentos muestrales . . . . . . . . . . . 34
de valores atpicos . 35
2.4.16.Box-plot y deteccion
2.4.17.T ransformaciones . . . . . . . . . . . . . 36
2.5. Problemas de Analisis

exploratorio de datos
3. Analis exploratorio de datos bivariantes
. . 37
45

Analisis
de Datos
3.1. Variables bidimensionales . . . . . . . . . . . . 45
3.2. Ajuste mnimo-cuadratico

. . . . . . . . . . . . 47
3.3. Problemas de Analisis

Exploratorio de Datos Bivariantes . . . . . . . . . . . . . . . . . . . . . 51
4. Conceptos Basicos de Probabilidad
57
4.1. Introduccion
. . . . . . . . . . . . . . . . . . . 57
axiomatica
4.2. Definicion
de probabilidad . . . . . . 59
4.3. Tecnicas de conteo. Combinatoria . . . . . . . . 62
4.3.1. Variaciones con repeticion

4.3.2. Variaciones ordinarias
. . . . . . . . 62
. . . . . . . . . . 63
4.3.3. Permutaciones ordinarias . . . . . . . . . 64

. . . . . . . 64
4.3.4. Permutaciones con repeticion
4.3.5. Combinaciones ordinarias
. . . . . . . . 65
4.3.6. Combinaciones con repeticion

. . . . . . 66
4.4. Probabilidad condicional . . . . . . . . . . . . . 68
4.5. Sucesos dependientes e independientes . . . . . 69
4.6. Teorema de las probabilidades totales . . . . . . 71
4.7. Formula
de Bayes
. . . . . . . . . . . . . . . . 72
4.8. Problemas de Probabilidad . . . . . . . . . . . . 73

5. Variables Aleatorias Discretas
85
5.1. Variables aleatorias discretas . . . . . . . . . . 85

5.2. Modelos probabilsticos discretos . . . . . . . . 89
J. L. DazBarrero
de Bernoulli . . . . . . . . . 89
5.2.1. Distribucion
Binomial . . . . . . . . . 90
5.2.2. La Distribucion
uniforme discreta . . . . . . 91
5.2.3. Distribucion
geometrica . . . . . . . . 91
5.2.4. La distribucion
de Poisson . . . . . . . . 92
5.2.6. Perodo de retorno . . . . . . . . . . . . . 94
5.3. Problemas . . . . . . . . . . . . . . . . . . . . . 94
6. Variables Aleatorias Continuas
101
6.1. Parametros
de una variable aleatoria continua . 103
6.2. Modelos probabilsticos continuos . . . . . . . . 104
uniforme continua
6.2.1. Distribucion
. . . . . 104
exponencial . . . . . . . . . 104
6.2.2. Distribucion
Normal
6.3. La Distribucion
. . . . . . . . . . . . . 105
6.4. El teorema del Lmite Central . . . . . . . . . . 107

6.5. Problemas . . . . . . . . . . . . . . . . . . . . . 109
de Parametros.
7. Inferencia Estadstica: Estimacion
Contrastes de Hipotesis
117
7.1. Introduccion
. . . . . . . . . . . . . . . . . . . 117
7.2. Muestreo . . . . . . . . . . . . . . . . . . . . . 118
de Parametros
7.3. Estimacion
. . . . . . . . . . . . 120
Puntual . . . . . 120
7.3.1. Metodos de Estimacion
7.3.2. Intervalo de probabilidad e intervalo de
confianza . . . . . . . . . . . . . . . . . 122

Analisis
de Datos
de la Media Muestral . . . . . . . . 123

7.4. Distribucion
7.5. Intervalos de confianza en poblaciones normales 123
7.6. Contraste de Hipotesis

. . . . . . . . . . . . . . 125
7.6.1. Contrastes para la media . . . . . . . . . 127
7.7. Analisis
de la Varianza . . . . . . . . . . . . . . 128
7.8. Test de Chi-cuadrado
. . . . . . . . . . . . . . 133
7.9. Problemas de inferencia . . . . . . . . . . . . . 136
J. L. DazBarrero
Captulo 1
Analisis de Datos
1.1.
Introduccion
El analisis
de datos, tecnicas cuantitativas o estadstica es el
conjunto de metodos y procedimientos encargados de la ob de informacion
util
a partir de un conjunto de datos.
tencion
Consiste en la recopilacion,
presentacion,
analisis
y uso de
de probledatos para la toma de decisiones y la resolucion
mas. Por tanto, el objetivo del analisis

de datos es la toma de
decisiones frente a la incertidumbre.
1.2.
Analisis descriptivo de datos
Los metodos descriptivos tienen por objeto organizar y resumir los datos disponibles de manera que sea posible perci
bir rapidamente
las caractersticas principales y las posibles
anomalas de los procesos de que provienen, sin intentar in alla de los propios datos.
ferir nada que vaya mas
7
J. L. DazBarrero
1.3.
Analisis inferencial
util
Tiene por objeto deducir informacion

sobre una pobla a partir del analisis
cion
de muestras de la misma. Hay dos
formas de abordar el problema:
de parametros
1. Estimacion
estadstica
2. Contraste de hipotesis
o decision
La primera consiste en aproximar los parametros

poblacionales con estadsticos muestrales adecuados o bien calculando intervalos muy probables de posibles valores. En cam estadstica consiste basicamente
bio, la decision
en estable
cer hipotesis
sobre los parametros
poblacionales y a conti utilizar la informacion
contenida en las muestras
nuacion
para decidir si las hipotesis

formuladas son o no aceptables.
de datos consta de las siguientes faEn general, un analisis

ses:
Planteamiento del problema que se desea estudiar
de un plan para la recogida de datos
Diseno
Analisis
exploratorio de los datos (tabulacion,
sntesis,
de valores anomalos
de primeras
deteccion
y obtencion
conclusiones)
del problema
Modelacion
del modelo
Validacion
Toma de decisiones

Analisis
de Datos
En cualquier caso, el analisis

de datos no dira cual es la
que se ha de tomar, sino que aportara informacion
decision
para que, juntamente con otras consideraciones, se este en
condiciones para tomarla.
Conceptos fundamentales en el analisis

de datos son los de
poblacion
y muestra. La poblacion
es el conjunto de todos los
elementos que tienen una determinada caracterstica, es de
cir, lo que se quiere estudiar. Los elementos de una poblacion
se llaman individuos o unidades muestrales. Una muestra es
i.e., lo que se puede
cualquier subconjunto de la poblacion,
estudiar. El numero
de elementos de que consta es el tama
no
o extension
de la muestra. Una muestra es aleatoria cuando
tiene la misma probabilidad
cada individuo de la poblacion
de ser incluido en ella.
su caracter
Segun
los datos se clasifican en cualitativos o
a su vez se clasifican
atributos y cuantitativos. Estos ultimos
el numero
en discretos y continuos. Segun

de datos observa estos se clasifican en
dos en cada individuo de la poblacion
de un dato).
univariantes (un solo dato) o multivariantes (mas
que se considera
Finalmente, se expone el orden de actuacion
adecuado para el tratamiento de los datos:
mas
depuracion
y presentacion
analtiRecogida, ordenacion,
ca (tablas) de los datos
grafica
Representacion
de estadsticos muestrales y obtencion
de
Evaluacion
valores aproximados de los parametros

poblacionales.
10
J. L. DazBarrero
Este apartado se puede concluir diciendo que el analisis

de
datos es un elemento decisivo para el incremento de la calidad, dado que las tecnicas cuantitativas permiten estudiar
la variabilidad, entendida como el resultado de los cambios
en las condiciones sobre las que se hacen las observaciones.
1.4.
Conjuntos de Datos
1. En la siguiente tabla aparecen 80 datos que han sido

simulados con MS Excel:
24,34
49,36
26,64
47,18
31,38
62,20
49,21
69,64
52,06
59,28
46,31
48,21
44,57
51,00
67,82
61,73
35,40
46,17
56,69
45,71
48,86
78,95
45,49
62,41
40,01
53,72
37,50
59,55
35,23
52,20
48,70
63,49
40,24
40,85
31,39
56,24
56,71
29,77
57,12
57,18
60,86
34,43
51,89
49,88
42,61
68,47
43,46
55,63
60,50
33,40
39,77
41,82
61,30
61,22
36,32
41,38
63,56
61,75
40,18
47,03
33,98
55,73
73,09
56,36
68,77
66,33
48,31
32,25
55,98
47,85
47,77
53,86
46,23
59,12
33,12
47,07
59,64
65,27
45,66
62,55
2. Los siguientes datos corresponden al tiempo medio (en

segundos) de envasado de una botella de agua mineral:
1,23
2,12
1,41
2,32
2,75
1,77
2,01
2,10
1,88
2,12
1,32
2,25
1,72
1,86
2,10
2,01
2,11
1,71
2,21
1,64
2,04
1,78
2,24
1,53
2,05
1,77
2,08
2,19
2,42
1,64
1,96
1,90
2,06
2,14
2,31
2,06
1,94
1,74
1,76
2,34
2,03
2,00
2,13
1,75
2,09
2,19
1,96
1,83
2,18
2,50
2,00
2,07
1,82
2,05
2,17
1,79
1,87
1,89
1,78
1,63
3. Los siguientes datos corresponden a porcentajes de basura reciclada obtenidos en 100 puntos seleccionados

Analisis
de Datos
11
aleatoriamente en una gran ciudad y su area

Metropolitana:
13
22
26
49
29
43
45
43
32
35
25
52
29
36
45
34
33
27
47
47
12
34
37
47
45
22
39
37
47
36
27
29
32
27
55
22
45
36
39
28
45
55
54
46
32
47
27
48
57
25
56
36
30
38
25
39
28
55
28
36
27
49
37
42
23
25
46
34
24
31
34
44
29
53
40
41
40
33
29
43
38
47
38
41
30
29
44
47
25
42
34
61
43
34
31
44
48
35
55
48
Problema 1.1 Para los conjuntos de datos anteriores se pide:

1. Ordenarlos, clasificarlos e intentar decir algo sobre la informacion
contenida en ellos y presentarla de forma resumida.
2. A la vista de lo obtenido en el apartado anterior, se pueden sacar algunas conclusiones? cuales?
12
J. L. DazBarrero
Captulo 2
Analisis exploratorio de
datos univariantes
2.1.
Introduccion
El Analisis
descriptivo de datos es la parte de la Estadstica
encargada de contar, organizar, resumir y representar grafi

camente los datos de forma que sean facilmente
perceptibles
sus principales caractersticas. Los elementos de trabajo son
los datos (variables estadsticas) y e stos, como ya se ha comentado, pueden ser cualitativos o cuantitativos.
La variables cualitativas describen cualidades de los elemen y no toman valores numericos. Por ejemtos de la poblacion
plo, la ciudad donde se ha nacido, el color del pelo, la ocupa de los padres, etc., son datos cualitativos.
cion
Las variables cuantitativas toman valores numericos y pue
den ser discretas (toman valores numericos enteros en numero finito o infinito numerable) y continuas cuando toman valo
res dentro de un intervalo. El numero

de mensajes electroni13
14
J. L. DazBarrero
cos recibidos por un usuario o el numero

de veces que se
ha de lanzar una moneda hasta que aparezca cara son ejemplos de variables discretas. La hora de llegada de un tren a la
el porcentaje de ocupacion
hotelera de una deterestacion,
de unas acciones en Bolsa,
minada comarca o la cotizacion
son ejemplos de datos cuantitativos continuos.
cuando la caTambien se utilizan las variables dicotomicas
racterstica observada toma solo los valores cero y/o uno.

Suele ser una variable cualitativa, reflejando dos modalidades posibles o la presencia o ausencia de una cualidad.
Un caso intermedio entre las variables cualitativas y las cuantitativas son las variables ordinales cuando los valores tienen
Por ejemun caracter nominal pero admiten una ordenacion.
(muy insatisfecho, insatisfecho,
plo, las variables de opinion
indiferente, satisfecho, muy satisfecho).
Finalmente, cuando sobre un mismo individuo se observa
de una caracterstica diremos que se trata de una variamas
ble multidimensional.
2.2.
de los datos
Presentacion
Se trata basicamente
de establecer la forma de organizar los
datos en tablas y representarlos graficamente

mediante dia
pergramas con el objetivo de proporcionar una rapida
y facil
de algunas de sus principales caractersticas.
cepcion
Habitualmente los datos se organizan en tablas llamadas dis
tribuciones de frecuencias y se representan graficamente
mediante diagramas: de puntos, de rectangulos,
de barras y sec
tores, histogramas, polgonos de frecuencias, cartas temporales, pictogramas, etc..
grafica
Antes de proceder a la representacion

de los datos

Analisis
de Datos
15
es conveniente utilizar un procedimiento semigrafico,

conocido como diagrama de tallo y hojas que sirve para ordenar
los datos y para hacernos una idea de como e stos se hallan
distribuidos.
2.2.1.
Distribuciones de frecuencias
es en
El resultado de observar una muestra o una poblacion
un conjunto de datos que recoge los valores que toma una
variable estadstica sobre los individuos observados. Estos
valores suelen registrarse en forma de listados o protocolos y
el tipo
pueden ser nominales, ordinales o numericos, segun
de variable observada. Una primera forma de sintetizar los
datos es analizar que valores aparecen y cuantas veces o en
aparecen.
que proporcion
Supongamos que se observa una determinada caracterstica X sobre n objetos o individuos. El valor n, como ya se
ha dicho, es el tama
no o extension
de la muestra. La muestra se denotara por Mx = {x1 , x2 , , xn } (es el conjunto
de valores observados sobre los n individuos), y por Dx =
{x1 , x2 , , xk } el conjunto de valores disitintos que aparecen en la muestra.
de
Se denomina frecuencia absoluta del valor xi al numero
veces ni que aparece el valor xi en el conjunto Mx , y se denota por fa (xi ) = ni .
Se denomina frecuencia relativa del valor xi a la proporcion

de apariciones del valor xi en el conjunto Mx , y se indica por
fr (xi ) =
ni
n
Con las frecuencias relativas se elimina la influencia del nume entre

ro total de observaciones y eso permite la comparacion
conjuntos de datos de distinto tamano.
Cuando los valores x1 , x2 , , xk admiten una ordenacion
16
J. L. DazBarrero
tiene sentido hablar de frecuencia acumulada hasta el va creciente x1 x2

lor iesimo. Supuesta una ordenacion
xk , se define:
Fa (xi ) =
Fr (xi ) =
i
X
fa (xk ) =
i
X
nk ;
k=1
k=1
i
X
i
X
nk
fr (xk ) =
k=1
k=1
Estos resultados se acostumbran a representar en tablas

(distribuciones de frecuencias), indicando en la primera columna los valores observados de la caracterstica X, ordenados de menor a mayor cuando ello es posible, y, en columnas
sucesivas, las frecuencias absolutas y relativas y las frecuencias absolutas acumuladas y relativas acumuladas cuando
ello tenga sentido.
xi
fa (xi ) fr (xi )
x1
n1
x2
..
.
n2
..
.
xk
nk
n1
n
n2
n
..
.
nk
n
Fa (xi )
n1
n1 + n2
..
.
n1 + n2 + + nk
Fr (xi )
n1
n
n1 + n2
n
..
.
n1 + n2 + + nk
n
de los datos en tablas de frecuencias

Para la presentacion
analtica) hay que distinguir entre variables
(presentacion
cualitativas y cuantitativas discretas y continuas. El el caso
de variables cualitativas o cuantitativas discretas hay poca
diferencia como se muestra en los siguientes ejemplos.

Analisis
de Datos
17
Ejemplo 2.2.1 De los 60 estudiantes que asisten a clase, 40

han nacido en Catalu
na, 15 en el resto de Espa
na y 5 son
extranjeros. Presentar los datos en una tabla de frecuencias.
Solucion.
En este caso se trata de una variable cualitativa
X que toma los valores {Cataluna,Espa

na,Extranjero},
con
frecuencias absolutas {40, 15, 5} respectivamente. La correspondiente tabla de frecuencias es la siguiente:
xi
fa (xi ) fr (xi )( %) Fa (xi ) Fr (xi )( %)
Cat
Esp
Ext
40
15
5
Total
60
66.66
25
8.33
40
55
60
66.66
91.66
100
2
Ejemplo 2.2.2 Durante 100 das se ha anotado el numero
de
veces diarias que se han producido deficiencias en el sumunistro electrico

por parte de la compa
nia suministradora. Los
resultados fueron
xi
ni
0
60
1 2
30 4
3 4 5
3 1 0
6
2
Presentar los datos en una tabla de frecuencias y concluir si el

sumunistro puede considerarse o no satisfactorio.
Solucion.
En este caso se trata de una variable cuantitativa
discreta. Su correspondiente tabla de frecuencias es
18
J. L. DazBarrero
xi
0
1
2
3
4
5
6
Total
fa (xi ) fr (xi ) Fa (xi ) Fr (xi )

60
30
4
3
1
0
2
100
0.60
0.30
0.04
0.03
0.01
0.00
0.02
60
90
94
97
98
98
100
0.60
0.90
0.94
0.97
0.98
0.98
1.00
En base a los datos contenidos en la tabla se puede decir

que el suministro es correcto ya que en el 90 % de los das el
suministro o no presenta o a lo sumo sufre una deficiencia.
2
En el caso de datos continuos es conveniente agrupar los
valores observados en clases y representar las frecuencias
de estas clases en tablas que como antes se llaman Tablas
de frecuencias.
Las fases a seguir son las siguientes:
i. Redondear los datos y expresarlos (si se considera conveniente) en unidades no decimales.
ii. Decidir el numero

de clases a considerar. Normalmente
es un numero
entre 5 i 20. Para determinarlo a veces se
utiliza la formula
de Sturges:

NUM = E
3
4
log n
log 2

.
Tambien se acostumbra a utilizar la raz cuadrada por
exceso del numero

de datos.

Analisis
de Datos
19
iii. Contar el numero

de observaciones que caen dentro de
cada clase, i.e., las frecuencies absolutas y completar la
tabla de frecuencias.
Se utiliza la siguiente terminologa:
Clase o intervalo de clase: son cada uno de los intervalos
en que se han de agrupar los datos (aunque no es necesario es conveniente que sean de igual longitud).
Lmites de clase: son los extremos de cada intervalo de clase. El lmite inferior se representa por Li y el lmite superior por Ls .
o de la clase: es la diferencia entre el Ls Li .
Taman
Marca de clase: es el punto medio del intervalo de clase. Todos los elementos de la clase se representan por la marca de clase.
Ejemplo 2.2.3 Los datos siguientes corresponden a los porcentajes de basura recilada de 104 puntos seleccionados al
azar en una determinada ciudad. Presentar los datos agrupados en clases y construir la correspondiente tabla de frecuencias.
96,4
89,3
84,7
81,4
79,7
77,1
73,8
69,7
65,5
59,0
38,0
92,6
88,4
84,0
81,3
79,4
77,0
73,6
68,8
65,0
55,9
35,0
92,3
87,7
83,2
81,2
79,4
77,0
72,4
68,5
64,7
55,6
33,8
92,0
87,7
83,2
81,1
79,3
75,9
71,9
68,1
62,2
54,9
32,1
92,0
87,3
83,0
81,1
79,2
75,8
71,5
68,1
61,8
48,9
91,9
87,3
82,4
81,0
78,9
75,6
71,2
68,0
61,4
48,8
91,8
87,0
82,4
81,0
78,8
75,3
70,7
67,7
61,2
46,7
91,5
85,8
82,0
80,9
77,6
74,9
70,7
67,7
60,0
43,6
90,4
85,1
81,9
80,4
77,3
74,4
70,6
66,8
60,0
42,6
89,4
84,9
81,7
79,8
77,1
73,9
69,9
65,8
59,2
39,1
20
J. L. DazBarrero
Solucion.
Los 104 datos de que disponemos los distribuiremos
en 10 clases. La correspondiente tabla de frecuencias es
Li Ls
xi
3037
3744
4451
5158
5865
6572
7279
7986
8693
93100
Total
33.5
40.5
47.5
54.5
61.5
68.5
75.5
82.5
89.5
96.5

3
4
3
3
10
18
18
28
16
1
104
2.885
3.846
2.885
2.885
9.615
17.308
17.308
26.923
15.385
0.962
3
7
10
13
23
41
59
87
103
104
2.885
6.731
9.616
12.501
22.116
39.424
56.732
83.655
99.04
100
2.2.2. Diagramas de puntos y de tallo y hojas
El diagrama de puntos es util

para conjuntos pequenos
de
datos, dado que permite ver con rapidez y facilidad la ubica o tendencia central de los datos, as como su dispersion
cion
o variabilidad.
El diagrama de tallo y hojas es un procedimiento semigrafico
para presentar variables cuantitativas cuando el numero

de
son
datos no es muy elevado. Las fases de su construccion
las siguientes:
i. Redondear los datos y expresarlos en unidades no decimales.

Analisis
de Datos
21
ii. Disponer los datos en una tabla a dos columnas separadas por una linea vertical de la forma siguiente:
a. Para datos con dos cifras, las decenas que son el tallo, a la izquierda de la linea vertical y las unidades
que son las hojas a la derecha.
b. Para datos con tres cifras las centenas y decenas
forman el tallo y las unidades las hojas.
Cada tallo se escribe una vez, el numero

de hojas da la frecuencia del tallo. Los diagramas de tallo y hojas son tambien
utiles
para ordenar los datos y para hacernos una idea de la
simetra de la distribucion.
2.3.
Representaciones graficas
contenida en las tablas de frecuencias pueLa informacion
de expresarse en forma grafica

sin que esta transformacion
Las distribusuponga una perdida o ganacia de informacion.
ciones de frecuencias se representan graficamente

mediante
diagramas de barras y rectangulos
en el caso de variables
cualitatives o cuantitativas discretas y mediante histogramas

de frecuencias y polgonos de frecuencias cuando las variables son continuas. En el caso cualitativo tambien se utilizan
los diagramas de sectores.
2.3.1. Diagramas de sectores
Se construyen de forma que su angulo

central y por tanto
su area
sea proporcional a la frecuencia absoluta correspon
diente. Son utiles
para presentar resultados de encuestas,
procesos electorales, etc.
22
J. L. DazBarrero
2.3.2. Diagrama de rectangulos

En el eje de abcisas se representan los valores de la variable en cualquier orden y en el de ordenadas se representan
las frecuencias. Cada categora se representa mediante un
rectangulo
de altura proporcional a la frecuencia observada.
Los rectangulos
tienen todos la misma amplitud de base.
2.3.3. Diagrama de Pareto
Es equivalente al diagrama de rectangulos

pero ordenando
las categoras de mayor a menor frecuencia. Se construyen
representando los valores observados en una escala horizontal (vertical), les frecuencias en una escala vertical (horizontal) y se dibujan segmentos sobre los valores observados de
longitudes proporcionales a las frecuencias correspondien
tes. Son utiles
para variables cualitativas y cuantitativas discretas. El diagrama de barras acumuladas es como el diagrama de barras pero para frecuencias acumuladas.
2.3.4. Histogramas
El Histograma se construye para representar la medida de las
observaciones que estan agrupadas en clases en un eje horizontal, las frecuencias de clase en un eje vertical y se dibujan rectangulos con sus bases determinadas por los lmites
de clase y sus alturas proporcionales a las correspondientes
frecuencias de clase. La altura de las clases puede calcularse
mediante la expresion
altura =
frecuencia relativa
Ls Li
A modo de sntesis diremos que el histograma es la descrip-

Analisis
de Datos
23
grafica
importante de la distribucion
de las variacion
mas
bles continuas. Su forma depende basicamente

de las clases,
de
que han de ser elegidas antes de construir la distribucion
frecuencias. Es recomendable que ninguna clase contenga
del 30 % de los datos y tambien que no halla muchas
mas
clases vacas.
2.3.5. Polgonos de frecuencies

En el caso de datos cualitativos o cuantitativos discretos se
construyen dibujando una poligonal que una los extremos
superiores de los segmentos del diagrama de barras. En el
caso de datos continuos se toman las frecuencies de clase en
las marcas de clase y se unen los puntos medios de la base
superior de los rectangulos del histograma mediante segmentos.
2.3.6. Diagramas de linea o cartas temporales

de una magnitud a
Una forma de representar la evolucion
lo largo del tiempo es a traves de los graficos

temporales.
Consisten en dibujar en un grafico

cartesiano los puntos que
tienen por abcisa el momento en que se raliza la observacion
y por ordenada la magnitud de la observacion.

Uniendo los
puntos consecutivos mediante lineas se obtiene una poligo temporal
nal que proporciona una idea visual de la evolucion
de la variable.
2.4.
numerica de datos
Descripcion
Los parametros poblacionales y los estadsticos muestra

les son cantidades numericas que resumen la informacion
24
J. L. DazBarrero
contenida en los datos. Se llaman parametros cuando ha y estadsticos cuando los datos
cen referencia a la poblacion
corresponden a una muestra. Se clasifican en:
(media aritmetica, mediana,
Parametros de posicion
moda, centiles)
(rango del conjunto de daParametros de dispersion
tos, rango intercuartilico, desviaciones respecto a la me tpica o estandard,
dia, varianza, desviacion

desviacion
de Pearson)
media, coeficiente de variacion
Parametros de asimetra (coeficiente de simetra: asimetra a la izquierda, simetra, asimetra a la derecha)
Parametros de forma (coeficiente de kurtosis: platicuarti
cas, mesocuarticas,
leptocuarticas).
2.4.1. Parametros de posicion

Son descriptores del conjunto total de los datos. En cierta
forma son las medidas que describen el centro del conjunto
de datos y por eso tambien se llaman parametros de centra o promedios.
lizacion
2.4.2.
La media aritmetica
comun
de tendencia central o localizacion
es
La medida mas
el promedio aritmetico ordinario o media aritmetica. Dado
que casi siempre, los datos con los que se trabaja corresponden a muestras, es por eso que a la media aritmetica tambien
se le conoce como media muestral.
n
Si los datos correspondientes a una muestra de tamano
son

Analisis
de Datos
25
x1 , x2 , , xk , con frecuencias f1 , f2 , , fk , f1 + f2 + +
fk = n, entonces la media muestral se define como
x=
x1 f1 + x2 f2 + + xk fk
f1 + f 2 + + fk
k
1X
xi fi .
i=1
La media muestral x representa el valor promedio de todas

las observaciones en la muestra. Tambien es posible pensar
en calcular el promedio de todas las observaciones de una
poblacion.
Este promedio se conoce como la media poblacional y se acostumbra a representar per la letra griega .
Ejemplo 2.4.1 Determinar un valor aproximado de la media
aritmetica
de un conjunto de datos del que se dispone de la
siguiente informacion:
Li Ls
xi
3037
3744
4451
5158
5865
6572
7279
7986
8693
93100
Total
33.5
40.5
47.5
54.5
61.5
68.5
75.5
82.5
89.5
96.5

3
4
3
3
10
18
18
28
16
1
104
2.885
3.846
2.885
2.885
9.615
17.308
17.308
26.923
15.385
0.962
3
7
10
13
23
41
59
87
103
104
2.885
6.731
9.616
12.501
22.116
39.424
56.732
83.655
99.04
100
Solucion.
La media aritmetica es
x=
x1 f1 + x2 f2 + + xk fk
f1 + f2 + + fk
k
1X
i=1
xi fi =
7614
104
= 73,21
26
J. L. DazBarrero
donde se han tomado las marcas de clase como representantes de todos los elementos contenidos en ellas.
2
La media goza de la siguiente propiedad:
(i) x + y + + z = x + y + + z
(ii) ax = ax.
El valor de la media, a diferencia de otros parametros

de posi no depende del orden en que se hayan escrito los datos.
cion,
Si
x1 , x 2 , , x n
es un conjunto de observaciones, se acostumbra a representar por
x(1) , x(2) , , x(n)
al conjunto de las mismas observaciones ordenadas de menor a mayor.
a su resistencia o sensiSe llama robustez de un parametro

bilidad a los valores extremos, tambien conocidos como datos atpicos o outliers. Son valores correctos, pero que se
caracterizan por una diferencia pronunciada respecto a los
datos. Deben analizarse cuidadosamente para deterdemas
Caso de corresponder
minar si provienen de otra poblacion.
analizada, puede interesar no considerarlos
a la poblacion
para el calculo
de estadsticos muy sensibles a los valores
extremos.
La media aritmetica, como ya se ha dicho, es muy sensible a
los valores extremos. Esta falta de robustez se remedia con la
media recortada que modera el efecto de los datos atpicos
en el calculo
de la media aritmetica suprimiendo los valores
extremos. La media recortada al por ciento es la media de
los datos que quedan despues de suprimir el /2 por cien grandes y el /2 por ciento de los mas
to de los datos mas

Analisis
de Datos
27
pequenos.
La media aritmetica ponderada es equivalente a
la media aritmetica, pero para observaciones ponderadas por
pesos w1 , w2 , , wk . Se define por
k
X
xp =
w i xi
i=1
k
X
.
wi
i=1
2.4.3. La Mediana
La mediana de un conjunto de datos es un valor que divide a la muestra en dos partes iguales cuando estos se ha
llan ordenados. Cuando la muestra consta de un numero
par
de elementos, cualquier numero

entre los dos centrales sa de mediana. En tal caso, sin embargo,
tisface la definicion
es conveniente tomar la media aritmetica de los dos valores
centrales como mediana. Sintetizando, con datos ordenados
la mediana se define como
x( n+1 ) ,
n impar,
2
M eX = x
= x(n/2) + x(n/2+1)
, n par.
2
agrupados en clases, para calcular
Cuando los datos estan
la mediana se utilizan las expresiones:
(a)
n
x
= M eX = Li + c 2
Fi1
fi
donde Li es el lmite inferior de la clase mediana, c es
la amplitud de la clase, n el numero

total de datos, Fi1
la frecuencia absoluta acumulada de la clase anterior a
28
J. L. DazBarrero
la clase mediana y fi la frecuencia absoluta de la clase
mediana
(b)
x
= M eX = Li + c(j/fi )
donde Li es el lmite inferior de la clase mediana, c es
la amplitud de la clase, j es el numero

de observaciones
en esta clase hasta completar un total de n/2 y fi la
frecuencia de la clase mediana.
Observese que las expresiones (a) y (b) dicen lo mismo dado
que n/2 Fi1 = j.
2.4.4.
Los Percentiles
generals que la mediana son los cenOtros parametros

mas
tiles que son los puntos que dividen la serie de datos ordenados en cien partes iguales. En general, el k-esimo centil xk
es un valor tal que, al menos el k % de las observaciones quedan en el valor o por debajo de e l, y al menos el (100 k) %
en el valor o por encima de e l. En el caso de datos agruestan
pados en clases para aproximar su valor se puede utilizar la
formula
nk
Fk1
100
xk = Li + c
fk
Algunos reciben nombres particulares. As x25 = qi = q1 =
peP0,25 es el cuartil inferior (el 25 % de los datos son mas
quenos
o iguales que e l). La mediana x
= x50 = P0,50 . El
centil x75 = qs = q3 = P0,75 es el cuartil superior (el 75 % de
los datos son inferiores o iguales a e l.)

Analisis
de Datos
29
2.4.5. La Moda
que presenta mayor frecuencia en la muesEs la observacion
de una observacion
con
tra. Cuando en la muestra hay mas
se dice bimodal si hay

la maxima
frecuencia la distribucion
modos modas, y en general, multimodal si hay tres o mas
das. En el caso de datos agrupados la moda se puede obtener
aproximadamente a partir de la formula

M oX = Li + c
D1
D 1 + D2
donde Li es el lmite inferior de la clase modal, c es el tamano

de la clase modal, D1 la diferencia entre la frecuencia absoluta de la clase modal y la anterior y D2 la diferencia entre la
frecuencia absoluta de la clase modal y la posterior.
2.4.6.
Parametros de dispersion
dan
Las medidas de variabilidad o parametros
de dispersion
una idea de hasta que punto los datos se dispersan o agrupan en torno a los valores centrales.
2.4.7. Rango de un conjunto de datos

El menor valor observado en la muestra es el mnimo, i.e.,
min{x1 , x2 , , xn } = x(1) .
El mayor valor observado en la muestra es el maximo,
i.e.,
max{x1 , x2 , , xn } = x(n) .
30
J. L. DazBarrero
sencillas de variabilidad es el rango

Una de las medidas mas
que se define como la diferencia entre los valores maximo

y
mnimo, es decir,
R = max{x1 , x2 , , xn } min{x1 , x2 , , xn } = x(n) x(1) .
Este parametro
es muy sensible (poco robusto) a los valores
extremos de la muestra.
2.4.8. Rango intercuartlico

Se define como la diferencia entre el cuartil superior y el inferior, i.e.,
Riq = qs qi = x75 x25 .
Es menos sensible a los valores extremos que el rango del
conjunto de datos.
2.4.9.
Desviaciones respecto a la media
Son las diferencias (errores) entre cada dato y su media aritmetica. Si los datos son
x1 , x 2 , , x n ,
entonces las desviaciones respecto a la media o errores absolutos son x1 x, x2 x, , xn x. Estas diferencias tienen
la propiedad de que su suma es zero.
tpica
2.4.10. La varianza y la desviacion
importantes de variabilidad. Si x1 , x2 , , xn ,
Son las medidas mas
es una muestra de n observaciones, entonces la varianza se

Analisis
de Datos
31
define como la media aritmetica de los cuadrados de las desviaciones respecto a la media. Es decir,
2
s =
n
1X
n
1X
(xk x) =
x2 x2 .
n k=1
n k=1 k
Tambien se puede definir el estadstico varianza muestral corregida por
s2c
n
X
(xk x) =
n 1 k=1
n1
n
X
)
x2k
nx
k=1
muestral estandard, s, es la raz cuadrada

La desviacion
positiva de la varianza, i.e.,
v
u
n
u1 X
(xk x)2 =
s=t
n k=1
v
u
n
u1 X
t
x2k x2 .
n k=1
La varianza goza de la siguiente propiedad

V ar(aX + b) = a2 V ar(X)
tpica verifica
y la desviacion
SaX+b = |a|SX .
El error estandard de la media se define por se = s/ n.

tpica s
Cuando solo se conocen la media x y la desviacion
de un conjunto de datos, la regla emprica de Chebyshev
de la desviecion
tpica proporpermite otra interpretacion
sobre el numero
cionando informacion
de observaciones que
caen en los siguientes intervalos:
(x 2s, x + 2s) contiene al menos el 75 % de los datos.
32
J. L. DazBarrero
media
2.4.11. Desviacion
Es la media aritmetica de los valores absolutos de las desviaciones respecto a la media, es decir,
d=
n
1X
n k=1
|xk x|.
Aunque no se cumple de forma exacta, se puede decir que la

entre d y s, viene dada por d ' 0,8s.
relacion
de Pearson
2.4.12. Coeficiente de variacion
como una fraccion
de
Cuando se quiere expresar la variacion
la media se puede utilizar una medida porcentual de variabi mueslidad relativa, denominada coeficiente de variacion
tral, que se define por
Cv =
s
|x|
100,
x 6= 0
tpica)
e indica la magnitud promedio del error (desviacion
como porcentaje de la media. Es util

para comparar las dispersiones de variables que aparecen en unidades distintas o
que difieren considerablemente en la magnitud de las observaciones.
Si el Cv es menor que 100, indica homogeneidad en los datos;
si es mayor que 150 puede ser indicio de heterogeneidades
debidas a mezclas de poblaciones distintas; esto puede darse

Analisis
de Datos
33
cuando
de forma no evidente en una primera aproximacion
han sido utilizados instrumentos distintos para la medicion

de parte de los objetos, o bien se han realizado las observaciones en momentos distintos o por personas distintas de
forma que estos factores hayan influido en los resultados.
2.4.13. Parametros de simetra

de la posicion
y la dispersion
Otro rasgo interesante, ademas

de los datos es la simetra de las observaciones respecto a
la media. Esta puede detectarse a partir de la representacion
grafica
de las frecuencias (diagramas de barras, histogramas,
polgonos de frecuencia). Indicadores numericos son la rela entre la media, mediana y moda:
cion
Mo x
x indica simetra.
Mo x
x indica simetra negativa (a la izquierda).
Mo x
x indica simetra positiva (a la derecha).
Otro indicador numerico es el coeficiente de asimetra que
se define a partir de las desviaciones respecto a la media x1
x, x2 x, , xn x, por
CasX =
n
X
(xk x)3 .
ns3X k=1
Este coeficiente, que es adimensional, vale cero para distribuciones simetricas alrededor de la media. Es negativo para
distribuciones asimetricas a la izquierda y positivo para distribuciones asimetricas a la derecha.
Si se detecta una asimetra junto con datos atpicos, es con de los
veniente estudiar la viabilidad de una transformacion
datos.
34
J. L. DazBarrero
2.4.14. Parametros de forma

de datos es
Otra caracterstica de interes en una distribucion
su apuntamiento o kurtosis. Considerando las cuartas potencias de las desviaciones respecto a la media se define el
coeficiente de apuntamiento por
CapX =
n
X
ns4X
k=1
(xk x)4 .
Este apuntamiento se suele comparar con una distribucion

generalmente la normal, y la distribucion
se dice leppatron,
apuntada que la normal (Cap
tocuartica cuando esta mas
3), mesocuartica cuando su apuntamiento es similar al de
la normal y platicuartica cuando esta menos apunatada que
la normal (Cap 3).
2.4.15. Momentos muestrales

El momento muestral r-esimo en torno al orgen se define
por
m0r
n
1X
n k=1
xrk .
El momento muestral r-esimo en torno a la media se define por

mr =
n
1X
(xk x)r .
n k=1
Observese que m01 = x y m2 = s2 .

Analisis
de Datos
35
de valores atpi2.4.16. Box-plot y deteccion

cos
El box-plot o diagrama de caja es un procedimiento grafico

que permite describir en forma resumida algunas de las ca importantes de un conjunto de datos. Estas
ractersticas mas
las asimetras y la distribucion
son: el centro, la dispersion,

se basa en medidas
Su construccion
de valores anomalos.
resistentes a la presencia de valores atpicos.
Las fases a seguir para construir un box-plot son:
Calculo
del rango intercuartilico Riq = q3 q1 .
Calculo
de los intervalos [f1 , f3 ] y [F1 , F3 ] con
f1 = q1 1,5Riq
f3 = q3 + 1,5Riq
F1 = q1 3Riq
F3 = q3 + 3Riq .
y
entonces los vaSi la asimetra en los datos es pequena,
lores observados en [F1 , f1 ] o en [f3 , F3 ] se consideran
como anomalias moderadas y los observados antes de
F1 y despues de F3 como anomalias extremas.
Este diagrama que puede servir para filtrar los datos de po
sibles errores, esta formado por una caja o rectangulo
horizontal o vertical, que presenta los tres cuartiles y los valo
res maximo
y mnimo de los datos. La arista izquierda del
rectangulo
corresponde al cuartil q1 y la derecha a q3 . Den
tro del rectangulo
se dibuja una linea que corresponde a la
mediana. Desde cualquier arista se extienden unas lineas o
bigotes que contienen todas las observaciones comprendidas entre cero y 1,5 veces el rango intercuartlico o barreras
interiores. Los valores en que finalizan los bigotes se llaman
adjuntos.
36
J. L. DazBarrero
2.4.17. Transformaciones
A veces a los datos es conveniente aplicarles transformaciones lineales de la forma yi = a + bxi . Se cumple que
y = a + bx y que s2y = b2 s2x . Una de las transformaciones
o estandariza importantes es la tipificacion
lineales mas
de una variable que para una serie de observaciones
cion
x1 , x2 , , xn , se define por
zi =
xi x
s
Se verifica que z = 0 y s2z = 1 y carece de unidades, lo que

directa entre fenomenos
permite una comparacion

de distin es muy asimetrica se sueta ndole. Cuando la distribucion
len aplicar transformaciones no lineales. Como regla general se tiene que si el cociente xmax /xmin es menor que 2, la
no modificara mucho la forma de la distributransformacion
mientras que para un cociente mayor que 10 el efecto
cion,
utilizadas son y = x2 que comprime
sera acusado. Las mas
la escala para valores pequenos

y la expande para valores
grandes. Es util
para asimetras a la izquierda. Para asimetras a la derecha se utilizan las transformaciones y = ln(x)
e y = 1/x que comprimen los valores grandes y expanden los
utilizada es el logaritmo neperiano.

pequenos.
La mas

Analisis
de Datos
2.5.
37
Problemas de Analisis exploratorio de datos
Problema 2.1 Dado el siguiente conjunto de datos

105
97
245
163
207
134
218
199
160
196
221
154
228
131
180
178
157
151
175
201
183
153
174
154
190
76
101
142
149
200
186
174
199
115
193
167
171
163
87
176
121
120
181
160
194
184
165
145
160
150
181
168
158
208
133
135
172
171
237
170
180
167
176
158
156
229
158
148
150
118
143
141
110
133
123
146
169
158
135
149
a. Ordenar los datos.

b. Hacer una tabla de frecuencias agrupando los datos en
nueve clases (utilizar el rango 70250).
c. Representar graficamente
la distribucion
de frecuencias mediante un histograma.

d. Dibujar los correspondientes polgonos de frecuencias (ordinarias y acumuladas)
Problema 2.2 Para asistir a una feria de la construccion
hay
dos tipos de entradas: empresas 25 euros y particulares 4 euros. Sabiendo que el precio medio resulto 18 euros. Que proporcion
de empresas asisitio a la feria?
Solucion.
Sean p1 y p2 las propociones respectivas de empresas y particulares que asisten a la feria y x1 y x2 los precios
38
J. L. DazBarrero
de las entradas. Entonces, x = x1 p1 + x2 p2 con p1 + p2 = 1.

Sustituyendo los datos del enunciado, resulta
)
25p1 + 4p2 = 18
.
p1 + p2 = 1
Resolviendo el sistema anterior se obtiene p1 = 2/3 y p2 =
1/3.
2
Problema 2.3 Durante los 6 ultimos
a
nos el precio del litro de
gasoil (en pts.) ha sufrido las siguientes variaciones:

55, 62, 72, 90, 120, 115.
Un peque
no transportista ha tanido 2 camiones los dos primeros a
nos, 3 durante el tercero y 4 los tres ultimos.
Hallar
el precio medio pagado por el transportista por cada litro de

gasoil consumido durante los 6 a
nos.
Solucion.
Cuando todos los valores que intervienen en la variable X no tienen la misma trascendencia, para obtener la
media aritmetica es preciso tener en cuenta la importancia
de cada dato, esto es ponderarlos.
se efectua
asignando a cada valor un coeEsta ponderacion
ficiente de importancia o peso. As si x1 , x2 , , xn son los
valores que toma X con frecuencias f1 , f2 , , fn y pesos
w1 , w2 , , wn , la media aritmetica
ponderada se calcula por
n
X
x=
xk fk w k
k=1
n
X
fk w k
k=1
En el caso que nos ocupa X = {55, 62, 72, 90, 120, 115} con
1750
pesos {2, 2, 3, 4, 4, 4} con lo que x =
= 92,10 pts.
2
19

Analisis
de Datos
39
Problema 2.4 En un area

de servicio de una autopista se de
sarrollo un proceso para atender a los clientes durante la hora
punta del almuerzo. Se registro el tiempo de espera de todos
los clientes que fueron atendidos durante una semana. Se selecciono una muestra aleatoria de 16 clientes y los resultados
fueron:
4,21, 5,55, 3,02, 5,13, 4,77, 2,34, 3,54, 4,15
3,20, 4,50, 6,10, 0,38, 5,12, 6,46, 6,19, 3,79
Obtener los siguientes estadsticos muestrales:
(1) media aritmetica,
(2) mediana, (3) primer cuartil, (4) tercer
cuartil, (5) segundo decil, (6) percentil x84 , (7) el rango, (8) el
rango intercartlico, (9) la varianza, (10) la desviacion
estandar,
(11) la desviacion
media, (12) el coeficiente de variacion
de
Pearson.
Problema 2.5 Comprobar que la varianza puede escribirse en
la forma
s =
n
1X
n k=1
x2k x2 .
Cuando
sera cero? Y negativa?
Problema 2.6 Dos variables constan de dos datos cada una.

La media de estas
es la misma, y tambien
lo son sus desviaciones tpicas. Son necesariamente iguales los dos conjuntos
de datos? Y si las variables tuviesen 3 datos cada una?
Solucion.
La respuesta a la primera pregunta es afirmativa.
En efecto, sean X = {x1 , x2 } e Y = {y1 , y2 } los dos conjuntos de adtos. Entonces, si x = y resulta
x1 + x2
2
y1 + y2
2
x1 + x2 = y1 + y2 .
(2.1)
40
J. L. DazBarrero
x1 x2
x1 x2
Observese que x1 x =
, x2 x =
, e igual2
2
y1 y2
y1 y2
mente y1 y =
, y2 y =
.
2
2
Entonces,
Sx2 =
Sy2 =
(x1 x)2 + (x2 x)2

2
(y1 y)2 + (y2 y)2
2
=
=
(x1 x2 )2
4
(y1 y2 )2
4
Si Sx2 = Sy2 , entonces

(x1 x2 )2 = (y1 y2 )2
(2.2)
De (2.1) y (2.2) resulta x1 = y1 y x2 = y2 or x2 = y1 y x1 = y2

como se haba anunciado.
La respuesta a la segunda pregunta es no. En efecto, basta
con encontrar un contraejemplo. Sean X = {3, 2, 1} e Y =
{1, 2, 3} ambos tienen media 0 e igual varianza, pero son
distintos.
2
Problema 2.7 En la determinacion
del Zn con complexometrica
tenido en una muestra de un determinado material se obtuvieron los siguientes resultados ( %): 10,02, 10,04, 9,98, 10,48. En
base a estos resultados, que dato se podra tomar como opti
mo? Porque?
Solucion.
La media aritmetica de las observaciones es x =
10,125. Las correspondientes desviaciones medias son
|x1 x| = 0,105, |x2 x| = 0,085,
|x3 x| = 0,170, |x4 x| = 0,335.
Parece razonable tomar x2 como valor optimo

por ser el que
se acerca a la media aritmetica de los resultados.
mas
2

Analisis
de Datos
41
Problema 2.8 Los siguientes datos corresponden a la resistencia a la tension

(kgf /cm2 )de un mortero portland:
17,50 17,63 18,25 18,00 17,86
17,75 18,22 17,90 17,96 18,15
Un ingeniero agrega un polmero de latex
al mortero para deter
minar sus efectos sobre la resistencia a la tension.
Los datos
obtenidos con este experimento fueron:
16,85 16,40 17,21 16,35 16,52
17,04 16,96 17,15 16,59 16,57
a. Ordenar los datos de ambos conjuntos y representarlos gra
ficamente de forma que sea facil
percibir su tendencia
central as como su variabilidad. Que se puede concluir?

b. Hallar la media y la desviacion
tpica de cada conjunto de
datos y comparar los resultados con los del apartado anterior.
Problema 2.9 Cinco determinaciones de Fe en un mineral por
volumetra dieron como resultado:
67,48, 67,37, 67,43, 67,40, 67,47.
Calcular los estadsticos que se consideren apropiados para
detectar si hay algun
Suponiendo que el proce valor anomalo.
dimiento se acepta como valido

siempre que la dispersion
de
los datos no supere el 0,08 %, podra decirse que los resultados obtenidos en la volumetra anterior han sido satisfactorios?
Solucion.
Calculando los estadsticos: media, mediana, va
tpica y coeficiente de variacion
se obtiene
rianza, desviacion
x = 67,43 M = 67,43 s2 = 0,0017 s = 0,0415 CV = 0,06 %
42
J. L. DazBarrero
es inferior al 0,08 % se
Dado que el coeficiente de variacion
puede concluir que los resultados obtenidos son satisfactorios.
2
Problema 2.10 Sobre un conjunto de datos X se dispone de

la siguiente informacion
Clases
58.561.5
61.564.5
64.567.5
67.570.5
70.573.5
73.576.5
76.579.5
79.582.5
82.585.5
85.588.5
Punto medio Frecuencia

60
63
66
69
72
75
78
81
84
87
4
8
12
13
21
15
12
9
4
2
Calcular el numero
de datos. Hallar la media, la mediana, la
moda y los cuartiles. La varianza, desviacion

tpica y coeficiente de variacion
de Pearson. Los coeficientes de asimetra y
kurtosis.
Problema 2.11 El Departamento de Recursos Naturales inicio un programa de seguimiento de la precipitacion

con
acida
el fin de desarrollar controles apropiados de polucion

del aire
para reducir el problema de la lluvia acida.
Se midio la aci
dez de las primeras 50 lluvias registradas, en escala pH, ob-

Analisis
de Datos
43
teniendose
los siguientes resultados:
3,58
4,27
4,45
4,58
4,70
3,80
4,28
4,50
4,60
4,72
4,01
4,30
4,50
4,61
4,78
4,01
4,32
4,50
4,61
4,78
4,05
4,33
4,50
4,62
4,80
4,05
4,35
4,51
4,62
5,07
4,12
4,35
4,52
4,65
5,20
4,18
4,41
4,52
4,70
5,26
4,20
4,42
4,52
4,70
5,41
4,21
4,45
4,57
4,70
5,48
Analizar estos datos (tabulacion

de es de frecuencias, calculo
tadsticos, representacion
y deteccion
grafica
de valores anoma
los)
(Observese
que todas las lluvias son mas
que la lluvia
acidas
normal, cuyo pH es 5,6).

Problema 2.12 Para estudiar la presencia de plomo en la atmosfe
ra (gr/m3 ) se han realizado 64 mediciones en una autopista
y se han obtenido los siguientes resultados:
6,7
5,3
5,0
8,6
8,1
8,4
6,8
10,1
5,4
5,9
6,0
6,2
2,1
8,3
8,6
8,0
5,2 6,0 8,7 6,0 6,4 8,3

7,6 5,0 6,9 6,8 4,9 6,3
7,2 8,0 8,1 7,2 10,9 9,2
6,1 6,5 7,8 6,2 8,5 6,4
6,1 6,5 7,9 15,1 9,5 10,6
5,9 6,0 6,4 3,9 9,9 7,6
8,5 11,2 7,0 7,1 6,0 9,0
6,8 7,3 9,7 9,3 3,2 6,4
Hacer un analisis
exploratorio de estos datos: escribir una ta
bla de frecuencias, calcular los estadsticos que se consideren
apropiados, dibujar el histograma y los polgonos de frecuencias ordinarias y acumuladas. Detectar los valores anomalos,
si los hay, haciendo el correspondiente boxplot.

Problema 2.13 En las grandes ciudades la calidad del aire
se controla periodicamente.
El estado de alarma L se presen
ta cuando el ndice de contaminacion
se halla entre 275 y 350.
44
J. L. DazBarrero
El estado de alarma G se presenta cuando el ndice de contaminacion

supera el valor 350. Suponiendo que el ndice de
contaminacion
se distribuye con media 125 y desviacion
tpica
75 y sin conocer nada mas
acerca de la distribucion,
que podemos decir sobre la proporcion
de das que se declarara la
alerta L?, y la alerta G?
Captulo 3
Analis exploratorio de
datos bivariantes
3.1.
Variables bidimensionales
Se llama variable estadstica bidimensional al conjunto de

conjunta
parejas de valores que resultan de la observacion
Una
de dos caractersticas medibles X e Y de una poblacion.
muestra compuesta por n pares de datos toma la forma
Mx,y = {(x1 , y1 ), (x2 , y2 ), , (xn , yn )}.
De forma analoga
a como se hizo en el caso de datos univariantes se define la frecuencia absoluta del par (xi , yj ) como
el numero
de apariciones de (xi , yj ) en la muestra Mx,y . La
de apariciofrecuencia relativa de (xi , yj ) es la proporcion
nes de (xi , yj ) respecto al numero

total de observaciones. Se
representan, respectivamente, por fa (xi , yj ) y fr (xi , yj ).
Si x1 , x2 , , xh son los h valores distintos de la caracterstica X e y1 , y2 , , yk son los k valores distintos de Y, se llama
conjunta de frecuencias absolutas a la tabla
distribucion
de doble entrada que contiene las frecuencias absolutas de
45
46
J. L. DazBarrero
los pares (xi , yj ). En ella, se escriben los elementos de una
variable en fila los de la otra en columna y, en la interseccion

de cada fila y cada columna, se escriben las frecuencias de la
pareja de valores correspondiente.
X\Y
x1
x2
..
.
y1
f11
f21
..
.
y2
f12
f22
..
.
...
...
...
..
.
yk
f1k
f2k
..
.
xh
fh1
fh2
...
fhk
Si se anade
a la tabla de doble entrada de una distribucion
bivariante una fila y una columna con los totales respectivos
se obtienen dos distribuciones unidimensionales: la formada
por la primera y ultima

columna por un lado y la formada por
la primera y la ultima
fila por otro. Estas reciben el nombre
de distribuciones marginales de la X y la Y respectivamente.
X\Y
x1
x2
..
.
y1
f11
f21
..
.
y2
f12
f22
..
.
...
...
...
..
.
yk
f1k
f2k
..
.
xh
fh1
P
fi1
fh2
P
fi2
...
...
fhk
P
fik
P
P f1j
f2j
..
P.
fhj
N
Las distribuciones marginales son las distribuciones de cada

una de les variables consideradas por separado, sin tener en
cuenta los valores de la otra.
Procediendo de forma analoga

se obtienen las distribuciones
conjunta y marginales de frecuencias relativas.

Analisis
de Datos
3.2.
47
Ajuste mnimo-cuadratico
Si se dispone de n parejas de datos se pueden representar
graficamente
en un sistema de ejes X-Y. A esta representa cartesiana de las parejas de valores que corresponden
cion
a una variable bidimensional se le denomina diagrama de
scattergram o nube de puntos. La observacion
dispersion,
proporciona una idea intuitiva de
de la nube de puntos solo
o dependencia entre las variables. A conla posible relacion
se presenta un procedimiento para hallar esta retinuacion
cuando sea lineal, i.e. cuando los puntos que resultan
lacion
estan aproximadamente situados alrededor de una recta. Si
se supone que los datos, en general de naturaleza diferente,
son
X : x1 x2 . . .
Y : y1 y2 . . .
xn
yn
Se llama variable control o variable independiente a la variable X y variable dependiente o variable respuesta a Y .
La variable control toma sus valores libremente, y posible de los experimenmente en una etapa previa a la realizacion
tos que conduciran a obtener los valores de la variable respuesta.
Un procedimiento de ajuste es el metodo de los mnimos
cuadrados (Legendre, pricipios del siglo XIX) y proporciona
los parametros
= a y = b de la recta y = + x para la
que (a, b) es un mnimo de la funcion

L(, ) =
n h
X
i2
yi xi .
i=1
Siguiendo el procedimiento habitual para minimizar la fun L(, ) resultan las ecuaciones normales
cion
48
J. L. DazBarrero
= 0,
=0
que tienen por solucion
=b=
Sxy
= a = y bx
2
SX
donde
Sxy =
n
1X
(xi x)(yi y)
i=1
es la covarianza muestral de X e Y y
Sx2
n
1X
(xi x)2
n i=1
es la varianza de X. La diferencia yi (a + bxi ) = ei se llama
residuo del modelo en xi . El numero

S2 =
1
n2
n
X
e2i
i=1
es un estimador de la varinza residual y sirve para dar una

idea de la magnitud de los residuos.
Supongamos que conocemos la recta de ajuste que liga dos
variables X e Y y que tiene por ecuacion

y = a + bx = y + b(x x)
Ahora cabe preguntarse como se puede relacionar el valor yi
con el valor predicho por el model yi ? La respuesta es que
y = y + b(xi x).

Analisis
de Datos
49
En particular,
yi ' yi = y + b(xi x),
i = 1, 2, , n.
De aqu resulta
yi y ' b(xi x),
i = 1, 2, , n,
o bien
yi y = b(xi x) + ei ,
i = 1, 2, , n
(3.1)
de y respecto a y es debida en
Esto significa que la variacion
de linealidad entre X e Y y en parte no.
parte a la relacion
total de yi y es igual
La diferencia yi y se llama variacion
explicada por el modelo b(xi x)
a la suma de la variacion
no explicada o residual ei ..
la variacion
mas
Como puede verse cuanto menor sea |i |, i.e., cuanto mayor
debida a la relacion
lineal mejor
sea la parte de la variacion
sera el ajuste. Ahora conviene tener en cuenta todos los datos
y definir:
Variabilidad total V T =
n
X
(yi y)2
i=1
Variabilidad explicada V E =
n
X
b2 (xi x)2
i=1
Variabilidad no explicada o residual V N E =
n
X
i=1
e2i .
50
J. L. DazBarrero
Puede demostrarse que

n
X
e2i
i=1
n
X
(yi y)
n
X
b2 (xi x)2 .
i=1
i=1
Dado que
VT=VE+VNE
resulta
n
X
(yi y) = b
i=1
n
X
(xi x) +
i=1
n
X
e2i
(3.2)
i=1
Ahora, a partir de (3.2) se puede escribir

2
nSY2 = nb2 SX
+ (n 2)Se2
como el porcentaje
y definir el coeficiente de determinacion
de variabilidad explicado por el modelo, i.e.,
2
r =
VE
VT
2
b2 SX
SY2
2
Sxy
Sx2 Sy2
muestral de Pearson por

y el coeficiente de correlacion
r=
Sxy
Sx Sy
(determinacion)
El coeficiente de correlacion
sirve para dar
una medida de la dependencia funcional (lineal) entre las variables X e Y. El criterio que se acostumbra a utilizar es el
siguiente:
Si |r| < 0,5, entonces la dependencia se considera debil.

Analisis
de Datos
51
Si 0,5 |r| < 0,8, entonces la dependencia se considera

moderada.
Si 0,8 |r| < 1, entonces la dependencia se considera
fuerte.
Tambien se utiliza la siguiente nomenclatura: si |r| = 1 se dice que hay dependencia funcional lineal entre las variables;
si 1 < r < 0 se habla de dependencia aleatoria con corre negativa o inversa; si 0 < r < 1, la dependencia es
lacion
positiva o directa y finalmente, si
aleatoria con correlacion
r = 0 se dice que las variables X e Y son incorrelacionadas
necesaria).
(condicion
Otras expresiones de la recta de ajuste son:
Y sobre X : y y =
X sobre Y : x x =
Sxy
Sx2
Sxy
Sy2
(x x).
(y y).
Observese que la recta de ajuste siempre pasa por (x, y) el

centro de gravedad de los datos. (Reflexionar sobre los valores
atpicos).
3.3.
Problemas de Analisis Exploratorio de Datos Bivariantes
Problema 3.1 En una muestra de 20 empresas del sector de

la construccion
se obtuvieron los siguientes datos sobre el nume
ro de empleados X y sus ingresos anuales Y (104 euros)
52
J. L. DazBarrero
X/Y
50-100
10-30
6
30-50
1
50-100
0
100-250 250-1000
2
0
1
0
0
10
a) Calcular la media de los ingresos anuales y del numero

em
pleados. Obtener tambien
su varianza.
b) Calcular los coeficientes de variacion
e interpretar los resultados obtenidos.
c) Obtener, aplicando el metodo
de los mnimos cuadrados,
una recta que ajuste los datos y permita predecir los ingresos medios anuales en funcion
de emplea del numero
dos.
Problema 3.2 En un estudio sobre la relacion
existente entre
el tiempo que tarda un obrero de una autopista en realizar
una tarea en la ma
nana (X) y al final de la tarde (Y ), se han
obtenido los siguientes datos:
10
X
xk = 86,7,
k=1
10
X
x2k
= 771,35,
k=1
10
X
yk2
= 819,34,
k=1
10
X
yk = 88,8,
k=1
10
X
xk yk = 792,92.
k=1
Calcular el coeficiente de correlacion

e interpretar el resultado.
Problema 3.3 Los datos siguientes corresponden a dos variables X e Y :
X
Y
1.5
23.0
1.5
24.5
2.0
25.0
2.5
30.0
2.5
33.5
3.0
40.0
3.5
40.5
3.5
47.0
4.0
49.0

Analisis
de Datos
53
a) Dibujar la nube de puntos. b) Sugiere este diagrama una

asociacion
lineal? Calcular el coeficiente de correlacion
muestral y determinar la ecuacion
de la recta de ajuste mnimo cuadratico.
Problema 3.4 La materia prima que se usa en la produccion
de un determinado material se almacena en un lugar que no

tiene control de humedad. Las medidas de la humedad relativa y del contenido de humedad de muestras de la materia
prima (en %) en 12 das fueron:
Humedad relativa
Contenido de humedad
45
54
37
41
35
29
61
45
43
49
34
40
11
15
11
13
11
7
18
14
11
16
11
13
Calcular el coeficiente de correlacion

muestral. Ajustar los datos a una recta utilizando el metodo
de los mnimos cuadrados.
Utilizar los resultados anteriores para prdedecir el contenido

de humedad cuando la humedad relativa es del 35 %.
Problema 3.5 En el analisis
de unos materiales se han medi
do tres caractersticas: X(ndice de concentracion
de carbono),
Y (ndice de resistencia a la traccion)
y Z(ndice de resistencia
a la torsion):
54
J. L. DazBarrero
X
Y
Z
0.2
3.4
25.6
0.5
6.5
29.5
0.7
11.0
29.0
1.2
13.5
31.2
2.3
22.0
31.5
2.4
25.8
33.2
2.9
33.5
33.4
3.0
34.6
32.6
a) Utilizar el metodo
de los mnimos cuadrados para obtener
las rectas de ajuste de Y sobre X y de Y sobre Z.

b) Calcular los coeficientes de correlacion
rxy , rxz y ryz .
Problema 3.6 Se quiere estudiar que tipo de relacion
existe
entre la temperatura X en una zona monta
nosa y el consumo de energa electrica
Y . Durante 18 das se anotaron las
temperaturas y el consumo de energa de una vivienda y se

obtuvieron los siguientes resultados:
X
Y
X
Y
X
Y
-1.0
94
4.0
74
7.0
65
1.5
81
5.0
67
3.0
73
3.5 -3.0
79
97
-5.0 -0.5
107 86
-2.0 6.0
91
65
0.5
88
9.0
58
8.0
58
2.5
75
9.5
55
10.0
52
a) Calcular los estadsticos que se consideren oportunos y comentar la relacion

existente entre la temperatura y el consumo de energa.
b) Aplicar el metodo
de los mnimos cuadrados para ajustar
los datos a una recta.

c) Estimar el consumo medio de energa de una vivienda cuando la temperatura sea de 0 C.
Problema 3.7 Se considera el conjunto de datos asosciados
en parejas Mx,y = {(xi , yi ) : i = 1, 2, , n}. Probar que la

Analisis
de Datos
55
covarianza muestral Sxy tambien

se escribe en la forma
Sxy =
n
1X
n k=1
xk yk x y.
Definimos SSxx = nSx2 y SSxy = nSxy . Probar que

n h
X
i2
yk (a + bxk ) = SSyy bSSxy .
k=0
Problema 3.8 Los siguientes datos corresponden al cloro residual en el deposito

de aguas de una ciudad en diversos tiem
pos despues
de haberse tratado el agua con productos qumicos para mantenerla apta para el consumo:
t (horas) 2
Cl (ppm) 1.8
4
1.5
6
1.4
8
1.1
10
1.1
12
0.9
a. Calcular el coeficiente de correlacion

muestral y comentar
el resultado.
b. Obtener una recta de mnimos cuadrados con la que se pueda predecir el cloro residual en terminos
del tiempo trans
currido desde que se trato el agua.
c. Utilizar la recta de mnimos cuadrados para estimar el cloro
residual en el deposito
7 horas despues
de haber sido
tratado.
56
J. L. DazBarrero
Captulo 4
Conceptos Basicos de
Probabilidad
4.1.
Introduccion
Un experimento que puede ser repetido tantas veces como

se quiera, siempre en las mismas condiciones controlables,
y cuyo resultado es impredecible, se llama un experimento
aleatorio; en caso contrario, el experimento se llama determinista. As, por ejemplo, el lanzamiento de un dado, la hora
de llegada de un tren a una estacion,

un sorteo de lotera,
pueden ser considerados como experimentos aleatorios.
Cada experimento aleatorio lleva asociado el conjunto E de
todos los resultados posibles. Dicho conjunto se llama espacio muestral, sus elementos se llaman sucesos elementales
y sus subconjuntos sucesos. El conjunto de los sucesos sera,

pues, P (E). Dado un suceso A vamos a definir una medida
teorica
de la ocurrencia de A. A esta medida la llamaremos
probabilidad.
57
58
J. L. DazBarrero
Si el espacio muestral E se halla compuesto por n sucesos

elementales, incompatibles dos a dos (disjuntos), y tales que:
(i) E=
n
[
{ak },
k=1
(ii) fr ({a1 }) = fr ({a2 }) = = fr ({an }).

Entonces, a partir de que fr (E) =
n
X
fr ({ak }) = 1, resulta
k=1
si A = {a1 , a2 , , ah },
fr ({ak }) = 1/n, k = 1, 2 , n. Ademas,
entonces fr (A) = fr ({a1 })+fr ({a2 })+ +fr ({ah }) = h/n.
clasica de probabilidad o re
Llegandose
as a la definicion
gla de Laplace (1812) que enuncia:
La probabilidad de un suceso A es el cociente entre el numero
de casos favorables dividido por el numero

de casos posibles,
considerados como equiprobales, Es decir,

p[A] =
Nf (A)
Np
N (A)
N (E)
anterior equivale a entender la probabilidad de

La definicion
un suceso o subconjunto de resultados elementales como la
frecuencia relativa de ese subconjunto en una muestra ex
haustiva. Los principales inconvenientes de esta definicion
son que no siempre es posible el muestreo exhaustivo y que
no siempre los resultados son equiprobables.
Otra forma de entender la probabilidad consiste en suponer
que el experimento se puede repetir indefinidamente de forma que un resultado no influya en los siguientes. As surge
frecuentista de probabilidad, formalizada por
la definicion
Von Misses en 1919 y que se enuncia
p[A] = lm fr (A).
n

Analisis
de Datos
59
Aqu hay que suponer que existe el lmite de las frecuencias relativas, i.e., existe el lmite y es el mismo para cual de experimentos. En otras palabras, las
quier subsucesion
frecuencias relativas de un suceso se estabillizan alrededor
de un valor fijo (su probabilidad) a medida que el numero

de
pruebas aumenta.
Las dificultades aparecidas en las definiciones anteriores se
axiomatica de Kolmogorov (1943).
solucionan con la definicion
4.2.
axiomatica de probabiDefinicion
lidad
Sea E el espacio muestral asociado a un experimento alea de subconjuntos de E. Se dice que

torio y A una coleccion
A es un a lgebra de Boole cuando se verifican las siguientes
codiciones:
1. El espacio muestral E pertenece a A.
2. Si un suceso A A, A E entonces A A. Como
consecuencia el conjunto = E pertenece a A.
3. Si A1 , A2 , An son elementos de A su union
n
[
Ak ,
k=1
pertenece a A y, por las leyes de Morgan, tambien su

n
\
interseccion,
Ak .
k=1
numerable
A es una algebra cuando para cada sucesion
A1 , A 2 , , An , ,
60
J. L. DazBarrero
de sucesos de E, su union
Ak y su interseccion
k=1
Ak
k=1
pertenecen a A. La algebra se acostumbra a representar

por S, y recoge todos los posibles sucesos de un experimento
aleatorio. Al par (E, S) se le llama espacio probabilizable o
medible.
expondremos la definicion
axiomatica
A continuacion
de Kolmogorov que consta de tres axiomas:
Axioma 1. Si A es un elemento de una algebra,

S, exis
te un numero
p[A] 0, denominado probabilidad del
suceso A.
Axioma 2. p[E] = 1.
finita de suscesos, disjuntos
Axioma 3.1 Dada T
una sucesion
dos a dos, Ai Aj = , se verifica que
p
n
h[
k=1
n
i
X
p[Ak ].
Ak =
k=1
numerable de suscesos, disAxioma 3.2 Dada una sucesi

T on
juntos dos a dos, Ai Aj = , se verifica que
h[
i
X
p
Ak =
p[Ak ].
k=1
k=1
La terna (E, S, p) se conoce como espacio de probabilidad.

Consecuencia de los axiomas de probabilidad son los siguientes
teoremas.
Teorema 4.1 La probabilidad del suceso imposible es cero,
i.e., p[] = 0.

Analisis
de Datos
61
numerable de sucesos
Demostracion.
Considerese la sucesion
el
disjuntos A1 , A2 , , An , , todos ellos igual al . Segun
tercer axioma de Kolmogorov
h[
i
X
p
Ak =
p[Ak ].
k=1
En nuestro caso,
Ak =
k=1
k=1
= . Por tanto,
k=1
p[] =
k=1
p[], es decir, la suma infinita de una cantidad constante de ocurre cuando p[] = 0. 2
be ser esa cantidad, lo cual solo
Teorema 4.2 La probabilidad de la union
de n sucesos disjuntos A1 , A2 , , An es igual a la suma de las probabilidades de cada uno de los sucesos Ai , i.e.,
n
n
i
h[
X
p[Ak ].
p
Ak =
k=1
k=1
numerable de suceDemostracion.
Considesere la suncesion
sos disjuntos A1 , A2 , , An , An+1 , An+2 , , siendo los su el tercer axioma de Kolmogorov
cesos An+k = , k 1. Segun
h[
i
X
p
Ak =
p[Ak ].
k=1
k=1
El primer miembro de la igualdad anterior se puede escribir

en la forma
n
h[
i
h[
i
h [
i
h[
i
p
Ak = p
Ak + p
Ak = p
Ak .
k=1
k=1
k=n+1
k=1
Por otra parte, el segundo miembro toma la forma
X
k=1
p[Ak ] =
n
X
k=1
p[Ak ] +
X
k=n+1
p[Ak ] =
n
X
k=1
p[Ak ].
62
J. L. DazBarrero
Identificando, resulta
n
n
h[
i
X
p
Ak =
p[Ak ].
k=1
k=1
2
Teorema 4.3 La probabilidad de la union
de dos sucesos cualesquiera viene dada por
[
\
p[A1
A2 ] = p[A1 ] + p[A2 ] p[A1
A2 ].
Teorema 4.4 Si A1 A2 , entonces p[A1 ] p[A2 ].
Teorema 4.5 Si A S, entonces se verifica que p[A] 1.
Teorema 4.6 La probabilidad del suceso contrario A, es el
complemento a uno de la probabilidad de A, i.e., p[A] = 1
p[A].
4.3.
Tecnicas de conteo. Combinatoria
4.3.1. Variaciones con repeticion

Dado un conjunto A = {a1 , a2 , , an } de n elementos, se
con repeticion
de los n elementos y de orllama variacion
de k elementos iguales o distintos,
den k a toda agrupacion
elegidos de entre los n de partida, de forma que dos agrupa elemento, o si tenienciones son distintas si difieren en algun
do los mismos e stos se hallan escritos en diferente orden.
Para hallar su numero

observemos que el primer lugar de la
puede estar ocupado por cualquiera de los n elevariacion
mentos de A; el segundo, como pueden repetirse pude ser

Analisis
de Datos
63
ocupado por por cualquiera de los n elementos de A, y as sucesivamente hasta el k-esimo que tambien puede ser ocupa
do por cualquier elemento de A. En consecuencia, el numero
de n elementos tomados de k
de variaciones con repeticion
en k es
VRkn = n n n = nk .
Nota 4.1 Observese
que cada variacion
con repeticion
de orden k es un elemento del producto cartesiano
Ak = {(a1 , a2 , , ak ) | ai A}.
Nota 4.2 Las variaciones con repeticion
de n elementos de orden k son tambien
de todas las aplicaciones que
las imagenes
se pueden establecer entre un conjunto de cardinal k y el A de

cardinal n.
4.3.2.
Variaciones ordinarias
Dado un conjunto A = {a1 , a2 , , an } de n elementos, se

ordinaria de los n elementos de A tomados
llama variacion
de k elementos distintos, elede k en k, a toda agrupacion
gidos de entre los n de partida de forma que dos de tales
elemento o
agrupaciones son distintas si difieren en algun
cuando teniendo los mismos e stos se hallan escritos en dife
rente orden. (Al ser distintos los elementos de cada variacion,
necesariamente ha de ser k menor o igual que n).

observemos que el primer lugar de la
puede ser ocupado por cualquiera de los n elemenvariacion
tos de A; hecha esta eleccion,

el segundo lugar puede ser
ocupado por cualquiera de los n 1 elementos restantes; el
no han sido eletercero, por cualquiera de los n 2 que aun
gidos; y as hasta el k-esimo lugar que podra ser ocupado por
64
J. L. DazBarrero
cualquiera de los n k + 1 elementos restantes. En conse

cuencia, el numero
de variaciones ordinarias de n elementos
y de orden k es
Vnk = n(n 1)(n 2) (n k + 1) = n(k) =
n!
(n k)!
Nota 4.3 Las variaciones ordinarias son las imagenes

de to
das las aplicaciones inyectivas que pueden establecerse entre
un conjunto de cardinal k, (k n) y otro de cardinal n.
4.3.3.
Permutaciones ordinarias
La variaciones ordinarias de n elementos tomados de n en

n se llaman permutaciones ordinarias de n elementos. Son
secuencias en las que intervienen los n elementos de partida
diferenciandose unas de otras en el orden en que se hallan
escritos sus elementos. Su numero

es
Pn = Vnn = n!.
Nota 4.4 Las permutaciones ordinarias de los elementos de
A = {a1 , a2 , , an } son las imagenes
de las aplicaciones bi
yectivas que pueden establecerse entre el conjunto {1, 2, , n}
y A.
4.3.4. Permutaciones con repeticion

Dado el conjunto A = {a, b, , l} de cardinal n, se lla con repeticion
de longitud m de los elema permutacion
t1 , t2 , , tn , con
mentos de A, y de ordenes
de repeticion
t1 + t2 + + tn = m; a cada una de las secuencias de m
elementos que se pueden formar con t1 iguales a a, t2 iguales

Analisis
de Datos
65
a b, , tn = l, de forma que todas ellas tienen los mismos

elementos pero escritos en orden diferente.

supongamos que una tal permutacion
fuera
t2
tn
t
z }|
{
z }|1 { z }| {
a aab bbl ll.
Si en ella suponemos que todas las a son distintas qudara
t
n
z }|2 {
z }|
{
a1 a2 at1 b b b l l l .
Permutando las a de todas las formas posibles sin cambiar

elementos, se obtendran
t1 ! permutaciones difelos demas
rentes. As si en una secuencia de m elementos hay t1 iguales
y se permutan de todas las formas posibles, se obtienen
Ptm1 =
m!
t1 !
permutaciones diferentes. De forma analoga,

si entre los m
elementos hay t1 iguales a a, t2 iguales a b, , tn iguales a
l, se obtendran
Ptm1 ,t2 , ,tn =
m!
t1 !, t2 !, , tn !
permutaciones.
Nota 4.5 Las permutaciones con repeticion
son las imagenes
de aplicaciones exhaustivas predeterminadas.
4.3.5. Combinaciones ordinarias

Dado el conjunto A = {a1 , a2 , , an } de cardinal n, se lla ordinaria de e stos n elementos y de orden
ma combinacion
66
J. L. DazBarrero
de k elementos elegidos de entre los n

k a toda agrupacion
de partida de forma que dos de ellos son distintos si difieren
elemento sin importar el orden en que se hallan esen algun
critos. Dicho de otra forma, las combinaciones ordinarias de
n elementos tomados de k en k o de orden k son los subconjuntos de cardianl k que se pueden formar con los n de
partida.
Su numero
se representa por Ckn . Para calcularlo, supongamos formadas las combinaciones de orden k con los elementos de A de las que hay en total Ckn . Si en cada una de e stas
combinaciones permutamos sus elementos de todas las for
mas posibles resulta que el numero
de secuencias obtenidas
es igual al de variaciones ordinarias de orden k que se pueden formar con los elementos de A. Por otro lado, como cada
genera k! del total de las variaciones, se tiene
combinacion
que Vnk = Ckn k! de donde
Ckn
Vnk
k!
n!
k!(n k)!

n
k
4.3.6. Combinaciones con repeticion

con
Dado un conjunto de cardinal n, se llama combinacion
de orden k a cada una de las agrupaciones que se
repeticion
pueden formar tomando k de los elementos de partida iguales
o distintos y considerando que dos agrupaciones son distin elemento sin importar el orden
tas cuando difieren en algun
en que e stos se hallen escritos. Su numero

se designa por
k
CRn .
de orden 1 coinciden con
Las combinaciones con repeticion
las ordinarias, las de orden 2 se obtienen a partir de las de
orden 1 escribiendo a la derecha de cada una de ellas su

Analisis
de Datos
67
ultimo
elemento y cada uno de los que le siguen en el orden
natural, obteniendose en total

n+21
2
= C2n+21 .
CRn =
2
A parir de las de orden 2 se obtiene las de orden 3, y as sucesivamente hasta que las de orden k se obtienen a partir de
las de orden k 1 anadiendo

a cada una de ellas su ultimo
elemento y todos los que le siguen en el orden natural. Es
facil
observar que tales combinaciones se pueden poner en
correspondencia biyectiva con las combinaciones ordinarias
de orden k de los elementos del conjunto {1, 2, , n + k 1}
siendo as su numero

n+k1
k
= Ckn+k1 .
CRn =
k
se citan dos formulas
Nota 4.6 A continuacion

que pueden
de problemas.
ser utiles
para la resolucion
Potencia del binomio (Formula

de Tartaglia)
n
(a + b) =
n
X
n
k=0
ak bnk .
Potencia de un polinomio (Formula

de Liebnitz)

X
m
m
(a1 +a2 + +an ) =
at11 at22 atnn
t
,
t
,
,
t
1 2
n
t1 +t2 ++tn =m
m!
t1 +t2 ++tn =m
t1 !t2 ! tn !
at11 at22 atnn .
68
4.4.
J. L. DazBarrero
Probabilidad condicional
Tiene interes cuando se quieren calcular probabilidades de

sucesos, sabiendo que o dado que ha ocurrido algo previamente. Dado el espacio de probabilidad (E, S, p) y un suceso
A S con p[A] > 0. Se define la probabilidad condicionada del suceso B por A, y se representa por p[B|A], como el
cociente
p[B A]
.
p[B|A] =
p[A]
Analogamente,
si p[B] > 0 se define
p[A|B] =
p[A B]
p[B]
Es inmediato comprobar que

pB [A] = p[A|B]
es una probabilidad.
Observese que la probabilidad condicionada de un suceso es
la probabilidad del mismo cuando el espacio muestral se ha
modificado.
Si A y B son sucesos de probabilidad no nula se tiene que
p[A B] = p[A]p[B|A] = p[B]p[A|B].
de varios sucesos se le
A la probabilidad de la interseccion
anterior se
llama probabilidad compuesta, y a la expresion
le conoce como ley de la probabilidad compuesta para dos
sucesos. En general, para n sucesos se tiene el siguiente resultado.

Analisis
de Datos
69
Teorema 4.7 Sean A1 , A2 , , An , n sucesos cualesquiera

de un experimento aleatorio y tales que la probabilidad de realizacion
de los mismos es no nula, entonces
p[A1 A2 An ] = p[A1 ]p[A2 |A1 ] p(An |A1 A2 An1 ).
procederemos por inducDemostracion.
Para la demostarcion
Para n = 2, 3 el resultado se comprueba facilmente
cion.
por
directa. Supongase
inspeccion
cierto para 2, 3, , n 1 y
veamoslo para n. En efecto,
h
i
p[A1 A2 An ] = p (A1 A2 An1 ) An
= p[A1 A2 An1 ]p[An |A1 A2 An1 ]
= p[A1 ]p[A2 |A1 ]p[A3 |A1 A2 ] p[An |A1 A2 An1 ].
2
4.5.
Sucesos dependientes e independientes
Se dice que dos sucesos A y B son independientes cuando

se verifica que p[B] = p[B|A]. Si por el contrario p[B] 6=
p[B|A] se dice que B depende estocasticamente de A. En
este ultimo
caso puede suceder:
de A desfavo(a) p[B] > p[B|A], en cuyo caso, la aparicion
de B.
rece la realizacion
de A favorece
(b) p[B] < p[B|A], en este caso, la aparicion
de B.
la realizacion
Se verifican las siguientes condiciones:
70
J. L. DazBarrero
(a) A y B son independientes p[A B] = p[A]p[B].

(b) p[B|A] = p[B] p[A|B] = p[A].
(c) Si A y B son independientes tambien lo son A y B.
de
Extenderemos ahora el concepto de independencia a mas
dos sucesos. Dados tres sucesos A, B y C se dice que son es
tocasticamente independientes, si se verifican simultaneamente las siguientes condiciones:
(a) p[A B] = p[A]p[B].
b) p[A C] = p[A]p[C].
(c) p[B C] = p[B][C].
(d) p[A B C] = p[A]p[B]p[C].
pero veremos
Pudiera parecer superflua la cuarta condicion,
su necesidad mediante un contraejemplo.
Ejemplo de Bernstein. Sea E = {1, 2, 3, 4} y consideremos
los sucesos A = {1, 2}, B = {1, 3} y C = {1, 4}. Es evidente
1
que p[A] = p[B] = p[C] = . Por otro lado, como A B =
2
A C = B C = {1}, entonces
p[A B] = p[A C] = p[B C] =
1
4
y
p[A]p[B] = p[A]p[C] = p[B]p[C] =
1
4
En cambio,
p[A B C] = p[{1}] =
6= p[A]p[B]p[C] =
.
4
8
Esto prueba la necesidad de la cuarta condicion.

Dados n sucesos A1 , A2 , , An , se dice que son independientes cuando se verifica

Analisis
de Datos
71
(a) p[Ai Aj ] = p[Ai ]p[Aj ].

(b) p[Ai Aj Ak ] = p[Ai ]p[Aj ]p[Ak ].
(`) P [A1 A2 An ] = p[A1 ]p[A2 ] p[An ].
4.6.
Teorema de las probabilidades totales
Diremos que A1 , A2 , , An es un sistema completo de su cuando se verifica

cesos o una particion
(a) E = A1 A2 An .
(b) Ai Aj = si i 6= j.
Teorema 4.8 (Formula

de las probabilidades totales) Sea
A1 , A2 , , An un sistema completo de suscesos con P [Ai ] >
0, i = 1, 2, , n. Sea B un suceso para el que se conocen las
probabilidades p[B|Ai ]. Entonces,
p[B] =
n
X
p[Ak ]p[B|Ak ].
k=1
Demostracion.
Al ser A1 , A2 , , An un sistema completo de
suscesos se tiene que
n
h
[
i
p[B] = p[B E] = p B
Ak
k=1
n
n
h[
i
X
=p
(B Ak ) =
p[Ak ]p[B|Ak ].
k=1
k=1
72
4.7.
J. L. DazBarrero
Formula
de Bayes
El siguiente resultado, conocido como la Formula

de Bayes,
importantes y fructferos de la teora de la
uno de los mas
probabilidad, se recoge en el siguiente teorema.
Teorema 4.9 Sea A1 , A2 , , An un sistema completo de sucesos con p[Ak ] > 0, y sea B un suceso cualquiera para el que
se conocen las probabilidades p[B|Ak ] que llamaremos verosimilitudes, entonces
p[Ak |B] =
p[Ak ]p[B|Ak ]
n
X
p[Ak ]p[B|Ak ]
k=1
A las probabilidades p[Ak ] se les llama probabilidades a priori y a las p[Ak |B] probabilidades a posteriori.
de probabilidad condicionada
Demostracion.
De la definicion
resulta
p[Ak B] = p[Ak ]p[B|Ak ] = p[B]p[Ak |B].
Por tanto,
p[Ak |B] =
p[Ak ]p[B|Ak ]
,
p[B]
la formula
pero segun
de las probabilidades totales,
p[B] =
n
X
p[Ak ]p[B|Ak ]
k=1
de donde
se deduce que
p[Ak |B] =
p[Ak ]p[B|Ak ]
n
X
p[Ak ]p[B|Ak ]
k=1

Analisis
de Datos
4.8.
73
Problemas de Probabilidad
Problema 4.1 Explicar por que hay un error en cada una de

las siguientes afirmaciones:
a. La probabilidad de que llueva en una zona desertica
es 0,12
y la de que nieve es 0,40.

b. La probabilidad que llueva es 0,6 y la probabilidad que llueva o nieve es 0,45.
c. La probabilidad que en la proxima
epoca
de lluvias las
aguas sobrepasen el umbral de un rio es 0,77, la probabilidad que se alcance el umbral es 0,08, y la probabilidad
que no se alcance el umbral es 0,05.
Solucion.
a. Una probailidad nunca puede ser negativa.

b. No puede ser que p[A] > p[A B].
c. Sean los sucesos A = {las aguas sobrepasan el umbral
} y B = { las aguas alcanzan el umbral }. Entonces,
p[A] = 0,77, p[B] = 0,08 y p[A B] = 0,05. De la ultima

se obtiene p[A B] = 0,95. Lo que implicara
relacion
p[A B] = 0,10 (Absurdo)
2
Problema 4.2 En un plan general para control de riadas, se
desea saber si una canalizacion
construida anteriormente para un arroyo es suficiente para aliviar los posibles caudales
maximos
(siendo el maximo
total de 10 m3 /s). Tras un estudio
74
J. L. DazBarrero
de riadas anteriores, las probabilidades de caudal maximo

en
un cierto a
no se definen como sigue:
A = 3 a 6 m3 /s, p[A] = 0,6;
B = 5 a 10 m3 /s, p[B] = 0,6;
C = A B,
p[C] = 0,7.
Calcular p[A B], p[A], p[B A], p[A B], p[A B], y definir
cada uno de los sucesos cuyas probabilidades se pide calcular.
Problema 4.3 Hallar la probabilidad de un suceso, sabiendo
que la suma de su cuadrado y la del cuadrado de la probabi5
lidad del suceso contrario es igual a .
9
el
Solucion.
Sea p[A] = p, entonces p[A] = 1 p. Segun
2
2
2
enunciado se tiene p + (1 p) = 5/9; 9p 9p + 2 = 0;
p = 1/3, p = 2/3.
2
Problema 4.4 En una reunion
hay mas
hombres que mujeres, mas
mujeres que beben que hombres que fuman, y mas
mujeres que fuman y no beben que hombres que no beben ni

fuman. Se elige una persona al azar y se pregunta: Que es
mas
probale?
a. Es mujer que no bebe ni fuma.
b. Es hombre que bebe y no fuma.
Solucion.
Sea E el conjunto de personas que asisten a la reu Formemos la siguiente particion
(sistema completo de
nion.
suscesos) de E :
8
[
E=
Xk
k=1

Analisis
de Datos
75
siendo
X1 = H B F ,
X2 = H B F ,
X3 = H B F,
X4 = H B F,
X5 = M
X6 = M
X7 = M
X8 = M
B F,
B F,
B F,
B F.
Veremos que el suceso X1 es mujer que no bebe ni fuma es

probable que el suceso X8 es hombre que bebe y no fuma.
mas
Esto es equivalente a comprobar que el cardinal de X1 es
mayor que el cardinal de X8 . Denotaremos el cardinal de Xi
por N (Xi ), i = 1, 2, , 8.
el enunciado se tienen las siguientes desigualdades:
Segun
4
X
N (Xi ) >
8
X
N (Xi ),
x=5
i=1
N (X5 ) + N (X6 ) > N (X3 ) + N (X4 ),

N (X7 ) > N (X2 ).
Sumando miembro a miembro resulta
N (X1 )+N (X2 )+N (X3 )+N (X4 )+N (X5 )+N (X6 )+N (X7 )
> N (X5 )+N (X6 )+N (X7 )+N (X8 )+N (X3 )+N (X4 )+N (X2 ).
Simplificando, se obtiene
N (X1 ) > N (X8 ).
Esto completa la demostracion.
Problema 4.5 En una encuesta sobre la liberalizacion

de los
peajes en las autopistas se han consultado 1000 personas,
obteniendose
los siguientes resultados:
76
sexo
hombre mujer
a favor
198
243
en contra
125
126
depende
147
161
J. L. DazBarrero
menor de 25
200
50
100
edad
25-50 myor de 50
180
61
111
90
159
49
Se escoge al azar una de las personas consultadas y se desea

saber:
1. Probabilidad de que este a favor de la liberalizacion.
2. Probabilidad que tenga menos de 25 a

nos.
3. Si esta a favor de la liberalizacion,
cual
es la probabilidad
de que sea mujer?
Se escogen dos personas al azar entre las encuestadas. Se
pide:
1. Probabilidad que sean de distinto sexo.
2. Probabilidad que ambas tengan menos de 50 a
nos.
3. Si las dos estan
a favor de la liberalizacion,
cual
es la
probabilidad de que sean dos mujeres?
Problema 4.6 En una ciudad costera se inauguraron el a

no
pasado un puerto deportivo, un peque
no aeropuerto y un deposi
to para el suministro de agua. La probabilidad que dentro de
100 a
nos continue funcionando el puerto deportivo es 0.76, la
de que no funcione el aeropuerto es 0.18 y la de que funcione
el deposito
de agua es 0.40. Se pide cual
es la probabilidad
que dentro de 100 a
nos: a) Continuen funcionando los tres. b)
No funcione ninguno de ellos. c) Funcione solamente el aeropuerto. d) Funcione exactamente uno de ellos.

Analisis
de Datos
77
Solucion.
Tenemos que P [P ] = 0,76, la P [A] = 1 P [A] =
por las caractersti1 0,18 = 0,82 y la P [D] = 0,4. Ademas,
cas del enunciado los sucesos P, A y D son independientes
y tambien lo son los sistemas que resultan de susutituir alguno de ellos por sus contrarios. Entonces:
a. P [P A D] = P [P ]P [A]P [D] = 0,76 0,82 0,4 =
0,2492.
b. P [P A D] = P [P ]P [A]P [D] = 0,24 0,18 0,6 =
0,0259.
c. P [P A D] = 0,24 0,82 0,6 = 0,1180.
d. P [P A D] + P [P A D] + P [P A D] = 0,0820 +
0,1180 + 0,0172 = 0,2172.
2
Problema 4.7 Justo despues
de ser puestos en circulacion,
algunos autobuses fabricados por cierta compa

na presentan
grietas en la pintura de los laterales de los vehiculos. Supongamos que una ciudad tiene 80 de estos autobuses y que en
doce de ellos han aparecido grietas.
a. De cuantas
maneras se puede seleccionar una muestra de
10 vehiculos para inspecionarla?

b. De cuantas
formas distintas puede una muestra de 10
autobuses contener 10 vehiculos con grietas?

c. Determinar la probabilidad que en una muestra de 10 vehiculos, elegidos al azar, 4 tengan grietas.
Problema 4.8 La probabilidad que un vuelo del puente aereo
Madrid-Barcelona salga puntual es 0,92, la de que llegue puntual es 0,93, y la de que salga y llegue puntual 0,84. Que es
78
J. L. DazBarrero
mas
probable: que llegue puntual un vuelo que ha salido puntual o que haya salido puntual un vuelo que ha llegado puntual.
Solucion.
Sean los sucesos A = { sale puntual} y B = { llega
puntual }. Entonces, p[A] = 0,92, p[B] = 0,93, y p[A B] =
0,84. A partir de aqu resulta que
p[B|A] =
p[A|B] =
p[A B]
p[A]
p[A B]
p[B]
= 0,91,
= 0,90.
probable que llegue puntual un vuelo que

Por tanto, es mas
ha salido puntual.
2
Problema 4.9 Las probabilidades que tres meteorologos
inde
pendientemente pronostiquen correctamente el tiempo para un
determinado fin de semana son respectivamente, 1/6,1/4 y
1/3. Si cada uno de ellos, pronostica el tiempo para el proximo
fin de semana, se pide:

1. Probabilidad que solamente uno de ellos acierte.
2. Si solamente acierta uno, cual
es la probabilidad que
sea el primero?
Solucion.
Sean los sucesos A = {acierta el primero}, B =
{acierta el segund} y C = {acierta el tercero}. Las probabilidades de estos sucesos y sus contarrios son, respectivamente,
1
1
1
P [A] = , P [B] = , P [C] =
6
4
3
5
3
2
P [A] = , P [B] = , P [A] =
6
4
3

Analisis
de Datos
79
1.- Sea X = {acierta solamente uno}, entonces

X = (A B C) (A B C) (A B C)
disjunta. Por tanto,
siendo dicha union
P [X] = P [(A B C) (A B C) (A B C)]
= P [A B C] + P [A B C] + P [A B C]
= P [A]P [B]P [C] + P [A]P [B]P [C] + P [A]P [B]P [C]
31
=
= 0,4305
72
2.- En este caso hemos de calcular
P [A|X] =
P [A X]
P [X]
P [A B C]
P [X]
6
31
= 0,1935
2
Problema 4.10 Tres maquinas

A, B y C han producido res
pectivamente 100, 200 y 300 piezas. Se sabe que A produce un
5 % de defectuosas, B un 6 % y C un 7 %. Se selecciona una
pieza al azar y se pide:
1. Probabilidad de que no sea defectuosa.
2. Sabiendo que es defectuosa, probabilidad de que haya sido
fabricada por la maquina
A.
Problema 4.11 Se estudian tres tipos de defectos de las memorias montadas sobre los circuitos integrados: Defectos de
los circuitos de encuadracion
H1 : p[H1 ] = 0,1); de (Hipotesis
fectos provocados por acoplamientos parasitos

entre las celu
las (Hipotesis
H2 : p[H2 ] = 0,6), y defectos de las barras de
direccion
H3 : p[H3 ] = 0,3). La diagnosis se lleva a
(Hipotesis
cabo con ayuda de una serie de tests T1 , T2 , , Tn cada uno
80
J. L. DazBarrero
de los cuales comprueba un estado determinado de la celula
de memeoria. El resultado observable es el estado de la celula
escogida respecto a cada test. Supongmos que la diagnosis se

ha realizado y se ha observado cierto resultado A. Si antes
de la prueba es conocido que p[A|H1 ] = 0,4, p[A|H2 ] = 0,2 y
p[A|H3 ] = 0,3. Que hipotesis
tiene la maxima
probabilidad a
posteriori? Es decir, que defecto es mas

probable?
Solucion.
de las probabilidades totales
Aplicando la formula
se tiene
p[A] = p[H1 ]p[A|H1 ] + p[H2 ]p[A|H2 ] + p[H3 ]p[A|H3 ] = 0,25
Aplicando la formula
de Bayes, resulta
p[H1 |A] = 0,16,
p[H2 |A] = 0,48,
p[H3 |A] = 0,36.
Por tanto, la maxima

probabilidad la tiene la hipotesis
H2 :
Defectos por acoplamiento de parasitos.

2
Problema 4.12 Un jugador arroja un dado, le sale 6 y gana.
Hallar la probabilidad de que haya hecho trampa. (Se supone
que el 40 % de los jugadores hacen trampa)
Solucion.
El espacio muestral se puede descomponer en la
forma E = T T , T T = con p[T ] = 2/5, p[T ] = 3/5, p[6|T ] =
de Bayes se obtiene
1, y p[6|T ] = 1/6. Aplicando la formula
p[T |6] =
p[T ]p[6|T ]
p[T ]p[6|T ] + p[T ]p[6|T ]
4
5
.
2
Problema 4.13 Un ladron

perseguido por la policia llega a un
garage que tiene tres puertas: una conduce al recinto A donde
hay 5 coches tres de los cuales tienen gasolina; la segunda al

Analisis
de Datos
81
recinto B donde de los 4 coches que hay uno solo tiene combustible; y finalmente, la tercera conduce al recinto C donde
hay 7 coches cinco de los cuales tienen gasolina. Elige una
puerta y un coche. cual
es la probabilidad de escapar? Si se
sabe que ha escapado, determinar la probabilidad de que haya salido por la puerta A.
Solucion.
Denotaremos por G al suceso tener combustible.
Entonces, podemos pensar los recintos como urnas con la

siguientes composiciones:
A(3G, 2G), B(1G, 3G), C(5G, 2G)
todas igualmente probables, es decir, p[A] = p[B] = p[C] =
1/3. Sea F el suceso escapar, entones
p[F |A] =
3
5
p[F |B] =
1
4
p[F |C] =
5
7
As
p[F ] = p[A]p[F |A] + p[B]p[F |B] + p[C]p[F |C] = 0,5214.
Por otro lado, teniendo en cuenta la formula

de Bayes, resulta
p[A|F ] =
p[A]p[F |A]
p[A]p[F |A] + p[B]p[F |B] + p[C]p[F |C]
= 0,3835.
2
Problema 4.14 La mitad de los habitantes de Barcelona y su

area
metropolitana acuden al trabajo en vehculo propio, el
40 % utiliza el transporte publico

y el resto van andando. Se
estima que el 10 % de los que usan vehculo propio, el 3 % de

los que utilizan los transportes publicos
y el 1 % de los que van
andando llegan tarde al trabajo. Se pide:
82
J. L. DazBarrero
1. Porcentaje de individuos que llegan puntuales al trabajo.

2. Si un individuo llego tarde al trabajo, cual
es la probabilidad que utilizase vehculo propio?
Solucion.
los datos del enunciado, tenemos

Segun
Prioris
p[V]=50/100
p[T]=40/100
p[A]=10/100
Verosimilitudes
p[t|V]=10/100
p[t|T]=3/100
p[t|A]=1/100
Posterioris
p[V|t]=(1/C) 50/10010/100
p[T|t]=(1/C) 40/1003/100
p[A|t]=(1/C) 10/1001/100
es la probabilidad que
donde C (constante de normalizacion)
un individuo llegue tarde. Es decir,
C = p[t] =
50
100
10
100
Por tanto, p[t] = 1
63
40
100
=
3
100
10
100
1
100
63
1000
937
.
1000
1000
1
En el segundo apartado nos piden p[V |t] =
p[V ]
C
50
.
2
p[t|V ] =
63
Problema 4.15 (Problema de los cumplea
nos) Hallar la probabilidad que en una reunion
de n personas todas tengan fecha de cumplea
nos diferente .
Solucion.
Puesto que hay n personas y 365 das en un ano,
resulta que el numero

de formas distintas de cumplir anos
que se pueden presentar es
n
VRn
365 = 365 .

Analisis
de Datos
83
Por otro lado, si las personas han de tener fechas distintas
de cumpleanos,
se tienen para la primera persona 365 posibilidades, para la segunda, 364; pra la tercera, 363 y as sucesivamente, hasta que para la n-esima se tienen 365 n + 1.
Por tanto, la probabilidad pedida es
p=
365 364 (365 n + 1)

365n
n
V365
VRn
365
.
2
Nota 4.7 Cuando n 23 se verifica que p <
lo que se
2
puede interpretar diciendo que a partir de 23 personas en
probable que dos coincidan en la fecha de
adelante es mas
nacimiento, a que todos tengan fechas de nacimiento distintas.
Problema 4.16 El gerente de una empresa que fabrica neumaticos
para maquinaria de construccion
estudia el lanzamiento de un nuevo neumatico.

En el pasado, el 40 % de los neuma
ticos proyectados han tenido exito

y el 60 % han fracasado.
Antes de lanzar el neumatico

se hace un estdio de mercado
y se solicita un informe, ya sea favorable o desfavorable. En

etapas anteriores, el 80 % de los neumaticos
con informe favo
rable tuvieron exito
y solo
el 30 % de los que fracasaron tenan

informe favorable. Calcular la probabilidad que un neumatico
tenga exito
si recibe un informe favorable.
Solucion.
con e xito} y F = {informe favorable}.
Sea E = {neumatico
Entonces,
Prioris
p[E]=40/100
p[E]=60/100
Verosimilitudes
p[F|E]=80/100
p[F|E]=30/100
Posterioris
p[E|F]=(1/C) 40/10080/100
p[E|F]=(1/C) 60/10030/100
84
J. L. DazBarrero
1
64
Entonces C = y p[E|F ] = (1/C) 40/100 80/100 =
.
2
100
2
Problema 4.17 Se dispone de tres urnas con las siguientes
composiciones: U1 (3B, 2N ), U2 (2B, 3N ) y U3 (1B, 4N ). Se lanza un dado, si sale 1 se elige la primera urna, si sale primo la
segunda y si sale 4 o 6 la tercera. A continuacion,
se extrae
una bola de la urna elegida. Hallar la probabilidad de que sea
blanca. Si ha resultado ser blanca, Cual
es la probabilidad
que hubiese salido primo en el lanzamiento del dado?
Captulo 5
Variables Aleatorias
Discretas
El concepto de variable aleatoria (v.a.) viene motivado por la
necesidad de trasladar el estudio de los sucesos del algebra

de sucesos a la recta real. Dado un espacio muestral E, una
X : E R que asovariable aleatoria X es una aplicacion
cia a cada suceso un numero

real que viene determinado
por el resultado de un experimento aleatorio. Esta asocia permitira expresar los sucesos en terminos numericos.
cion
En otras palabras, una variable aleatoria es la modelizacion
teorica
de las variables estadsticas anteriormente estudia del espacio de
das. Tienen la ventaja de obviar la descripcion
probabilidad. Distinguiremos entre variables aleatorias discretas y continuas.
5.1.
Variables aleatorias discretas
Una variable aleatoria X es discreta cuando el conjunto de

valores que toma X(E) es finito o infinito numerable, i.e.,
85
86
J. L. DazBarrero
X(E) = {x1 , x2 , x3 , }. Dado un espacio de probabilidad

(E, S, p) y una v.a. X definida sobre E. Llamamos
Dx = {x1 , x2 , x3 , , xn , } X
al conjunto de valores posibles de X y definimos la funcion
de densidad de probailidad p(x) de X como la aplicacion

p : R [0, 1] definida por p(x) = p[X = x], que verifica las
siguientes condiciones:
1. p(x) 0, para todo x Dx .
2. p(x) = 0 para todo x R Dx .
X
p(x) = 1.
3.
xDx
p(x) tal que para un conjunto de valores fiToda funcion

nito o infinito numerable cumple las condiciones anteriores
de densidad de una variable aleatoria discreta X.
es funcion
fX (x) = p(x).
Tambien se utiliza la notacion
de distribucion
acumulada FX (x) de una vaLa funcion
de densidad p(x) se
riable aleatoria discreta X con funcion
define para cada x R por
X
FX (x) = p[X x] =
p(y)
{y : yx}
y verifica:
1.
2.
lm FX (x) = 0.
lm FX (x) = 1.
x+
3. Para culesquiera numeros

reales a y b con a < b se verifica que FX (a) FX (b) (no decreciente)

Analisis
de Datos
87
4. lm FX (x) = FX (a) para todo a R (continua por la

xa+
derecha)
de distribucion
goza de las siguientes propiedaLa funcion
des:
1. p[a < X b] = FX (b) FX (a).
2. p(x) = fX (x) = FX (x) lm FX (y).
yx
de densidad de una variable aleatoria disSea p(x) la funcion

creta. La esperanza matematica o valor esperado de X se
define por
X
xk p(xk )
E(X) = =
xk Dx
g(X) de la v.a. X por

y la esperanza de la funcion
X
E[g(X)] = g(X) =
g(xk )p(xk ).
xk Dx
La esperanza es una medida de tendencia central y su va

lor es un numero
real. La esperanza existe siempre que sea
convergente la correspondiente serie que la define. Se verifica
que
E(aX + b) = aE(X) + b, a, b R.
Los momentos ordinarios de una variable aleatoria, si existen, se definen como las esperanzas de potencias de la variable aleatoria, i.e.,
X
k = E(X k ) =
xki fX (xi )
xi Dx
De entre ellos destacan 0 = 1 y 1 = = E(X) llamada

media de X.
88
J. L. DazBarrero
Los momentos centrados sobre , si existen, se definen como

h
i
X
mk = E (X E[X])k =
(xi )k fX (xi ).
xi Dx
Son
X momentos destacados m0 = 1, m1 = 0, m2 = V ar(X) =
tpica o estandar
es la
(xi )2 fX (xi ). La desviacion
xi Dx
raz cuadrada positiva de la varianza, i.e.,

n X
o1/2
p
X = V ar(X) =
(xi )2 fX (xi )
.
xi Dx
La varianza goza de las sguientes propiedades:

h
i2
1. V ar(X) = E(X 2 ) E(X) .
2. V ar(aX + b) = a2 V ar(X), a, b R.
Entre los momentos centrados y ordinarios se verifica la si
guiente relacion
h
i
k
mk = E (X E[X])
=E
k
hX
j=0
kj
(1)

k
j
kj
k
X
j=0
kj
(1)

k
j
kj
j .
1
generadora de momentos, si existe, se define

La funcion
como
X
mX (t) = E(etX ) =
etxj p(xj )
xj Dx
caracterstica como
y la funcion
X
X (t) = E(eitX ) =
eitxj p(xj ).
xj Dx
Se verifica

Analisis
de Datos
89
1. mX (t) = X (it), X (t) = mX (it)

2.
3.
dk
dt

m
(t)

X
k
t=0
dk
dt

(t)
k X
5.2.
t=0
= k
= ik k .
Modelos probabilsticos discretos
de Bernoulli
5.2.1. Distribucion
Si un experimento aleatorio tiene dos resultados posibles
e xito y fracaso, i.e., E = {e, f }. Entonces, la aplicacion

X : E R definida por X(e) = 1 y X(f ) = 0 es una variable
de densidad de probabilidad
aleatoria que tiene como funcion
(
1 p si x = 0,
fX (x) =
p
si x = 1
de Bernoulli de parametro
p, i.e., X
se llama distribucion
Ber(p). Su esperanza es E(X) = p, su varianza V ar(X) =
p(1 p) y mX (t) = E(etX ) = 1(1 p) + et p = 1 + p(et 1).
Ejemplo 5.2.1 La probabilidad anual que se produzca un tornado en Mallorca es 0,2. La variable aleatoria
(
0 si no se produce,
X=
1 si se produce
es una variable aleatoria de Bernoulli de parametro
p = 0,2
con funcion
de densidad
(
0,8 si x = 0,
fX (x) =
0,2 si x = 1.
90
J. L. DazBarrero
Binomial
5.2.2. La Distribucion
de repeticioEn el experimento que consiste en la realizacion
nes independientes de una prueba de Bernoulli, si n repre
senta el numero
de pruebas y X es la variable aleatoria que
toma como valores el numero

de e xitos en estas n repeticiones, entonces
X = {0, 1, 2, , n}.
de densidad de probabilidad fX (k) = p[X = k]
Su funcion
representa la probabilidad de obtener k e xitos y n k fracasos en n repeticiones del experimento. Dado que las repe
ticiones se consideran independientes cualquier ordenacion
k
nk
de k e xitos y n k fracasos tiene probabilidad p (1 p)
k,nk
y como hay P Rn
ordenaciones posibles, entonces, para
k = 0, 1, , n, se tiene que
k,nk k
p[X = k] = P Rn
p (1 p)nk

n k
n!
k
nk
p (1 p)
=
p (1 p)nk .
=
k
k!(n k)!
de probabilidad anteriormente definida se reLa distribucion

X B(n; p) y se denomina Distripresenta con la notacion
Binomial porque los valores que toma su funcion
de
bucion
densidad coinciden con los terminos del binomio
n
X
n k
n
[(1 p) + p] =
p (1 p)nk .
k
k=0
Sus parametros
son:
1. = E(X) = np,
2. V ar(X) = 2 = np(1 p), =
3. mX (t) = [(1 p) + pet ]n .
p
np(1 p)

Analisis
de Datos
91
uniforme discreta
5.2.3. Distribucion
Una variable aleatoria que puede asumir n valores diferentes
con igual probabilidad diremos que tiene una distribucion

uniforme discreta, i.e., si Dx = {1, 2, , n} entonces
X U {1, 2, , n} fX (x) =
1
n
, x = 1, 2, , n.
Sus parametros
son:
1. E[X] =
n+1
2
2. V ar(X) =
3. mX (t) =
n2 1
12
n
1X
n k=1
ekt .
geometrica
geometrica modela el numero
La distribucion
de fracasos
hasta el primer e xito. Existen dos versiones: (1) La que cuen
ta unicamente
el numero
de fracasos y (2) La que cuenta
el numero
de pruebas incluyendo la que constituye el primer
e xito. Puesto que modela unidades, en general de tiempo, que
hay que esperar hasta obtener el primer e xito, se denomina
tambien variable aleatoria discreta de tiempo de espera.
Se dice que la variable aleatoria X con Dx = {0, 1, 2, }
geometrica de parametro
sigue una distribucion

p si
fX (x) = p(1 p)x , x = 0, 1, 2, .
modela el numero
Esta distribucion
de fracasos hasta el pri
mer e xito, sin incluirlo. Sus parametros
son:
92
J. L. DazBarrero
1. E(X) =
1p
p
2. V ar(X) =
3. mX (t) =
1p
p2
p
1
et (1
p)
La variable aleatoria X con Dx = {1, 2, 3, } sigue una dis geometrica de parametro
tribucion
p cuando
fX (x) = p(1 p)x1 , x = 1, 2, 3,
Sus parametros
son
1. E(X) =
1
p
2. V ar(X) =
1p
p2
Modela el numero
de pruebas hasta alcanzar el primer e xito,
incluyendo e ste.
de Poisson
Una variable aleatoria X con Dx = {0, 1, 2, } se dice que
de Poisson de parametro
sigue una Distribucion

cuando
y solo cuando
fX (x) = p[X = x] =
Sus parametros
son:
x e
x!
, x Dx , > 0.

Analisis
de Datos
93
1. E(X) = ,
2. V ar(X) = .
3. mX (t) = e(e
t 1)
es un modelo adecuado para muchos fenome

Esta distribucion
nos aleatorios, independientes, que cuentan e xitos por uni
dad de tiempo, espacio, longitud, etc. Ejemplos: numero
de
tornados, terremotos o inundaciones que ocurren en una de
terminada zona por ano.
de Poisson puede obtenerse como lmite de la
La distribucion
Binomial. En efecto, supongamos que en un tiempo t se reali
zan n experimentos independientes de Bernoulli con parame
tro p. Si X es la variable aleatoria que cuenta el numero
de
e xitos, entonces se distribuye como una Binomial de parametros n y p, es decir, X B(n, p) con

n x
fX (x) = p[X = x] =
p (1 p)nx , x = 0, 1, 2, , n.
x
Supongamos que en el periodo t aumentamos el numero

de
experimentos de forma que el promedio de e xitos sea cons
y
tante, i.e., E(X) = np = = cte., entonces p =
n

n x
nx
fX (x) = p[X = x] =
1
, x = 0, 1, 2, , n.
x n
n
Tomando lmite con n se obtiene
fX (x) = p[X = x] =
x e
x!
, x = 0, 1, 2, .
de Poisson se obtiene como lmiSintetizando, la distribucion
te de una Binomial para la que el numero

de experimentos
de Bernoulli crece indefinidamente manteniendo constante
el numero
medio de e xitos por unidad de tiempo.
94
J. L. DazBarrero
5.2.6. Perodo de retorno

Se llama perodo de retorno al tiempo esperado entre sucesos. Es decir, si A es un suceso y T es la variable aleatoria
(temporal) que mide el tiempo entre ocurrencias consecutivas de A, entonces el periodo de retorno de A es E(T ). Por
ejemplo, si T = numero
de anos
que transcurren hasta la
de un suceso A, entonces T G(p) con p = p[A].
realizacion
1
Por tanto, = E(T ) = es el periodo de retorno de A.
p
5.3.
Problemas
Problema 5.1 Se considera la distribucion

de probabilidad (X, fX )
donde X {1, 2, , 9, 10} y fX (x) = 1/10, x = 1, 2, , 9, 10.
a. Representar graficamente
las funciones de densidad de pro
babilidad y de distribucion.
b. Calcular la esperanza y la varianza de X.

c. Calcular p[X > 5], p[3 < X 8], p[X 7].
Problema 5.2 La probabilidad anual de que se produzcan inundaciones en la costa del Maresme es 0,45. Calcular la probabilidad que en los proximos
10 a
nos se produzcan inundaciones:
a. Todos los a
nos.
b. Al menos dos a
nos.
c. Exactamente 4 a
nos.
d. Mas
nos.
de cuatro pero menos de ocho a

Analisis
de Datos
95
Problema 5.3 Trece hormigoneras estan

suministrando hormigon
a una obra. La probabilidad que al final de una jornada una hormigonera continue funcionando es de 0,60. Si las
hormigoneras funcionan independientemente hallar cual es el
numero
mas
probable de hormigoneras en funcionamiento al

final del da y cual es su probabilidad.
Solucion.
Sea X = numero
de hormigoneras en funciona
miento al final del dia. Bajo la hipotesis

de independencia X
una Binomial de parametros
se distribuye segun
n = 13 y
de densidad es
p = 0,60. La correspondiente funcion
x
fX
x
fX
0
6.6e-06
7
0.1932
1
2
3
4
5
6
0.0001 0.0011 0.0063 0.0238 0.0643 0.1287
8
9
10
11
12
13
0.2173 0.1811 0.1086 0.0444 0.0113 0.0013
La mayor probabilidad es fX (8) = 0,2173 y por tanto 8 es
probable de maquinas
el numero
mas
en funcionamiento al
final del da y su probabilidad es 0,2173.
2
Problema 5.4 Calcular la probabilidad de que en una reunion
de 100 personas, elegidas al azar, hallan nacido k, (0 k

100) en el mismo da.
Solucion.
Parece natural asignar a un individuo, elegido al
azar, la probabilidad
1
p=
365
de haber nacido un determinado da del ano.

Tenemos 100 personas y de ellas seleccionamos k. La probabilidad de que todos ellos hayan nacido el mismo da y que
96
J. L. DazBarrero
no lo hayan hecho ninguno de los 100 k restantes es

1 k
365
1 100k
365
Dadoque con las 100 personas que tenemos se pueden for100

mar
grupos de k personas, entonces la probabilidad
k
pedida es

1 100k
100 1 k
1
.
p=
365
365
k
2
Problema 5.5 Se tiene un dado trucado. En 10 tiradas independientes la probabilidad de que aparezca numero
par 5 ve
ces es el doble de la probabilidad de aparezca 4 veces. Cual
sera la probabilidad de que aparezca par al menos una vez en

las 10 tiradas?
Solucion.
Sean p y q las probabilidades de que al lanzar el
dado aparezca par e impar respectivamente. La probabilidad
de que aparezca par en 5 ocasiones es

10 5 5
p q
5
y la de que aparezca en 4 ocasiones

10 4 6
p q .
4
los datos del enunciado se tine
Segun

10 5 5
10 4 6
p q =2
p q
5
4

Analisis
de Datos
97
o 6p = 10q. Por otro lado, q = 1 p. Resolviendo el sistema

5
3
anterior se obtiene p = y q = .
8
8
Por tanto, la probabilidad pedida es la del suceso contrario a
de par, es decir,
la no aparicion

p=1

10
0
0 10
p q
=1
3 10
8
' 0,999945.
2
Problema 5.6 Trafico

pretende modificar la normativa de cir
culacion
de modo que un conductor pierda su permiso de conducir si recibe tres multas por exceso de velocidad. Cada vez
que un conductor coge su coche tiene una probabilidad de
0,001 de ser sancionado por exceso de velocidad.
a. Calcular la probabilidad que un conductor reciba su primera multa por exceso de velocidad la decimoquinta
vez que
coja el coche despues

de la aplicacion
de la nueva normativa.
b. Cual
esperado de veces que cogera el coche
es el numero
hasta que reciba la primera multa por exceso de velocidad?

c. Cual
es la probabilidad de que un conductor coja su coche
al menos tres veces hasta que reciba la primera multa?
Y la de que lo coja al menos tres veces antes de recibir
su primera multa?
d. Si un conductor ha salido ya tres veces con su coche y todava no ha sido multado por exceso de velocidad, cual
es la probabilidad de que conduzca al menos una vez

mas
antes de recibir la primera multa?
98
J. L. DazBarrero
Solucion.
de veces que el conductor coge
(a) Sea X el numero
su coche antes de ser sancionado por primera vez, i.e., X =
{0, 1, 2, }. La probabilidad de ser sancionado por exceso
de velocidad es p = 0,001 y la de no ser sancionado es 1p =
de variables de
0,999. Por tanto, se trata de una repeticion
Bernoulli independientes hasta que se produzca la primera
geometrica de
sancion,
es decir, X sigue una distribucion
parametro
p = 0,001, i.e.,
X G(0,001).
La probabilidad pedida es p[X = 14] = (1p)14 p = 0,99914
0,001 = 0,00099.
(b) Ahora hay que calcular el numero

esperado de veces que
y anadirle
(la
coge el coche sin recibir sancion
una vez mas
vez que conduce y recibe la sancion),

i.e.,
1p
= 1000 veces.
N = E(X) + 1 = 1 +
p
(c) Las probabilidades pedidas son p[X 2] = La sancion

puede ocurrir en la tercera vez o siguientes = 0,998; y p[X
puede ocurrir en la cuarta vez o siguientes
3] = La sancion
= 0,9970.
(d) Si la tercera vez que coge el coche todava no ha sido
multado, entonces la variable X tomara valores mayores o
iguales que 3, pues la primera multa llegara en el peor de
los casos, la cuarta vez. Por tanto, la probabilidad pedida es
p[X 4|X 3] =
p[X 4 X 3]
p[X 3]
p[X 4]
p[X 3]
= 0,999.
2
Problema 5.7 Determinar la esperanza y la varianza para las

distribuciones geometrica
y de Poisson. (Utilizar la funcion
generatiz de momentos)

Analisis
de Datos
99
generatriz de momentos para una

Solucion.
(a) La funcion
geometrica de
variable aleatoria que sigue una distribucion
parametro p es
tX
mX (t) = E(e
)=
tx
e fX (x) =
x=0
=p
etx p(1 p)x
x=0
h
i
etx (1 p)x = p 1 + et (1 p) + e2t (1 p)2 + . . .
x=0
=p
Por tanto, dado que mX (t) =

E(X) = lm
t0
si et (1 p) < 1.
1 et (1 p)
d
dt
1 et (1 p)
mX (t) = lm h
t0
, entonces
p(1 p)
i2 =
t
1 e (1 p)
Ahora es facil
obtener que V ar(X) =
1p
p2
1p
p
(b) Si X P oiss() entonces

tX
mX (t) = E(e
)=
tx
e fX (x) =
x=0
=e
x=0
X
(et )x
x=0
x!
= e(e
t 1)
(et )x
x!
A partir de mX (t) se obtiene

E(X) = lm
t0
d
dt
h
i
t
mX (t) = lm e(e 1) et = .
t0
E(X ) = lm
t0
d2
dt2
mX (t)
100
J. L. DazBarrero
h
(et 1)
= lm e
t0
2 2t (et 1)
e + e e
= + 2 .
Por tanto, V ar(X) = E(X 2 ) E 2 (X) = .
Problema 5.8 Suponiendo que el numero

de tornados obser
vados en un a
no en una cierta region
tiene una distribucion
de
Poisson de parametro
= 8.
h
i h
i h
i
1. Calcular p X 5 , p 6 X 9 , p 10 X .
2. Cuantos
tornados cabe esperar que se produzcan en un
a
no y cual
de tornados
es la desviacion
tpica del numero
observados?
h
Solucion.
1.- Dado que P X = x =
P [X 5] =
x e
x!
, entonces
5
X
8x e8
= 0,191.
x!
x=0
9
X
8x e8
p[6 X 9] =
= 0,526.
x!
x=6
9
X
8x e8
p[x 10] = 1 p[X < 10] = 1
= 0,283.
x!
x=0
(b) E(X) = 8, V ar(X) = 8 y X =
V ar(X) = 2,828.
2
Captulo 6
Variables Aleatorias
Continuas
Dado un espacio de probabilidad (E, S, p); una variable aleatoria X definida sobre S con Dx R (intervalo) se dice que
es una variable aleatoria continua.
de densidad de probabilidad de una variable
La funcion
fX : R
aleatoria continua X se define como una funcion
[0, 1] tal que para todo a, b R, con a < b,
Z b
p[a < X b] =
fX (x) dx.
a
de densidad verifica:
La funcion
1. fX (x) 0, para todo x R.
Z
2.
fX (x) dx = 1.
fX : R [0, 1]
Al igual que en el caso discreto toda funcion
de denque cumpla las dos condiciones anteriores es funcion
sidad de una variable aleatoria X, en este caso continua.
101
102
J. L. DazBarrero
de densidad goza de las siguientes propiedades:

La funcion
1. p[X = c] = 0, para toda constante c R.
2. p[a < X b] = p[a X b] = p[a X < b] = p[a <
X < b], para todo a, b R, a < b.
conA la pareja formada por (X, fX ) se le llama distribucion
tinua de probabilidad.
acumulada FX (x) de una varia de distribucion
La funcion
ble aleatoria continua X se define por
Z
FX (x) = p[X x] =
fX (x) dx,
y verifica las siguientes propiedades:

1.
2.
lm FX (x) = 0,
lm FX (x) = 1,
x+
3. FX (a) FX (b), para todo a < b (no decreciente),

4. lm FX (x) = FX (a) (continua derecha),
xa+
5. p[a < X b] = p[X b] p[X a] = FX (b) FX (a),

para todo a, b R, a < b,
de densidad es la derivada de la funcion
de
6. La funcion
distribucion
0
fX (x) = FX
(x) =
dFX (x)
dx

Analisis
de Datos
6.1.
103
Parametros de una variable aleatoria continua
La esperanza matematica de una variable aleatoria continua se define por
Z
E(X) = =
xfX (x) dx,
g(X) por
y la esperanza o valor esperado de la funcion
Z
E[g(X)] = g(X) =
g(x)fX (x) dx.
que existe
La esperanza es un parametro
de centralizacion
siempre y cuando sea convergente la integral que la define.
La varianza de X se define por
V ar(X) =
2
X
(x )2 fX (x) dx = E(X 2 ) E 2 (X).
tpica es la raz cuadrada positiva de la vaLa desviacion

rianza, i.e.,
p
X = V ar(X).
La desigualdad de Chebychev enuncia que para toda variable aleatoria X con esperanza y varianza finita 2 , y toda
k > 0,
1
p[|X | k] 2 ,
k
o equivalentemente,
p[ k < X < + k] 1
1
k2
104
J. L. DazBarrero
El percentil qesimo se define para todo q [0, 1], como

aquel valor q tal que
q = mn{xk |FX (xk ) q}.
La moda se define como el valor o valores de x donde fX
alcanza sus maximos.
6.2.
Modelos probabilsticos continuos
uniforme continua
6.2.1. Distribucion
uniforme continua o distribucion
rectanguLa distribucion
lar sirve para modelar fenomenos

que toman valores en un
intervalo finito [a, b] donde se supone la equiprobabilidad de
los subintervalos de igual longitud. Ejemplo: situar puntos
sobre un segmento. Se dice que X U [a, b] cuando su fun de densidad es
cion
fX (x) =
1
ba
I{a X b}.
Sus parametros
son
1. E(X) =
a+b
2. V ar(X) =
(b a)2
12
exponencial
6.2.2. Distribucion
Es util
para modelar tiempos entre sucesos de Poisson. Se
dice que la variable aleatoria X con Dx = R+ sigue una dis-

Analisis
de Datos
105
exponencial de parametro
tribucion
, ( > 0), i.e.,
X Exp() fX (X) = ex I{0 x}.
Sus parametros
son
1. E(X) =
2. V ar(X) =
6.3.
(perodo de retorno)
1
2
Normal
La Distribucion
Una variable aleatoria continua X se dice que sigue una

Normal o Distribucion
de GaussLaplace de
Distribucion
de densidad
parametros
, 2 si tiene por funcion
1 x 2
.
fX (x) = e 2
2
importante y la mas
utilizada de las
Probablemente es la mas
distribuciones de probabilidad, entre otras, por las siguientes
razones:
de la inferencia estadstica al
1. Es basica
en la aplicacion
analisis
de datos, dado que gran cantidad de estadsti normal a medicos muestrales tienden a la distribucion
de la muestra.
da que aumenta el tamano
2. Gran parte de los fenomenos

observables se representan
normal al menos en una primediante la distribucion
mera aproximacion.
3. Las variables aleatorias continuas que dependen de un
gran numero
de causas independientes, que suman sus
efectos y que ninguna de ellas es preponderante sobre
tambien sigue una distribucion
normal.
las demas,
106
J. L. DazBarrero
aparece en el siglo XVIII definida en forma

Esta distribucion
emprica o grafica
en problemas relacionados con el comercio
y la navegacion. En 1733 De Moivre la introdujo como lmite
de la Binomial (aproximacion)
cuando el numero
de pruebas n crece indefinidamente. Posteriormente, Gauss (1808)
y Laplace (1812) presentan el modelo normal expresandolo
de densidad y lo utilizan para estudiar la
con una funcion
de los errores al realizar mediciones fsicas (Asdistribucion
tronoma).
La grafica
de fX (x) tiene forma de campana con un maximo
en x = . Las dos colas se extienden indefinidamente siendo y = 0 una asntota horizontal. Cualesquiera que sean los
valores de y 2 para una variable aleatoria normal, el area

bajo la curva fX es igual a 1 y se verifica que aproximada se encuenmente el 68,25 % de los valores de la distribucion
tran en el intervalo [ , + ], el 95,5 % en [ 2, + 2]
y el 99,7 % en [ 3, + 3].
Puede comprobarse que si X N (, 2 ) sus parametros

son:
1. E(X) = ,
2. V ar(X) = 2 ,
1
t + 2 t2
2
3. mX (t) = e
.
Dado que la p[a X b] viene dada por
Z b
p[a X b] =
fX (x) dx
a
y que esta integral no es resoluble por cuadraturas, se necesita aproximarla numericmente mediante tablas. Esto comportara hacer una tabla para cada pareja de valores , 2 .

Analisis
de Datos
107
de la vaEste problema se resuelve mediante la tipificacion

riable que consiste en hacer el cambio de variable
Z=
que permite pasar de la variable X N (, 2 ) a la normal

estandard Z N (0, 1). En efecto,
E(Z) = E
X
V ar(Z) = V ar
6.4.
o
1n
1
E(X) = ( ) = 0.
X
V ar(X) =
2
= 1.
El teorema del Lmite Central
historica
La aparicion
de variables aleatorias normales en las
aplicaciones proviene del hecho que cuando se suman variables aleatorias, el resultado tiende a comportarse como una
variable aleatoria normal. Esto se justifica con el Teorema
importantes en
del Lmite Central que es uno de los mas
la Teora de la Probabilidad y con enormes consecuencias en
se enuncia una version
sencilla
Estadstica. A continuacion,
de este resultado:
Teorema del Lmite Central
Sean X1 , X2 , . . . , Xn variables aleatorias independientes e
identicamente distribuidas, con E(Xi ) = y V ar(Xi ) =
n
X
2 , i = 1, 2, . . . , n. Definimos Sn =
Xi . Entonces, la vai=1
riable Sn tipificada
Sn n
Sn E(Sn )
Zn = p
=
n
V ar(Sn )
108
J. L. DazBarrero
FZn (x) tal que, para cualquier x R

tiene distribucion
lm FZn (x) = FZ (x).
n+
En otras palabras,
lm p[a Zn b] = p[a Z b]
n+
con Z N (0, 1). Sintetizando, este resultado enuncia que:

de pruebas repetidas e independientes la
En una sucesion
media muestral estandarizada tiende a la normal estandard
a medida que el numero
de pruebas aumenta.
El teorema del lmite central puede aplicarse a la suma de

variables aleatorias discretas. El siguiente teorema, anterior
al del lmite central, puede considerarse un corolario.
Teorema de De MoivreLaplace
Sea X B(n, p). Definimos Zn = p
X np
np(1 p)
cuya distri-
escalonada es FZn . Entonces,

bucion
lm FZn (x) = FZ (x).
n+
Es decir, para valores grandes de n, si p no es proximo

a 1,
normal
la distribucion

N np, np(1 p)
se puede utilizar para aproximar a la Binomial. Cuanto ma proximo
yor sea n y p mas

a 0,5 mejor sera la aproximacion.
Finalmente, se ha de comentar que actualmente con la tecnologa que tenemos a nuestro alcance las aproximaciones de la
Binomial por la la normal carecen de sentido.

Analisis
de Datos
6.5.
109
Problemas
Problema 6.1 En una fabrica

de cementos se anuncia que
los pedidos son atendidos en 30 minutos. Supongamos que

el tiempo en atender los pedidos se distribuye segun
una variable aleatoria continua X U (25, 35). se pide:
1. Definir las funciones
de densidad de probabilidad y dis
tribucion
y dibujar sus graficas.
2. Cual
es la probabilidad que el tiempo de atencion
del
siguiente pedido exceda los 33 minutos?
3. Cual
es la probabilidad que el tiempo en que un pedido
es atendido difiera en 2 minutos del tiempo anunciado?
4. Para cada a tal que 25 < a < a + 2 < 35, cual
es la
probabilidad que un pedido sea atendido en el intervalo
[a, a + 2]?
Problema 6.2 Un estudio realizado sobre la cantidad de Chapapote retirado diariamente por los equipos de limpieza (voluntarios, pescadores y ejercito),
revela que el 50 % de los equi
pos retiran mas
de 100 y menos de 200 teneladas, el 25 % mas
de 200 y menos de 300 y el resto no llega a las 100 toneladas. Con esta informacion
construir una funcion
de densidad
que modelice la distribucion
X (en cientos de toneladas) de los
residuos recogidos por los equipos de limpieza y, a partir de
ella, obtener:
1. La funcion
de distribucion
de X.
2. La media de residuos recogidos y su desviacion
tpica.
3. El porcentaje de equipos que recogen entre 50 y 150 toneladas diarias.
110
J. L. DazBarrero
el inforSolucion.
de toneladas recogidas, segun
El numero
me, oscila entre 0 y 300 toneladas diarias. Entonces, La fun de densidad es
cion
1/4, 0 x < 1;
1/2, 1 x < 2;
fX (x) =
1/4, 2 x < 3;
0,
en el resto.
0,
Z x
x/4,
x/2 1/4,
1. FX (x) =
fX (x) dx =
x/4
+ 1/4,
1, Z
x < 0;
0 x < 1;
1 x < 2;
2 x < 3.
x 3.
0 dx = 0. Para 0
En efecto, para x < 0, FX (x) =
Z 0
Z x
x
x < 1, FX (x) =
0 dx +
1/4 dx = . Para 1
4
Z
Z0 1
Z x
0
x < 2, FX (x) =
0 dx +
1/4 dx +
1/2 dx =
0
Z 0
Z1 1
x
1
. Para 2 x < 3, FX (x) =
0 dx +
1/4 dx +
2
4
0
Z 2
Z x
x 1
1/2 dx+
1/4 dx = + . Finalmente, para x 3,
1
Z 0 2
Z 1 4 4 Z 2
Z 3
FX (x) =
0 dx+
1/4 dx+
1/2 dx+
1/4 dx =
1.
3
2. E(X) =
xfX (x) dx = , i.e., 150 toneladas. E(X 2 ) =
2
Z
34
x2 fX (x) dx =
. Por tanto, V ar(X) = 0,5833 y
12
sX = 0,7638.
Z 1,5
3. P [0,5 X 1,5] =
fX (x) dx = FX (1,5)FX (0,5) =
0,5
0,375. Es decir, el 37,5 % de los equipos.

Analisis
de Datos
111
2
Problema 6.3 Sea Z una variable aleatoria que se distribuye

segun
Calcular las siguientes probabi una normal estandard.
lidades:
p(0 z 2,2)
p(z 1,37)
p(2,5 z 2,5)
p(0 z 1)
p(1,8 z)
p(1,4 z 2,5)
p(2,5 z 0) p(1,5 z 2)
p(1,5 z)
Problema 6.4 Hallar los valores aproximados de los siguientes percentiles de la distribucion
normal estandadrd:
a.
91 b.
9 c.
75 d .
95
Solucion.
a. Se ha de calcular el valor de a de forma que
p(z a) = 0,91. Directamente de las tablas se obtiene que

a = 1,34. En los otros casos los valores aproximados son
respectivamente: 1,34, 0,68, 1,645.
2
Problema 6.5 Obtener el valor de k en las siguientes ecuaciones para la variable aleatoria N (0, 1):
p(z k) = 0,01
p(k z k) = 0,6826
p(k z k) = 0,98 p(k z k) = 0,9544
p(z k) = 0,01
p(z k) = 0,95
Solucion.
En el primer caso hay que tener encuenta que p(z
k) = 0,01 es equivalente a que 1 p(z < k) = 0,01 o p(z <
k) = 0,99. Directamente de las tablas resulta que k = 2,33.
En los otros casos se obtienen los valores 2,33, 2,33, 1,00, 2,00
y 1,645 respectivamente.
2
Problema 6.6 Sea X una variable aleatoria que se distribuye
segun
una N (30, 25). Hallar las siguientes probabilidades:
P (30 X 37,1)
P (21,05 X 27,3) P (26,35 X 30)
P (23,15 X 40,05) P (33,25 X 36,3)
P (|X| 32,5)
112
J. L. DazBarrero
Solucion.
Tipificando la variable mediante la transformacion
x
z=
, se obtienen losisguientes resultados:
0,4222 0,1540 0,2673 0,8925 0,2579 0,6913

2
Problema 6.7 Suponiendo que los errores en la medida de
300 observaciones topograficas
siguen una distribucion
normal de media 0 y desviacion

4, calcular :
estandar
(i) La probabilidad de que un error no sea mayor que 6

(ii) La probabilidad de que sea por defecto y mayor que 8
(iii) Si llamamos peque
nos a los errores menores que 7 y grandes a los mayores que 7, calcular el numero
esperado de
errores grandes y peque

nos en las 300 observaciones.
Solucion.
Si X N (0, 16) y Z N (0, 1), entonces:
(i) p[|X| 6] = p[6 X 6] = p[1,5 Z 1,5] =
0,8662.
(ii) p[X < 8] = p[Z < 2] = 0,0228.
(iii) p[ error pequeno]=p[|X|

7] = p[|Z| 1,75] = 0,9198 y
p[error grande] = 1 0,9198 = 0,0802. Por tanto, el nume

ro esperado de rrores pequenos
es de 276 y el de errrores
grandes de 24.
2
Problema 6.8 Supongamos que el pH del suelo de la cuenca
de un rio es una variable aleatoria que se distribuye normalmente con media 6 y desviacion
tpica 0,10. Si se elige una
muestra al azar del suelo y se determina su pH:
1. Cual
es la probabilidad que el pH resultante este entre
5,90 y 6,25?

Analisis
de Datos
113
2. Cual
es la probabilidad que el pH se mayor que 6,10?
3. Que valor sera superado solamente por el 5 % de los posibles pH?
Problema 6.9 Para conocer el grado de concienciacion
de los
problemas medio ambientales que tienen los trabajadores de
las constructoras un inspector ha aplicado un test de ambientalizacion
a los 500 trabajadores de una empresa. Se supone
que las puntuaciones obtenidas se distribuyen se gun
una normal de media 80 y desviacion
tpica 12. (a) Que puntuacion
separa al 25 % de los trabajadores con menor conocimiento de

los problemas ambientales? (b) A partir de que puntuacion
se
encuentra el 25 % de los trabajadores con mejor conocimiento
de la ambientalizacion?
(c) El inspector visita otra empresa y
al aplicar el mismo test a sus trabajadores encuentra que las

puntuaciones se distribuyen segun
una N (82, 169). Que se
puede decir? Hay en la segunda empresa trabajadores con
mejor conocimiento de los problemas ambientales que en la
primera?

X 80
z = 0,25.
Solucion.
(a) p[X x] = 0,25; p
12
X 80
= 0,67; X = 71,96.
z = 0,67;
12
El 25 % de los trabajadores con menor conocimiento en am obtiene puntuaciones inferiores a 71,96.
bientalizacion
X 80

z = 0,75. z = 0,67;
(b) P [X x] = 0,75; p
12
X 80
= 0,67; X = 88,04
12
A partir de 88,04 se encuentra el 25 % de los trabajadores con
mejor conocimiento de los problemas ambientales.
(c) Teniendo en cuenta que en el intervalo ( , + ) se
114
J. L. DazBarrero
halla el 68,2 % de los individuos; en ( 2, + 2) el 95,4 %

y en ( 3, + 3) el 99,7 %, entonces
68.2 % 95.4 %
Empresa 1 (68,92) (56,104)
Empresa 2 (69,95) (56,108)
99.7 %
(44,116)
(43,121)
Se puede concluir que en la segunda empresa hay trabajadores con mejor conocimiento de los problemas ambientales
que en la primera, ya que los lmites inferiores de los inter
valos son muy proximos;
en cambio los superiores son sen altos en la segunda empresa.
siblemente mas
2
Problema 6.10 La vida de una hormigonera se distribuye normalmente con media 10000 horas. Por la experiencia acumulada, se sabe que el 50 % de ellas dura menos de 9190 horas o
mas
de 10810 horas. Se pide:
1. Cual
del tiempo de vida de
es la desviacion
estandard
las hormigoneras?
2. Cual
es el porcentaje de hormigoneras que funcionara mas
de 11500 horas?
3. Si una hormigonera lleva funcionando 12000 horas, cual
es la probabilidad de que continue funcionando despues
de las 13000 horas?
Solucion.
La vida de las hormigoneras X se distribuye segun
2
una N (10000, ). Tipificando, mediante el cambio de variax 10000
ble z =
se obtiene que Z N (0, 1). Entonces:
10810 10000
810
9190 10000
810
1. z1 =
=
, z2 =
=
.

Analisis
de Datos
115
el enunciado, tenemos
Segun
h
h
810 i
810 i
=p Z
p Z>
h
h
810 i
810 i
p Z>
+p Z
= 0,5
h
810 i
810
De donde
p Z
= 0,75;
= 0,675 y = 1200.
2. p[X 11500] = 1 p[X < 11500] = 1 p[Z < 1,25] =

1 0,8944 = 0,1056.
3. p[X > 13000|X 12000] =

p[X > 13000]
p[X 12000]
p[X > 13000 X 12000]

p[X 12000]
=
2
= 0,1278.
Problema 6.11 La temperatura que se registra en la superfcie

de un satelite
meteorologico
se puede considerar que se distri
buye segun
una variable aleatoria normal. Cuando se encuentra afectado por la sombra de la Tierra, se tiene que en un 95 %
de los casos la temperatura es inferior a los 263 K, mientras
que supera los 253 K en el 40 % de las mediciones.
1. Calcular la media y la varianza de la temperatura en estas condiciones.
2. Cuando el satelite
recibe directamente la luz solar, la tem
peratura en su superfcie presenta la misma varianza que
en el caso anterior, pero su media se incrementa en 35 K.
Cual
es la probabilidad que la temperatura supere los
278 K?
Solucion.
(1) La variable aleatoria temperatura en la sombra
una normal X N (, 2 ). Ademas,
se distribuye segun
p[X < 263] = 0,95,
p[X > 253] = 0,4
116
J. L. DazBarrero
o equivalentemente,
263
= 1,645,
253
= 0,255
Resolviendo el sistema anterior resulta: = 251,16 K y =

7,19 K.
(2) La variable aleatoria temperatura al sol se distribuye segun

una normal Y N ( + 35, 2 ). Entonces,

278 286,16
= 0,871.
p[Y > 278] = 1p[Y 278] = 1p
7,19
2
Problema 6.12 La probabilidad que un cliente pague con VISA la compra de unos materiales de lampisteria es del 50 %.
Hallar la probabilidad que de los 100 proximos
clientes:
1. Exactamente 60 paguen con VISA.

2. A lo sumo 40 paguen con VISA.
3. Mas
de 40 paguen con VISA.
Binomial B(100, 0,5).
Solucion.
Ahora se trata de una distribucion
Como np = 50 > 5 y nq = 50 > 5, entonces aplicando
el teorema de De Moivre se puede aproximar mediante una
N (, ) donde = np = 50 y = npq = 5. Por tanto,

1. P [X = 60] P [59,5 X 60,5] = P [1,9 Z
2,1] = 0,0108
2. P [X 40,5] = P [Z 1,9] = 0,0287.
3. P [X > 40,5] = 1 P [X 40,5] = 1 0,0287 = 0,9713.
2
Captulo 7
Inferencia Estadstica:
de Parametros.
Estimacion
Contrastes de Hipotesis
7.1.
Introduccion
La inferencia estadstica tiene como objetivo obtener infor sobre la poblacion

(lo que se quiere estudiar) a partir
macion
de una o varias muestras de ella misma (lo que se puede
estudiar). La inferencia es un conjunto de tecnicas y procedimientos que permiten de alguna forma cuantificar la incerti
dumbre acerca del modelo y de sus parametros.
Es deseable,
apropiada para seleccionar
que la tecnica elegida sea la mas
el modelo que permita tomar las mejores decisiones a partir
obtenida en las muestras.
de la informacion
Sintetizando, podramos decir que el objetivo de la estadstica
es obtener conclusiones sobre una caracterstica de la po a partir de la informacion
proporcionada por una
blacion
muestra, para lo cual, es clave garantizar que la muestra sea
representativa de la poblacion.
117
118
7.2.
J. L. DazBarrero
Muestreo
se entiende un conjunto homogeneo de elePor poblacion

mentos en los que se estudia una cracterstica o variable dada. Una muestra es un conjunto representativo de los ele
mentos de la poblacion.
Para obtener datos de una pobla se puede proceder de dos formas, mediante un censo
cion
o seleccionando una muestra
(se estudia toda la poblacion)
(se estudia parte de la poblacion).

Este ultimo
procedimiento
se denomina muestreo. Existen varios tipos de muestreo:
1. Muestreo aleatorio simple. Es un procedimiento de se de una muestra de forma que cada individuo de
leccion
tiene la misma probabilidad de ser elegido.
la poblacion
se realiza con reemplazamiento,
Cuando la seleccion
es identica en todas las exde forma que la poblacion
tracciones, la muestra se llama aleatoria simple.
2. Muestreo aleatorio sistematico. Se utiliza cuando el
es elevado. Para
numero
de individuos de la poblacion
realizarlo, se calcula primero el parametro

k que es la
del censo N y
parte entera del cociente entre el tamano
de la muestra n. A continuacion,
el tamanno
se selecciona aleatoriamente el primer elemento de la muestra
(ordeentre los k primeros elementos de la poblacion
criterio), el segundo entre los k
nados siguiendo algun
siguientes y as hasta completar la muestra.
3. Muestreo aleatorio estratificado. Se utiliza en poblaciones heterogeneas cuando los individuos de la pobla se agrupan en estratos (grupos de caractersticas
cion
homogeneas, como sexo, renta,...). Consiste en dividir
en estratos y mediante muestreo aleatorio
la poblacion
simple seleccionar una muestra representativa de cada uno de ellos. Puede ser constante (cuando se extrae
el mismo numero
de individuos de cada estrato) o pro
porcional (cuando el numero
de elementos que se se-

Analisis
de Datos
119
leccionan de cada estrato es proporcional al numero

de
elementos del estrato en la poblacion).

4. Muestreo aleatorio por clusters o conglomerados. Se
utiliza cuando no se dispone de un censo de la poblacion

o cuando sus individuos se hallan muy dispersos geo
graficamente.
Asume como unidades muestrales grupos
y no individuos particulares. El procedide la poblacion
miento consiste es seleccionar tantos clusters o conglomerados como individuos tenga la muestra y despues
seleccionar mediante muestro aleatorio simple un individuo de cada cluster para poder as formar una mues
tra representativa de la poblacion.
5. Muestreo aleatorio dirigido. Consiste en seleccionar
una muestra con un cierto criterio, de forma que los
individuos selecionados se supongan representativos de
la poblacion.
6. Muestreo no aleatorio por cuotas. Se utiliza en en
cuestas de opinion.
Se basa en un buen conocimiento
El investigador selecciona, segun
su cride la poblacion.
terio, el numero
de estratos o individuos que considera
apropiados para su investigacion.
mas
7. Muestreo no aleatorio deliberado. Consiste en seleccionar la muestra a partir de un segmento concreto de
(por ejemplo, la guia telefonica)
la poblacion
o seleccionando deliberadamente los individuos que se conside apropiados para constituir la muestra objeto
ran mas
de estudio.
Finalmente, comentaremos que la representatividad de una
muestra no se halla solamente en el metodo de muestreo si
o de la muestra es fundamental. Los criterios
no que el taman
de una muestra son:
generales para seleccionar el tamano
120
J. L. DazBarrero
1. El objetivo perseguido.
investigada.
2. Las caractersticas de la poblacion
3. El grado de error que se pueda tolerar.
7.3.
de Parametros
Estimacion
caracterizada por una variable aleatoria

Dada una poblacion
X, se llama muestra aleatoria a un conjunto X1 , X2 , . . . , Xn
de variables aleatorias independientes, identicamente distri y los mismos prame
buidas, todas con la misma distribucion
de densidad conjunta de la muestra
tros que X. La funcion
es
n
Y
f (xi ).
f (x1 , x2 , . . . , xn ) =
i=1
Observese que antes de tomar la muestra los Xi son variables

aleatorias que al realizarse generan la muestra x1 , x2 , . . . , xn .
de la muestra apropiada para
Un estimador es una funcion
Es una variable aleaestimar un parametro

de la poblacion.
de la v.a. por una
toria y cada vez que se realiza ( sustitucion
puntual del parametro,
muestra) produce una estimacion
i.e., un numero.
Puntual
7.3.1. Metodos de Estimacion
Dada una muestra aleatoria X1 , X2 , . . . , Xn , y una realiza de la misma x1 , x2 , . . . , xn , el metodo de los momencion
tos consiste en identificar los momentos muestrales con los
momentos poblacionales. Los estimadores de los parametros

Analisis
de Datos
121
son las soluciones del sistema de ecuaciones

k
k = E(X ) =
n
1X
Xik = m0k , k = 1, 2, . . .
i=1
El sistema, que tiene tantas ecuaciones como parametros

a
unica.
estimar, no siempre tiene solucion

Tambien pueden
utilizarse los momentos centrados en torno a la media.
El metodo de la maxima verosimilitud consiste en hallar
verosmil (prolos valores de los parametros

que hacen mas
bable) la muestra. Es decir, se trata de hallar los valores de
de verosimilitud
los parametros
que maximizan la funcion
L(1 , 2 ; x1 , x2 , . . . , xn ) =
n
Y
f (xk ; 1 , 2 ).
k=1
comodo
En la practica
es mas
maximizar el logaritmo de la
de verosimilitud, i.e.,
funcion
ln L(1 , 2 ; x1 , x2 , . . . , xn ) =
n
X
ln f (xk ; 1 , 2 ).
k=1
Uno de los objetivos que se ha de procurar conseguir cuando

de un parametro
se hace la estimacion
es, obtener de en adecuado. Al intentar
tre todos los posibles, el que sea mas
obtener este estimador es util

el concepto de error cuadatico medio (RMS) del estimador. Si = (X1 , X2 , . . . , Xn ) es
un estimador de , se llama error cuadatico

medio de a la
esperanza de la diferencia entre y , i.e.,
= E[( )2 ].
RM S()
anterior, se obtiene
Desarrollando la expresion
= E[( )2 ] = V ar()
+ [ E()]
2.
RM S()
122
J. L. DazBarrero
Como puede observarse el error cuadratico

medio es la suma
de dos cantidades no negativas, la varianza del estimador y
el cuadrado de su sesgo respecto al parametro

desconocido.
Esto pone de manifiesto que las propiedades deseables de un
pequena
estimador han de ser que su varianza sea lo mas

muestral de se concentre alreposible y que la distribucion
dedor del parametro.

Un estimador se dice que es insesgado o centrado cuando
= . Es decir, cuando su sesgo E()
= 0. Un esE()
timador con sesgo negativo subestima al parametro

y si el
sesgo es positivo lo sobrestima. Si,
= ,
lm E()
insesgado. Un esentonces el estimador es asintoticamente
timador se dice que es consistente en media cuadratica

si y
si,
solo
lm E[( )2 ] = 0.
n
eficiente que 2 si
Se dice que el estimador 1 es mas
V ar(1 ) < V ar(2 ).
Un estimador es optimo
cuando es insesgado y de varianza
mnima. Finalmente, un estimador se dice que es suficien
toda
te para un parametro
, cuando utiliza en la estimacion
contenida en la muestra sobre el parametro
la informacion
.
7.3.2.
Intervalo de probabilidad e intervalo de

confianza
Dada una muestra aleatoria X1 , X2 , . . . , Xn , sean `1 , `2 dos

funciones de la muestra, i.e.,
`i = `i (X1 , X2 , . . . , Xn ), i = 1, 2,

Analisis
de Datos
123
tales que `1 `2 y p[`1 < < `2 ] = 1 . Entonces, se

dice que (`1 , `2 ) es un intervalo de probabilidad 1 , (0 <
que se obtiene al sustituir en
< 1) para . Su realizacion,
la muestra aleatoria los valores obtenidos, se llama intervalo
de confianza al 100(1 ). %
7.4.
de la Media Muestral
Distribucion
que se
Si se considera una caracterstica de una poblacion
una variable aleatoria de parametros
distribuye segun
y
2 , i.e., X X(, 2 ) y se seleccionan un gran numero

de
n, entonces la media
muestras aleatorias simples de tamano
muestral X es una variable aleatoria que tiene por media
2
2
=
. Es decir,
X = y por varianza X
n
2
2
X X(, ) = X X ,
.
n
el Teorema del Lmite Central se tiene que indepenSegun
dientemente de la poblacion
original, la distribucion
de la media muestral X sera aproximadamente normal para muestras
suficientemente grandes (n > 30). Es decir, si X es normal,
de
entonces X sera normal independientemente del tamano
las muestras. En cambio, si X no es normal X sera aproxi para valores grandes de n.
madamente normal solo
7.5.
Intervalos de confianza en poblaciones normales
En lo que sigue, consideraremos muestras aleatorias procedentes de variables aleatorias normales o muestras grandes
de poblaciones cualesquiera.
124
J. L. DazBarrero
1. Intervalo de confianza para la media con varianza

conocida. Supongamos que X N (, 2 ), en don
de el parametro
es desconocido y deseamos obtener
un intervalo de confianza para al nivel de confianza
100(1 ) %. Para ello tomamos una muestra de ta n, X1 , X2 , . . . , Xn de una poblacion
normal o de
mano
cualquiera con n > 30 y hallamos dos
una poblacion
numeros
`1 , `2 tales que
p[`1 X `2 ] = 1 .
Para determinar los valores de `1 , `2 utilizaremos la me una normal de
dia muestral X (que se distribuye segun
2
parametros
y /n). Entonces, tipificando, resulta
Z=
/ n
que se distribuye como una N (0, 1) y por tanto, utilizan

do la normal estandard,
podemos encontrar dos valores
`1 , `2 tales que
i
h
x
`
(7.1)
p `1
2 = 1
/ n
de donde se deduce
h
i
=1
p x `2 x `1
n
n
y en consecuencia el intervalo
h
i
x `2 , x `1 .
n
n
(7.2)
(7.1) no quiere decir que `1 , `2 sean

Pero la expresion
unicos.
Entonces, de entre todos los posibles valores
tendremos que elegir aquellos que hagan mnima la longitud del in tervalo (7.2). Es decir, hemos de minimizar
(longitud del intervalo):
la funcion

L(`1 , `2 ) = x `1
x `2
= (`2 `1 )
n
n
n

Analisis
de Datos
125
dada en (7.1), i.e.,

sujeta a la condicion
Z `2
p[`1 Z `2 ] =
fZ (z) dz = 1 .
`1
Aplicando un metodo de minimizacion,

por ejemplo, el
de los multiplicadores de Lagrange, se obtienen los valores `1 = z/2 y `2 = z/2 . As, el intervalo de confianza
para la media de una normal con varianza conocida viene dado por
h
i
x z/2 , x + z/2
n
n
donde x es la media muestral observada y z/2 es tal
que p[Z > z/2 ] = .

2
2. Intervalo de confianza para la media con varianza
desconocida.
Cuando la varianza es desconocida, y la media y la varianza muestrales observadas son x y s2 , entonces un
intervalo de confianza para la media poblacional al
100(1 ) % de confianza viene dado por
h
s
s i
x t/2,n1 , x + t/2,n1
n
n
donde t/2,n1 es tal que p[tn1 > t/2,n1 ] =

y tn1
2
tStudent con n 1 grados de
sigue una distribucion
libertad.
7.6.
Contraste de Hipotesis
El objetivo de este tipo de inferencia es determinar, a partir
del analisis
de una muestra, si hay o no evidencia estadsti
ca suficiente para concluir si es o no razonable la hipotesis
hecha sobre un parametro

de la poblacion.
126
J. L. DazBarrero
de densisdad
Dada una variable aleatoria X con funcion
fX (x) y una muestra aleatoria X1 , X2 , . . . , Xn , un contraste
de hipotesis
o test parmetrico sobre los parametros
de la
consta de las siguientes fases:
poblacion
1. Una hipotesis
nula o primaria que se representa por
H0 especifica siempre el valor de uno o varios parame
tros de la poblacion.
Si se reduce a un unico
valor se
dice simple y en caso contrario compuesta.
2. Una hipotesis
alternativa que se representa por Ha o
H1 .
de la muestra
3. El test de prueba que es una funcion
de densidad conocida. Habitualaleatoria con funcion
mente un estimador del parametro.

del contraste. Se acostumbra
4. El nivel de significacion
a representar por .
para aceptar o rechazar la hipote
5. La regla de decision
sis nula. Define el rango de valores del test de prueba
para rechazar la hipotesis

primaria H0 .
La hipotesis
nula puede ser verdadera o falsa y por tanto son
posibles dos decisiones correctas:
1. No rechazarla cuando es correcta.
2. Rechazarla cuando es incorrecta.
Pero tambien son posibles dos decisiones incorrectas:
1. Rechazar H0 cuando es correcta.
2. No rechazarla cuando es incorrecta.

Analisis
de Datos
127
En este ultimo
caso, a (1) se le llama error de tipo I y a
(2) error de tipo II. La probabilidad de un error de tipo I se
representa por y la de un error de tipo II por . Se llama
potencia del contraste al valor 1 . Cuando la hipotesis

H1 es compuesta el error de tipo II esta definido para una
infinidad de valores. Entonces, es una curva (caracterstica
y en este caso 1 es la funcion
de potencia
de operacion)
del test.
7.6.1.
Contrastes para la media
1. Test de dos colas
Hipotesis
nula :
H0 : = 0
Hipotesis
alternativa :
Test de prueba:
z=
HA : 6= 0
x 0
/ n
: Rechazo de H0 si z > z/2 o si

Regla de decision
z < z/2 , o equivalentmente, rechazo de H0 si |z| >
z/2 .
2. Test de una cola por la derecha
Hipotesis
nula :
H0 : = 0
Hipotesis
alternativa :
Test de prueba:
:
Regla de decision
z=
H A : > 0
x 0
/ n
Rechazo de H0 si z > z .
128
J. L. DazBarrero
3. Test de una cola por la izquierda
Hipotesis
nula:
H0 : = 0
Hipotesis
alternativa:
Test de prueba:
:
Regla de decision
z=
H A : < 0
x 0
/ n
Rechazo de H0 si z < z .
En poblaciones de varianza desconocida sx . A continua se exponen algunos ejemplos de test parametricos.

cion,
7.7.
Analisis de la Varianza
El objetivo que se pretende con este analisis

es la compa de las medias de dos o mas
poblaciones cuando los
racion
datos son cuantitativos. La tecnica que se utiliza emplea las
varianzas muestrales para detectar las diferencias entre las
por la que se conoce como analimedias, siendo esta la razon
sis de la varianza o metodo ANOVA. Dadas k poblaciones
Xi N (i , 2 ), i = 1, 2, . . . , n,
que se suponen normales con medias desconocidas y varian
zas desconocidas pero iguales (homocedasticas),
se seleccionan k muestras independientes
Mi (ni , xi , s2i ), i = 1, 2, . . . , k.
se realiza el siguiente test de hipotesis:
A continuacion
1. Hipotesis
nula:
H0 : 1 = 2 = . . . = k .

Analisis
de Datos
129
2. Hipotesis
alternativa: H1 : Al menos dos medias son
diferentes.
3. Test de prueba: El estadstico de prueba que se utiliza
tiene en cuenta tanto la variabilidad entre los grupos
(muestras) como la variabilidad dentro de cada grupo (muestra). Se denotan por SST (sum of squares for
treatments) y SSE (sum of squares for error) respectivamente. Se definen por
SST =
k
X
nj (xj x)2 ,
j=1
donde x es la media de todas las observaciones, y

SSE =
nj
k X
X
(xij xj ) =
j=1 i=1
k
X
(nj 1)s2j .
j=1
se evaluan las medias de los cuadraA continuacion

dos:
SST
SSE
M ST =
,
M SE =
k1
nk
y el test de prueba que se utiliza es
F =
M ST
M SE
con 1 = k 1 grados de libertad del numerador y 2 =

n k grados de libertad del denominador.
Rechazo de H0 si F > F,k1,nk .
4. Regla de decision:
Los calculos
anteriores se acostumbran a disponer en
una tabla como la que se describe a continuacion.
130
J. L. DazBarrero
Tabla ANOVA
variabilidad
df
SS
e.m.
k-1
SST
d.c.m
n-k
SSE
Total
n-1
SS(Total)
MS
SST
MST=
k1
SSE
MSE=
nk
F-ratio
F=
M ST
M SE
Ejemplo 7.7.1 Un nuevo producto ha sido introducido en el

mercado de los materiales de construccion.
Para saber si hay
diferencia entre las medias de ventas de tres importantes mercados regionales se han anotado las ventas de los ultimos
8
das y se han obtenido (en unidades apropiadas) los siguientes resultados:

Mercado 1 15 17
Mercado 2 10 12
Mercado 3 13 18
22 20 18
15 17 12
19 16 17
16 14
13 15
16 15
19
16
18
Se puede concluir al 5 % de significacion

que hay diferencia
entre las medias de ventas de los tres mercados? (Se supone
que las poblaciones son normales y con varianzas iguales).
Solucion.
son:
En este caso las hipotesis
1. H0 : 1 = 2 = 3
2. H1 : Al menos dos medias son diferentes.

Analisis
de Datos
131
3. Estadstico de prueba:
x1 =
x2 =
x3 =
x=
SST =
15 + 17 + . . . + 19
8
10 + 12 + . . . + 16
8
13 + 18 + . . . + 18
8
15 + 17 + . . . + 18
24
3
X
=
=
=
=
141
8
110
8
132
8
383
24
= 17,625
= 13,750
= 16,500
= 15,958
nj (xj x)2 = 63,59.
j=1
s21 = 7,125,
s22 = 5,643,
s23 = 3,714
SSE = (n1 1)s21 + (n2 1)s22 + (n3 1)s23 = 115,375

SST
63,59
M ST =
=
= 31,80
k1
31
115,375
SSE
M SE =
=
= 5,49
nk
24 3
M ST
31,80
F =
=
= 5,79.
M SE
5,49
El numero
de grados de libertad del numerador es 1 =
k 1 = 3 1 = 2 y los del denominador 2 = n k =
24 3 = 21, por tanto, F,1 ,2 = F0,05,2,21 = 3,47.
Rechazamos H0 si F > F,1 ,2 . Por
tanto, dado que 3,47 < 5,79, en base a los datos analiza
dos, rechazaremos la hipotesis
primaria al 5 % de nivel
de significacion.
2
132
J. L. DazBarrero
Los datos de la tabla ANOVA se pueden utilizar para obtener

intervalos de confianza para las medias de cada una de las
poblaciones y para la diferencia de medias entre dos de ellas
mediante las expresiones:
s
M SE
xj t/2,nk
nj
s
1
1
(xj xm ) t/2,nk M SE
+
.
nj
nm
Considerando el mismo ejemplo de antes hallaremos intervalos de confianza al 95 % para 1 y 1 2 respectivamente.
En el primer caso es x1 = 17,625 y s1 = 2,67. Por tanto, si
1 = 95 % el metodo tradicional da:
s1
2,67
x1 t/2,n1 1 = 17,625 2,365 = 17,625 2,23
n
8
con una cota de error E = 2,23. En cambio, utilizando la
tabla ANOVA se obtiene
s
M SE
x1 t/2,21
n1
r
5,49
= 17,625 2,080
= 17,625 1,72
8
con una cota de error E = 1,72. Dado que en este caso la
es mejor.
cota de error es menor la estimacion
En el segundo caso, el intervalo pedido es
s
1
1
(x1 x2 ) t/2,nk M SE
+
n1
n2
p
= (17,625 13,75) 2,080 5,49(1/8 + 1/8) = 3,875 2,44
y el intervalo de confianza es [1,435, 6,315].

Analisis
de Datos
7.8.
133
Test de Chi-cuadrado
El objetivo que se pretende con este tipo de tests es comparar

poblaciones. La tecnica utililas proporciones de dos o mas
zada es parecida a la que se utiliza en las tablas ANOVA pero
con variables cualitativas. Los test que habitualmente se realizan son los de bondad del ajuste y de independencia.
Supongamos que realizamos un experimento tal que sus resultados se pueden clasificar en k categoras o celulas, y que
supondremos que las probabilo repetimos n veces. Ademas
lidades o proporciones de los diferentes resultados son
p1 , p2 , , pk ,
p1 + p2 + + pk = 1,
y que en el total de las n repeticiones las frecuencias observadas de cada uno de estos resultados ha sido:
O1 , O2 , , Ok ,
O1 + O2 + + Ok = n.
Entonces un Test de bondad de ajuste consiste en :

1. H0 : 1 = p10 , 2 = p20 , , k = pk0 .
2. Ha : Al menos un i 6= pi0 .
: .
3. Nivel de significacion
4. Estadstico de contraste:
2 =
k
X
(Oi ei )2
i=1
ei
donde ei = npi (frecuencia esperada).

Rechazo de H0 si 2 > 2,k1 .
134
J. L. DazBarrero
Ejemplo 7.8.1 Cosiderar 300 repeticiones de un mismo experimento con 5 celulas

donde las frecuencias observadas son:
Categora
Frecuencia
1
2
24 65
3
4
5
86 70 55
contrastar las hipotesis

:
1. H0 : 1 = 0,1, 2 = 0,2, 3 = 0,3, 4 = 0,2, 5 = 0,2

2. H1 : Al menos un i 6= pi0 .
con un nivel de significacion
del 1 %.
Solucion.
y fijado el nivel de sig Una vez hechas las hipotesis
se procedera a evaluar el estadstico de contraste:
nificacion
e1 = np1 = 300(0,1) = 30, e2 = np2 = 300(0,2) = 60
e3 = np3 = 300(0,3) = 90, e4 = np4 = 300(0,2) = 60,
e5 = np5 = 300(0,2) = 60.
2 =
5
X
(Oi ei )2
i=1
ei
(86 90)2
(24 30)2
30
(70 60)2
(65 60)2
60
(55 60)2
90
60
60
36
25
16
100
25
=
+
+
+
+
= 3,88.
30
60
90
60
60
El valor de 20,01,4 = 13,27. Dado que 3,88 < 13,27, en base a
estos datos, no se puede rechazar la hipotesis

nula.
2
El segundo test de chi-cuadrado trata con datos ordenados
en una tabla de contingencia y determina si dos clasifica cualitativa son o no independientes.
ciones de una poblacion
Las hipotesis
a contrastar son:

Analisis
de Datos
135
1. H0 :
Las dos clasificaciones son independientes.
2. H1 :
Las dos clasificaciones son dependientes.
3. Estdstico de contraste:
2 =
h X
k
X
(Oij eij )2
i=1 j=1
eij
eij =
P
P
( Fi ) ( Cj )
n
: .
Rechazo de H0 si 2 > 2,(h1)(k1) ,
donde h es el numero
de filas de la matriz de contingen
cia y k el numero
de columnas.
Ejemplo 7.8.2 En un momento determinado el gobierno de
una Cominudad Autonoma
tiene dos opciones en poltica economi
ca: recortar el Gasto publico

o subir los impuestos. Antes de to
mar ninguna descision
se realiza un sondeo entre la poblacion
del que resulta:
Afiliacion
R.G.P
A
62
B
103
C
31
Totales
196
S.I.
90
85
29
204
Totales
152
188
60
400
Se puede concluir al 10 % de nivel de significacion

que hay
relacion
entre la afiliacion
poltica y el soporte del electorado a
cada una de las opciones economicas?.
Solucion.
a contrastar son:
Las hipotesis
1. H0 :
Las dos opciones son independientes.
2. H1 :
Las dos opciones son dependientes.
136
J. L. DazBarrero
3. Estadstico de contraste:
h X
k
X
(Oij eij )2
i=1 j=1
eij
Afiliacion
R.G.P
A
62(74.48)
B
103(92.12)
C
31(29.40)
Totales
196
(103 92,12)2
92,12
eij
95,88
29,40
(85 95,88)
Totales
152
188
60
400
(62 74,48)2
(31 29,40)2
eij =
S.I.
90(77.52)
85(95.88)
29(30.60)
204
k
h X
X
(Oij eij )2
i=1 j=1
P
P
( Fi ) ( Cj )
74,48
(90 77,52)2
77,52
2
(29 30,60)
30,60
= 6,79
El valor del modelo de probabilidad es 20,1,(31)(21) = 20,1,2 =

4,60517. Dado que 6,79 > 4,60 hemos de rechazar H0 , lo que
significa que los datos obtenidos en este sondeo aportan evi endencia estadstica suficiente para creer que hay relacion
poltica y el soporte a la opcion
economica.
tre la afiliacion
2
7.9.
Problemas de inferencia
Problema 7.1 El gerente de una fabrica

de pinturas para la
se
nalizacion
de las carreteras ha observado que el conntenido
de las bolsas medianas (33 kg.) se distribuye normalmente
con media 33,2 y desviacion
0,3. Se pide:
estandard

Analisis
de Datos
137
1. Hallar la probabilidad que una bolsa de pintura comprada por un cliente contenga menos de 33 kg.
2. Probabilidad de que si compra un paquete de 6 bolsas, la
media del contenido de estas
sea inferior a 33 kg.
Solucion.
El contenido de las bolsas de pintura es una v.a. X
que se distribuye normalmente con media 33,2 y desviacion
esandard
0,3, i.e. X = N (33,2, 0,3).
x
de tipificacion
es z =
1. En este caso la ecuacion
=
33 33,2
= 0,667 y P [x < 33] = P [z < 0,667] =
0,3
0,2514.
2. X es una v.a. normalmentedistribuidacon media 33,2
estandard
y desviacion
/ n = 0,2/ 6 = 0,12. Por
x 33,2
tanto, X = N (33,2, 0,12), z =
= 1,667 y
0,12
P [x < 33] = P [z < 1,667] = 0,0485.
2
Problema 7.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria de
una distribucion
normal con funcion
de densidad de probabilidad
h 1 x 2 i
1
.
fX (x) = exp
2
2
Hallar por metodo
de la maxima
verosimilitud estimadores de
2
y . En una realizacion
de la muestra con n = 10 se han observado los valores: 26,3, 35,1, 23,0, 28,4, 31,6, 30,9, 25,2, 28,0,
27,3, 29,2. Utilizar los resultados anteriores para obtener estimaciones de los parametros
y 2.
138
J. L. DazBarrero
de verosimiSolucion.
En primer lugar definiremos la funcion
2
litud que dependera de los parametros

y . Es decir,
n
Y
h 1 x 2 i
1
k
L(, ; x) =
exp
2
2
k=1
2
n
i
h
1 n
1 X
2
(xk ) .
exp 2
2 k=1
2
procederemos a maximizar la funcion
A continuacion
ln L(, 2 ; x) =
n
2
ln 2
n
2
n
1 X
ln 2
2 2
(xk )2 .
k=1
Para ello calcularemos sus derivadas parciales respecto a

y 2 y resolveremos el sistema de ecuaciones
ln L(, 2 ; x)
ln L(, 2 ; x)
2
=
n
2 2
n
1 X
(xk ) = 0
k=1
n
1 X
2 4
(xk )2 = 0.
k=1
y sustituyendo en la
Despejando de la primera ecuacion
segunda se obtienen los estimadores
b=
n
1X
n k=1
Xk ;
b2 =
n
1X
(Xk X)2 .
n k=1
de la muestra, una estimaUna vez tenemos una realizacion

de la media es x = 28,5 y una estimacion
de la varianza
cion
2
es s = 10,71.
2
Problema 7.3 Sea X una variable aleatoria que se distribuye
segun
una N (, 2 ) con conocida. Se pide:

Analisis
de Datos
139
1. Cual
es el nivel de confianza para el intervalo

x 2,58 , x + 2,58 .
n
n
2. Cual
es el nivel de confianza para el intervalo x1,645 .
n
3. Calcular un intervalo para la media al 95 % de confianza cuando n = 100 y x = 58,3 (Tomar = 3).
Solucion.
1. Si z/2 = 2,58 esto significa que p[z > 2,58] = /2 o

eqivalentemente que p[z 2,58] = 1 /2. Directamente de las tablas de la N (0, 1) se obtiene 1 /2 =
0,9951, = 0,0098 y el nivel de confianza es 100(1
) % = 99 %.
2. Procediendo como en el caso anterior el nivel de confianza es 100(1 ) % = 90 %.
3. Un intervalo de confianza para la media viene dado por
3
x z/2 = 58,3 1,96
= 58,3 0,588 o equin
100
valentemente (57,71, 58,89).
2
Problema 7.4 Un test de turbidez realizado sobre 16 muestras de aguas arenosas en el delta de un rio arrojo los siguientes resultados:
26,7 25,8 24,0 24,9 26,4 25,9 24,4 21,7
24,1 25,9 27,3 26,9 27,3 24,8 23,6 25,0
Suponiendo que el muestreo se llevo a cabo sobre una poblacion
normal, estimar intervalos al 90 %, 95 % y 99 % de nivel
de confianza para la media de turbidez .
140
J. L. DazBarrero
Solucion.
Se trata de obtener estimaciones de intervalos de
normal de varianza
confianza para la media de una poblacion
desconocida a partir de una muestra de 16 observaciones.
Las estimaciones las obtendremos al realizar los estimadores
S
S
`1 = X t/2,n1 y `2 = X +t/2,n1 sobre la muestra.
n
n
Teniendo en cuenta que x = 25,29 y s = 1,47, entonces:
1. Si 1 = 90 %, /2 = 0,05, t/2,15 = 1,753 y la estima1,47
del intervalo es 25,29 1,753
= 25,29 0,64,
cion
4
i.e., (24,65, 25,93).
2. Si 1 = 95 %, /2 = 0,025, t/2,15 = 2,131 y la estima1,47
cion
= 25,29 0,78,
4
i.e., (24,51, 26,07).
3. Si 1 = 99 %, /2 = 0,005, t/2,15 = 2,947 y la estima1,47
cion
= 25,29 1,08,
4
i.e., (24,21, 26,37).
2
Problema 7.5 Una compa
na que produce neumaticos
para
automoviles
de turismo esta considerando la posibilidad de in
torducir una cierta modificacion
no de sus productos.
en el dise
El gerente de la compa
na considera que la inversion
economi
ca que supone dicha modificacion
estara justificada solo
si
se aumentase la duracion
que ac promedio de los neumaticos
tualmente es de 20000 km. Se selecciona una muestra aleatoria de 16 prototipos del neumatico
modificado y se observa que
la duracion
promedio de los mismos es de 20758 km. Suponiendo que la vida media de los neumaticos
se distribuye normal
mente con desviacion
1500 km. (La del neumatico
estandard
que actualmente se fabrica), sugiere este experimento que se

Analisis
de Datos
141
dan las condiciones apropiadas para que el gerente autorice el

cambio de dise
no? (Tomar = 0,01).)
Solucion.
Se realizara un test parametrico para la media que
consta de las siguientes fases:
1. Hipotesis
primaria H0 : = 20000.
2. Hipotesis
alternativa H1 : > 20000.
y cuantil que marca la zona de
rechazo de la hipotesis primaria: = 0,01, z = z0,01 =

2,33.
4. Estadstico de contraste: z =
20758 20000
x 0
=
=
/ n
1500/ 16
2,02.
5. Como z = 2,02 < 2,33 = z0,01 , en base a los datos
contenidos en esta muestra, no se puede rechazar la
hipotesis
primaria y por tanto se recomienda continuar
tal y como se venia haciendo hasta ahora.
la produccion
2
Problema 7.6 Una empresa de telefona movil

realiza una encuesta entre 470 personas para determinar si la opinion
de las
personas respecto a la instalacion
de una antena, depende de
la distancia entre su lugar de residencia y la ubicacion
de la
antena. Para ello se clasifico a los encuestados en tres zonas
(zona 1, zona 2, zona 3) siendo la zona 1 la mas
y la
proxima
zona 3 la mas
alejada del lugar donde se piensa instalar la
antena. La informacion
obtenida es
142
J. L. DazBarrero
Opinion
zona 1 zona 2
A favor
40
55
En contra
85
70
Indecisos
30
40
Total
155
165
zona 3 Total
60
155
50
205
40
110
150
470
1. Contrastar la independencia entre la opinion

acerca de la
antena y la distancia a la misma ( = 0,05).
2. Comentar la discrepancia entre las frecuencias observadas y esperadas para la zona 1.
Solucion.
1) Las frecuencias esperadas son
Opinion
zona 1
A favor
51.12
En contra 67.61
Indecisos
36.28
Total
155
zona 2 zona 3
54.51 49.47
71.97 65.43
38.62 35.11
165
150
Total
155
205
110
470
Entonces 2 = 14,448 y 20,05,4 = 9,49. Por tanto, RH0 .

(2) Para la zona 1, el rechazo es mayor que el que sera de
esperar si las caractersticas fueran independientes.
2

Libro de Estadistica

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Libro de Estadistica

Enviado por

Direitos autorais:

Formatos disponíveis

Indice general

1.4. Conjuntos de Datos

2. Analisis exploratorio de datos univariantes

2.2.1. Distribuciones de frecuencias

2.2.2. Diagramas de puntos y de tallo y hojas

2.3. Representaciones graficas

2.3.2. Diagrama de rectangulos

2.3.6. Diagramas de linea o cartas temporales . 23

2.4.4. Los Percentiles . . . . . . . . . . . . . . . 28

2.5. Problemas de Analisis

3.1. Variables bidimensionales . . . . . . . . . . . . 45

3.2. Ajuste mnimo-cuadratico

3.3. Problemas de Analisis

4.3.1. Variaciones con repeticion

4.3.3. Permutaciones ordinarias . . . . . . . . . 64

4.3.6. Combinaciones con repeticion

4.8. Problemas de Probabilidad . . . . . . . . . . . . 73

5.1. Variables aleatorias discretas . . . . . . . . . . 85

6. Variables Aleatorias Continuas

6.4. El teorema del Lmite Central . . . . . . . . . . 107

de la Media Muestral . . . . . . . . 123

7.6. Contraste de Hipotesis

7.9. Problemas de inferencia . . . . . . . . . . . . . 136

mas. Por tanto, el objetivo del analisis

Analisis descriptivo de datos

Tiene por objeto deducir informacion

La primera consiste en aproximar los parametros

para decidir si las hipotesis

de datos consta de las siguientes faEn general, un analisis

En cualquier caso, el analisis

Conceptos fundamentales en el analisis

en discretos y continuos. Segun

valores aproximados de los parametros

Este apartado se puede concluir diciendo que el analisis

1. En la siguiente tabla aparecen 80 datos que han sido

2. Los siguientes datos corresponden al tiempo medio (en

aleatoriamente en una gran ciudad y su area

Problema 1.1 Para los conjuntos de datos anteriores se pide:

encargada de contar, organizar, resumir y representar grafi

res dentro de un intervalo. El numero

cos recibidos por un usuario o el numero

racterstica observada toma solo los valores cero y/o uno.

datos en tablas y representarlos graficamente

Antes de proceder a la representacion

es conveniente utilizar un procedimiento semigrafico,

Se denomina frecuencia relativa del valor xi a la proporcion

Con las frecuencias relativas se elimina la influencia del nume entre

conjuntos de datos de distinto tamano.

Cuando los valores x1 , x2 , , xk admiten una ordenacion

tiene sentido hablar de frecuencia acumulada hasta el va creciente x1 x2

Estos resultados se acostumbran a representar en tablas

de los datos en tablas de frecuencias

Ejemplo 2.2.1 De los 60 estudiantes que asisten a clase, 40

X que toma los valores {Cataluna,Espa

fa (xi ) fr (xi )( %) Fa (xi ) Fr (xi )( %)

veces diarias que se han producido deficiencias en el sumunistro electrico

Presentar los datos en una tabla de frecuencias y concluir si el

fa (xi ) fr (xi ) Fa (xi ) Fr (xi )

En base a los datos contenidos en la tabla se puede decir

ii. Decidir el numero

Tambien se acostumbra a utilizar la raz cuadrada por

exceso del numero