Você está na página 1de 142

Indice general

1. Analisis de Datos

1.1. Introduccion
. . . . . . . . . . . . . . . . . . .

1.2. Analisis
descriptivo de datos . . . . . . . . . . .

1.3. Analisis
inferencial . . . . . . . . . . . . . . . .

1.4. Conjuntos de Datos

. . . . . . . . . . . . . . . 10

2. Analisis exploratorio de datos univariantes

13

2.1. Introduccion
. . . . . . . . . . . . . . . . . . . 13
de los datos
2.2. Presentacion

. . . . . . . . . . . . 14

2.2.1. Distribuciones de frecuencias

. . . . . . 15

2.2.2. Diagramas de puntos y de tallo y hojas

. 20

2.3. Representaciones graficas


. . . . . . . . . . . . 21
2.3.1. Diagramas de sectores

. . . . . . . . . . 21

2.3.2. Diagrama de rectangulos


. . . . . . . . . 22
2.3.3. Diagrama de Pareto . . . . . . . . . . . . 22
2.3.4. Histogramas . . . . . . . . . . . . . . . . 22
1

J. L. DazBarrero
2.3.5. Polgonos de frecuencies

. . . . . . . . . 23

2.3.6. Diagramas de linea o cartas temporales . 23


numerica de datos
2.4. Descripcion

. . . . . . . . . 23

. . . . . . . . . . 24
2.4.1. Parametros
de posicion
2.4.2. La media aritmetica . . . . . . . . . . . . 24
2.4.3. La Mediana

. . . . . . . . . . . . . . . . 27

2.4.4. Los Percentiles . . . . . . . . . . . . . . . 28


2.4.5. La Moda . . . . . . . . . . . . . . . . . . 29

. . . . . . . . . 29
2.4.6. Parametros
de dispersion
2.4.7. Rango de un conjunto de datos . . . . . . 29
2.4.8. Rango intercuartlico . . . . . . . . . . . 30
2.4.9. Desviaciones respecto a la media . . . . . 30
tpica . . . . . 30
2.4.10.La varianza y la desviacion
media . . . . . . . . . . . . . 32
2.4.11.Desviacion
de Pearson
2.4.12.Coeficiente de variacion

. . . 32

2.4.13.Parametros
de simetra . . . . . . . . . . 33

2.4.14.Parametros
de forma . . . . . . . . . . . 34
2.4.15.Momentos muestrales . . . . . . . . . . . 34
de valores atpicos . 35
2.4.16.Box-plot y deteccion
2.4.17.T ransformaciones . . . . . . . . . . . . . 36

2.5. Problemas de Analisis


exploratorio de datos
3. Analis exploratorio de datos bivariantes

. . 37
45


Analisis
de Datos

3.1. Variables bidimensionales . . . . . . . . . . . . 45

3.2. Ajuste mnimo-cuadratico


. . . . . . . . . . . . 47

3.3. Problemas de Analisis


Exploratorio de Datos Bivariantes . . . . . . . . . . . . . . . . . . . . . 51
4. Conceptos Basicos de Probabilidad

57

4.1. Introduccion
. . . . . . . . . . . . . . . . . . . 57
axiomatica

4.2. Definicion
de probabilidad . . . . . . 59
4.3. Tecnicas de conteo. Combinatoria . . . . . . . . 62

4.3.1. Variaciones con repeticion


4.3.2. Variaciones ordinarias

. . . . . . . . 62

. . . . . . . . . . 63

4.3.3. Permutaciones ordinarias . . . . . . . . . 64


. . . . . . . 64
4.3.4. Permutaciones con repeticion
4.3.5. Combinaciones ordinarias

. . . . . . . . 65

4.3.6. Combinaciones con repeticion


. . . . . . 66
4.4. Probabilidad condicional . . . . . . . . . . . . . 68
4.5. Sucesos dependientes e independientes . . . . . 69
4.6. Teorema de las probabilidades totales . . . . . . 71

4.7. Formula
de Bayes

. . . . . . . . . . . . . . . . 72

4.8. Problemas de Probabilidad . . . . . . . . . . . . 73


5. Variables Aleatorias Discretas

85

5.1. Variables aleatorias discretas . . . . . . . . . . 85


5.2. Modelos probabilsticos discretos . . . . . . . . 89

J. L. DazBarrero
de Bernoulli . . . . . . . . . 89
5.2.1. Distribucion
Binomial . . . . . . . . . 90
5.2.2. La Distribucion
uniforme discreta . . . . . . 91
5.2.3. Distribucion
geometrica . . . . . . . . 91
5.2.4. La distribucion
de Poisson . . . . . . . . 92
5.2.5. La distribucion
5.2.6. Perodo de retorno . . . . . . . . . . . . . 94
5.3. Problemas . . . . . . . . . . . . . . . . . . . . . 94

6. Variables Aleatorias Continuas

101

6.1. Parametros
de una variable aleatoria continua . 103
6.2. Modelos probabilsticos continuos . . . . . . . . 104
uniforme continua
6.2.1. Distribucion

. . . . . 104

exponencial . . . . . . . . . 104
6.2.2. Distribucion
Normal
6.3. La Distribucion

. . . . . . . . . . . . . 105

6.4. El teorema del Lmite Central . . . . . . . . . . 107


6.5. Problemas . . . . . . . . . . . . . . . . . . . . . 109
de Parametros.
7. Inferencia Estadstica: Estimacion

Contrastes de Hipotesis
117

7.1. Introduccion
. . . . . . . . . . . . . . . . . . . 117
7.2. Muestreo . . . . . . . . . . . . . . . . . . . . . 118
de Parametros

7.3. Estimacion
. . . . . . . . . . . . 120
Puntual . . . . . 120
7.3.1. Metodos de Estimacion
7.3.2. Intervalo de probabilidad e intervalo de
confianza . . . . . . . . . . . . . . . . . 122


Analisis
de Datos

de la Media Muestral . . . . . . . . 123


7.4. Distribucion
7.5. Intervalos de confianza en poblaciones normales 123

7.6. Contraste de Hipotesis


. . . . . . . . . . . . . . 125
7.6.1. Contrastes para la media . . . . . . . . . 127

7.7. Analisis
de la Varianza . . . . . . . . . . . . . . 128
7.8. Test de Chi-cuadrado

. . . . . . . . . . . . . . 133

7.9. Problemas de inferencia . . . . . . . . . . . . . 136

J. L. DazBarrero

Captulo 1
Analisis de Datos
1.1.

Introduccion

El analisis
de datos, tecnicas cuantitativas o estadstica es el
conjunto de metodos y procedimientos encargados de la ob de informacion
util
a partir de un conjunto de datos.
tencion

Consiste en la recopilacion,
presentacion,
analisis
y uso de
de probledatos para la toma de decisiones y la resolucion

mas. Por tanto, el objetivo del analisis


de datos es la toma de
decisiones frente a la incertidumbre.

1.2.

Analisis descriptivo de datos

Los metodos descriptivos tienen por objeto organizar y resumir los datos disponibles de manera que sea posible perci
bir rapidamente
las caractersticas principales y las posibles
anomalas de los procesos de que provienen, sin intentar in alla de los propios datos.
ferir nada que vaya mas
7

J. L. DazBarrero

1.3.

Analisis inferencial

util

Tiene por objeto deducir informacion


sobre una pobla a partir del analisis

cion
de muestras de la misma. Hay dos
formas de abordar el problema:
de parametros

1. Estimacion

estadstica
2. Contraste de hipotesis
o decision

La primera consiste en aproximar los parametros


poblacionales con estadsticos muestrales adecuados o bien calculando intervalos muy probables de posibles valores. En cam estadstica consiste basicamente

bio, la decision
en estable

cer hipotesis
sobre los parametros
poblacionales y a conti utilizar la informacion
contenida en las muestras
nuacion

para decidir si las hipotesis


formuladas son o no aceptables.

de datos consta de las siguientes faEn general, un analisis


ses:
Planteamiento del problema que se desea estudiar
de un plan para la recogida de datos
Diseno

Analisis
exploratorio de los datos (tabulacion,
sntesis,
de valores anomalos

de primeras
deteccion
y obtencion
conclusiones)
del problema
Modelacion
del modelo
Validacion
Toma de decisiones


Analisis
de Datos

En cualquier caso, el analisis


de datos no dira cual es la
que se ha de tomar, sino que aportara informacion

decision
para que, juntamente con otras consideraciones, se este en
condiciones para tomarla.

Conceptos fundamentales en el analisis


de datos son los de
poblacion
y muestra. La poblacion
es el conjunto de todos los
elementos que tienen una determinada caracterstica, es de
cir, lo que se quiere estudiar. Los elementos de una poblacion
se llaman individuos o unidades muestrales. Una muestra es
i.e., lo que se puede
cualquier subconjunto de la poblacion,

estudiar. El numero
de elementos de que consta es el tama
no
o extension
de la muestra. Una muestra es aleatoria cuando
tiene la misma probabilidad
cada individuo de la poblacion
de ser incluido en ella.
su caracter

Segun
los datos se clasifican en cualitativos o

a su vez se clasifican
atributos y cuantitativos. Estos ultimos
el numero

en discretos y continuos. Segun


de datos observa estos se clasifican en
dos en cada individuo de la poblacion
de un dato).
univariantes (un solo dato) o multivariantes (mas
que se considera
Finalmente, se expone el orden de actuacion
adecuado para el tratamiento de los datos:
mas

depuracion
y presentacion
analtiRecogida, ordenacion,
ca (tablas) de los datos
grafica

Representacion
de estadsticos muestrales y obtencion
de
Evaluacion

valores aproximados de los parametros


poblacionales.

10

J. L. DazBarrero

Este apartado se puede concluir diciendo que el analisis


de
datos es un elemento decisivo para el incremento de la calidad, dado que las tecnicas cuantitativas permiten estudiar
la variabilidad, entendida como el resultado de los cambios
en las condiciones sobre las que se hacen las observaciones.

1.4.

Conjuntos de Datos

1. En la siguiente tabla aparecen 80 datos que han sido


simulados con MS Excel:
24,34
49,36
26,64
47,18
31,38
62,20
49,21
69,64
52,06
59,28

46,31
48,21
44,57
51,00
67,82
61,73
35,40
46,17
56,69
45,71

48,86
78,95
45,49
62,41
40,01
53,72
37,50
59,55
35,23
52,20

48,70
63,49
40,24
40,85
31,39
56,24
56,71
29,77
57,12
57,18

60,86
34,43
51,89
49,88
42,61
68,47
43,46
55,63
60,50
33,40

39,77
41,82
61,30
61,22
36,32
41,38
63,56
61,75
40,18
47,03

33,98
55,73
73,09
56,36
68,77
66,33
48,31
32,25
55,98
47,85

47,77
53,86
46,23
59,12
33,12
47,07
59,64
65,27
45,66
62,55

2. Los siguientes datos corresponden al tiempo medio (en


segundos) de envasado de una botella de agua mineral:
1,23
2,12
1,41
2,32
2,75
1,77

2,01
2,10
1,88
2,12
1,32
2,25

1,72
1,86
2,10
2,01
2,11
1,71

2,21
1,64
2,04
1,78
2,24
1,53

2,05
1,77
2,08
2,19
2,42
1,64

1,96
1,90
2,06
2,14
2,31
2,06

1,94
1,74
1,76
2,34
2,03
2,00

2,13
1,75
2,09
2,19
1,96
1,83

2,18
2,50
2,00
2,07
1,82
2,05

2,17
1,79
1,87
1,89
1,78
1,63

3. Los siguientes datos corresponden a porcentajes de basura reciclada obtenidos en 100 puntos seleccionados


Analisis
de Datos

11

aleatoriamente en una gran ciudad y su area


Metropolitana:
13
22
26
49
29
43
45
43
32
35

25
52
29
36
45
34
33
27
47
47

12
34
37
47
45
22
39
37
47
36

27
29
32
27
55
22
45
36
39
28

45
55
54
46
32
47
27
48
57
25

56
36
30
38
25
39
28
55
28
36

27
49
37
42
23
25
46
34
24
31

34
44
29
53
40
41
40
33
29
43

38
47
38
41
30
29
44
47
25
42

34
61
43
34
31
44
48
35
55
48

Problema 1.1 Para los conjuntos de datos anteriores se pide:


1. Ordenarlos, clasificarlos e intentar decir algo sobre la informacion
contenida en ellos y presentarla de forma resumida.
2. A la vista de lo obtenido en el apartado anterior, se pueden sacar algunas conclusiones? cuales?

12

J. L. DazBarrero

Captulo 2
Analisis exploratorio de
datos univariantes
2.1.

Introduccion

El Analisis
descriptivo de datos es la parte de la Estadstica

encargada de contar, organizar, resumir y representar grafi


camente los datos de forma que sean facilmente
perceptibles
sus principales caractersticas. Los elementos de trabajo son
los datos (variables estadsticas) y e stos, como ya se ha comentado, pueden ser cualitativos o cuantitativos.
La variables cualitativas describen cualidades de los elemen y no toman valores numericos. Por ejemtos de la poblacion
plo, la ciudad donde se ha nacido, el color del pelo, la ocupa de los padres, etc., son datos cualitativos.
cion
Las variables cuantitativas toman valores numericos y pue
den ser discretas (toman valores numericos enteros en numero finito o infinito numerable) y continuas cuando toman valo

res dentro de un intervalo. El numero


de mensajes electroni13

14

J. L. DazBarrero

cos recibidos por un usuario o el numero


de veces que se
ha de lanzar una moneda hasta que aparezca cara son ejemplos de variables discretas. La hora de llegada de un tren a la
el porcentaje de ocupacion
hotelera de una deterestacion,
de unas acciones en Bolsa,
minada comarca o la cotizacion
son ejemplos de datos cuantitativos continuos.
cuando la caTambien se utilizan las variables dicotomicas

racterstica observada toma solo los valores cero y/o uno.


Suele ser una variable cualitativa, reflejando dos modalidades posibles o la presencia o ausencia de una cualidad.
Un caso intermedio entre las variables cualitativas y las cuantitativas son las variables ordinales cuando los valores tienen
Por ejemun caracter nominal pero admiten una ordenacion.
(muy insatisfecho, insatisfecho,
plo, las variables de opinion
indiferente, satisfecho, muy satisfecho).
Finalmente, cuando sobre un mismo individuo se observa
de una caracterstica diremos que se trata de una variamas
ble multidimensional.

2.2.

de los datos
Presentacion

Se trata basicamente
de establecer la forma de organizar los

datos en tablas y representarlos graficamente


mediante dia
pergramas con el objetivo de proporcionar una rapida
y facil
de algunas de sus principales caractersticas.
cepcion
Habitualmente los datos se organizan en tablas llamadas dis
tribuciones de frecuencias y se representan graficamente
mediante diagramas: de puntos, de rectangulos,
de barras y sec
tores, histogramas, polgonos de frecuencias, cartas temporales, pictogramas, etc..
grafica

Antes de proceder a la representacion


de los datos


Analisis
de Datos

15

es conveniente utilizar un procedimiento semigrafico,


conocido como diagrama de tallo y hojas que sirve para ordenar
los datos y para hacernos una idea de como e stos se hallan
distribuidos.

2.2.1.

Distribuciones de frecuencias

es en
El resultado de observar una muestra o una poblacion
un conjunto de datos que recoge los valores que toma una
variable estadstica sobre los individuos observados. Estos
valores suelen registrarse en forma de listados o protocolos y
el tipo
pueden ser nominales, ordinales o numericos, segun
de variable observada. Una primera forma de sintetizar los
datos es analizar que valores aparecen y cuantas veces o en
aparecen.
que proporcion
Supongamos que se observa una determinada caracterstica X sobre n objetos o individuos. El valor n, como ya se
ha dicho, es el tama
no o extension
de la muestra. La muestra se denotara por Mx = {x1 , x2 , , xn } (es el conjunto
de valores observados sobre los n individuos), y por Dx =
{x1 , x2 , , xk } el conjunto de valores disitintos que aparecen en la muestra.

de
Se denomina frecuencia absoluta del valor xi al numero
veces ni que aparece el valor xi en el conjunto Mx , y se denota por fa (xi ) = ni .

Se denomina frecuencia relativa del valor xi a la proporcion


de apariciones del valor xi en el conjunto Mx , y se indica por
fr (xi ) =

ni
n

Con las frecuencias relativas se elimina la influencia del nume entre


ro total de observaciones y eso permite la comparacion

conjuntos de datos de distinto tamano.

Cuando los valores x1 , x2 , , xk admiten una ordenacion

16

J. L. DazBarrero

tiene sentido hablar de frecuencia acumulada hasta el va creciente x1 x2


lor iesimo. Supuesta una ordenacion
xk , se define:
Fa (xi ) =
Fr (xi ) =

i
X

fa (xk ) =

i
X

nk ;

k=1

k=1

i
X

i
X
nk

fr (xk ) =

k=1

k=1

Estos resultados se acostumbran a representar en tablas


(distribuciones de frecuencias), indicando en la primera columna los valores observados de la caracterstica X, ordenados de menor a mayor cuando ello es posible, y, en columnas
sucesivas, las frecuencias absolutas y relativas y las frecuencias absolutas acumuladas y relativas acumuladas cuando
ello tenga sentido.

xi

fa (xi ) fr (xi )

x1

n1

x2
..
.

n2
..
.

xk

nk

n1
n
n2
n
..
.
nk
n

Fa (xi )

n1
n1 + n2
..
.
n1 + n2 + + nk

Fr (xi )
n1
n
n1 + n2
n
..
.
n1 + n2 + + nk
n

de los datos en tablas de frecuencias


Para la presentacion
analtica) hay que distinguir entre variables
(presentacion
cualitativas y cuantitativas discretas y continuas. El el caso
de variables cualitativas o cuantitativas discretas hay poca
diferencia como se muestra en los siguientes ejemplos.


Analisis
de Datos

17

Ejemplo 2.2.1 De los 60 estudiantes que asisten a clase, 40


han nacido en Catalu
na, 15 en el resto de Espa
na y 5 son
extranjeros. Presentar los datos en una tabla de frecuencias.
Solucion.
En este caso se trata de una variable cualitativa

X que toma los valores {Cataluna,Espa


na,Extranjero},
con
frecuencias absolutas {40, 15, 5} respectivamente. La correspondiente tabla de frecuencias es la siguiente:

xi

fa (xi ) fr (xi )( %) Fa (xi ) Fr (xi )( %)

Cat
Esp
Ext

40
15
5

Total

60

66.66
25
8.33

40
55
60

66.66
91.66
100

2
Ejemplo 2.2.2 Durante 100 das se ha anotado el numero
de

veces diarias que se han producido deficiencias en el sumunistro electrico


por parte de la compa
nia suministradora. Los

resultados fueron
xi
ni

0
60

1 2
30 4

3 4 5
3 1 0

6
2

Presentar los datos en una tabla de frecuencias y concluir si el


sumunistro puede considerarse o no satisfactorio.
Solucion.
En este caso se trata de una variable cuantitativa
discreta. Su correspondiente tabla de frecuencias es

18

J. L. DazBarrero

xi
0
1
2
3
4
5
6
Total

fa (xi ) fr (xi ) Fa (xi ) Fr (xi )


60
30
4
3
1
0
2
100

0.60
0.30
0.04
0.03
0.01
0.00
0.02

60
90
94
97
98
98
100

0.60
0.90
0.94
0.97
0.98
0.98
1.00

En base a los datos contenidos en la tabla se puede decir


que el suministro es correcto ya que en el 90 % de los das el
suministro o no presenta o a lo sumo sufre una deficiencia.
2
En el caso de datos continuos es conveniente agrupar los
valores observados en clases y representar las frecuencias
de estas clases en tablas que como antes se llaman Tablas
de frecuencias.
Las fases a seguir son las siguientes:
i. Redondear los datos y expresarlos (si se considera conveniente) en unidades no decimales.

ii. Decidir el numero


de clases a considerar. Normalmente

es un numero
entre 5 i 20. Para determinarlo a veces se

utiliza la formula
de Sturges:

NUM = E

3
4

log n
log 2


.

Tambien se acostumbra a utilizar la raz cuadrada por

exceso del numero


de datos.


Analisis
de Datos

19

iii. Contar el numero


de observaciones que caen dentro de
cada clase, i.e., las frecuencies absolutas y completar la
tabla de frecuencias.
Se utiliza la siguiente terminologa:
Clase o intervalo de clase: son cada uno de los intervalos
en que se han de agrupar los datos (aunque no es necesario es conveniente que sean de igual longitud).
Lmites de clase: son los extremos de cada intervalo de clase. El lmite inferior se representa por Li y el lmite superior por Ls .
o de la clase: es la diferencia entre el Ls Li .
Taman
Marca de clase: es el punto medio del intervalo de clase. Todos los elementos de la clase se representan por la marca de clase.
Ejemplo 2.2.3 Los datos siguientes corresponden a los porcentajes de basura recilada de 104 puntos seleccionados al
azar en una determinada ciudad. Presentar los datos agrupados en clases y construir la correspondiente tabla de frecuencias.
96,4
89,3
84,7
81,4
79,7
77,1
73,8
69,7
65,5
59,0
38,0

92,6
88,4
84,0
81,3
79,4
77,0
73,6
68,8
65,0
55,9
35,0

92,3
87,7
83,2
81,2
79,4
77,0
72,4
68,5
64,7
55,6
33,8

92,0
87,7
83,2
81,1
79,3
75,9
71,9
68,1
62,2
54,9
32,1

92,0
87,3
83,0
81,1
79,2
75,8
71,5
68,1
61,8
48,9

91,9
87,3
82,4
81,0
78,9
75,6
71,2
68,0
61,4
48,8

91,8
87,0
82,4
81,0
78,8
75,3
70,7
67,7
61,2
46,7

91,5
85,8
82,0
80,9
77,6
74,9
70,7
67,7
60,0
43,6

90,4
85,1
81,9
80,4
77,3
74,4
70,6
66,8
60,0
42,6

89,4
84,9
81,7
79,8
77,1
73,9
69,9
65,8
59,2
39,1

20

J. L. DazBarrero

Solucion.
Los 104 datos de que disponemos los distribuiremos
en 10 clases. La correspondiente tabla de frecuencias es

Li Ls

xi

3037
3744
4451
5158
5865
6572
7279
7986
8693
93100
Total

33.5
40.5
47.5
54.5
61.5
68.5
75.5
82.5
89.5
96.5

fa (xi ) fr (xi )( %) Fa (xi ) Fr (xi )( %)


3
4
3
3
10
18
18
28
16
1
104

2.885
3.846
2.885
2.885
9.615
17.308
17.308
26.923
15.385
0.962

3
7
10
13
23
41
59
87
103
104

2.885
6.731
9.616
12.501
22.116
39.424
56.732
83.655
99.04
100

2.2.2. Diagramas de puntos y de tallo y hojas

El diagrama de puntos es util


para conjuntos pequenos
de
datos, dado que permite ver con rapidez y facilidad la ubica o tendencia central de los datos, as como su dispersion

cion
o variabilidad.
El diagrama de tallo y hojas es un procedimiento semigrafico

para presentar variables cuantitativas cuando el numero


de
son
datos no es muy elevado. Las fases de su construccion
las siguientes:
i. Redondear los datos y expresarlos en unidades no decimales.


Analisis
de Datos

21

ii. Disponer los datos en una tabla a dos columnas separadas por una linea vertical de la forma siguiente:
a. Para datos con dos cifras, las decenas que son el tallo, a la izquierda de la linea vertical y las unidades
que son las hojas a la derecha.
b. Para datos con tres cifras las centenas y decenas
forman el tallo y las unidades las hojas.

Cada tallo se escribe una vez, el numero


de hojas da la frecuencia del tallo. Los diagramas de tallo y hojas son tambien

utiles
para ordenar los datos y para hacernos una idea de la

simetra de la distribucion.

2.3.

Representaciones graficas

contenida en las tablas de frecuencias pueLa informacion

de expresarse en forma grafica


sin que esta transformacion
Las distribusuponga una perdida o ganacia de informacion.

ciones de frecuencias se representan graficamente


mediante
diagramas de barras y rectangulos
en el caso de variables

cualitatives o cuantitativas discretas y mediante histogramas


de frecuencias y polgonos de frecuencias cuando las variables son continuas. En el caso cualitativo tambien se utilizan
los diagramas de sectores.

2.3.1. Diagramas de sectores

Se construyen de forma que su angulo


central y por tanto

su area
sea proporcional a la frecuencia absoluta correspon
diente. Son utiles
para presentar resultados de encuestas,
procesos electorales, etc.

22

J. L. DazBarrero

2.3.2. Diagrama de rectangulos


En el eje de abcisas se representan los valores de la variable en cualquier orden y en el de ordenadas se representan
las frecuencias. Cada categora se representa mediante un

rectangulo
de altura proporcional a la frecuencia observada.

Los rectangulos
tienen todos la misma amplitud de base.

2.3.3. Diagrama de Pareto

Es equivalente al diagrama de rectangulos


pero ordenando
las categoras de mayor a menor frecuencia. Se construyen
representando los valores observados en una escala horizontal (vertical), les frecuencias en una escala vertical (horizontal) y se dibujan segmentos sobre los valores observados de
longitudes proporcionales a las frecuencias correspondien
tes. Son utiles
para variables cualitativas y cuantitativas discretas. El diagrama de barras acumuladas es como el diagrama de barras pero para frecuencias acumuladas.

2.3.4. Histogramas
El Histograma se construye para representar la medida de las
observaciones que estan agrupadas en clases en un eje horizontal, las frecuencias de clase en un eje vertical y se dibujan rectangulos con sus bases determinadas por los lmites
de clase y sus alturas proporcionales a las correspondientes
frecuencias de clase. La altura de las clases puede calcularse

mediante la expresion
altura =

frecuencia relativa
Ls Li

A modo de sntesis diremos que el histograma es la descrip-


Analisis
de Datos

23

grafica

importante de la distribucion
de las variacion
mas

bles continuas. Su forma depende basicamente


de las clases,
de
que han de ser elegidas antes de construir la distribucion
frecuencias. Es recomendable que ninguna clase contenga
del 30 % de los datos y tambien que no halla muchas
mas
clases vacas.

2.3.5. Polgonos de frecuencies


En el caso de datos cualitativos o cuantitativos discretos se
construyen dibujando una poligonal que una los extremos
superiores de los segmentos del diagrama de barras. En el
caso de datos continuos se toman las frecuencies de clase en
las marcas de clase y se unen los puntos medios de la base
superior de los rectangulos del histograma mediante segmentos.

2.3.6. Diagramas de linea o cartas temporales


de una magnitud a
Una forma de representar la evolucion

lo largo del tiempo es a traves de los graficos


temporales.

Consisten en dibujar en un grafico


cartesiano los puntos que

tienen por abcisa el momento en que se raliza la observacion

y por ordenada la magnitud de la observacion.


Uniendo los
puntos consecutivos mediante lineas se obtiene una poligo temporal
nal que proporciona una idea visual de la evolucion
de la variable.

2.4.

numerica de datos
Descripcion

Los parametros poblacionales y los estadsticos muestra


les son cantidades numericas que resumen la informacion

24

J. L. DazBarrero

contenida en los datos. Se llaman parametros cuando ha y estadsticos cuando los datos
cen referencia a la poblacion
corresponden a una muestra. Se clasifican en:
(media aritmetica, mediana,
Parametros de posicion
moda, centiles)
(rango del conjunto de daParametros de dispersion
tos, rango intercuartilico, desviaciones respecto a la me tpica o estandard,

dia, varianza, desviacion


desviacion
de Pearson)
media, coeficiente de variacion
Parametros de asimetra (coeficiente de simetra: asimetra a la izquierda, simetra, asimetra a la derecha)

Parametros de forma (coeficiente de kurtosis: platicuarti

cas, mesocuarticas,
leptocuarticas).

2.4.1. Parametros de posicion


Son descriptores del conjunto total de los datos. En cierta
forma son las medidas que describen el centro del conjunto
de datos y por eso tambien se llaman parametros de centra o promedios.
lizacion

2.4.2.

La media aritmetica

comun
de tendencia central o localizacion
es
La medida mas
el promedio aritmetico ordinario o media aritmetica. Dado
que casi siempre, los datos con los que se trabaja corresponden a muestras, es por eso que a la media aritmetica tambien
se le conoce como media muestral.
n
Si los datos correspondientes a una muestra de tamano
son


Analisis
de Datos

25

x1 , x2 , , xk , con frecuencias f1 , f2 , , fk , f1 + f2 + +
fk = n, entonces la media muestral se define como

x=

x1 f1 + x2 f2 + + xk fk
f1 + f 2 + + fk

k
1X

xi fi .

i=1

La media muestral x representa el valor promedio de todas


las observaciones en la muestra. Tambien es posible pensar
en calcular el promedio de todas las observaciones de una

poblacion.
Este promedio se conoce como la media poblacional y se acostumbra a representar per la letra griega .
Ejemplo 2.4.1 Determinar un valor aproximado de la media
aritmetica
de un conjunto de datos del que se dispone de la

siguiente informacion:

Li Ls

xi

3037
3744
4451
5158
5865
6572
7279
7986
8693
93100
Total

33.5
40.5
47.5
54.5
61.5
68.5
75.5
82.5
89.5
96.5

fa (xi ) fr (xi )( %) Fa (xi ) Fr (xi )( %)


3
4
3
3
10
18
18
28
16
1
104

2.885
3.846
2.885
2.885
9.615
17.308
17.308
26.923
15.385
0.962

3
7
10
13
23
41
59
87
103
104

2.885
6.731
9.616
12.501
22.116
39.424
56.732
83.655
99.04
100

Solucion.
La media aritmetica es
x=

x1 f1 + x2 f2 + + xk fk
f1 + f2 + + fk

k
1X

i=1

xi fi =

7614
104

= 73,21

26

J. L. DazBarrero

donde se han tomado las marcas de clase como representantes de todos los elementos contenidos en ellas.
2
La media goza de la siguiente propiedad:
(i) x + y + + z = x + y + + z
(ii) ax = ax.

El valor de la media, a diferencia de otros parametros


de posi no depende del orden en que se hayan escrito los datos.
cion,
Si
x1 , x 2 , , x n
es un conjunto de observaciones, se acostumbra a representar por
x(1) , x(2) , , x(n)
al conjunto de las mismas observaciones ordenadas de menor a mayor.

a su resistencia o sensiSe llama robustez de un parametro


bilidad a los valores extremos, tambien conocidos como datos atpicos o outliers. Son valores correctos, pero que se
caracterizan por una diferencia pronunciada respecto a los
datos. Deben analizarse cuidadosamente para deterdemas
Caso de corresponder
minar si provienen de otra poblacion.
analizada, puede interesar no considerarlos
a la poblacion

para el calculo
de estadsticos muy sensibles a los valores
extremos.
La media aritmetica, como ya se ha dicho, es muy sensible a
los valores extremos. Esta falta de robustez se remedia con la
media recortada que modera el efecto de los datos atpicos

en el calculo
de la media aritmetica suprimiendo los valores
extremos. La media recortada al por ciento es la media de
los datos que quedan despues de suprimir el /2 por cien grandes y el /2 por ciento de los mas

to de los datos mas


Analisis
de Datos

27

pequenos.
La media aritmetica ponderada es equivalente a
la media aritmetica, pero para observaciones ponderadas por
pesos w1 , w2 , , wk . Se define por
k
X

xp =

w i xi

i=1
k
X

.
wi

i=1

2.4.3. La Mediana
La mediana de un conjunto de datos es un valor que divide a la muestra en dos partes iguales cuando estos se ha
llan ordenados. Cuando la muestra consta de un numero
par

de elementos, cualquier numero


entre los dos centrales sa de mediana. En tal caso, sin embargo,
tisface la definicion
es conveniente tomar la media aritmetica de los dos valores
centrales como mediana. Sintetizando, con datos ordenados
la mediana se define como

x( n+1 ) ,
n impar,
2
M eX = x
= x(n/2) + x(n/2+1)

, n par.
2
agrupados en clases, para calcular
Cuando los datos estan
la mediana se utilizan las expresiones:
(a)

n
x
= M eX = Li + c 2

Fi1
fi

donde Li es el lmite inferior de la clase mediana, c es

la amplitud de la clase, n el numero


total de datos, Fi1
la frecuencia absoluta acumulada de la clase anterior a

28

J. L. DazBarrero
la clase mediana y fi la frecuencia absoluta de la clase
mediana

(b)
x
= M eX = Li + c(j/fi )
donde Li es el lmite inferior de la clase mediana, c es

la amplitud de la clase, j es el numero


de observaciones
en esta clase hasta completar un total de n/2 y fi la
frecuencia de la clase mediana.
Observese que las expresiones (a) y (b) dicen lo mismo dado
que n/2 Fi1 = j.

2.4.4.

Los Percentiles

generals que la mediana son los cenOtros parametros


mas
tiles que son los puntos que dividen la serie de datos ordenados en cien partes iguales. En general, el k-esimo centil xk
es un valor tal que, al menos el k % de las observaciones quedan en el valor o por debajo de e l, y al menos el (100 k) %
en el valor o por encima de e l. En el caso de datos agruestan
pados en clases para aproximar su valor se puede utilizar la

formula
 nk 
Fk1
100
xk = Li + c
fk
Algunos reciben nombres particulares. As x25 = qi = q1 =
peP0,25 es el cuartil inferior (el 25 % de los datos son mas

quenos
o iguales que e l). La mediana x
= x50 = P0,50 . El
centil x75 = qs = q3 = P0,75 es el cuartil superior (el 75 % de
los datos son inferiores o iguales a e l.)


Analisis
de Datos

29

2.4.5. La Moda
que presenta mayor frecuencia en la muesEs la observacion
de una observacion
con
tra. Cuando en la muestra hay mas

se dice bimodal si hay


la maxima
frecuencia la distribucion
modos modas, y en general, multimodal si hay tres o mas
das. En el caso de datos agrupados la moda se puede obtener

aproximadamente a partir de la formula


M oX = Li + c

D1
D 1 + D2

donde Li es el lmite inferior de la clase modal, c es el tamano


de la clase modal, D1 la diferencia entre la frecuencia absoluta de la clase modal y la anterior y D2 la diferencia entre la
frecuencia absoluta de la clase modal y la posterior.

2.4.6.

Parametros de dispersion

dan
Las medidas de variabilidad o parametros
de dispersion
una idea de hasta que punto los datos se dispersan o agrupan en torno a los valores centrales.

2.4.7. Rango de un conjunto de datos


El menor valor observado en la muestra es el mnimo, i.e.,
min{x1 , x2 , , xn } = x(1) .
El mayor valor observado en la muestra es el maximo,
i.e.,

max{x1 , x2 , , xn } = x(n) .

30

J. L. DazBarrero

sencillas de variabilidad es el rango


Una de las medidas mas

que se define como la diferencia entre los valores maximo


y
mnimo, es decir,
R = max{x1 , x2 , , xn } min{x1 , x2 , , xn } = x(n) x(1) .

Este parametro
es muy sensible (poco robusto) a los valores
extremos de la muestra.

2.4.8. Rango intercuartlico


Se define como la diferencia entre el cuartil superior y el inferior, i.e.,
Riq = qs qi = x75 x25 .
Es menos sensible a los valores extremos que el rango del
conjunto de datos.

2.4.9.

Desviaciones respecto a la media

Son las diferencias (errores) entre cada dato y su media aritmetica. Si los datos son
x1 , x 2 , , x n ,
entonces las desviaciones respecto a la media o errores absolutos son x1 x, x2 x, , xn x. Estas diferencias tienen
la propiedad de que su suma es zero.

tpica
2.4.10. La varianza y la desviacion
importantes de variabilidad. Si x1 , x2 , , xn ,
Son las medidas mas
es una muestra de n observaciones, entonces la varianza se


Analisis
de Datos

31

define como la media aritmetica de los cuadrados de las desviaciones respecto a la media. Es decir,
2

s =

n
1X

n
1X

(xk x) =
x2 x2 .
n k=1
n k=1 k

Tambien se puede definir el estadstico varianza muestral corregida por

s2c

n
X

(xk x) =
n 1 k=1
n1

n
X

)
x2k

nx

k=1

muestral estandard, s, es la raz cuadrada


La desviacion
positiva de la varianza, i.e.,
v
u
n
u1 X
(xk x)2 =
s=t
n k=1

v
u
n
u1 X
t
x2k x2 .
n k=1

La varianza goza de la siguiente propiedad


V ar(aX + b) = a2 V ar(X)
tpica verifica
y la desviacion
SaX+b = |a|SX .

El error estandard de la media se define por se = s/ n.


tpica s
Cuando solo se conocen la media x y la desviacion
de un conjunto de datos, la regla emprica de Chebyshev
de la desviecion
tpica proporpermite otra interpretacion
sobre el numero

cionando informacion
de observaciones que
caen en los siguientes intervalos:
(x 2s, x + 2s) contiene al menos el 75 % de los datos.

32

J. L. DazBarrero
(x 3s, x + 3s) contiene al menos el 88 % de los datos.
(x 4s, x + 4s) contiene al menos el 93 % de los datos.

media
2.4.11. Desviacion
Es la media aritmetica de los valores absolutos de las desviaciones respecto a la media, es decir,
d=

n
1X

n k=1

|xk x|.

Aunque no se cumple de forma exacta, se puede decir que la


entre d y s, viene dada por d ' 0,8s.
relacion

de Pearson
2.4.12. Coeficiente de variacion
como una fraccion
de
Cuando se quiere expresar la variacion
la media se puede utilizar una medida porcentual de variabi mueslidad relativa, denominada coeficiente de variacion
tral, que se define por
Cv =

s
|x|

100,

x 6= 0

tpica)
e indica la magnitud promedio del error (desviacion

como porcentaje de la media. Es util


para comparar las dispersiones de variables que aparecen en unidades distintas o
que difieren considerablemente en la magnitud de las observaciones.
Si el Cv es menor que 100, indica homogeneidad en los datos;
si es mayor que 150 puede ser indicio de heterogeneidades
debidas a mezclas de poblaciones distintas; esto puede darse


Analisis
de Datos

33

cuando
de forma no evidente en una primera aproximacion

han sido utilizados instrumentos distintos para la medicion


de parte de los objetos, o bien se han realizado las observaciones en momentos distintos o por personas distintas de
forma que estos factores hayan influido en los resultados.

2.4.13. Parametros de simetra


de la posicion
y la dispersion

Otro rasgo interesante, ademas


de los datos es la simetra de las observaciones respecto a

la media. Esta puede detectarse a partir de la representacion

grafica
de las frecuencias (diagramas de barras, histogramas,
polgonos de frecuencia). Indicadores numericos son la rela entre la media, mediana y moda:
cion
Mo x
x indica simetra.
Mo  x
 x indica simetra negativa (a la izquierda).
Mo  x
 x indica simetra positiva (a la derecha).
Otro indicador numerico es el coeficiente de asimetra que
se define a partir de las desviaciones respecto a la media x1
x, x2 x, , xn x, por
CasX =

n
X

(xk x)3 .

ns3X k=1

Este coeficiente, que es adimensional, vale cero para distribuciones simetricas alrededor de la media. Es negativo para
distribuciones asimetricas a la izquierda y positivo para distribuciones asimetricas a la derecha.
Si se detecta una asimetra junto con datos atpicos, es con de los
veniente estudiar la viabilidad de una transformacion
datos.

34

J. L. DazBarrero

2.4.14. Parametros de forma


de datos es
Otra caracterstica de interes en una distribucion
su apuntamiento o kurtosis. Considerando las cuartas potencias de las desviaciones respecto a la media se define el
coeficiente de apuntamiento por

CapX =

n
X

ns4X

k=1

(xk x)4 .

Este apuntamiento se suele comparar con una distribucion


generalmente la normal, y la distribucion
se dice leppatron,
apuntada que la normal (Cap
tocuartica cuando esta mas
3), mesocuartica cuando su apuntamiento es similar al de
la normal y platicuartica cuando esta menos apunatada que
la normal (Cap 3).

2.4.15. Momentos muestrales


El momento muestral r-esimo en torno al orgen se define
por
m0r

n
1X

n k=1

xrk .

El momento muestral r-esimo en torno a la media se define por


mr =

n
1X

(xk x)r .
n k=1

Observese que m01 = x y m2 = s2 .


Analisis
de Datos

35

de valores atpi2.4.16. Box-plot y deteccion


cos

El box-plot o diagrama de caja es un procedimiento grafico


que permite describir en forma resumida algunas de las ca importantes de un conjunto de datos. Estas
ractersticas mas
las asimetras y la distribucion

son: el centro, la dispersion,


se basa en medidas

Su construccion
de valores anomalos.
resistentes a la presencia de valores atpicos.
Las fases a seguir para construir un box-plot son:

Calculo
del rango intercuartilico Riq = q3 q1 .

Calculo
de los intervalos [f1 , f3 ] y [F1 , F3 ] con
f1 = q1 1,5Riq

f3 = q3 + 1,5Riq

F1 = q1 3Riq

F3 = q3 + 3Riq .

y
entonces los vaSi la asimetra en los datos es pequena,
lores observados en [F1 , f1 ] o en [f3 , F3 ] se consideran
como anomalias moderadas y los observados antes de
F1 y despues de F3 como anomalias extremas.
Este diagrama que puede servir para filtrar los datos de po
sibles errores, esta formado por una caja o rectangulo
horizontal o vertical, que presenta los tres cuartiles y los valo
res maximo
y mnimo de los datos. La arista izquierda del

rectangulo
corresponde al cuartil q1 y la derecha a q3 . Den
tro del rectangulo
se dibuja una linea que corresponde a la
mediana. Desde cualquier arista se extienden unas lineas o
bigotes que contienen todas las observaciones comprendidas entre cero y 1,5 veces el rango intercuartlico o barreras
interiores. Los valores en que finalizan los bigotes se llaman
adjuntos.

36

J. L. DazBarrero

2.4.17. Transformaciones
A veces a los datos es conveniente aplicarles transformaciones lineales de la forma yi = a + bxi . Se cumple que
y = a + bx y que s2y = b2 s2x . Una de las transformaciones
o estandariza importantes es la tipificacion
lineales mas
de una variable que para una serie de observaciones
cion
x1 , x2 , , xn , se define por
zi =

xi x
s

Se verifica que z = 0 y s2z = 1 y carece de unidades, lo que


directa entre fenomenos

permite una comparacion


de distin es muy asimetrica se sueta ndole. Cuando la distribucion
len aplicar transformaciones no lineales. Como regla general se tiene que si el cociente xmax /xmin es menor que 2, la
no modificara mucho la forma de la distributransformacion
mientras que para un cociente mayor que 10 el efecto
cion,
utilizadas son y = x2 que comprime
sera acusado. Las mas

la escala para valores pequenos


y la expande para valores

grandes. Es util
para asimetras a la izquierda. Para asimetras a la derecha se utilizan las transformaciones y = ln(x)
e y = 1/x que comprimen los valores grandes y expanden los

utilizada es el logaritmo neperiano.


pequenos.
La mas


Analisis
de Datos

2.5.

37

Problemas de Analisis exploratorio de datos

Problema 2.1 Dado el siguiente conjunto de datos


105
97
245
163
207
134
218
199
160
196

221
154
228
131
180
178
157
151
175
201

183
153
174
154
190
76
101
142
149
200

186
174
199
115
193
167
171
163
87
176

121
120
181
160
194
184
165
145
160
150

181
168
158
208
133
135
172
171
237
170

180
167
176
158
156
229
158
148
150
118

143
141
110
133
123
146
169
158
135
149

a. Ordenar los datos.


b. Hacer una tabla de frecuencias agrupando los datos en
nueve clases (utilizar el rango 70250).
c. Representar graficamente
la distribucion

de frecuencias mediante un histograma.


d. Dibujar los correspondientes polgonos de frecuencias (ordinarias y acumuladas)
Problema 2.2 Para asistir a una feria de la construccion
hay
dos tipos de entradas: empresas 25 euros y particulares 4 euros. Sabiendo que el precio medio resulto 18 euros. Que proporcion
de empresas asisitio a la feria?
Solucion.
Sean p1 y p2 las propociones respectivas de empresas y particulares que asisten a la feria y x1 y x2 los precios

38

J. L. DazBarrero

de las entradas. Entonces, x = x1 p1 + x2 p2 con p1 + p2 = 1.


Sustituyendo los datos del enunciado, resulta
)
25p1 + 4p2 = 18
.
p1 + p2 = 1
Resolviendo el sistema anterior se obtiene p1 = 2/3 y p2 =
1/3.
2
Problema 2.3 Durante los 6 ultimos
a
nos el precio del litro de

gasoil (en pts.) ha sufrido las siguientes variaciones:


55, 62, 72, 90, 120, 115.
Un peque
no transportista ha tanido 2 camiones los dos primeros a
nos, 3 durante el tercero y 4 los tres ultimos.
Hallar

el precio medio pagado por el transportista por cada litro de


gasoil consumido durante los 6 a
nos.
Solucion.
Cuando todos los valores que intervienen en la variable X no tienen la misma trascendencia, para obtener la
media aritmetica es preciso tener en cuenta la importancia
de cada dato, esto es ponderarlos.
se efectua
asignando a cada valor un coeEsta ponderacion
ficiente de importancia o peso. As si x1 , x2 , , xn son los
valores que toma X con frecuencias f1 , f2 , , fn y pesos
w1 , w2 , , wn , la media aritmetica
ponderada se calcula por

n
X

x=

xk fk w k

k=1
n
X

fk w k

k=1

En el caso que nos ocupa X = {55, 62, 72, 90, 120, 115} con
1750
pesos {2, 2, 3, 4, 4, 4} con lo que x =
= 92,10 pts.
2
19


Analisis
de Datos

39

Problema 2.4 En un area


de servicio de una autopista se de
sarrollo un proceso para atender a los clientes durante la hora
punta del almuerzo. Se registro el tiempo de espera de todos
los clientes que fueron atendidos durante una semana. Se selecciono una muestra aleatoria de 16 clientes y los resultados
fueron:
4,21, 5,55, 3,02, 5,13, 4,77, 2,34, 3,54, 4,15
3,20, 4,50, 6,10, 0,38, 5,12, 6,46, 6,19, 3,79
Obtener los siguientes estadsticos muestrales:
(1) media aritmetica,
(2) mediana, (3) primer cuartil, (4) tercer

cuartil, (5) segundo decil, (6) percentil x84 , (7) el rango, (8) el
rango intercartlico, (9) la varianza, (10) la desviacion
estandar,

(11) la desviacion
media, (12) el coeficiente de variacion
de
Pearson.
Problema 2.5 Comprobar que la varianza puede escribirse en
la forma

s =

n
1X

n k=1

x2k x2 .

Cuando
sera cero? Y negativa?

Problema 2.6 Dos variables constan de dos datos cada una.


La media de estas
es la misma, y tambien

lo son sus desviaciones tpicas. Son necesariamente iguales los dos conjuntos
de datos? Y si las variables tuviesen 3 datos cada una?
Solucion.
La respuesta a la primera pregunta es afirmativa.
En efecto, sean X = {x1 , x2 } e Y = {y1 , y2 } los dos conjuntos de adtos. Entonces, si x = y resulta
x1 + x2
2

y1 + y2
2

x1 + x2 = y1 + y2 .

(2.1)

40

J. L. DazBarrero

x1 x2
x1 x2
Observese que x1 x =
, x2 x =
, e igual2
2
y1 y2
y1 y2
mente y1 y =
, y2 y =
.
2
2
Entonces,
Sx2 =
Sy2 =

(x1 x)2 + (x2 x)2


2
(y1 y)2 + (y2 y)2
2

=
=

(x1 x2 )2
4
(y1 y2 )2
4

Si Sx2 = Sy2 , entonces


(x1 x2 )2 = (y1 y2 )2

(2.2)

De (2.1) y (2.2) resulta x1 = y1 y x2 = y2 or x2 = y1 y x1 = y2


como se haba anunciado.
La respuesta a la segunda pregunta es no. En efecto, basta
con encontrar un contraejemplo. Sean X = {3, 2, 1} e Y =
{1, 2, 3} ambos tienen media 0 e igual varianza, pero son
distintos.
2
Problema 2.7 En la determinacion
del Zn con complexometrica

tenido en una muestra de un determinado material se obtuvieron los siguientes resultados ( %): 10,02, 10,04, 9,98, 10,48. En
base a estos resultados, que dato se podra tomar como opti
mo? Porque?

Solucion.
La media aritmetica de las observaciones es x =
10,125. Las correspondientes desviaciones medias son
|x1 x| = 0,105, |x2 x| = 0,085,
|x3 x| = 0,170, |x4 x| = 0,335.

Parece razonable tomar x2 como valor optimo


por ser el que
se acerca a la media aritmetica de los resultados.
mas
2


Analisis
de Datos

41

Problema 2.8 Los siguientes datos corresponden a la resistencia a la tension


(kgf /cm2 )de un mortero portland:
17,50 17,63 18,25 18,00 17,86
17,75 18,22 17,90 17,96 18,15
Un ingeniero agrega un polmero de latex
al mortero para deter
minar sus efectos sobre la resistencia a la tension.
Los datos
obtenidos con este experimento fueron:
16,85 16,40 17,21 16,35 16,52
17,04 16,96 17,15 16,59 16,57
a. Ordenar los datos de ambos conjuntos y representarlos gra
ficamente de forma que sea facil
percibir su tendencia

central as como su variabilidad. Que se puede concluir?


b. Hallar la media y la desviacion
tpica de cada conjunto de
datos y comparar los resultados con los del apartado anterior.
Problema 2.9 Cinco determinaciones de Fe en un mineral por
volumetra dieron como resultado:
67,48, 67,37, 67,43, 67,40, 67,47.
Calcular los estadsticos que se consideren apropiados para
detectar si hay algun
Suponiendo que el proce valor anomalo.

dimiento se acepta como valido


siempre que la dispersion

de
los datos no supere el 0,08 %, podra decirse que los resultados obtenidos en la volumetra anterior han sido satisfactorios?
Solucion.
Calculando los estadsticos: media, mediana, va
tpica y coeficiente de variacion
se obtiene
rianza, desviacion
x = 67,43 M = 67,43 s2 = 0,0017 s = 0,0415 CV = 0,06 %

42

J. L. DazBarrero

es inferior al 0,08 % se
Dado que el coeficiente de variacion
puede concluir que los resultados obtenidos son satisfactorios.
2

Problema 2.10 Sobre un conjunto de datos X se dispone de


la siguiente informacion

Clases
58.561.5
61.564.5
64.567.5
67.570.5
70.573.5
73.576.5
76.579.5
79.582.5
82.585.5
85.588.5

Punto medio Frecuencia


60
63
66
69
72
75
78
81
84
87

4
8
12
13
21
15
12
9
4
2

Calcular el numero
de datos. Hallar la media, la mediana, la

moda y los cuartiles. La varianza, desviacion


tpica y coeficiente de variacion
de Pearson. Los coeficientes de asimetra y
kurtosis.

Problema 2.11 El Departamento de Recursos Naturales inicio un programa de seguimiento de la precipitacion


con
acida

el fin de desarrollar controles apropiados de polucion


del aire
para reducir el problema de la lluvia acida.
Se midio la aci
dez de las primeras 50 lluvias registradas, en escala pH, ob-


Analisis
de Datos

43

teniendose
los siguientes resultados:

3,58
4,27
4,45
4,58
4,70

3,80
4,28
4,50
4,60
4,72

4,01
4,30
4,50
4,61
4,78

4,01
4,32
4,50
4,61
4,78

4,05
4,33
4,50
4,62
4,80

4,05
4,35
4,51
4,62
5,07

4,12
4,35
4,52
4,65
5,20

4,18
4,41
4,52
4,70
5,26

4,20
4,42
4,52
4,70
5,41

4,21
4,45
4,57
4,70
5,48

Analizar estos datos (tabulacion


de es de frecuencias, calculo

tadsticos, representacion
y deteccion
grafica

de valores anoma
los)
(Observese
que todas las lluvias son mas
que la lluvia

acidas

normal, cuyo pH es 5,6).


Problema 2.12 Para estudiar la presencia de plomo en la atmosfe
ra (gr/m3 ) se han realizado 64 mediciones en una autopista
y se han obtenido los siguientes resultados:
6,7
5,3
5,0
8,6
8,1
8,4
6,8
10,1

5,4
5,9
6,0
6,2
2,1
8,3
8,6
8,0

5,2 6,0 8,7 6,0 6,4 8,3


7,6 5,0 6,9 6,8 4,9 6,3
7,2 8,0 8,1 7,2 10,9 9,2
6,1 6,5 7,8 6,2 8,5 6,4
6,1 6,5 7,9 15,1 9,5 10,6
5,9 6,0 6,4 3,9 9,9 7,6
8,5 11,2 7,0 7,1 6,0 9,0
6,8 7,3 9,7 9,3 3,2 6,4

Hacer un analisis
exploratorio de estos datos: escribir una ta
bla de frecuencias, calcular los estadsticos que se consideren
apropiados, dibujar el histograma y los polgonos de frecuencias ordinarias y acumuladas. Detectar los valores anomalos,

si los hay, haciendo el correspondiente boxplot.


Problema 2.13 En las grandes ciudades la calidad del aire
se controla periodicamente.
El estado de alarma L se presen
ta cuando el ndice de contaminacion
se halla entre 275 y 350.

44

J. L. DazBarrero

El estado de alarma G se presenta cuando el ndice de contaminacion


supera el valor 350. Suponiendo que el ndice de
contaminacion
se distribuye con media 125 y desviacion
tpica
75 y sin conocer nada mas
acerca de la distribucion,
que podemos decir sobre la proporcion
de das que se declarara la
alerta L?, y la alerta G?

Captulo 3
Analis exploratorio de
datos bivariantes
3.1.

Variables bidimensionales

Se llama variable estadstica bidimensional al conjunto de


conjunta
parejas de valores que resultan de la observacion
Una
de dos caractersticas medibles X e Y de una poblacion.
muestra compuesta por n pares de datos toma la forma
Mx,y = {(x1 , y1 ), (x2 , y2 ), , (xn , yn )}.

De forma analoga
a como se hizo en el caso de datos univariantes se define la frecuencia absoluta del par (xi , yj ) como

el numero
de apariciones de (xi , yj ) en la muestra Mx,y . La
de apariciofrecuencia relativa de (xi , yj ) es la proporcion

nes de (xi , yj ) respecto al numero


total de observaciones. Se
representan, respectivamente, por fa (xi , yj ) y fr (xi , yj ).
Si x1 , x2 , , xh son los h valores distintos de la caracterstica X e y1 , y2 , , yk son los k valores distintos de Y, se llama
conjunta de frecuencias absolutas a la tabla
distribucion
de doble entrada que contiene las frecuencias absolutas de
45

46

J. L. DazBarrero

los pares (xi , yj ). En ella, se escriben los elementos de una

variable en fila los de la otra en columna y, en la interseccion


de cada fila y cada columna, se escriben las frecuencias de la
pareja de valores correspondiente.

X\Y
x1
x2
..
.

y1
f11
f21
..
.

y2
f12
f22
..
.

...
...
...
..
.

yk
f1k
f2k
..
.

xh

fh1

fh2

...

fhk

Si se anade
a la tabla de doble entrada de una distribucion
bivariante una fila y una columna con los totales respectivos
se obtienen dos distribuciones unidimensionales: la formada

por la primera y ultima


columna por un lado y la formada por

la primera y la ultima
fila por otro. Estas reciben el nombre
de distribuciones marginales de la X y la Y respectivamente.
X\Y
x1
x2
..
.

y1
f11
f21
..
.

y2
f12
f22
..
.

...
...
...
..
.

yk
f1k
f2k
..
.

xh

fh1
P
fi1

fh2
P
fi2

...
...

fhk
P
fik

P
P f1j
f2j
..
P.
fhj
N

Las distribuciones marginales son las distribuciones de cada


una de les variables consideradas por separado, sin tener en
cuenta los valores de la otra.

Procediendo de forma analoga


se obtienen las distribuciones
conjunta y marginales de frecuencias relativas.


Analisis
de Datos

3.2.

47

Ajuste mnimo-cuadratico

Si se dispone de n parejas de datos se pueden representar

graficamente
en un sistema de ejes X-Y. A esta representa cartesiana de las parejas de valores que corresponden
cion
a una variable bidimensional se le denomina diagrama de
scattergram o nube de puntos. La observacion

dispersion,
proporciona una idea intuitiva de
de la nube de puntos solo
o dependencia entre las variables. A conla posible relacion
se presenta un procedimiento para hallar esta retinuacion
cuando sea lineal, i.e. cuando los puntos que resultan
lacion
estan aproximadamente situados alrededor de una recta. Si
se supone que los datos, en general de naturaleza diferente,
son
X : x1 x2 . . .
Y : y1 y2 . . .

xn
yn

Se llama variable control o variable independiente a la variable X y variable dependiente o variable respuesta a Y .
La variable control toma sus valores libremente, y posible de los experimenmente en una etapa previa a la realizacion
tos que conduciran a obtener los valores de la variable respuesta.
Un procedimiento de ajuste es el metodo de los mnimos
cuadrados (Legendre, pricipios del siglo XIX) y proporciona

los parametros
= a y = b de la recta y = + x para la

que (a, b) es un mnimo de la funcion


L(, ) =

n h
X

i2
yi xi .

i=1

Siguiendo el procedimiento habitual para minimizar la fun L(, ) resultan las ecuaciones normales
cion

48

J. L. DazBarrero

= 0,

=0

que tienen por solucion

=b=

Sxy

= a = y bx

2
SX

donde

Sxy =

n
1X

(xi x)(yi y)

i=1

es la covarianza muestral de X e Y y

Sx2

n
1X

(xi x)2

n i=1
es la varianza de X. La diferencia yi (a + bxi ) = ei se llama

residuo del modelo en xi . El numero


S2 =

1
n2

n
X

e2i

i=1

es un estimador de la varinza residual y sirve para dar una


idea de la magnitud de los residuos.
Supongamos que conocemos la recta de ajuste que liga dos

variables X e Y y que tiene por ecuacion


y = a + bx = y + b(x x)
Ahora cabe preguntarse como se puede relacionar el valor yi
con el valor predicho por el model yi ? La respuesta es que
y = y + b(xi x).


Analisis
de Datos

49

En particular,
yi ' yi = y + b(xi x),

i = 1, 2, , n.

De aqu resulta
yi y ' b(xi x),

i = 1, 2, , n,

o bien
yi y = b(xi x) + ei ,

i = 1, 2, , n

(3.1)

de y respecto a y es debida en
Esto significa que la variacion
de linealidad entre X e Y y en parte no.
parte a la relacion
total de yi y es igual
La diferencia yi y se llama variacion
explicada por el modelo b(xi x)
a la suma de la variacion
no explicada o residual ei ..
la variacion
mas
Como puede verse cuanto menor sea |i |, i.e., cuanto mayor
debida a la relacion
lineal mejor
sea la parte de la variacion
sera el ajuste. Ahora conviene tener en cuenta todos los datos
y definir:

Variabilidad total V T =

n
X

(yi y)2

i=1

Variabilidad explicada V E =

n
X

b2 (xi x)2

i=1

Variabilidad no explicada o residual V N E =

n
X
i=1

e2i .

50

J. L. DazBarrero

Puede demostrarse que


n
X

e2i

i=1

n
X

(yi y)

n
X

b2 (xi x)2 .

i=1

i=1

Dado que

VT=VE+VNE
resulta
n
X

(yi y) = b

i=1

n
X

(xi x) +

i=1

n
X

e2i

(3.2)

i=1

Ahora, a partir de (3.2) se puede escribir


2
nSY2 = nb2 SX
+ (n 2)Se2

como el porcentaje
y definir el coeficiente de determinacion
de variabilidad explicado por el modelo, i.e.,
2

r =

VE
VT

2
b2 SX

SY2

2
Sxy

Sx2 Sy2

muestral de Pearson por


y el coeficiente de correlacion
r=

Sxy
Sx Sy

(determinacion)

El coeficiente de correlacion
sirve para dar
una medida de la dependencia funcional (lineal) entre las variables X e Y. El criterio que se acostumbra a utilizar es el
siguiente:
Si |r| < 0,5, entonces la dependencia se considera debil.


Analisis
de Datos

51

Si 0,5 |r| < 0,8, entonces la dependencia se considera


moderada.
Si 0,8 |r| < 1, entonces la dependencia se considera
fuerte.
Tambien se utiliza la siguiente nomenclatura: si |r| = 1 se dice que hay dependencia funcional lineal entre las variables;
si 1 < r < 0 se habla de dependencia aleatoria con corre negativa o inversa; si 0 < r < 1, la dependencia es
lacion
positiva o directa y finalmente, si
aleatoria con correlacion
r = 0 se dice que las variables X e Y son incorrelacionadas
necesaria).
(condicion
Otras expresiones de la recta de ajuste son:

Y sobre X : y y =
X sobre Y : x x =

Sxy
Sx2
Sxy
Sy2

(x x).

(y y).

Observese que la recta de ajuste siempre pasa por (x, y) el


centro de gravedad de los datos. (Reflexionar sobre los valores
atpicos).

3.3.

Problemas de Analisis Exploratorio de Datos Bivariantes

Problema 3.1 En una muestra de 20 empresas del sector de


la construccion
se obtuvieron los siguientes datos sobre el nume
ro de empleados X y sus ingresos anuales Y (104 euros)

52

J. L. DazBarrero
X/Y
50-100
10-30
6
30-50
1
50-100
0

100-250 250-1000
2
0
1
0
0
10

a) Calcular la media de los ingresos anuales y del numero


em
pleados. Obtener tambien
su varianza.
b) Calcular los coeficientes de variacion
e interpretar los resultados obtenidos.
c) Obtener, aplicando el metodo
de los mnimos cuadrados,

una recta que ajuste los datos y permita predecir los ingresos medios anuales en funcion
de emplea del numero

dos.
Problema 3.2 En un estudio sobre la relacion
existente entre
el tiempo que tarda un obrero de una autopista en realizar
una tarea en la ma
nana (X) y al final de la tarde (Y ), se han
obtenido los siguientes datos:
10
X

xk = 86,7,

k=1

10
X

x2k

= 771,35,

k=1
10
X

yk2

= 819,34,

k=1

10
X

yk = 88,8,

k=1
10
X

xk yk = 792,92.

k=1

Calcular el coeficiente de correlacion


e interpretar el resultado.
Problema 3.3 Los datos siguientes corresponden a dos variables X e Y :
X
Y

1.5
23.0

1.5
24.5

2.0
25.0

2.5
30.0

2.5
33.5

3.0
40.0

3.5
40.5

3.5
47.0

4.0
49.0


Analisis
de Datos

53

a) Dibujar la nube de puntos. b) Sugiere este diagrama una


asociacion
lineal? Calcular el coeficiente de correlacion
muestral y determinar la ecuacion
de la recta de ajuste mnimo cuadratico.

Problema 3.4 La materia prima que se usa en la produccion

de un determinado material se almacena en un lugar que no


tiene control de humedad. Las medidas de la humedad relativa y del contenido de humedad de muestras de la materia
prima (en %) en 12 das fueron:
Humedad relativa

Contenido de humedad

45
54
37
41
35
29
61
45
43
49
34
40

11
15
11
13
11
7
18
14
11
16
11
13

Calcular el coeficiente de correlacion


muestral. Ajustar los datos a una recta utilizando el metodo
de los mnimos cuadrados.

Utilizar los resultados anteriores para prdedecir el contenido


de humedad cuando la humedad relativa es del 35 %.
Problema 3.5 En el analisis
de unos materiales se han medi
do tres caractersticas: X(ndice de concentracion
de carbono),
Y (ndice de resistencia a la traccion)
y Z(ndice de resistencia
a la torsion):

54

J. L. DazBarrero
X
Y
Z

0.2
3.4
25.6

0.5
6.5
29.5

0.7
11.0
29.0

1.2
13.5
31.2

2.3
22.0
31.5

2.4
25.8
33.2

2.9
33.5
33.4

3.0
34.6
32.6

a) Utilizar el metodo
de los mnimos cuadrados para obtener

las rectas de ajuste de Y sobre X y de Y sobre Z.


b) Calcular los coeficientes de correlacion
rxy , rxz y ryz .
Problema 3.6 Se quiere estudiar que tipo de relacion
existe
entre la temperatura X en una zona monta
nosa y el consumo de energa electrica
Y . Durante 18 das se anotaron las

temperaturas y el consumo de energa de una vivienda y se


obtuvieron los siguientes resultados:
X
Y
X
Y
X
Y

-1.0
94
4.0
74
7.0
65

1.5
81
5.0
67
3.0
73

3.5 -3.0
79
97
-5.0 -0.5
107 86
-2.0 6.0
91
65

0.5
88
9.0
58
8.0
58

2.5
75
9.5
55
10.0
52

a) Calcular los estadsticos que se consideren oportunos y comentar la relacion


existente entre la temperatura y el consumo de energa.
b) Aplicar el metodo
de los mnimos cuadrados para ajustar

los datos a una recta.


c) Estimar el consumo medio de energa de una vivienda cuando la temperatura sea de 0 C.
Problema 3.7 Se considera el conjunto de datos asosciados
en parejas Mx,y = {(xi , yi ) : i = 1, 2, , n}. Probar que la


Analisis
de Datos

55

covarianza muestral Sxy tambien


se escribe en la forma
Sxy =

n
1X

n k=1

xk yk x y.

Definimos SSxx = nSx2 y SSxy = nSxy . Probar que


n h
X

i2
yk (a + bxk ) = SSyy bSSxy .

k=0

Problema 3.8 Los siguientes datos corresponden al cloro residual en el deposito


de aguas de una ciudad en diversos tiem
pos despues
de haberse tratado el agua con productos qumicos para mantenerla apta para el consumo:
t (horas) 2
Cl (ppm) 1.8

4
1.5

6
1.4

8
1.1

10
1.1

12
0.9

a. Calcular el coeficiente de correlacion


muestral y comentar
el resultado.
b. Obtener una recta de mnimos cuadrados con la que se pueda predecir el cloro residual en terminos
del tiempo trans
currido desde que se trato el agua.
c. Utilizar la recta de mnimos cuadrados para estimar el cloro
residual en el deposito
7 horas despues

de haber sido
tratado.

56

J. L. DazBarrero

Captulo 4
Conceptos Basicos de
Probabilidad
4.1.

Introduccion

Un experimento que puede ser repetido tantas veces como


se quiera, siempre en las mismas condiciones controlables,
y cuyo resultado es impredecible, se llama un experimento
aleatorio; en caso contrario, el experimento se llama determinista. As, por ejemplo, el lanzamiento de un dado, la hora

de llegada de un tren a una estacion,


un sorteo de lotera,
pueden ser considerados como experimentos aleatorios.
Cada experimento aleatorio lleva asociado el conjunto E de
todos los resultados posibles. Dicho conjunto se llama espacio muestral, sus elementos se llaman sucesos elementales

y sus subconjuntos sucesos. El conjunto de los sucesos sera,


pues, P (E). Dado un suceso A vamos a definir una medida

teorica
de la ocurrencia de A. A esta medida la llamaremos
probabilidad.
57

58

J. L. DazBarrero

Si el espacio muestral E se halla compuesto por n sucesos


elementales, incompatibles dos a dos (disjuntos), y tales que:
(i) E=

n
[

{ak },

k=1

(ii) fr ({a1 }) = fr ({a2 }) = = fr ({an }).


Entonces, a partir de que fr (E) =

n
X

fr ({ak }) = 1, resulta

k=1

si A = {a1 , a2 , , ah },
fr ({ak }) = 1/n, k = 1, 2 , n. Ademas,
entonces fr (A) = fr ({a1 })+fr ({a2 })+ +fr ({ah }) = h/n.
clasica de probabilidad o re
Llegandose
as a la definicion
gla de Laplace (1812) que enuncia:
La probabilidad de un suceso A es el cociente entre el numero

de casos favorables dividido por el numero


de casos posibles,

considerados como equiprobales, Es decir,


p[A] =

Nf (A)
Np

N (A)
N (E)

anterior equivale a entender la probabilidad de


La definicion
un suceso o subconjunto de resultados elementales como la
frecuencia relativa de ese subconjunto en una muestra ex
haustiva. Los principales inconvenientes de esta definicion
son que no siempre es posible el muestreo exhaustivo y que
no siempre los resultados son equiprobables.
Otra forma de entender la probabilidad consiste en suponer
que el experimento se puede repetir indefinidamente de forma que un resultado no influya en los siguientes. As surge
frecuentista de probabilidad, formalizada por
la definicion
Von Misses en 1919 y que se enuncia
p[A] = lm fr (A).
n


Analisis
de Datos

59

Aqu hay que suponer que existe el lmite de las frecuencias relativas, i.e., existe el lmite y es el mismo para cual de experimentos. En otras palabras, las
quier subsucesion
frecuencias relativas de un suceso se estabillizan alrededor

de un valor fijo (su probabilidad) a medida que el numero


de
pruebas aumenta.
Las dificultades aparecidas en las definiciones anteriores se
axiomatica de Kolmogorov (1943).
solucionan con la definicion

4.2.

axiomatica de probabiDefinicion
lidad

Sea E el espacio muestral asociado a un experimento alea de subconjuntos de E. Se dice que


torio y A una coleccion
A es un a lgebra de Boole cuando se verifican las siguientes
codiciones:
1. El espacio muestral E pertenece a A.
2. Si un suceso A A, A E entonces A A. Como
consecuencia el conjunto = E pertenece a A.

3. Si A1 , A2 , An son elementos de A su union

n
[

Ak ,

k=1

pertenece a A y, por las leyes de Morgan, tambien su


n
\

interseccion,
Ak .
k=1

numerable
A es una algebra cuando para cada sucesion
A1 , A 2 , , An , ,

60

J. L. DazBarrero

de sucesos de E, su union

Ak y su interseccion

k=1

Ak

k=1

pertenecen a A. La algebra se acostumbra a representar


por S, y recoge todos los posibles sucesos de un experimento
aleatorio. Al par (E, S) se le llama espacio probabilizable o
medible.
expondremos la definicion
axiomatica

A continuacion
de Kolmogorov que consta de tres axiomas:

Axioma 1. Si A es un elemento de una algebra,


S, exis
te un numero
p[A] 0, denominado probabilidad del
suceso A.
Axioma 2. p[E] = 1.
finita de suscesos, disjuntos
Axioma 3.1 Dada T
una sucesion
dos a dos, Ai Aj = , se verifica que
p

n
h[
k=1

n
i
X
p[Ak ].
Ak =
k=1

numerable de suscesos, disAxioma 3.2 Dada una sucesi


T on
juntos dos a dos, Ai Aj = , se verifica que

h[
i
X
p
Ak =
p[Ak ].
k=1

k=1

La terna (E, S, p) se conoce como espacio de probabilidad.


Consecuencia de los axiomas de probabilidad son los siguientes
teoremas.
Teorema 4.1 La probabilidad del suceso imposible es cero,
i.e., p[] = 0.


Analisis
de Datos

61

numerable de sucesos
Demostracion.
Considerese la sucesion
el
disjuntos A1 , A2 , , An , , todos ellos igual al . Segun
tercer axioma de Kolmogorov

h[
i
X
p
Ak =
p[Ak ].
k=1

En nuestro caso,

Ak =

k=1

k=1

= . Por tanto,

k=1

p[] =

k=1

p[], es decir, la suma infinita de una cantidad constante de ocurre cuando p[] = 0. 2
be ser esa cantidad, lo cual solo
Teorema 4.2 La probabilidad de la union
de n sucesos disjuntos A1 , A2 , , An es igual a la suma de las probabilidades de cada uno de los sucesos Ai , i.e.,
n
n
i
h[
X
p[Ak ].
p
Ak =
k=1

k=1

numerable de suceDemostracion.
Considesere la suncesion
sos disjuntos A1 , A2 , , An , An+1 , An+2 , , siendo los su el tercer axioma de Kolmogorov
cesos An+k = , k 1. Segun

h[
i
X
p
Ak =
p[Ak ].
k=1

k=1

El primer miembro de la igualdad anterior se puede escribir


en la forma

n
h[
i
h[
i
h [
i
h[
i
p
Ak = p
Ak + p
Ak = p
Ak .
k=1

k=1

k=n+1

k=1

Por otra parte, el segundo miembro toma la forma

X
k=1

p[Ak ] =

n
X
k=1

p[Ak ] +

X
k=n+1

p[Ak ] =

n
X
k=1

p[Ak ].

62

J. L. DazBarrero

Identificando, resulta
n
n
h[
i
X
p
Ak =
p[Ak ].
k=1

k=1

2
Teorema 4.3 La probabilidad de la union
de dos sucesos cualesquiera viene dada por
[
\
p[A1
A2 ] = p[A1 ] + p[A2 ] p[A1
A2 ].
Teorema 4.4 Si A1 A2 , entonces p[A1 ] p[A2 ].
Teorema 4.5 Si A S, entonces se verifica que p[A] 1.
Teorema 4.6 La probabilidad del suceso contrario A, es el
complemento a uno de la probabilidad de A, i.e., p[A] = 1
p[A].

4.3.

Tecnicas de conteo. Combinatoria

4.3.1. Variaciones con repeticion


Dado un conjunto A = {a1 , a2 , , an } de n elementos, se
con repeticion
de los n elementos y de orllama variacion
de k elementos iguales o distintos,
den k a toda agrupacion
elegidos de entre los n de partida, de forma que dos agrupa elemento, o si tenienciones son distintas si difieren en algun
do los mismos e stos se hallan escritos en diferente orden.

Para hallar su numero


observemos que el primer lugar de la
puede estar ocupado por cualquiera de los n elevariacion
mentos de A; el segundo, como pueden repetirse pude ser


Analisis
de Datos

63

ocupado por por cualquiera de los n elementos de A, y as sucesivamente hasta el k-esimo que tambien puede ser ocupa
do por cualquier elemento de A. En consecuencia, el numero
de n elementos tomados de k
de variaciones con repeticion
en k es
VRkn = n n n = nk .
Nota 4.1 Observese
que cada variacion

con repeticion
de orden k es un elemento del producto cartesiano
Ak = {(a1 , a2 , , ak ) | ai A}.
Nota 4.2 Las variaciones con repeticion
de n elementos de orden k son tambien
de todas las aplicaciones que
las imagenes

se pueden establecer entre un conjunto de cardinal k y el A de


cardinal n.

4.3.2.

Variaciones ordinarias

Dado un conjunto A = {a1 , a2 , , an } de n elementos, se


ordinaria de los n elementos de A tomados
llama variacion
de k elementos distintos, elede k en k, a toda agrupacion
gidos de entre los n de partida de forma que dos de tales
elemento o
agrupaciones son distintas si difieren en algun
cuando teniendo los mismos e stos se hallan escritos en dife
rente orden. (Al ser distintos los elementos de cada variacion,
necesariamente ha de ser k menor o igual que n).

Para hallar su numero


observemos que el primer lugar de la
puede ser ocupado por cualquiera de los n elemenvariacion

tos de A; hecha esta eleccion,


el segundo lugar puede ser
ocupado por cualquiera de los n 1 elementos restantes; el
no han sido eletercero, por cualquiera de los n 2 que aun
gidos; y as hasta el k-esimo lugar que podra ser ocupado por

64

J. L. DazBarrero

cualquiera de los n k + 1 elementos restantes. En conse


cuencia, el numero
de variaciones ordinarias de n elementos
y de orden k es
Vnk = n(n 1)(n 2) (n k + 1) = n(k) =

n!
(n k)!

Nota 4.3 Las variaciones ordinarias son las imagenes


de to
das las aplicaciones inyectivas que pueden establecerse entre
un conjunto de cardinal k, (k n) y otro de cardinal n.

4.3.3.

Permutaciones ordinarias

La variaciones ordinarias de n elementos tomados de n en


n se llaman permutaciones ordinarias de n elementos. Son
secuencias en las que intervienen los n elementos de partida
diferenciandose unas de otras en el orden en que se hallan

escritos sus elementos. Su numero


es
Pn = Vnn = n!.
Nota 4.4 Las permutaciones ordinarias de los elementos de
A = {a1 , a2 , , an } son las imagenes
de las aplicaciones bi
yectivas que pueden establecerse entre el conjunto {1, 2, , n}
y A.

4.3.4. Permutaciones con repeticion


Dado el conjunto A = {a, b, , l} de cardinal n, se lla con repeticion
de longitud m de los elema permutacion

t1 , t2 , , tn , con
mentos de A, y de ordenes
de repeticion
t1 + t2 + + tn = m; a cada una de las secuencias de m
elementos que se pueden formar con t1 iguales a a, t2 iguales


Analisis
de Datos

65

a b, , tn = l, de forma que todas ellas tienen los mismos


elementos pero escritos en orden diferente.

Para hallar su numero


supongamos que una tal permutacion
fuera
t2
tn
t
z }|
{
z }|1 { z }| {
a aab bbl ll.
Si en ella suponemos que todas las a son distintas qudara
t

n
z }|2 {
z }|
{
a1 a2 at1 b b b l l l .

Permutando las a de todas las formas posibles sin cambiar


elementos, se obtendran
t1 ! permutaciones difelos demas
rentes. As si en una secuencia de m elementos hay t1 iguales
y se permutan de todas las formas posibles, se obtienen
Ptm1 =

m!
t1 !

permutaciones diferentes. De forma analoga,


si entre los m
elementos hay t1 iguales a a, t2 iguales a b, , tn iguales a

l, se obtendran
Ptm1 ,t2 , ,tn =

m!
t1 !, t2 !, , tn !

permutaciones.
Nota 4.5 Las permutaciones con repeticion
son las imagenes

de aplicaciones exhaustivas predeterminadas.

4.3.5. Combinaciones ordinarias


Dado el conjunto A = {a1 , a2 , , an } de cardinal n, se lla ordinaria de e stos n elementos y de orden
ma combinacion

66

J. L. DazBarrero

de k elementos elegidos de entre los n


k a toda agrupacion
de partida de forma que dos de ellos son distintos si difieren
elemento sin importar el orden en que se hallan esen algun
critos. Dicho de otra forma, las combinaciones ordinarias de
n elementos tomados de k en k o de orden k son los subconjuntos de cardianl k que se pueden formar con los n de
partida.

Su numero
se representa por Ckn . Para calcularlo, supongamos formadas las combinaciones de orden k con los elementos de A de las que hay en total Ckn . Si en cada una de e stas
combinaciones permutamos sus elementos de todas las for
mas posibles resulta que el numero
de secuencias obtenidas
es igual al de variaciones ordinarias de orden k que se pueden formar con los elementos de A. Por otro lado, como cada
genera k! del total de las variaciones, se tiene
combinacion
que Vnk = Ckn k! de donde
Ckn

Vnk
k!

n!
k!(n k)!

 
n
k

4.3.6. Combinaciones con repeticion


con
Dado un conjunto de cardinal n, se llama combinacion
de orden k a cada una de las agrupaciones que se
repeticion
pueden formar tomando k de los elementos de partida iguales
o distintos y considerando que dos agrupaciones son distin elemento sin importar el orden
tas cuando difieren en algun

en que e stos se hallen escritos. Su numero


se designa por
k
CRn .
de orden 1 coinciden con
Las combinaciones con repeticion
las ordinarias, las de orden 2 se obtienen a partir de las de
orden 1 escribiendo a la derecha de cada una de ellas su


Analisis
de Datos

67

ultimo
elemento y cada uno de los que le siguen en el orden
natural, obteniendose en total


n+21
2
= C2n+21 .
CRn =
2
A parir de las de orden 2 se obtiene las de orden 3, y as sucesivamente hasta que las de orden k se obtienen a partir de

las de orden k 1 anadiendo


a cada una de ellas su ultimo
elemento y todos los que le siguen en el orden natural. Es

facil
observar que tales combinaciones se pueden poner en
correspondencia biyectiva con las combinaciones ordinarias
de orden k de los elementos del conjunto {1, 2, , n + k 1}

siendo as su numero


n+k1
k
= Ckn+k1 .
CRn =
k
se citan dos formulas

Nota 4.6 A continuacion


que pueden

de problemas.
ser utiles
para la resolucion

Potencia del binomio (Formula


de Tartaglia)
n

(a + b) =

n  
X
n
k=0

ak bnk .

Potencia de un polinomio (Formula


de Liebnitz)


X
m
m
(a1 +a2 + +an ) =
at11 at22 atnn
t
,
t
,

,
t
1 2
n
t1 +t2 ++tn =m

m!

t1 +t2 ++tn =m

t1 !t2 ! tn !

at11 at22 atnn .

68

4.4.

J. L. DazBarrero

Probabilidad condicional

Tiene interes cuando se quieren calcular probabilidades de


sucesos, sabiendo que o dado que ha ocurrido algo previamente. Dado el espacio de probabilidad (E, S, p) y un suceso
A S con p[A] > 0. Se define la probabilidad condicionada del suceso B por A, y se representa por p[B|A], como el
cociente
p[B A]
.
p[B|A] =
p[A]

Analogamente,
si p[B] > 0 se define
p[A|B] =

p[A B]
p[B]

Es inmediato comprobar que


pB [A] = p[A|B]
es una probabilidad.
Observese que la probabilidad condicionada de un suceso es
la probabilidad del mismo cuando el espacio muestral se ha
modificado.
Si A y B son sucesos de probabilidad no nula se tiene que
p[A B] = p[A]p[B|A] = p[B]p[A|B].
de varios sucesos se le
A la probabilidad de la interseccion
anterior se
llama probabilidad compuesta, y a la expresion
le conoce como ley de la probabilidad compuesta para dos
sucesos. En general, para n sucesos se tiene el siguiente resultado.


Analisis
de Datos

69

Teorema 4.7 Sean A1 , A2 , , An , n sucesos cualesquiera


de un experimento aleatorio y tales que la probabilidad de realizacion
de los mismos es no nula, entonces
p[A1 A2 An ] = p[A1 ]p[A2 |A1 ] p(An |A1 A2 An1 ).
procederemos por inducDemostracion.
Para la demostarcion
Para n = 2, 3 el resultado se comprueba facilmente

cion.
por
directa. Supongase

inspeccion
cierto para 2, 3, , n 1 y
veamoslo para n. En efecto,
h
i
p[A1 A2 An ] = p (A1 A2 An1 ) An
= p[A1 A2 An1 ]p[An |A1 A2 An1 ]
= p[A1 ]p[A2 |A1 ]p[A3 |A1 A2 ] p[An |A1 A2 An1 ].
2

4.5.

Sucesos dependientes e independientes

Se dice que dos sucesos A y B son independientes cuando


se verifica que p[B] = p[B|A]. Si por el contrario p[B] 6=
p[B|A] se dice que B depende estocasticamente de A. En

este ultimo
caso puede suceder:
de A desfavo(a) p[B] > p[B|A], en cuyo caso, la aparicion
de B.
rece la realizacion
de A favorece
(b) p[B] < p[B|A], en este caso, la aparicion
de B.
la realizacion
Se verifican las siguientes condiciones:

70

J. L. DazBarrero

(a) A y B son independientes p[A B] = p[A]p[B].


(b) p[B|A] = p[B] p[A|B] = p[A].
(c) Si A y B son independientes tambien lo son A y B.
de
Extenderemos ahora el concepto de independencia a mas
dos sucesos. Dados tres sucesos A, B y C se dice que son es
tocasticamente independientes, si se verifican simultaneamente las siguientes condiciones:
(a) p[A B] = p[A]p[B].
b) p[A C] = p[A]p[C].
(c) p[B C] = p[B][C].
(d) p[A B C] = p[A]p[B]p[C].
pero veremos
Pudiera parecer superflua la cuarta condicion,
su necesidad mediante un contraejemplo.
Ejemplo de Bernstein. Sea E = {1, 2, 3, 4} y consideremos
los sucesos A = {1, 2}, B = {1, 3} y C = {1, 4}. Es evidente
1
que p[A] = p[B] = p[C] = . Por otro lado, como A B =
2
A C = B C = {1}, entonces
p[A B] = p[A C] = p[B C] =

1
4

y
p[A]p[B] = p[A]p[C] = p[B]p[C] =

1
4

En cambio,
p[A B C] = p[{1}] =

6= p[A]p[B]p[C] =

.
4
8

Esto prueba la necesidad de la cuarta condicion.


Dados n sucesos A1 , A2 , , An , se dice que son independientes cuando se verifica


Analisis
de Datos

71

(a) p[Ai Aj ] = p[Ai ]p[Aj ].


(b) p[Ai Aj Ak ] = p[Ai ]p[Aj ]p[Ak ].

(`) P [A1 A2 An ] = p[A1 ]p[A2 ] p[An ].

4.6.

Teorema de las probabilidades totales

Diremos que A1 , A2 , , An es un sistema completo de su cuando se verifica


cesos o una particion
(a) E = A1 A2 An .
(b) Ai Aj = si i 6= j.

Teorema 4.8 (Formula


de las probabilidades totales) Sea
A1 , A2 , , An un sistema completo de suscesos con P [Ai ] >
0, i = 1, 2, , n. Sea B un suceso para el que se conocen las
probabilidades p[B|Ai ]. Entonces,
p[B] =

n
X

p[Ak ]p[B|Ak ].

k=1

Demostracion.
Al ser A1 , A2 , , An un sistema completo de
suscesos se tiene que
n
h
[
i
p[B] = p[B E] = p B
Ak
k=1
n
n
h[
i
X
=p
(B Ak ) =
p[Ak ]p[B|Ak ].
k=1

k=1

72

4.7.

J. L. DazBarrero

Formula
de Bayes

El siguiente resultado, conocido como la Formula


de Bayes,
importantes y fructferos de la teora de la
uno de los mas
probabilidad, se recoge en el siguiente teorema.
Teorema 4.9 Sea A1 , A2 , , An un sistema completo de sucesos con p[Ak ] > 0, y sea B un suceso cualquiera para el que
se conocen las probabilidades p[B|Ak ] que llamaremos verosimilitudes, entonces
p[Ak |B] =

p[Ak ]p[B|Ak ]
n
X

p[Ak ]p[B|Ak ]

k=1

A las probabilidades p[Ak ] se les llama probabilidades a priori y a las p[Ak |B] probabilidades a posteriori.
de probabilidad condicionada
Demostracion.
De la definicion
resulta
p[Ak B] = p[Ak ]p[B|Ak ] = p[B]p[Ak |B].
Por tanto,
p[Ak |B] =

p[Ak ]p[B|Ak ]

,
p[B]
la formula

pero segun
de las probabilidades totales,
p[B] =

n
X

p[Ak ]p[B|Ak ]

k=1

de donde
se deduce que
p[Ak |B] =

p[Ak ]p[B|Ak ]
n
X

p[Ak ]p[B|Ak ]

k=1


Analisis
de Datos

4.8.

73

Problemas de Probabilidad

Problema 4.1 Explicar por que hay un error en cada una de


las siguientes afirmaciones:
a. La probabilidad de que llueva en una zona desertica
es 0,12

y la de que nieve es 0,40.


b. La probabilidad que llueva es 0,6 y la probabilidad que llueva o nieve es 0,45.
c. La probabilidad que en la proxima
epoca
de lluvias las

aguas sobrepasen el umbral de un rio es 0,77, la probabilidad que se alcance el umbral es 0,08, y la probabilidad
que no se alcance el umbral es 0,05.
Solucion.

a. Una probailidad nunca puede ser negativa.


b. No puede ser que p[A] > p[A B].
c. Sean los sucesos A = {las aguas sobrepasan el umbral
} y B = { las aguas alcanzan el umbral }. Entonces,

p[A] = 0,77, p[B] = 0,08 y p[A B] = 0,05. De la ultima


se obtiene p[A B] = 0,95. Lo que implicara
relacion
p[A B] = 0,10 (Absurdo)
2
Problema 4.2 En un plan general para control de riadas, se
desea saber si una canalizacion
construida anteriormente para un arroyo es suficiente para aliviar los posibles caudales
maximos
(siendo el maximo
total de 10 m3 /s). Tras un estudio

74

J. L. DazBarrero

de riadas anteriores, las probabilidades de caudal maximo


en

un cierto a
no se definen como sigue:
A = 3 a 6 m3 /s, p[A] = 0,6;
B = 5 a 10 m3 /s, p[B] = 0,6;
C = A B,
p[C] = 0,7.
Calcular p[A B], p[A], p[B A], p[A B], p[A B], y definir
cada uno de los sucesos cuyas probabilidades se pide calcular.
Problema 4.3 Hallar la probabilidad de un suceso, sabiendo
que la suma de su cuadrado y la del cuadrado de la probabi5
lidad del suceso contrario es igual a .
9
el
Solucion.
Sea p[A] = p, entonces p[A] = 1 p. Segun

2
2
2
enunciado se tiene p + (1 p) = 5/9; 9p 9p + 2 = 0;
p = 1/3, p = 2/3.
2
Problema 4.4 En una reunion
hay mas
hombres que mujeres, mas
mujeres que beben que hombres que fuman, y mas

mujeres que fuman y no beben que hombres que no beben ni


fuman. Se elige una persona al azar y se pregunta: Que es
mas
probale?
a. Es mujer que no bebe ni fuma.
b. Es hombre que bebe y no fuma.
Solucion.
Sea E el conjunto de personas que asisten a la reu Formemos la siguiente particion
(sistema completo de
nion.
suscesos) de E :
8
[
E=
Xk
k=1


Analisis
de Datos

75

siendo
X1 = H B F ,
X2 = H B F ,
X3 = H B F,
X4 = H B F,

X5 = M
X6 = M
X7 = M
X8 = M

B F,
B F,
B F,
B F.

Veremos que el suceso X1 es mujer que no bebe ni fuma es


probable que el suceso X8 es hombre que bebe y no fuma.
mas
Esto es equivalente a comprobar que el cardinal de X1 es
mayor que el cardinal de X8 . Denotaremos el cardinal de Xi
por N (Xi ), i = 1, 2, , 8.
el enunciado se tienen las siguientes desigualdades:
Segun
4
X

N (Xi ) >

8
X

N (Xi ),

x=5

i=1

N (X5 ) + N (X6 ) > N (X3 ) + N (X4 ),


N (X7 ) > N (X2 ).
Sumando miembro a miembro resulta
N (X1 )+N (X2 )+N (X3 )+N (X4 )+N (X5 )+N (X6 )+N (X7 )
> N (X5 )+N (X6 )+N (X7 )+N (X8 )+N (X3 )+N (X4 )+N (X2 ).
Simplificando, se obtiene
N (X1 ) > N (X8 ).

Esto completa la demostracion.

Problema 4.5 En una encuesta sobre la liberalizacion


de los
peajes en las autopistas se han consultado 1000 personas,
obteniendose
los siguientes resultados:

76

sexo
hombre mujer
a favor
198
243
en contra
125
126
depende
147
161

J. L. DazBarrero

menor de 25
200
50
100

edad
25-50 myor de 50
180
61
111
90
159
49

Se escoge al azar una de las personas consultadas y se desea


saber:
1. Probabilidad de que este a favor de la liberalizacion.

2. Probabilidad que tenga menos de 25 a


nos.
3. Si esta a favor de la liberalizacion,
cual
es la probabilidad
de que sea mujer?
Se escogen dos personas al azar entre las encuestadas. Se
pide:
1. Probabilidad que sean de distinto sexo.
2. Probabilidad que ambas tengan menos de 50 a
nos.
3. Si las dos estan
a favor de la liberalizacion,
cual
es la
probabilidad de que sean dos mujeres?

Problema 4.6 En una ciudad costera se inauguraron el a


no
pasado un puerto deportivo, un peque
no aeropuerto y un deposi
to para el suministro de agua. La probabilidad que dentro de
100 a
nos continue funcionando el puerto deportivo es 0.76, la
de que no funcione el aeropuerto es 0.18 y la de que funcione
el deposito
de agua es 0.40. Se pide cual

es la probabilidad
que dentro de 100 a
nos: a) Continuen funcionando los tres. b)
No funcione ninguno de ellos. c) Funcione solamente el aeropuerto. d) Funcione exactamente uno de ellos.


Analisis
de Datos

77

Solucion.
Tenemos que P [P ] = 0,76, la P [A] = 1 P [A] =
por las caractersti1 0,18 = 0,82 y la P [D] = 0,4. Ademas,
cas del enunciado los sucesos P, A y D son independientes
y tambien lo son los sistemas que resultan de susutituir alguno de ellos por sus contrarios. Entonces:
a. P [P A D] = P [P ]P [A]P [D] = 0,76 0,82 0,4 =
0,2492.
b. P [P A D] = P [P ]P [A]P [D] = 0,24 0,18 0,6 =
0,0259.
c. P [P A D] = 0,24 0,82 0,6 = 0,1180.
d. P [P A D] + P [P A D] + P [P A D] = 0,0820 +
0,1180 + 0,0172 = 0,2172.
2
Problema 4.7 Justo despues
de ser puestos en circulacion,

algunos autobuses fabricados por cierta compa


na presentan
grietas en la pintura de los laterales de los vehiculos. Supongamos que una ciudad tiene 80 de estos autobuses y que en
doce de ellos han aparecido grietas.
a. De cuantas
maneras se puede seleccionar una muestra de

10 vehiculos para inspecionarla?


b. De cuantas
formas distintas puede una muestra de 10

autobuses contener 10 vehiculos con grietas?


c. Determinar la probabilidad que en una muestra de 10 vehiculos, elegidos al azar, 4 tengan grietas.
Problema 4.8 La probabilidad que un vuelo del puente aereo

Madrid-Barcelona salga puntual es 0,92, la de que llegue puntual es 0,93, y la de que salga y llegue puntual 0,84. Que es

78

J. L. DazBarrero

mas
probable: que llegue puntual un vuelo que ha salido puntual o que haya salido puntual un vuelo que ha llegado puntual.
Solucion.
Sean los sucesos A = { sale puntual} y B = { llega
puntual }. Entonces, p[A] = 0,92, p[B] = 0,93, y p[A B] =
0,84. A partir de aqu resulta que
p[B|A] =

p[A|B] =

p[A B]
p[A]
p[A B]
p[B]

= 0,91,

= 0,90.

probable que llegue puntual un vuelo que


Por tanto, es mas
ha salido puntual.
2
Problema 4.9 Las probabilidades que tres meteorologos
inde
pendientemente pronostiquen correctamente el tiempo para un
determinado fin de semana son respectivamente, 1/6,1/4 y
1/3. Si cada uno de ellos, pronostica el tiempo para el proximo

fin de semana, se pide:


1. Probabilidad que solamente uno de ellos acierte.
2. Si solamente acierta uno, cual
es la probabilidad que
sea el primero?
Solucion.
Sean los sucesos A = {acierta el primero}, B =

{acierta el segund} y C = {acierta el tercero}. Las probabilidades de estos sucesos y sus contarrios son, respectivamente,
1
1
1
P [A] = , P [B] = , P [C] =
6
4
3
5
3
2
P [A] = , P [B] = , P [A] =
6
4
3


Analisis
de Datos

79

1.- Sea X = {acierta solamente uno}, entonces


X = (A B C) (A B C) (A B C)
disjunta. Por tanto,
siendo dicha union
P [X] = P [(A B C) (A B C) (A B C)]
= P [A B C] + P [A B C] + P [A B C]
= P [A]P [B]P [C] + P [A]P [B]P [C] + P [A]P [B]P [C]
31
=
= 0,4305
72
2.- En este caso hemos de calcular
P [A|X] =

P [A X]
P [X]

P [A B C]
P [X]

6
31

= 0,1935
2

Problema 4.10 Tres maquinas


A, B y C han producido res
pectivamente 100, 200 y 300 piezas. Se sabe que A produce un
5 % de defectuosas, B un 6 % y C un 7 %. Se selecciona una
pieza al azar y se pide:
1. Probabilidad de que no sea defectuosa.
2. Sabiendo que es defectuosa, probabilidad de que haya sido
fabricada por la maquina
A.

Problema 4.11 Se estudian tres tipos de defectos de las memorias montadas sobre los circuitos integrados: Defectos de
los circuitos de encuadracion
H1 : p[H1 ] = 0,1); de (Hipotesis

fectos provocados por acoplamientos parasitos


entre las celu

las (Hipotesis
H2 : p[H2 ] = 0,6), y defectos de las barras de

direccion
H3 : p[H3 ] = 0,3). La diagnosis se lleva a
(Hipotesis

cabo con ayuda de una serie de tests T1 , T2 , , Tn cada uno

80

J. L. DazBarrero

de los cuales comprueba un estado determinado de la celula

de memeoria. El resultado observable es el estado de la celula

escogida respecto a cada test. Supongmos que la diagnosis se


ha realizado y se ha observado cierto resultado A. Si antes
de la prueba es conocido que p[A|H1 ] = 0,4, p[A|H2 ] = 0,2 y
p[A|H3 ] = 0,3. Que hipotesis
tiene la maxima
probabilidad a

posteriori? Es decir, que defecto es mas


probable?

Solucion.
de las probabilidades totales
Aplicando la formula
se tiene
p[A] = p[H1 ]p[A|H1 ] + p[H2 ]p[A|H2 ] + p[H3 ]p[A|H3 ] = 0,25

Aplicando la formula
de Bayes, resulta
p[H1 |A] = 0,16,

p[H2 |A] = 0,48,

p[H3 |A] = 0,36.

Por tanto, la maxima


probabilidad la tiene la hipotesis
H2 :

Defectos por acoplamiento de parasitos.


2
Problema 4.12 Un jugador arroja un dado, le sale 6 y gana.
Hallar la probabilidad de que haya hecho trampa. (Se supone
que el 40 % de los jugadores hacen trampa)
Solucion.
El espacio muestral se puede descomponer en la

forma E = T T , T T = con p[T ] = 2/5, p[T ] = 3/5, p[6|T ] =

de Bayes se obtiene
1, y p[6|T ] = 1/6. Aplicando la formula
p[T |6] =

p[T ]p[6|T ]
p[T ]p[6|T ] + p[T ]p[6|T ]

4
5

.
2

Problema 4.13 Un ladron


perseguido por la policia llega a un
garage que tiene tres puertas: una conduce al recinto A donde
hay 5 coches tres de los cuales tienen gasolina; la segunda al


Analisis
de Datos

81

recinto B donde de los 4 coches que hay uno solo tiene combustible; y finalmente, la tercera conduce al recinto C donde
hay 7 coches cinco de los cuales tienen gasolina. Elige una
puerta y un coche. cual
es la probabilidad de escapar? Si se
sabe que ha escapado, determinar la probabilidad de que haya salido por la puerta A.
Solucion.
Denotaremos por G al suceso tener combustible.

Entonces, podemos pensar los recintos como urnas con la


siguientes composiciones:
A(3G, 2G), B(1G, 3G), C(5G, 2G)
todas igualmente probables, es decir, p[A] = p[B] = p[C] =
1/3. Sea F el suceso escapar, entones
p[F |A] =

3
5

p[F |B] =

1
4

p[F |C] =

5
7

As
p[F ] = p[A]p[F |A] + p[B]p[F |B] + p[C]p[F |C] = 0,5214.

Por otro lado, teniendo en cuenta la formula


de Bayes, resulta
p[A|F ] =

p[A]p[F |A]
p[A]p[F |A] + p[B]p[F |B] + p[C]p[F |C]

= 0,3835.
2

Problema 4.14 La mitad de los habitantes de Barcelona y su


area
metropolitana acuden al trabajo en vehculo propio, el

40 % utiliza el transporte publico


y el resto van andando. Se

estima que el 10 % de los que usan vehculo propio, el 3 % de


los que utilizan los transportes publicos
y el 1 % de los que van

andando llegan tarde al trabajo. Se pide:

82

J. L. DazBarrero

1. Porcentaje de individuos que llegan puntuales al trabajo.


2. Si un individuo llego tarde al trabajo, cual
es la probabilidad que utilizase vehculo propio?
Solucion.

los datos del enunciado, tenemos


Segun

Prioris
p[V]=50/100
p[T]=40/100
p[A]=10/100

Verosimilitudes
p[t|V]=10/100
p[t|T]=3/100
p[t|A]=1/100

Posterioris
p[V|t]=(1/C) 50/10010/100
p[T|t]=(1/C) 40/1003/100
p[A|t]=(1/C) 10/1001/100

es la probabilidad que
donde C (constante de normalizacion)
un individuo llegue tarde. Es decir,
C = p[t] =

50
100

10
100

Por tanto, p[t] = 1

63

40
100
=

3
100

10
100

1
100

63
1000

937

.
1000
1000
1
En el segundo apartado nos piden p[V |t] =
p[V ]
C
50
.
2
p[t|V ] =
63
Problema 4.15 (Problema de los cumplea
nos) Hallar la probabilidad que en una reunion
de n personas todas tengan fecha de cumplea
nos diferente .

Solucion.
Puesto que hay n personas y 365 das en un ano,

resulta que el numero


de formas distintas de cumplir anos
que se pueden presentar es
n
VRn
365 = 365 .


Analisis
de Datos

83

Por otro lado, si las personas han de tener fechas distintas

de cumpleanos,
se tienen para la primera persona 365 posibilidades, para la segunda, 364; pra la tercera, 363 y as sucesivamente, hasta que para la n-esima se tienen 365 n + 1.
Por tanto, la probabilidad pedida es
p=

365 364 (365 n + 1)


365n

n
V365

VRn
365

.
2

Nota 4.7 Cuando n 23 se verifica que p <

lo que se
2
puede interpretar diciendo que a partir de 23 personas en
probable que dos coincidan en la fecha de
adelante es mas
nacimiento, a que todos tengan fechas de nacimiento distintas.
Problema 4.16 El gerente de una empresa que fabrica neumaticos
para maquinaria de construccion

estudia el lanzamiento de un nuevo neumatico.


En el pasado, el 40 % de los neuma

ticos proyectados han tenido exito


y el 60 % han fracasado.

Antes de lanzar el neumatico


se hace un estdio de mercado

y se solicita un informe, ya sea favorable o desfavorable. En


etapas anteriores, el 80 % de los neumaticos
con informe favo
rable tuvieron exito
y solo

el 30 % de los que fracasaron tenan


informe favorable. Calcular la probabilidad que un neumatico

tenga exito
si recibe un informe favorable.

Solucion.
con e xito} y F = {informe favorable}.
Sea E = {neumatico
Entonces,
Prioris
p[E]=40/100
p[E]=60/100

Verosimilitudes
p[F|E]=80/100
p[F|E]=30/100

Posterioris
p[E|F]=(1/C) 40/10080/100
p[E|F]=(1/C) 60/10030/100

84

J. L. DazBarrero

1
64
Entonces C = y p[E|F ] = (1/C) 40/100 80/100 =
.
2
100
2
Problema 4.17 Se dispone de tres urnas con las siguientes
composiciones: U1 (3B, 2N ), U2 (2B, 3N ) y U3 (1B, 4N ). Se lanza un dado, si sale 1 se elige la primera urna, si sale primo la
segunda y si sale 4 o 6 la tercera. A continuacion,
se extrae
una bola de la urna elegida. Hallar la probabilidad de que sea
blanca. Si ha resultado ser blanca, Cual
es la probabilidad
que hubiese salido primo en el lanzamiento del dado?

Captulo 5
Variables Aleatorias
Discretas
El concepto de variable aleatoria (v.a.) viene motivado por la

necesidad de trasladar el estudio de los sucesos del algebra


de sucesos a la recta real. Dado un espacio muestral E, una
X : E R que asovariable aleatoria X es una aplicacion

cia a cada suceso un numero


real que viene determinado
por el resultado de un experimento aleatorio. Esta asocia permitira expresar los sucesos en terminos numericos.
cion

En otras palabras, una variable aleatoria es la modelizacion

teorica
de las variables estadsticas anteriormente estudia del espacio de
das. Tienen la ventaja de obviar la descripcion
probabilidad. Distinguiremos entre variables aleatorias discretas y continuas.

5.1.

Variables aleatorias discretas

Una variable aleatoria X es discreta cuando el conjunto de


valores que toma X(E) es finito o infinito numerable, i.e.,
85

86

J. L. DazBarrero

X(E) = {x1 , x2 , x3 , }. Dado un espacio de probabilidad


(E, S, p) y una v.a. X definida sobre E. Llamamos
Dx = {x1 , x2 , x3 , , xn , } X

al conjunto de valores posibles de X y definimos la funcion

de densidad de probailidad p(x) de X como la aplicacion


p : R [0, 1] definida por p(x) = p[X = x], que verifica las
siguientes condiciones:
1. p(x) 0, para todo x Dx .
2. p(x) = 0 para todo x R Dx .
X
p(x) = 1.
3.
xDx

p(x) tal que para un conjunto de valores fiToda funcion


nito o infinito numerable cumple las condiciones anteriores
de densidad de una variable aleatoria discreta X.
es funcion
fX (x) = p(x).
Tambien se utiliza la notacion
de distribucion
acumulada FX (x) de una vaLa funcion
de densidad p(x) se
riable aleatoria discreta X con funcion
define para cada x R por
X
FX (x) = p[X x] =
p(y)
{y : yx}

y verifica:
1.
2.

lm FX (x) = 0.

lm FX (x) = 1.

x+

3. Para culesquiera numeros


reales a y b con a < b se verifica que FX (a) FX (b) (no decreciente)


Analisis
de Datos

87

4. lm FX (x) = FX (a) para todo a R (continua por la


xa+

derecha)
de distribucion
goza de las siguientes propiedaLa funcion
des:
1. p[a < X b] = FX (b) FX (a).
2. p(x) = fX (x) = FX (x) lm FX (y).
yx

de densidad de una variable aleatoria disSea p(x) la funcion


creta. La esperanza matematica o valor esperado de X se
define por
X
xk p(xk )
E(X) = =
xk Dx

g(X) de la v.a. X por


y la esperanza de la funcion
X
E[g(X)] = g(X) =
g(xk )p(xk ).
xk Dx

La esperanza es una medida de tendencia central y su va


lor es un numero
real. La esperanza existe siempre que sea
convergente la correspondiente serie que la define. Se verifica
que
E(aX + b) = aE(X) + b, a, b R.

Los momentos ordinarios de una variable aleatoria, si existen, se definen como las esperanzas de potencias de la variable aleatoria, i.e.,
X
k = E(X k ) =
xki fX (xi )
xi Dx

De entre ellos destacan 0 = 1 y 1 = = E(X) llamada


media de X.

88

J. L. DazBarrero

Los momentos centrados sobre , si existen, se definen como


h
i
X
mk = E (X E[X])k =
(xi )k fX (xi ).
xi Dx

Son
X momentos destacados m0 = 1, m1 = 0, m2 = V ar(X) =
tpica o estandar

es la
(xi )2 fX (xi ). La desviacion
xi Dx

raz cuadrada positiva de la varianza, i.e.,


n X
o1/2
p
X = V ar(X) =
(xi )2 fX (xi )
.
xi Dx

La varianza goza de las sguientes propiedades:


h
i2
1. V ar(X) = E(X 2 ) E(X) .
2. V ar(aX + b) = a2 V ar(X), a, b R.
Entre los momentos centrados y ordinarios se verifica la si
guiente relacion
h
i
k
mk = E (X E[X])
=E

k
hX
j=0

kj

(1)

 
k
j

kj

k
X
j=0

kj

(1)

 
k
j

kj
j .
1

generadora de momentos, si existe, se define


La funcion
como
X
mX (t) = E(etX ) =
etxj p(xj )
xj Dx

caracterstica como
y la funcion
X
X (t) = E(eitX ) =
eitxj p(xj ).
xj Dx

Se verifica


Analisis
de Datos

89

1. mX (t) = X (it), X (t) = mX (it)


2.
3.

dk
dt



m
(t)

X
k

t=0

dk
dt



(t)
k X

5.2.

t=0

= k
= ik k .

Modelos probabilsticos discretos

de Bernoulli
5.2.1. Distribucion
Si un experimento aleatorio tiene dos resultados posibles

e xito y fracaso, i.e., E = {e, f }. Entonces, la aplicacion


X : E R definida por X(e) = 1 y X(f ) = 0 es una variable
de densidad de probabilidad
aleatoria que tiene como funcion
(
1 p si x = 0,
fX (x) =
p
si x = 1
de Bernoulli de parametro

p, i.e., X
se llama distribucion
Ber(p). Su esperanza es E(X) = p, su varianza V ar(X) =
p(1 p) y mX (t) = E(etX ) = 1(1 p) + et p = 1 + p(et 1).
Ejemplo 5.2.1 La probabilidad anual que se produzca un tornado en Mallorca es 0,2. La variable aleatoria
(
0 si no se produce,
X=
1 si se produce
es una variable aleatoria de Bernoulli de parametro
p = 0,2

con funcion
de densidad
(
0,8 si x = 0,
fX (x) =
0,2 si x = 1.

90

J. L. DazBarrero

Binomial
5.2.2. La Distribucion
de repeticioEn el experimento que consiste en la realizacion
nes independientes de una prueba de Bernoulli, si n repre
senta el numero
de pruebas y X es la variable aleatoria que

toma como valores el numero


de e xitos en estas n repeticiones, entonces
X = {0, 1, 2, , n}.
de densidad de probabilidad fX (k) = p[X = k]
Su funcion
representa la probabilidad de obtener k e xitos y n k fracasos en n repeticiones del experimento. Dado que las repe
ticiones se consideran independientes cualquier ordenacion
k
nk
de k e xitos y n k fracasos tiene probabilidad p (1 p)
k,nk
y como hay P Rn
ordenaciones posibles, entonces, para
k = 0, 1, , n, se tiene que
k,nk k
p[X = k] = P Rn
p (1 p)nk
 
n k
n!
k
nk
p (1 p)
=
p (1 p)nk .
=
k
k!(n k)!

de probabilidad anteriormente definida se reLa distribucion


X B(n; p) y se denomina Distripresenta con la notacion
Binomial porque los valores que toma su funcion
de
bucion
densidad coinciden con los terminos del binomio
n  
X
n k
n
[(1 p) + p] =
p (1 p)nk .
k
k=0

Sus parametros
son:
1. = E(X) = np,
2. V ar(X) = 2 = np(1 p), =
3. mX (t) = [(1 p) + pet ]n .

p
np(1 p)


Analisis
de Datos

91

uniforme discreta
5.2.3. Distribucion
Una variable aleatoria que puede asumir n valores diferentes

con igual probabilidad diremos que tiene una distribucion


uniforme discreta, i.e., si Dx = {1, 2, , n} entonces
X U {1, 2, , n} fX (x) =

1
n

, x = 1, 2, , n.

Sus parametros
son:
1. E[X] =

n+1
2

2. V ar(X) =
3. mX (t) =

n2 1
12

n
1X

n k=1

ekt .

geometrica
5.2.4. La distribucion
geometrica modela el numero

La distribucion
de fracasos
hasta el primer e xito. Existen dos versiones: (1) La que cuen

ta unicamente
el numero
de fracasos y (2) La que cuenta

el numero
de pruebas incluyendo la que constituye el primer
e xito. Puesto que modela unidades, en general de tiempo, que
hay que esperar hasta obtener el primer e xito, se denomina
tambien variable aleatoria discreta de tiempo de espera.
Se dice que la variable aleatoria X con Dx = {0, 1, 2, }
geometrica de parametro

sigue una distribucion


p si
fX (x) = p(1 p)x , x = 0, 1, 2, .
modela el numero

Esta distribucion
de fracasos hasta el pri
mer e xito, sin incluirlo. Sus parametros
son:

92

J. L. DazBarrero

1. E(X) =

1p
p

2. V ar(X) =
3. mX (t) =

1p
p2

p
1

et (1

p)

La variable aleatoria X con Dx = {1, 2, 3, } sigue una dis geometrica de parametro

tribucion
p cuando
fX (x) = p(1 p)x1 , x = 1, 2, 3,

Sus parametros
son
1. E(X) =

1
p

2. V ar(X) =

1p
p2

Modela el numero
de pruebas hasta alcanzar el primer e xito,
incluyendo e ste.

de Poisson
5.2.5. La distribucion
Una variable aleatoria X con Dx = {0, 1, 2, } se dice que
de Poisson de parametro

sigue una Distribucion


cuando
y solo cuando
fX (x) = p[X = x] =

Sus parametros
son:

x e
x!

, x Dx , > 0.


Analisis
de Datos

93

1. E(X) = ,
2. V ar(X) = .
3. mX (t) = e(e

t 1)

es un modelo adecuado para muchos fenome


Esta distribucion
nos aleatorios, independientes, que cuentan e xitos por uni
dad de tiempo, espacio, longitud, etc. Ejemplos: numero
de
tornados, terremotos o inundaciones que ocurren en una de
terminada zona por ano.
de Poisson puede obtenerse como lmite de la
La distribucion
Binomial. En efecto, supongamos que en un tiempo t se reali
zan n experimentos independientes de Bernoulli con parame
tro p. Si X es la variable aleatoria que cuenta el numero
de

e xitos, entonces se distribuye como una Binomial de parametros n y p, es decir, X B(n, p) con
 
n x
fX (x) = p[X = x] =
p (1 p)nx , x = 0, 1, 2, , n.
x

Supongamos que en el periodo t aumentamos el numero


de
experimentos de forma que el promedio de e xitos sea cons
y
tante, i.e., E(X) = np = = cte., entonces p =
n
   
n x
nx
fX (x) = p[X = x] =
1
, x = 0, 1, 2, , n.
x n
n
Tomando lmite con n se obtiene
fX (x) = p[X = x] =

x e
x!

, x = 0, 1, 2, .

de Poisson se obtiene como lmiSintetizando, la distribucion

te de una Binomial para la que el numero


de experimentos
de Bernoulli crece indefinidamente manteniendo constante

el numero
medio de e xitos por unidad de tiempo.

94

J. L. DazBarrero

5.2.6. Perodo de retorno


Se llama perodo de retorno al tiempo esperado entre sucesos. Es decir, si A es un suceso y T es la variable aleatoria
(temporal) que mide el tiempo entre ocurrencias consecutivas de A, entonces el periodo de retorno de A es E(T ). Por

ejemplo, si T = numero
de anos
que transcurren hasta la
de un suceso A, entonces T G(p) con p = p[A].
realizacion
1
Por tanto, = E(T ) = es el periodo de retorno de A.
p

5.3.

Problemas

Problema 5.1 Se considera la distribucion


de probabilidad (X, fX )
donde X {1, 2, , 9, 10} y fX (x) = 1/10, x = 1, 2, , 9, 10.
a. Representar graficamente
las funciones de densidad de pro
babilidad y de distribucion.

b. Calcular la esperanza y la varianza de X.


c. Calcular p[X > 5], p[3 < X 8], p[X 7].
Problema 5.2 La probabilidad anual de que se produzcan inundaciones en la costa del Maresme es 0,45. Calcular la probabilidad que en los proximos
10 a
nos se produzcan inundaciones:

a. Todos los a
nos.
b. Al menos dos a
nos.
c. Exactamente 4 a
nos.
d. Mas
nos.
de cuatro pero menos de ocho a


Analisis
de Datos

95

Problema 5.3 Trece hormigoneras estan


suministrando hormigon
a una obra. La probabilidad que al final de una jornada una hormigonera continue funcionando es de 0,60. Si las
hormigoneras funcionan independientemente hallar cual es el
numero
mas

probable de hormigoneras en funcionamiento al


final del da y cual es su probabilidad.

Solucion.
Sea X = numero
de hormigoneras en funciona

miento al final del dia. Bajo la hipotesis


de independencia X
una Binomial de parametros

se distribuye segun
n = 13 y
de densidad es
p = 0,60. La correspondiente funcion

x
fX
x
fX

0
6.6e-06
7
0.1932

1
2
3
4
5
6
0.0001 0.0011 0.0063 0.0238 0.0643 0.1287
8
9
10
11
12
13
0.2173 0.1811 0.1086 0.0444 0.0113 0.0013

La mayor probabilidad es fX (8) = 0,2173 y por tanto 8 es

probable de maquinas

el numero
mas
en funcionamiento al
final del da y su probabilidad es 0,2173.
2
Problema 5.4 Calcular la probabilidad de que en una reunion

de 100 personas, elegidas al azar, hallan nacido k, (0 k


100) en el mismo da.
Solucion.
Parece natural asignar a un individuo, elegido al

azar, la probabilidad
1
p=
365

de haber nacido un determinado da del ano.


Tenemos 100 personas y de ellas seleccionamos k. La probabilidad de que todos ellos hayan nacido el mismo da y que

96

J. L. DazBarrero

no lo hayan hecho ninguno de los 100 k restantes es


 1 k 
365

1 100k
365

Dadoque con las 100 personas que tenemos se pueden for100


mar
grupos de k personas, entonces la probabilidad
k
pedida es


1 100k
100  1 k 
1
.
p=
365
365
k
2
Problema 5.5 Se tiene un dado trucado. En 10 tiradas independientes la probabilidad de que aparezca numero
par 5 ve
ces es el doble de la probabilidad de aparezca 4 veces. Cual

sera la probabilidad de que aparezca par al menos una vez en


las 10 tiradas?
Solucion.
Sean p y q las probabilidades de que al lanzar el
dado aparezca par e impar respectivamente. La probabilidad
de que aparezca par en 5 ocasiones es
 
10 5 5
p q
5
y la de que aparezca en 4 ocasiones
 
10 4 6
p q .
4
los datos del enunciado se tine
Segun
 
 
10 5 5
10 4 6
p q =2
p q
5
4


Analisis
de Datos

97

o 6p = 10q. Por otro lado, q = 1 p. Resolviendo el sistema


5
3
anterior se obtiene p = y q = .
8
8
Por tanto, la probabilidad pedida es la del suceso contrario a
de par, es decir,
la no aparicion

p=1


10
0

0 10

p q

=1

 3 10
8

' 0,999945.
2

Problema 5.6 Trafico


pretende modificar la normativa de cir
culacion
de modo que un conductor pierda su permiso de conducir si recibe tres multas por exceso de velocidad. Cada vez
que un conductor coge su coche tiene una probabilidad de
0,001 de ser sancionado por exceso de velocidad.
a. Calcular la probabilidad que un conductor reciba su primera multa por exceso de velocidad la decimoquinta
vez que

coja el coche despues


de la aplicacion
de la nueva normativa.
b. Cual
esperado de veces que cogera el coche
es el numero

hasta que reciba la primera multa por exceso de velocidad?


c. Cual
es la probabilidad de que un conductor coja su coche
al menos tres veces hasta que reciba la primera multa?
Y la de que lo coja al menos tres veces antes de recibir
su primera multa?
d. Si un conductor ha salido ya tres veces con su coche y todava no ha sido multado por exceso de velocidad, cual

es la probabilidad de que conduzca al menos una vez


mas
antes de recibir la primera multa?

98

J. L. DazBarrero

Solucion.
de veces que el conductor coge
(a) Sea X el numero
su coche antes de ser sancionado por primera vez, i.e., X =
{0, 1, 2, }. La probabilidad de ser sancionado por exceso
de velocidad es p = 0,001 y la de no ser sancionado es 1p =
de variables de
0,999. Por tanto, se trata de una repeticion
Bernoulli independientes hasta que se produzca la primera

geometrica de
sancion,
es decir, X sigue una distribucion

parametro
p = 0,001, i.e.,
X G(0,001).
La probabilidad pedida es p[X = 14] = (1p)14 p = 0,99914
0,001 = 0,00099.

(b) Ahora hay que calcular el numero


esperado de veces que
y anadirle

(la
coge el coche sin recibir sancion
una vez mas

vez que conduce y recibe la sancion),


i.e.,
1p
= 1000 veces.
N = E(X) + 1 = 1 +
p

(c) Las probabilidades pedidas son p[X 2] = La sancion


puede ocurrir en la tercera vez o siguientes = 0,998; y p[X
puede ocurrir en la cuarta vez o siguientes
3] = La sancion
= 0,9970.
(d) Si la tercera vez que coge el coche todava no ha sido
multado, entonces la variable X tomara valores mayores o
iguales que 3, pues la primera multa llegara en el peor de
los casos, la cuarta vez. Por tanto, la probabilidad pedida es
p[X 4|X 3] =

p[X 4 X 3]
p[X 3]

p[X 4]
p[X 3]

= 0,999.
2

Problema 5.7 Determinar la esperanza y la varianza para las


distribuciones geometrica
y de Poisson. (Utilizar la funcion

generatiz de momentos)


Analisis
de Datos

99

generatriz de momentos para una


Solucion.
(a) La funcion

geometrica de
variable aleatoria que sigue una distribucion

parametro p es
tX

mX (t) = E(e

)=

tx

e fX (x) =

x=0

=p

etx p(1 p)x

x=0

h
i
etx (1 p)x = p 1 + et (1 p) + e2t (1 p)2 + . . .

x=0

=p

Por tanto, dado que mX (t) =


E(X) = lm
t0

si et (1 p) < 1.

1 et (1 p)

d
dt

1 et (1 p)

mX (t) = lm h
t0

, entonces

p(1 p)

i2 =
t
1 e (1 p)

Ahora es facil
obtener que V ar(X) =

1p
p2

1p
p

(b) Si X P oiss() entonces


tX

mX (t) = E(e

)=

tx

e fX (x) =

x=0

=e

x=0

X
(et )x
x=0

x!

= e(e

t 1)

(et )x
x!

A partir de mX (t) se obtiene


E(X) = lm
t0

d
dt

h
i
t
mX (t) = lm e(e 1) et = .
t0

E(X ) = lm
t0

d2
dt2

mX (t)

100

J. L. DazBarrero
h

(et 1)

= lm e
t0

2 2t (et 1)

e + e e

= + 2 .

Por tanto, V ar(X) = E(X 2 ) E 2 (X) = .

Problema 5.8 Suponiendo que el numero


de tornados obser
vados en un a
no en una cierta region
tiene una distribucion
de
Poisson de parametro
= 8.

h
i h
i h
i
1. Calcular p X 5 , p 6 X 9 , p 10 X .
2. Cuantos
tornados cabe esperar que se produzcan en un

a
no y cual
de tornados
es la desviacion
tpica del numero

observados?
h

Solucion.
1.- Dado que P X = x =

P [X 5] =

x e
x!

, entonces

5
X
8x e8

= 0,191.
x!
x=0
9
X
8x e8
p[6 X 9] =
= 0,526.
x!
x=6
9
X
8x e8
p[x 10] = 1 p[X < 10] = 1
= 0,283.
x!
x=0
(b) E(X) = 8, V ar(X) = 8 y X =

V ar(X) = 2,828.
2

Captulo 6
Variables Aleatorias
Continuas
Dado un espacio de probabilidad (E, S, p); una variable aleatoria X definida sobre S con Dx R (intervalo) se dice que
es una variable aleatoria continua.
de densidad de probabilidad de una variable
La funcion
fX : R
aleatoria continua X se define como una funcion
[0, 1] tal que para todo a, b R, con a < b,
Z b
p[a < X b] =
fX (x) dx.
a

de densidad verifica:
La funcion
1. fX (x) 0, para todo x R.
Z
2.
fX (x) dx = 1.

fX : R [0, 1]
Al igual que en el caso discreto toda funcion
de denque cumpla las dos condiciones anteriores es funcion
sidad de una variable aleatoria X, en este caso continua.
101

102

J. L. DazBarrero

de densidad goza de las siguientes propiedades:


La funcion
1. p[X = c] = 0, para toda constante c R.
2. p[a < X b] = p[a X b] = p[a X < b] = p[a <
X < b], para todo a, b R, a < b.
conA la pareja formada por (X, fX ) se le llama distribucion
tinua de probabilidad.
acumulada FX (x) de una varia de distribucion
La funcion
ble aleatoria continua X se define por
Z

FX (x) = p[X x] =

fX (x) dx,

y verifica las siguientes propiedades:


1.
2.

lm FX (x) = 0,

lm FX (x) = 1,

x+

3. FX (a) FX (b), para todo a < b (no decreciente),


4. lm FX (x) = FX (a) (continua derecha),
xa+

5. p[a < X b] = p[X b] p[X a] = FX (b) FX (a),


para todo a, b R, a < b,
de densidad es la derivada de la funcion
de
6. La funcion

distribucion
0
fX (x) = FX
(x) =

dFX (x)
dx


Analisis
de Datos

6.1.

103

Parametros de una variable aleatoria continua

La esperanza matematica de una variable aleatoria continua se define por

Z
E(X) = =

xfX (x) dx,

g(X) por
y la esperanza o valor esperado de la funcion
Z

E[g(X)] = g(X) =

g(x)fX (x) dx.

que existe
La esperanza es un parametro
de centralizacion
siempre y cuando sea convergente la integral que la define.
La varianza de X se define por
V ar(X) =

2
X

(x )2 fX (x) dx = E(X 2 ) E 2 (X).

tpica es la raz cuadrada positiva de la vaLa desviacion


rianza, i.e.,
p
X = V ar(X).
La desigualdad de Chebychev enuncia que para toda variable aleatoria X con esperanza y varianza finita 2 , y toda
k > 0,
1
p[|X | k] 2 ,
k
o equivalentemente,
p[ k < X < + k] 1

1
k2

104

J. L. DazBarrero

El percentil qesimo se define para todo q [0, 1], como


aquel valor q tal que
q = mn{xk |FX (xk ) q}.
La moda se define como el valor o valores de x donde fX

alcanza sus maximos.

6.2.

Modelos probabilsticos continuos

uniforme continua
6.2.1. Distribucion
uniforme continua o distribucion
rectanguLa distribucion

lar sirve para modelar fenomenos


que toman valores en un
intervalo finito [a, b] donde se supone la equiprobabilidad de
los subintervalos de igual longitud. Ejemplo: situar puntos
sobre un segmento. Se dice que X U [a, b] cuando su fun de densidad es
cion
fX (x) =

1
ba

I{a X b}.

Sus parametros
son
1. E(X) =

a+b

2. V ar(X) =

(b a)2
12

exponencial
6.2.2. Distribucion

Es util
para modelar tiempos entre sucesos de Poisson. Se
dice que la variable aleatoria X con Dx = R+ sigue una dis-


Analisis
de Datos

105

exponencial de parametro

tribucion
, ( > 0), i.e.,
X Exp() fX (X) = ex I{0 x}.

Sus parametros
son
1. E(X) =

2. V ar(X) =

6.3.

(perodo de retorno)
1
2

Normal
La Distribucion

Una variable aleatoria continua X se dice que sigue una


Normal o Distribucion
de GaussLaplace de
Distribucion

de densidad
parametros
, 2 si tiene por funcion
1  x 2

.
fX (x) = e 2
2
importante y la mas
utilizada de las
Probablemente es la mas
distribuciones de probabilidad, entre otras, por las siguientes
razones:

de la inferencia estadstica al
1. Es basica
en la aplicacion

analisis
de datos, dado que gran cantidad de estadsti normal a medicos muestrales tienden a la distribucion
de la muestra.
da que aumenta el tamano

2. Gran parte de los fenomenos


observables se representan
normal al menos en una primediante la distribucion

mera aproximacion.
3. Las variables aleatorias continuas que dependen de un

gran numero
de causas independientes, que suman sus
efectos y que ninguna de ellas es preponderante sobre
tambien sigue una distribucion
normal.
las demas,

106

J. L. DazBarrero

aparece en el siglo XVIII definida en forma


Esta distribucion

emprica o grafica
en problemas relacionados con el comercio

y la navegacion. En 1733 De Moivre la introdujo como lmite

de la Binomial (aproximacion)
cuando el numero
de pruebas n crece indefinidamente. Posteriormente, Gauss (1808)
y Laplace (1812) presentan el modelo normal expresandolo
de densidad y lo utilizan para estudiar la
con una funcion
de los errores al realizar mediciones fsicas (Asdistribucion
tronoma).

La grafica
de fX (x) tiene forma de campana con un maximo
en x = . Las dos colas se extienden indefinidamente siendo y = 0 una asntota horizontal. Cualesquiera que sean los

valores de y 2 para una variable aleatoria normal, el area


bajo la curva fX es igual a 1 y se verifica que aproximada se encuenmente el 68,25 % de los valores de la distribucion
tran en el intervalo [ , + ], el 95,5 % en [ 2, + 2]
y el 99,7 % en [ 3, + 3].

Puede comprobarse que si X N (, 2 ) sus parametros


son:
1. E(X) = ,
2. V ar(X) = 2 ,
1
t + 2 t2
2
3. mX (t) = e
.
Dado que la p[a X b] viene dada por
Z b
p[a X b] =
fX (x) dx
a

y que esta integral no es resoluble por cuadraturas, se necesita aproximarla numericmente mediante tablas. Esto comportara hacer una tabla para cada pareja de valores , 2 .


Analisis
de Datos

107

de la vaEste problema se resuelve mediante la tipificacion


riable que consiste en hacer el cambio de variable
Z=

que permite pasar de la variable X N (, 2 ) a la normal


estandard Z N (0, 1). En efecto,
E(Z) = E

X 

V ar(Z) = V ar

6.4.

o
1n
1
E(X) = ( ) = 0.

X 

V ar(X) =
2

= 1.

El teorema del Lmite Central

historica

La aparicion
de variables aleatorias normales en las
aplicaciones proviene del hecho que cuando se suman variables aleatorias, el resultado tiende a comportarse como una
variable aleatoria normal. Esto se justifica con el Teorema
importantes en
del Lmite Central que es uno de los mas
la Teora de la Probabilidad y con enormes consecuencias en
se enuncia una version
sencilla
Estadstica. A continuacion,
de este resultado:
Teorema del Lmite Central
Sean X1 , X2 , . . . , Xn variables aleatorias independientes e
identicamente distribuidas, con E(Xi ) = y V ar(Xi ) =
n
X
2 , i = 1, 2, . . . , n. Definimos Sn =
Xi . Entonces, la vai=1

riable Sn tipificada
Sn n
Sn E(Sn )
Zn = p
=

n
V ar(Sn )

108

J. L. DazBarrero

FZn (x) tal que, para cualquier x R


tiene distribucion
lm FZn (x) = FZ (x).

n+

En otras palabras,
lm p[a Zn b] = p[a Z b]

n+

con Z N (0, 1). Sintetizando, este resultado enuncia que:


de pruebas repetidas e independientes la
En una sucesion
media muestral estandarizada tiende a la normal estandard
a medida que el numero
de pruebas aumenta.

El teorema del lmite central puede aplicarse a la suma de


variables aleatorias discretas. El siguiente teorema, anterior
al del lmite central, puede considerarse un corolario.
Teorema de De MoivreLaplace
Sea X B(n, p). Definimos Zn = p

X np
np(1 p)

cuya distri-

escalonada es FZn . Entonces,


bucion
lm FZn (x) = FZ (x).

n+

Es decir, para valores grandes de n, si p no es proximo


a 1,
normal
la distribucion


N np, np(1 p)
se puede utilizar para aproximar a la Binomial. Cuanto ma proximo

yor sea n y p mas


a 0,5 mejor sera la aproximacion.
Finalmente, se ha de comentar que actualmente con la tecnologa que tenemos a nuestro alcance las aproximaciones de la
Binomial por la la normal carecen de sentido.


Analisis
de Datos

6.5.

109

Problemas

Problema 6.1 En una fabrica


de cementos se anuncia que

los pedidos son atendidos en 30 minutos. Supongamos que


el tiempo en atender los pedidos se distribuye segun
una variable aleatoria continua X U (25, 35). se pide:
1. Definir las funciones
de densidad de probabilidad y dis
tribucion
y dibujar sus graficas.

2. Cual
es la probabilidad que el tiempo de atencion
del
siguiente pedido exceda los 33 minutos?
3. Cual
es la probabilidad que el tiempo en que un pedido
es atendido difiera en 2 minutos del tiempo anunciado?
4. Para cada a tal que 25 < a < a + 2 < 35, cual
es la
probabilidad que un pedido sea atendido en el intervalo
[a, a + 2]?
Problema 6.2 Un estudio realizado sobre la cantidad de Chapapote retirado diariamente por los equipos de limpieza (voluntarios, pescadores y ejercito),
revela que el 50 % de los equi
pos retiran mas
de 100 y menos de 200 teneladas, el 25 % mas

de 200 y menos de 300 y el resto no llega a las 100 toneladas. Con esta informacion
construir una funcion
de densidad
que modelice la distribucion
X (en cientos de toneladas) de los
residuos recogidos por los equipos de limpieza y, a partir de
ella, obtener:
1. La funcion
de distribucion
de X.
2. La media de residuos recogidos y su desviacion
tpica.
3. El porcentaje de equipos que recogen entre 50 y 150 toneladas diarias.

110

J. L. DazBarrero

el inforSolucion.
de toneladas recogidas, segun
El numero
me, oscila entre 0 y 300 toneladas diarias. Entonces, La fun de densidad es
cion

1/4, 0 x < 1;

1/2, 1 x < 2;
fX (x) =
1/4, 2 x < 3;

0,
en el resto.

0,

Z x
x/4,
x/2 1/4,
1. FX (x) =
fX (x) dx =

x/4
+ 1/4,

1, Z

x < 0;
0 x < 1;
1 x < 2;
2 x < 3.
x 3.

0 dx = 0. Para 0
En efecto, para x < 0, FX (x) =

Z 0
Z x
x
x < 1, FX (x) =
0 dx +
1/4 dx = . Para 1
4
Z
Z0 1
Z x
0
x < 2, FX (x) =
0 dx +
1/4 dx +
1/2 dx =

0
Z 0
Z1 1
x
1
. Para 2 x < 3, FX (x) =
0 dx +
1/4 dx +
2
4

0
Z 2
Z x
x 1
1/2 dx+
1/4 dx = + . Finalmente, para x 3,
1
Z 0 2
Z 1 4 4 Z 2
Z 3
FX (x) =
0 dx+
1/4 dx+
1/2 dx+
1/4 dx =

1.

3
2. E(X) =
xfX (x) dx = , i.e., 150 toneladas. E(X 2 ) =
2

Z
34
x2 fX (x) dx =
. Por tanto, V ar(X) = 0,5833 y
12

sX = 0,7638.
Z 1,5
3. P [0,5 X 1,5] =
fX (x) dx = FX (1,5)FX (0,5) =

0,5

0,375. Es decir, el 37,5 % de los equipos.


Analisis
de Datos

111
2

Problema 6.3 Sea Z una variable aleatoria que se distribuye


segun
Calcular las siguientes probabi una normal estandard.

lidades:
p(0 z 2,2)
p(z 1,37)
p(2,5 z 2,5)
p(0 z 1)
p(1,8 z)
p(1,4 z 2,5)
p(2,5 z 0) p(1,5 z 2)
p(1,5 z)
Problema 6.4 Hallar los valores aproximados de los siguientes percentiles de la distribucion
normal estandadrd:

a.

91 b.

9 c.

75 d .

95

Solucion.
a. Se ha de calcular el valor de a de forma que

p(z a) = 0,91. Directamente de las tablas se obtiene que


a = 1,34. En los otros casos los valores aproximados son
respectivamente: 1,34, 0,68, 1,645.
2
Problema 6.5 Obtener el valor de k en las siguientes ecuaciones para la variable aleatoria N (0, 1):
p(z k) = 0,01
p(k z k) = 0,6826
p(k z k) = 0,98 p(k z k) = 0,9544
p(z k) = 0,01
p(z k) = 0,95
Solucion.
En el primer caso hay que tener encuenta que p(z
k) = 0,01 es equivalente a que 1 p(z < k) = 0,01 o p(z <
k) = 0,99. Directamente de las tablas resulta que k = 2,33.
En los otros casos se obtienen los valores 2,33, 2,33, 1,00, 2,00
y 1,645 respectivamente.
2
Problema 6.6 Sea X una variable aleatoria que se distribuye
segun
una N (30, 25). Hallar las siguientes probabilidades:
P (30 X 37,1)
P (21,05 X 27,3) P (26,35 X 30)
P (23,15 X 40,05) P (33,25 X 36,3)
P (|X| 32,5)

112

J. L. DazBarrero

Solucion.
Tipificando la variable mediante la transformacion
x
z=
, se obtienen losisguientes resultados:

0,4222 0,1540 0,2673 0,8925 0,2579 0,6913


2
Problema 6.7 Suponiendo que los errores en la medida de
300 observaciones topograficas
siguen una distribucion

normal de media 0 y desviacion


4, calcular :
estandar

(i) La probabilidad de que un error no sea mayor que 6


(ii) La probabilidad de que sea por defecto y mayor que 8
(iii) Si llamamos peque
nos a los errores menores que 7 y grandes a los mayores que 7, calcular el numero
esperado de

errores grandes y peque


nos en las 300 observaciones.
Solucion.
Si X N (0, 16) y Z N (0, 1), entonces:
(i) p[|X| 6] = p[6 X 6] = p[1,5 Z 1,5] =
0,8662.
(ii) p[X < 8] = p[Z < 2] = 0,0228.

(iii) p[ error pequeno]=p[|X|


7] = p[|Z| 1,75] = 0,9198 y

p[error grande] = 1 0,9198 = 0,0802. Por tanto, el nume


ro esperado de rrores pequenos
es de 276 y el de errrores
grandes de 24.
2
Problema 6.8 Supongamos que el pH del suelo de la cuenca
de un rio es una variable aleatoria que se distribuye normalmente con media 6 y desviacion
tpica 0,10. Si se elige una
muestra al azar del suelo y se determina su pH:
1. Cual
es la probabilidad que el pH resultante este entre
5,90 y 6,25?


Analisis
de Datos

113

2. Cual
es la probabilidad que el pH se mayor que 6,10?
3. Que valor sera superado solamente por el 5 % de los posibles pH?
Problema 6.9 Para conocer el grado de concienciacion
de los
problemas medio ambientales que tienen los trabajadores de
las constructoras un inspector ha aplicado un test de ambientalizacion
a los 500 trabajadores de una empresa. Se supone
que las puntuaciones obtenidas se distribuyen se gun
una normal de media 80 y desviacion
tpica 12. (a) Que puntuacion

separa al 25 % de los trabajadores con menor conocimiento de


los problemas ambientales? (b) A partir de que puntuacion
se
encuentra el 25 % de los trabajadores con mejor conocimiento
de la ambientalizacion?
(c) El inspector visita otra empresa y

al aplicar el mismo test a sus trabajadores encuentra que las


puntuaciones se distribuyen segun
una N (82, 169). Que se
puede decir? Hay en la segunda empresa trabajadores con
mejor conocimiento de los problemas ambientales que en la
primera?

 X 80
z = 0,25.
Solucion.
(a) p[X x] = 0,25; p

12
X 80
= 0,67; X = 71,96.
z = 0,67;
12
El 25 % de los trabajadores con menor conocimiento en am obtiene puntuaciones inferiores a 71,96.
bientalizacion
 X 80

z = 0,75. z = 0,67;
(b) P [X x] = 0,75; p
12
X 80
= 0,67; X = 88,04
12
A partir de 88,04 se encuentra el 25 % de los trabajadores con
mejor conocimiento de los problemas ambientales.
(c) Teniendo en cuenta que en el intervalo ( , + ) se

114

J. L. DazBarrero

halla el 68,2 % de los individuos; en ( 2, + 2) el 95,4 %


y en ( 3, + 3) el 99,7 %, entonces
68.2 % 95.4 %
Empresa 1 (68,92) (56,104)
Empresa 2 (69,95) (56,108)

99.7 %
(44,116)
(43,121)

Se puede concluir que en la segunda empresa hay trabajadores con mejor conocimiento de los problemas ambientales
que en la primera, ya que los lmites inferiores de los inter
valos son muy proximos;
en cambio los superiores son sen altos en la segunda empresa.
siblemente mas
2
Problema 6.10 La vida de una hormigonera se distribuye normalmente con media 10000 horas. Por la experiencia acumulada, se sabe que el 50 % de ellas dura menos de 9190 horas o
mas
de 10810 horas. Se pide:
1. Cual
del tiempo de vida de
es la desviacion
estandard

las hormigoneras?
2. Cual
es el porcentaje de hormigoneras que funcionara mas

de 11500 horas?
3. Si una hormigonera lleva funcionando 12000 horas, cual

es la probabilidad de que continue funcionando despues

de las 13000 horas?

Solucion.
La vida de las hormigoneras X se distribuye segun
2
una N (10000, ). Tipificando, mediante el cambio de variax 10000
ble z =
se obtiene que Z N (0, 1). Entonces:

10810 10000
810
9190 10000
810
1. z1 =
=
, z2 =
=
.


Analisis
de Datos

115

el enunciado, tenemos
Segun
h
h
810 i
810 i
=p Z
p Z>

h
h
810 i
810 i
p Z>
+p Z
= 0,5

h
810 i
810

De donde
p Z
= 0,75;
= 0,675 y = 1200.

2. p[X 11500] = 1 p[X < 11500] = 1 p[Z < 1,25] =


1 0,8944 = 0,1056.

3. p[X > 13000|X 12000] =


p[X > 13000]
p[X 12000]

p[X > 13000 X 12000]


p[X 12000]

=
2

= 0,1278.

Problema 6.11 La temperatura que se registra en la superfcie


de un satelite
meteorologico
se puede considerar que se distri

buye segun
una variable aleatoria normal. Cuando se encuentra afectado por la sombra de la Tierra, se tiene que en un 95 %
de los casos la temperatura es inferior a los 263 K, mientras
que supera los 253 K en el 40 % de las mediciones.
1. Calcular la media y la varianza de la temperatura en estas condiciones.
2. Cuando el satelite
recibe directamente la luz solar, la tem
peratura en su superfcie presenta la misma varianza que
en el caso anterior, pero su media se incrementa en 35 K.
Cual
es la probabilidad que la temperatura supere los
278 K?
Solucion.
(1) La variable aleatoria temperatura en la sombra
una normal X N (, 2 ). Ademas,

se distribuye segun
p[X < 263] = 0,95,

p[X > 253] = 0,4

116

J. L. DazBarrero

o equivalentemente,
263

= 1,645,

253

= 0,255

Resolviendo el sistema anterior resulta: = 251,16 K y =


7,19 K.

(2) La variable aleatoria temperatura al sol se distribuye segun


una normal Y N ( + 35, 2 ). Entonces,


278 286,16
= 0,871.
p[Y > 278] = 1p[Y 278] = 1p
7,19
2
Problema 6.12 La probabilidad que un cliente pague con VISA la compra de unos materiales de lampisteria es del 50 %.
Hallar la probabilidad que de los 100 proximos
clientes:

1. Exactamente 60 paguen con VISA.


2. A lo sumo 40 paguen con VISA.
3. Mas
de 40 paguen con VISA.
Binomial B(100, 0,5).
Solucion.
Ahora se trata de una distribucion
Como np = 50 > 5 y nq = 50 > 5, entonces aplicando
el teorema de De Moivre se puede aproximar mediante una

N (, ) donde = np = 50 y = npq = 5. Por tanto,


1. P [X = 60] P [59,5 X 60,5] = P [1,9 Z
2,1] = 0,0108
2. P [X 40,5] = P [Z 1,9] = 0,0287.
3. P [X > 40,5] = 1 P [X 40,5] = 1 0,0287 = 0,9713.
2

Captulo 7
Inferencia Estadstica:
de Parametros.
Estimacion

Contrastes de Hipotesis
7.1.

Introduccion

La inferencia estadstica tiene como objetivo obtener infor sobre la poblacion


(lo que se quiere estudiar) a partir
macion
de una o varias muestras de ella misma (lo que se puede
estudiar). La inferencia es un conjunto de tecnicas y procedimientos que permiten de alguna forma cuantificar la incerti
dumbre acerca del modelo y de sus parametros.
Es deseable,
apropiada para seleccionar
que la tecnica elegida sea la mas
el modelo que permita tomar las mejores decisiones a partir
obtenida en las muestras.
de la informacion
Sintetizando, podramos decir que el objetivo de la estadstica
es obtener conclusiones sobre una caracterstica de la po a partir de la informacion
proporcionada por una
blacion
muestra, para lo cual, es clave garantizar que la muestra sea

representativa de la poblacion.
117

118

7.2.

J. L. DazBarrero

Muestreo

se entiende un conjunto homogeneo de elePor poblacion


mentos en los que se estudia una cracterstica o variable dada. Una muestra es un conjunto representativo de los ele
mentos de la poblacion.
Para obtener datos de una pobla se puede proceder de dos formas, mediante un censo
cion
o seleccionando una muestra
(se estudia toda la poblacion)

(se estudia parte de la poblacion).


Este ultimo
procedimiento
se denomina muestreo. Existen varios tipos de muestreo:
1. Muestreo aleatorio simple. Es un procedimiento de se de una muestra de forma que cada individuo de
leccion
tiene la misma probabilidad de ser elegido.
la poblacion
se realiza con reemplazamiento,
Cuando la seleccion
es identica en todas las exde forma que la poblacion
tracciones, la muestra se llama aleatoria simple.
2. Muestreo aleatorio sistematico. Se utiliza cuando el

es elevado. Para
numero
de individuos de la poblacion

realizarlo, se calcula primero el parametro


k que es la
del censo N y
parte entera del cociente entre el tamano
de la muestra n. A continuacion,

el tamanno
se selecciona aleatoriamente el primer elemento de la muestra
(ordeentre los k primeros elementos de la poblacion
criterio), el segundo entre los k
nados siguiendo algun
siguientes y as hasta completar la muestra.
3. Muestreo aleatorio estratificado. Se utiliza en poblaciones heterogeneas cuando los individuos de la pobla se agrupan en estratos (grupos de caractersticas
cion
homogeneas, como sexo, renta,...). Consiste en dividir
en estratos y mediante muestreo aleatorio
la poblacion
simple seleccionar una muestra representativa de cada uno de ellos. Puede ser constante (cuando se extrae

el mismo numero
de individuos de cada estrato) o pro
porcional (cuando el numero
de elementos que se se-


Analisis
de Datos

119

leccionan de cada estrato es proporcional al numero


de

elementos del estrato en la poblacion).


4. Muestreo aleatorio por clusters o conglomerados. Se

utiliza cuando no se dispone de un censo de la poblacion


o cuando sus individuos se hallan muy dispersos geo
graficamente.
Asume como unidades muestrales grupos
y no individuos particulares. El procedide la poblacion
miento consiste es seleccionar tantos clusters o conglomerados como individuos tenga la muestra y despues
seleccionar mediante muestro aleatorio simple un individuo de cada cluster para poder as formar una mues
tra representativa de la poblacion.
5. Muestreo aleatorio dirigido. Consiste en seleccionar
una muestra con un cierto criterio, de forma que los
individuos selecionados se supongan representativos de

la poblacion.
6. Muestreo no aleatorio por cuotas. Se utiliza en en
cuestas de opinion.
Se basa en un buen conocimiento
El investigador selecciona, segun
su cride la poblacion.

terio, el numero
de estratos o individuos que considera
apropiados para su investigacion.

mas
7. Muestreo no aleatorio deliberado. Consiste en seleccionar la muestra a partir de un segmento concreto de
(por ejemplo, la guia telefonica)

la poblacion
o seleccionando deliberadamente los individuos que se conside apropiados para constituir la muestra objeto
ran mas
de estudio.
Finalmente, comentaremos que la representatividad de una
muestra no se halla solamente en el metodo de muestreo si
o de la muestra es fundamental. Los criterios
no que el taman
de una muestra son:
generales para seleccionar el tamano

120

J. L. DazBarrero

1. El objetivo perseguido.
investigada.
2. Las caractersticas de la poblacion
3. El grado de error que se pueda tolerar.

7.3.

de Parametros
Estimacion

caracterizada por una variable aleatoria


Dada una poblacion
X, se llama muestra aleatoria a un conjunto X1 , X2 , . . . , Xn
de variables aleatorias independientes, identicamente distri y los mismos prame
buidas, todas con la misma distribucion
de densidad conjunta de la muestra
tros que X. La funcion
es
n
Y
f (xi ).
f (x1 , x2 , . . . , xn ) =
i=1

Observese que antes de tomar la muestra los Xi son variables


aleatorias que al realizarse generan la muestra x1 , x2 , . . . , xn .
de la muestra apropiada para
Un estimador es una funcion

Es una variable aleaestimar un parametro


de la poblacion.
de la v.a. por una
toria y cada vez que se realiza ( sustitucion
puntual del parametro,

muestra) produce una estimacion

i.e., un numero.

Puntual
7.3.1. Metodos de Estimacion
Dada una muestra aleatoria X1 , X2 , . . . , Xn , y una realiza de la misma x1 , x2 , . . . , xn , el metodo de los momencion
tos consiste en identificar los momentos muestrales con los

momentos poblacionales. Los estimadores de los parametros


Analisis
de Datos

121

son las soluciones del sistema de ecuaciones


k

k = E(X ) =

n
1X

Xik = m0k , k = 1, 2, . . .

i=1

El sistema, que tiene tantas ecuaciones como parametros


a
unica.

estimar, no siempre tiene solucion


Tambien pueden
utilizarse los momentos centrados en torno a la media.
El metodo de la maxima verosimilitud consiste en hallar

verosmil (prolos valores de los parametros


que hacen mas
bable) la muestra. Es decir, se trata de hallar los valores de
de verosimilitud

los parametros
que maximizan la funcion
L(1 , 2 ; x1 , x2 , . . . , xn ) =

n
Y

f (xk ; 1 , 2 ).

k=1

comodo

En la practica
es mas
maximizar el logaritmo de la
de verosimilitud, i.e.,
funcion
ln L(1 , 2 ; x1 , x2 , . . . , xn ) =

n
X

ln f (xk ; 1 , 2 ).

k=1

Uno de los objetivos que se ha de procurar conseguir cuando


de un parametro

se hace la estimacion
es, obtener de en adecuado. Al intentar
tre todos los posibles, el que sea mas

obtener este estimador es util


el concepto de error cuadatico medio (RMS) del estimador. Si = (X1 , X2 , . . . , Xn ) es

un estimador de , se llama error cuadatico


medio de a la
esperanza de la diferencia entre y , i.e.,
= E[( )2 ].
RM S()
anterior, se obtiene
Desarrollando la expresion
= E[( )2 ] = V ar()
+ [ E()]
2.
RM S()

122

J. L. DazBarrero

Como puede observarse el error cuadratico


medio es la suma
de dos cantidades no negativas, la varianza del estimador y

el cuadrado de su sesgo respecto al parametro


desconocido.
Esto pone de manifiesto que las propiedades deseables de un
pequena

estimador han de ser que su varianza sea lo mas


muestral de se concentre alreposible y que la distribucion

dedor del parametro.


Un estimador se dice que es insesgado o centrado cuando
= . Es decir, cuando su sesgo E()
= 0. Un esE()

timador con sesgo negativo subestima al parametro


y si el
sesgo es positivo lo sobrestima. Si,
= ,
lm E()

insesgado. Un esentonces el estimador es asintoticamente

timador se dice que es consistente en media cuadratica


si y
si,
solo
lm E[( )2 ] = 0.
n

eficiente que 2 si
Se dice que el estimador 1 es mas
V ar(1 ) < V ar(2 ).

Un estimador es optimo
cuando es insesgado y de varianza
mnima. Finalmente, un estimador se dice que es suficien
toda
te para un parametro
, cuando utiliza en la estimacion
contenida en la muestra sobre el parametro

la informacion
.

7.3.2.

Intervalo de probabilidad e intervalo de


confianza

Dada una muestra aleatoria X1 , X2 , . . . , Xn , sean `1 , `2 dos


funciones de la muestra, i.e.,
`i = `i (X1 , X2 , . . . , Xn ), i = 1, 2,


Analisis
de Datos

123

tales que `1 `2 y p[`1 < < `2 ] = 1 . Entonces, se


dice que (`1 , `2 ) es un intervalo de probabilidad 1 , (0 <
que se obtiene al sustituir en
< 1) para . Su realizacion,
la muestra aleatoria los valores obtenidos, se llama intervalo
de confianza al 100(1 ). %

7.4.

de la Media Muestral
Distribucion

que se
Si se considera una caracterstica de una poblacion
una variable aleatoria de parametros

distribuye segun
y

2 , i.e., X X(, 2 ) y se seleccionan un gran numero


de
n, entonces la media
muestras aleatorias simples de tamano
muestral X es una variable aleatoria que tiene por media
2
2
=
. Es decir,
X = y por varianza X
n
 2 
2
X X(, ) = X X ,
.
n
el Teorema del Lmite Central se tiene que indepenSegun
dientemente de la poblacion
original, la distribucion
de la media muestral X sera aproximadamente normal para muestras
suficientemente grandes (n > 30). Es decir, si X es normal,
de
entonces X sera normal independientemente del tamano
las muestras. En cambio, si X no es normal X sera aproxi para valores grandes de n.
madamente normal solo

7.5.

Intervalos de confianza en poblaciones normales

En lo que sigue, consideraremos muestras aleatorias procedentes de variables aleatorias normales o muestras grandes
de poblaciones cualesquiera.

124

J. L. DazBarrero

1. Intervalo de confianza para la media con varianza


conocida. Supongamos que X N (, 2 ), en don
de el parametro
es desconocido y deseamos obtener
un intervalo de confianza para al nivel de confianza
100(1 ) %. Para ello tomamos una muestra de ta n, X1 , X2 , . . . , Xn de una poblacion
normal o de
mano
cualquiera con n > 30 y hallamos dos
una poblacion

numeros
`1 , `2 tales que
p[`1 X `2 ] = 1 .
Para determinar los valores de `1 , `2 utilizaremos la me una normal de
dia muestral X (que se distribuye segun
2

parametros
y /n). Entonces, tipificando, resulta
Z=

/ n

que se distribuye como una N (0, 1) y por tanto, utilizan


do la normal estandard,
podemos encontrar dos valores
`1 , `2 tales que
i
h
x

`
(7.1)
p `1

2 = 1
/ n
de donde se deduce
h

i
=1
p x `2 x `1
n
n
y en consecuencia el intervalo
h

i
x `2 , x `1 .
n
n

(7.2)

(7.1) no quiere decir que `1 , `2 sean


Pero la expresion

unicos.
Entonces, de entre todos los posibles valores
tendremos que elegir aquellos que hagan mnima la longitud del in tervalo (7.2). Es decir, hemos de minimizar
(longitud del intervalo):
la funcion

 


L(`1 , `2 ) = x `1
x `2
= (`2 `1 )
n
n
n


Analisis
de Datos

125

dada en (7.1), i.e.,


sujeta a la condicion
Z `2
p[`1 Z `2 ] =
fZ (z) dz = 1 .
`1

Aplicando un metodo de minimizacion,


por ejemplo, el
de los multiplicadores de Lagrange, se obtienen los valores `1 = z/2 y `2 = z/2 . As, el intervalo de confianza
para la media de una normal con varianza conocida viene dado por
h

i
x z/2 , x + z/2
n
n
donde x es la media muestral observada y z/2 es tal

que p[Z > z/2 ] = .


2
2. Intervalo de confianza para la media con varianza
desconocida.
Cuando la varianza es desconocida, y la media y la varianza muestrales observadas son x y s2 , entonces un
intervalo de confianza para la media poblacional al
100(1 ) % de confianza viene dado por
h
s
s i
x t/2,n1 , x + t/2,n1
n
n

donde t/2,n1 es tal que p[tn1 > t/2,n1 ] =


y tn1
2
tStudent con n 1 grados de
sigue una distribucion
libertad.

7.6.

Contraste de Hipotesis

El objetivo de este tipo de inferencia es determinar, a partir

del analisis
de una muestra, si hay o no evidencia estadsti
ca suficiente para concluir si es o no razonable la hipotesis

hecha sobre un parametro


de la poblacion.

126

J. L. DazBarrero

de densisdad
Dada una variable aleatoria X con funcion
fX (x) y una muestra aleatoria X1 , X2 , . . . , Xn , un contraste

de hipotesis
o test parmetrico sobre los parametros
de la
consta de las siguientes fases:
poblacion

1. Una hipotesis
nula o primaria que se representa por

H0 especifica siempre el valor de uno o varios parame

tros de la poblacion.
Si se reduce a un unico
valor se
dice simple y en caso contrario compuesta.

2. Una hipotesis
alternativa que se representa por Ha o
H1 .
de la muestra
3. El test de prueba que es una funcion
de densidad conocida. Habitualaleatoria con funcion

mente un estimador del parametro.


del contraste. Se acostumbra
4. El nivel de significacion
a representar por .
para aceptar o rechazar la hipote
5. La regla de decision
sis nula. Define el rango de valores del test de prueba

para rechazar la hipotesis


primaria H0 .

La hipotesis
nula puede ser verdadera o falsa y por tanto son
posibles dos decisiones correctas:
1. No rechazarla cuando es correcta.
2. Rechazarla cuando es incorrecta.
Pero tambien son posibles dos decisiones incorrectas:
1. Rechazar H0 cuando es correcta.
2. No rechazarla cuando es incorrecta.


Analisis
de Datos

127

En este ultimo
caso, a (1) se le llama error de tipo I y a
(2) error de tipo II. La probabilidad de un error de tipo I se
representa por y la de un error de tipo II por . Se llama

potencia del contraste al valor 1 . Cuando la hipotesis


H1 es compuesta el error de tipo II esta definido para una
infinidad de valores. Entonces, es una curva (caracterstica
y en este caso 1 es la funcion
de potencia
de operacion)
del test.

7.6.1.

Contrastes para la media

1. Test de dos colas

Hipotesis
nula :

H0 : = 0

Hipotesis
alternativa :
Test de prueba:

z=

HA : 6= 0
x 0

/ n

: Rechazo de H0 si z > z/2 o si


Regla de decision
z < z/2 , o equivalentmente, rechazo de H0 si |z| >
z/2 .
2. Test de una cola por la derecha

Hipotesis
nula :

H0 : = 0

Hipotesis
alternativa :
Test de prueba:
:
Regla de decision

z=

H A : > 0
x 0

/ n

Rechazo de H0 si z > z .

128

J. L. DazBarrero

3. Test de una cola por la izquierda

Hipotesis
nula:

H0 : = 0

Hipotesis
alternativa:
Test de prueba:
:
Regla de decision

z=

H A : < 0
x 0

/ n

Rechazo de H0 si z < z .

En poblaciones de varianza desconocida sx . A continua se exponen algunos ejemplos de test parametricos.


cion,

7.7.

Analisis de la Varianza

El objetivo que se pretende con este analisis


es la compa de las medias de dos o mas
poblaciones cuando los
racion
datos son cuantitativos. La tecnica que se utiliza emplea las
varianzas muestrales para detectar las diferencias entre las
por la que se conoce como analimedias, siendo esta la razon
sis de la varianza o metodo ANOVA. Dadas k poblaciones
Xi N (i , 2 ), i = 1, 2, . . . , n,
que se suponen normales con medias desconocidas y varian
zas desconocidas pero iguales (homocedasticas),
se seleccionan k muestras independientes
Mi (ni , xi , s2i ), i = 1, 2, . . . , k.
se realiza el siguiente test de hipotesis:

A continuacion

1. Hipotesis
nula:

H0 : 1 = 2 = . . . = k .


Analisis
de Datos

129

2. Hipotesis
alternativa: H1 : Al menos dos medias son
diferentes.
3. Test de prueba: El estadstico de prueba que se utiliza
tiene en cuenta tanto la variabilidad entre los grupos
(muestras) como la variabilidad dentro de cada grupo (muestra). Se denotan por SST (sum of squares for
treatments) y SSE (sum of squares for error) respectivamente. Se definen por
SST =

k
X

nj (xj x)2 ,

j=1

donde x es la media de todas las observaciones, y


SSE =

nj
k X
X

(xij xj ) =

j=1 i=1

k
X

(nj 1)s2j .

j=1

se evaluan las medias de los cuadraA continuacion


dos:
SST
SSE
M ST =
,
M SE =
k1
nk
y el test de prueba que se utiliza es
F =

M ST
M SE

con 1 = k 1 grados de libertad del numerador y 2 =


n k grados de libertad del denominador.
Rechazo de H0 si F > F,k1,nk .
4. Regla de decision:

Los calculos
anteriores se acostumbran a disponer en

una tabla como la que se describe a continuacion.

130

J. L. DazBarrero
Tabla ANOVA

variabilidad

df

SS

e.m.

k-1

SST

d.c.m

n-k

SSE

Total

n-1

SS(Total)

MS
SST
MST=
k1
SSE
MSE=
nk

F-ratio

F=

M ST
M SE

Ejemplo 7.7.1 Un nuevo producto ha sido introducido en el


mercado de los materiales de construccion.
Para saber si hay
diferencia entre las medias de ventas de tres importantes mercados regionales se han anotado las ventas de los ultimos
8

das y se han obtenido (en unidades apropiadas) los siguientes resultados:


Mercado 1 15 17
Mercado 2 10 12
Mercado 3 13 18

22 20 18
15 17 12
19 16 17

16 14
13 15
16 15

19
16
18

Se puede concluir al 5 % de significacion


que hay diferencia
entre las medias de ventas de los tres mercados? (Se supone
que las poblaciones son normales y con varianzas iguales).

Solucion.
son:
En este caso las hipotesis

1. H0 : 1 = 2 = 3
2. H1 : Al menos dos medias son diferentes.


Analisis
de Datos

131

3. Estadstico de prueba:
x1 =
x2 =
x3 =
x=
SST =

15 + 17 + . . . + 19
8
10 + 12 + . . . + 16
8
13 + 18 + . . . + 18
8
15 + 17 + . . . + 18
24
3
X

=
=
=
=

141
8
110
8
132
8
383
24

= 17,625
= 13,750
= 16,500
= 15,958

nj (xj x)2 = 63,59.

j=1

s21 = 7,125,

s22 = 5,643,

s23 = 3,714

SSE = (n1 1)s21 + (n2 1)s22 + (n3 1)s23 = 115,375


SST
63,59
M ST =
=
= 31,80
k1
31
115,375
SSE
M SE =
=
= 5,49
nk
24 3
M ST
31,80
F =
=
= 5,79.
M SE
5,49

El numero
de grados de libertad del numerador es 1 =
k 1 = 3 1 = 2 y los del denominador 2 = n k =
24 3 = 21, por tanto, F,1 ,2 = F0,05,2,21 = 3,47.
Rechazamos H0 si F > F,1 ,2 . Por
4. Regla de decision:
tanto, dado que 3,47 < 5,79, en base a los datos analiza
dos, rechazaremos la hipotesis
primaria al 5 % de nivel

de significacion.
2

132

J. L. DazBarrero

Los datos de la tabla ANOVA se pueden utilizar para obtener


intervalos de confianza para las medias de cada una de las
poblaciones y para la diferencia de medias entre dos de ellas
mediante las expresiones:
s
M SE
xj t/2,nk
nj
s
1
1 
(xj xm ) t/2,nk M SE
+
.
nj
nm
Considerando el mismo ejemplo de antes hallaremos intervalos de confianza al 95 % para 1 y 1 2 respectivamente.
En el primer caso es x1 = 17,625 y s1 = 2,67. Por tanto, si
1 = 95 % el metodo tradicional da:
s1
2,67
x1 t/2,n1 1 = 17,625 2,365 = 17,625 2,23
n
8
con una cota de error E = 2,23. En cambio, utilizando la
tabla ANOVA se obtiene
s
M SE
x1 t/2,21
n1
r
5,49
= 17,625 2,080
= 17,625 1,72
8
con una cota de error E = 1,72. Dado que en este caso la
es mejor.
cota de error es menor la estimacion
En el segundo caso, el intervalo pedido es
s
 1
1
(x1 x2 ) t/2,nk M SE
+
n1
n2
p
= (17,625 13,75) 2,080 5,49(1/8 + 1/8) = 3,875 2,44
y el intervalo de confianza es [1,435, 6,315].


Analisis
de Datos

7.8.

133

Test de Chi-cuadrado

El objetivo que se pretende con este tipo de tests es comparar


poblaciones. La tecnica utililas proporciones de dos o mas
zada es parecida a la que se utiliza en las tablas ANOVA pero
con variables cualitativas. Los test que habitualmente se realizan son los de bondad del ajuste y de independencia.
Supongamos que realizamos un experimento tal que sus resultados se pueden clasificar en k categoras o celulas, y que
supondremos que las probabilo repetimos n veces. Ademas
lidades o proporciones de los diferentes resultados son
p1 , p2 , , pk ,

p1 + p2 + + pk = 1,

y que en el total de las n repeticiones las frecuencias observadas de cada uno de estos resultados ha sido:
O1 , O2 , , Ok ,

O1 + O2 + + Ok = n.

Entonces un Test de bondad de ajuste consiste en :


1. H0 : 1 = p10 , 2 = p20 , , k = pk0 .
2. Ha : Al menos un i 6= pi0 .
: .
3. Nivel de significacion
4. Estadstico de contraste:
2 =

k
X
(Oi ei )2
i=1

ei

donde ei = npi (frecuencia esperada).


Rechazo de H0 si 2 > 2,k1 .
5. Regla de decision:

134

J. L. DazBarrero

Ejemplo 7.8.1 Cosiderar 300 repeticiones de un mismo experimento con 5 celulas


donde las frecuencias observadas son:

Categora
Frecuencia

1
2
24 65

3
4
5
86 70 55

contrastar las hipotesis


:

1. H0 : 1 = 0,1, 2 = 0,2, 3 = 0,3, 4 = 0,2, 5 = 0,2


2. H1 : Al menos un i 6= pi0 .
con un nivel de significacion
del 1 %.

Solucion.
y fijado el nivel de sig Una vez hechas las hipotesis
se procedera a evaluar el estadstico de contraste:
nificacion
e1 = np1 = 300(0,1) = 30, e2 = np2 = 300(0,2) = 60
e3 = np3 = 300(0,3) = 90, e4 = np4 = 300(0,2) = 60,
e5 = np5 = 300(0,2) = 60.
2 =

5
X
(Oi ei )2
i=1

ei

(86 90)2

(24 30)2
30

(70 60)2

(65 60)2
60

(55 60)2

90
60
60
36
25
16
100
25
=
+
+
+
+
= 3,88.
30
60
90
60
60
El valor de 20,01,4 = 13,27. Dado que 3,88 < 13,27, en base a

estos datos, no se puede rechazar la hipotesis


nula.
2
El segundo test de chi-cuadrado trata con datos ordenados
en una tabla de contingencia y determina si dos clasifica cualitativa son o no independientes.
ciones de una poblacion

Las hipotesis
a contrastar son:


Analisis
de Datos

135

1. H0 :

Las dos clasificaciones son independientes.

2. H1 :

Las dos clasificaciones son dependientes.

3. Estdstico de contraste:
2 =

h X
k
X
(Oij eij )2
i=1 j=1

eij

eij =

P
P
( Fi ) ( Cj )
n

: .
4. Nivel de significacion
Rechazo de H0 si 2 > 2,(h1)(k1) ,
5. Regla de decision:

donde h es el numero
de filas de la matriz de contingen
cia y k el numero
de columnas.
Ejemplo 7.8.2 En un momento determinado el gobierno de
una Cominudad Autonoma
tiene dos opciones en poltica economi

ca: recortar el Gasto publico


o subir los impuestos. Antes de to
mar ninguna descision
se realiza un sondeo entre la poblacion

del que resulta:

Afiliacion
R.G.P
A
62
B
103
C
31
Totales
196

S.I.
90
85
29
204

Totales
152
188
60
400

Se puede concluir al 10 % de nivel de significacion


que hay
relacion
entre la afiliacion
poltica y el soporte del electorado a
cada una de las opciones economicas?.

Solucion.
a contrastar son:
Las hipotesis
1. H0 :

Las dos opciones son independientes.

2. H1 :

Las dos opciones son dependientes.

136

J. L. DazBarrero

3. Estadstico de contraste:
h X
k
X
(Oij eij )2

i=1 j=1

eij

Afiliacion
R.G.P
A
62(74.48)
B
103(92.12)
C
31(29.40)
Totales
196

(103 92,12)2
92,12

eij

95,88

29,40

(85 95,88)

Totales
152
188
60
400

(62 74,48)2

(31 29,40)2

eij =

S.I.
90(77.52)
85(95.88)
29(30.60)
204

k
h X
X
(Oij eij )2
i=1 j=1

P
P
( Fi ) ( Cj )

74,48
(90 77,52)2

77,52
2

(29 30,60)
30,60

= 6,79

El valor del modelo de probabilidad es 20,1,(31)(21) = 20,1,2 =


4,60517. Dado que 6,79 > 4,60 hemos de rechazar H0 , lo que
significa que los datos obtenidos en este sondeo aportan evi endencia estadstica suficiente para creer que hay relacion
poltica y el soporte a la opcion
economica.

tre la afiliacion
2

7.9.

Problemas de inferencia

Problema 7.1 El gerente de una fabrica


de pinturas para la

se
nalizacion
de las carreteras ha observado que el conntenido
de las bolsas medianas (33 kg.) se distribuye normalmente
con media 33,2 y desviacion
0,3. Se pide:
estandard


Analisis
de Datos

137

1. Hallar la probabilidad que una bolsa de pintura comprada por un cliente contenga menos de 33 kg.
2. Probabilidad de que si compra un paquete de 6 bolsas, la
media del contenido de estas
sea inferior a 33 kg.

Solucion.
El contenido de las bolsas de pintura es una v.a. X

que se distribuye normalmente con media 33,2 y desviacion

esandard
0,3, i.e. X = N (33,2, 0,3).
x
de tipificacion
es z =
1. En este caso la ecuacion
=

33 33,2
= 0,667 y P [x < 33] = P [z < 0,667] =
0,3
0,2514.
2. X es una v.a. normalmentedistribuidacon media 33,2
estandard

y desviacion
/ n = 0,2/ 6 = 0,12. Por
x 33,2
tanto, X = N (33,2, 0,12), z =
= 1,667 y
0,12
P [x < 33] = P [z < 1,667] = 0,0485.
2
Problema 7.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria de
una distribucion
normal con funcion
de densidad de probabilidad
h 1  x 2 i
1
.
fX (x) = exp
2

2
Hallar por metodo
de la maxima
verosimilitud estimadores de

2
y . En una realizacion
de la muestra con n = 10 se han observado los valores: 26,3, 35,1, 23,0, 28,4, 31,6, 30,9, 25,2, 28,0,
27,3, 29,2. Utilizar los resultados anteriores para obtener estimaciones de los parametros
y 2.

138

J. L. DazBarrero

de verosimiSolucion.
En primer lugar definiremos la funcion
2

litud que dependera de los parametros


y . Es decir,
n
Y

h 1  x 2 i
1
k
L(, ; x) =
exp
2

2
k=1
2

n
i
h
1 n
1 X
2
(xk ) .
exp 2

2 k=1
2

procederemos a maximizar la funcion

A continuacion
ln L(, 2 ; x) =

n
2

ln 2

n
2

n
1 X

ln 2

2 2

(xk )2 .

k=1

Para ello calcularemos sus derivadas parciales respecto a


y 2 y resolveremos el sistema de ecuaciones
ln L(, 2 ; x)

ln L(, 2 ; x)
2

=
n
2 2

n
1 X

(xk ) = 0

k=1
n
1 X

2 4

(xk )2 = 0.

k=1

y sustituyendo en la
Despejando de la primera ecuacion
segunda se obtienen los estimadores
b=

n
1X

n k=1

Xk ;

b2 =

n
1X

(Xk X)2 .

n k=1

de la muestra, una estimaUna vez tenemos una realizacion


de la media es x = 28,5 y una estimacion
de la varianza
cion
2
es s = 10,71.
2
Problema 7.3 Sea X una variable aleatoria que se distribuye
segun
una N (, 2 ) con conocida. Se pide:


Analisis
de Datos

139

1. Cual
es el nivel de confianza para el intervalo



x 2,58 , x + 2,58 .
n
n

2. Cual
es el nivel de confianza para el intervalo x1,645 .
n
3. Calcular un intervalo para la media al 95 % de confianza cuando n = 100 y x = 58,3 (Tomar = 3).
Solucion.

1. Si z/2 = 2,58 esto significa que p[z > 2,58] = /2 o


eqivalentemente que p[z 2,58] = 1 /2. Directamente de las tablas de la N (0, 1) se obtiene 1 /2 =
0,9951, = 0,0098 y el nivel de confianza es 100(1
) % = 99 %.
2. Procediendo como en el caso anterior el nivel de confianza es 100(1 ) % = 90 %.
3. Un intervalo de confianza para la media viene dado por

3
x z/2 = 58,3 1,96
= 58,3 0,588 o equin
100
valentemente (57,71, 58,89).
2
Problema 7.4 Un test de turbidez realizado sobre 16 muestras de aguas arenosas en el delta de un rio arrojo los siguientes resultados:
26,7 25,8 24,0 24,9 26,4 25,9 24,4 21,7
24,1 25,9 27,3 26,9 27,3 24,8 23,6 25,0
Suponiendo que el muestreo se llevo a cabo sobre una poblacion
normal, estimar intervalos al 90 %, 95 % y 99 % de nivel
de confianza para la media de turbidez .

140

J. L. DazBarrero

Solucion.
Se trata de obtener estimaciones de intervalos de
normal de varianza
confianza para la media de una poblacion
desconocida a partir de una muestra de 16 observaciones.
Las estimaciones las obtendremos al realizar los estimadores
S
S
`1 = X t/2,n1 y `2 = X +t/2,n1 sobre la muestra.
n
n
Teniendo en cuenta que x = 25,29 y s = 1,47, entonces:
1. Si 1 = 90 %, /2 = 0,05, t/2,15 = 1,753 y la estima1,47
del intervalo es 25,29 1,753
= 25,29 0,64,
cion
4
i.e., (24,65, 25,93).
2. Si 1 = 95 %, /2 = 0,025, t/2,15 = 2,131 y la estima1,47
del intervalo es 25,29 2,131
cion
= 25,29 0,78,
4
i.e., (24,51, 26,07).
3. Si 1 = 99 %, /2 = 0,005, t/2,15 = 2,947 y la estima1,47
del intervalo es 25,29 2,947
cion
= 25,29 1,08,
4
i.e., (24,21, 26,37).
2
Problema 7.5 Una compa
na que produce neumaticos
para

automoviles
de turismo esta considerando la posibilidad de in
torducir una cierta modificacion
no de sus productos.
en el dise
El gerente de la compa
na considera que la inversion
economi
ca que supone dicha modificacion
estara justificada solo
si
se aumentase la duracion
que ac promedio de los neumaticos

tualmente es de 20000 km. Se selecciona una muestra aleatoria de 16 prototipos del neumatico
modificado y se observa que

la duracion
promedio de los mismos es de 20758 km. Suponiendo que la vida media de los neumaticos
se distribuye normal
mente con desviacion
1500 km. (La del neumatico
estandard

que actualmente se fabrica), sugiere este experimento que se


Analisis
de Datos

141

dan las condiciones apropiadas para que el gerente autorice el


cambio de dise
no? (Tomar = 0,01).)

Solucion.
Se realizara un test parametrico para la media que
consta de las siguientes fases:

1. Hipotesis
primaria H0 : = 20000.

2. Hipotesis
alternativa H1 : > 20000.
y cuantil que marca la zona de
3. Nivel de significacion

rechazo de la hipotesis primaria: = 0,01, z = z0,01 =


2,33.
4. Estadstico de contraste: z =

20758 20000
x 0
=

=
/ n
1500/ 16

2,02.
5. Como z = 2,02 < 2,33 = z0,01 , en base a los datos
contenidos en esta muestra, no se puede rechazar la

hipotesis
primaria y por tanto se recomienda continuar
tal y como se venia haciendo hasta ahora.
la produccion
2

Problema 7.6 Una empresa de telefona movil


realiza una encuesta entre 470 personas para determinar si la opinion
de las
personas respecto a la instalacion
de una antena, depende de
la distancia entre su lugar de residencia y la ubicacion
de la
antena. Para ello se clasifico a los encuestados en tres zonas
(zona 1, zona 2, zona 3) siendo la zona 1 la mas
y la
proxima

zona 3 la mas
alejada del lugar donde se piensa instalar la
antena. La informacion
obtenida es

142

J. L. DazBarrero
Opinion
zona 1 zona 2

A favor
40
55
En contra
85
70
Indecisos
30
40
Total
155
165

zona 3 Total
60
155
50
205
40
110
150
470

1. Contrastar la independencia entre la opinion


acerca de la
antena y la distancia a la misma ( = 0,05).
2. Comentar la discrepancia entre las frecuencias observadas y esperadas para la zona 1.
Solucion.
1) Las frecuencias esperadas son

Opinion
zona 1
A favor
51.12
En contra 67.61
Indecisos
36.28
Total
155

zona 2 zona 3
54.51 49.47
71.97 65.43
38.62 35.11
165
150

Total
155
205
110
470

Entonces 2 = 14,448 y 20,05,4 = 9,49. Por tanto, RH0 .


(2) Para la zona 1, el rechazo es mayor que el que sera de
esperar si las caractersticas fueran independientes.
2

Você também pode gostar