Você está na página 1de 20

Universidad Polit

ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes:

Metodos estadsticos de la ingeniera


Ingeniera Tecnica Industrial,
todas especialidades
Estadstica
Ingeniera Tecnica Telecomunicaciones,
Telematica
Problemas de examenes

Estadstica descriptiva

Universidad Polit
ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes: Estadstica descriptiva

Problema 1
I.1 Un ingeniero estudia la relacion entre dos variables X e Y . Dispone de los valores de Y
para 15 valores de X, y sabe que la media y la varianza de los valores de X valen x = 20,
s2x = 4. Decide ajustar una recta de regresion y encuentra la ecuacion siguiente:
y = 32 x
1. Cual es el signo de la correlacion entre X e Y ? Justifica tu respuesta.
2. Calcular la covarianza de X e Y.
3. Cuanto vale y?
I.2 La siguiente tabla muestra la puntuacion de los 20 equipos de segunda division B (despues
de 25 partidos jugados). Construir un diagrama de caja y bigotes para las puntuaciones
de los equipos y comentar sus aspectos mas relevantes:
16 23 24 24 27 28 28 29 30 31
31 34 39 40 42 43 45 45 48 49

Problema 2
I.1 El Instituto Nacional de Estadstica proporciona los datos siguientes sobre el crecimiento
vegetativo, es decir la diferencia entre el n
umero de nacimientos y defunciones, en las
comunidades autonomas:
Comunidad
crecimiento
Galicia
-9865
Castilla y Leon
-8825
Asturias
-5915
Aragon
-3853
Pas Vasco
-2040
Cantabria
-1332
Cast.-La Mancha
-837
Extremadura
-553
La Rioja
-384
Navarra
136

Comunidad
Ceuta
Valencia
Melilla
Catalu
na
Baleares
Murcia
Canarias
Madrid
Andaluca

1. Calcular la mediana y los cuartiles de estos datos.

crecimiento
455
543
599
779
1230
3730
5668
11152
15489

Estadstica descriptiva
2. Realizar el diagrama de cajas y bigotes para estos datos. Para que sirve este
diagrama? Hay datos atpicos? Que representan estos u
ltimos?

I.2 Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosion.
En un estudio se recocieron cinco especmenes de la aleacion a 7000 cada uno durante un
intervalo de tiempo distinto (x, en minutos). Despuees se midio el potencial de pasivacion
(y, en mV)- una medida de resistividad de la aleacion cristalizada- para cada especimen.
Los datos experimentales son los siguientes:
x 10
20
45
90
120
y -408 -400 -392 -379 -385
1. Suponiendo que la mejor forma de describir la relacion entre las variables es lineal,
ajustar una recta de regresion a los datos. Calcular r2 e interpretar el resultado.
2. Cual es el potencial de pasivacion cuando el tiempo de recocido es de 30 minutos?

Problema 3
1. Con el fin de determinar la profundidad de un lago subterraneo, se midio el contenido
de oxgeno, en miligramos/litro, a distintas profundidades, en metros, obteniendose los
siguientes resultados:
profundidad ( m ) 15 20 30 40 50 60 70
oxgeno ( mg/l )
6.5 5.6 5.4 6.0 4.6 1.4 0.1
Se pide:
(a) Ajustar una recta a los datos obtenidos por el metodo de los mnimos cuadrados.
(b) Estudiar la bondad del ajuste.
(c) A que profundidad es previsible que nos encontremos si el contenido en oxgeno
medido es de 3.2 mg/l?.

Problema 4
I.1 En la direccion http://dataservice.eea.eu.int/dataservice/, se pueden encontrar los datos
de emision de CO2 por fuentes fosiles para los distintos paises europeos entre los a
nos
1985 y 1997. Se indican a continuacion los datos de emision total de este contaminante
para Espa
na entre los a
nos 1990 y 1997.
A
no (X)
90
91
92
93
94
95
96
97
Emision total (Y ) 203.8 215.5 225.1 211.5 222.8 237.5 226.6 242.8
( Megatoneladas)
Se pueden utilizar las cantidades numericas siguientes:
X
X
X
X
X
xi = 748;
x2i = 69980;
yi = 1785.6;
yi2 = 399722;
xi yi = 167142
1. Realizar el ajuste lineal de la emision total en funcion del a
no. Calcular el valor de
R2 y comentar la bondad del ajuste.

Estadstica descriptiva

2. Seg
un nuestro modelo, se esta produciendo un aumento o un descenso de la emision
de CO2?
3. Seg
un nuestro modelo, cual sera la cantidad de CO2 emitida en 1998 por Espa
na?
I.2 A continuacion se presentan los diagramas de caja-bigotes para la emision total de cuatro paises de la Union europea entre 1990 y 1997. ( ES=Espa
na, FR=Francia,
GB=Gran Breta
na, y IT=Italia).

1. Como se construye un diagrama de caja-bigotes?


2. Como clasificara estos cuatro paises en cuanto a contaminacion por CO2?
3. Cual es el pas que presenta mayor dispersion entre sus datos de contaminacion?
Que quiere decir?
4. Si se realiza un ajuste lineal de la emision de CO2 en funcion del a
no para cada uno
de los paises, obtenemos las rectas siguientes:
Espa
na
Emision= 196.4 + 4.48 a
no
Francia
Emision= 403.2 0.51 a
no
Gran Breta
na Emision= 1126.2 6.15 a
no
Italia
Emision= 192.9 + 2.143 a
no
Que paises han ido reduciendo sus emisiones entre 1990 y 1997? Que paises las
han incrementado? Cual es el pas que mas ha reducido sus emisiones de CO2?
Cual es el pas que mas las han incrementado?

Problema 5

Estadstica descriptiva

I.1 En la siguiente tabla estan representados los datos referidos al alquiler pagado mensualmente por 45 familias que habitan pisos de alquiler en una determinada ciudad:
Alquiler en miles de ptas. N
umero de familias
(0 15]
5
(15 30]
12
(30 60]
16
(60 90]
10
(90 120]
2
Se pide:
1. Representar graficamente la variable mediante un histograma. Cuales son las caractersticas de dicho histograma? Que medidas de centralizacion y dispersion son
mas adecuadas para resumir los datos? Razonar la respuesta.
2. Calcular el alquiler medio pagado por las familias analizadas. En que intervalo se
sit
ua la mediana? Cual es el intervalo modal?
3. Cual es la proporcion de familias que pagan un alquiler menor o igual a sesenta mil
ptas.?
I.2. Los siguientes datos se refieren al crecimiento de una colonia de bacterias en un medio de
cultivo:
x 3
6
9
12
15
18
y 115000 147000 239000 356000 579000 864000
siendo x los das desde la inoculacion e y el n
umero de bacterias.
1. Representar y en funcion de x para verificar que es razonable ajustar una curva
exponencial.
2. Ajustar una curva exponencial a los datos.
3. Estimar, usando el modelo ajustado en el apartado anterior, el n
umero de bacterias
al termino de 20 das.

Problema 6
I.1- Seg
un el principio de la termodinamica, la presion P y el volumen V de una determinada
masa de gas estan relacionados por la siguiente formula :
PV = C
donde y C son dos constantes. Supongamos que disponemos de n mediciones de la
presion y del volumen, (p1 , v1 ), . . . , (pn , vn ) cual es la manera de obtener valores de las
dos constantes y C? (pensar en una transformacion de los datos).

Estadstica descriptiva

I.2- La comision de comercio federal americana midio el n


umero de miligramos de tar (X) y
monoxido de carbono (C0) (Y ) por cigarrillo en las distintas marcas comerciales disponibles.
Se tomo una muestra de 12 marcas, obteniendo para cada una:
X
Y

9 4 14 12
6 6 14 12

10
12

5 3
7 4

17 6
18 8

7 8
8 13

15
13

a) Calcula el porcentaje de marcas con un nivel de C0 inferior a 8. Calcula los cuartiles


de la distribucion de X.
b) Ajusta una recta de regresion de Y sobre X y discute la bondad del ajuste.
P
P
P
P 2
P 2
(Ayuda:
x = 110;
y = 121;
xy = 1294
x = 1234;
y = 1411)
I.3- Se realizaron investigaciones con el fin de estudiar la relacion entre la elevacion de la
temperatura de las celdas solares en Co por encima de la temperatura ambiente (y) y
la cantidad de aislamiento en megawatts por centimetro cuadrado (x), obteniendose los
siguientes datos:
x
y

9
25

25 20 12
70 50 30

15 22
45 60

14
28

16 24 25
50 68 68

15
20

12
21

10
20

1. Se quiere desarrollar un modelo que explique la evolucion de y en funcion de la


variable x. LLevar a cabo el ajuste correspondiente y comentar su bondad.
2. Para un aislamiento de 62 que temperatura cabe esperar?

Problema 7
I.1.- Describir las caractersticas globales del histograma siguiente. En tu opinion, para ese
conjunto de datos, cuales son las medidas de centralizacion y de dispersion mas representativas? Justifica tu respuesta.

Estadstica descriptiva

I.2- Una fabrica de refrescos ha tomado aleatoriamente 6 semanas del a


no observando la Temperatura media correspondiente a cada una de ellas, y la Cantidad de refrescos pedidos
durante cada una de estas semanas. Los datos obtenidos son los siguientes:
Temperatura media (o C )
28 12 30 24 5 15
Cantidad de refrescos pedidos (miles de litros) 65 19 75 67 11 24
(a) Calcular la media y la varianza de cada variable.
(b) Realizar un ajuste por mnimos cuadrados de la Cantidad de refrescos pedidos respecto de la Temperatura media. Comentar la bondad del ajuste.
(c) Si el modelo lineal es correcto, cual sera la cantidad de refrescos pedidos para una
semana donde la temperatura media sea igual a 20o C?

Problema 8
I.2.- En un estudio sobre la rapidez de combustion del grafito artificial en un flujo de aire
h
umedo, se llevo a cabo un experimento para investigar la difusividad del Oxgeno a
traves de una mezcla de vapor de agua. Para ello se prepararon muestras de Nitrogeno y
Oxgeno con una fraccion molar de agua de 0.017 a 9 temperaturas distintas, midiendose
la difusividad del Oxgeno en cada una, obteniendose:
T emperatura
1
1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
Dif usividadO2 1.69 1.99 2.31 2.65 3.01 3.39 3.79 4.21 4.64
(a) Realice el diagrama de dispersion correspondiente. Es posible el ajuste de un modelo de regresion lineal simple, que relacione la difusividad del O2 en funcion de la
temperatura? Como debe salir el coeficiente de correlacion? (positivo, negativo,
cerca de 0?).
(b) En caso afirmativo, obtener la correspondiente recta de regresion utilizando la tecnica
de los mnimos cuadrados.
(c) Hallar el coeficiente de determinacion r2 e interpretar su valor.
(d) Cual sera la prediccion sobre la difusividad del O2 , para una temperatura de 3o a
partir del modelo construido?.

Problema 9
I.3 La tabla siguiente representa los datos correspondientes a 9 pruebas donde se ha estudiado
el volumen de desgaste de una pieza (Y ) dependiendo de la viscosidad del aceite (X)
X(aceite) 1.6 9.4 15.5 20.0 22.0 35.5 43.0 40.5 33.0
Y (desg.) 240 181 193 155 172 110 113 75
94
(a) Construye un grafico de dispersion ( es decir nube de puntos) de los datos. Parece
plausible el uso de un modelo de regresion lineal simple? Como debe salir el coeficiente de correlacion?.

Estadstica descriptiva

(b) Ajusta una recta de regresion utilizando la tecnica de los mnimos cuadrados. Comentar la bondad del ajuste.
(c) Cual sera la prediccion sobre el desgaste para una viscosidad de 45?. Obtener el
valor ajustado de y para x = 22 y calcular el residuo correspondiente.

Problema 10
I.3.- Con el fin de estudiar la relacion existente entre la densidad de tr
af ico, representada en
n
umero de automoviles por kilometro, y la velocidad a la que se circula en una determinada avenida de una ciudad, el ayuntamiento decide tomar una muestra durante un
mes seleccionando aleatoriamente 10 das laborables del mismo. Los resultados que se
obtuvieron vienen reflejados en la siguiente tabla:
Densidad de tr
af ico 69
56
V elocidad
25.4 32.5

62
28.6

119
11.3

84
21.3

74
22.1

73
22.3

90
38
22
18.56 37.2 44.6

(a) Calcular la media y varianza asociada a cada una de las variables.


(b) Calcular la covarianza existente entre ambas variables as como el coeficiente de correlacion.
(c) Realizar un ajuste por mnimos cuadrados de la Densidad de tr
af ico respeto a la
V elocidad.
(d) Deducir, suponiendo que la relacion proporcionada por las rectas de regresion es
valida,
(d.1) A que velocidad se estima que se circulara, si la densidad de trafico es de 85
autom
oviles/km?.
(d.2) Si se desea regular la velocidad modificando los semaforos que dan acceso a la
avenida, calcular a partir de la recta de regresion correspondiente, cual debe de
ser la densidad de trafico para que la velocidad sea de 30 Km/h.

Problema 11
1. Una empresa encarga a su departamento de recursos humanos un estudio con el fin de
determinar si existe relacion entre el tiempo que llevan en la empresa sus empleados y el
absentismo laboral (faltas al trabajo). Con el fin de realizar dicho estudio se seleccionan
al azar 10 empleados obteniendose los siguientes resultados:
Antig
uedad en la empresa
Das perdidos (a
no)

25
1

13 19 12 6 33
6 6 9 12 4

4 40
4 2

16
5

20
3

(a) Puede afirmarse que los empleados de mayor antig


uedad faltan con mas frecuencia
al trabajo?. Razona tu respuesta utilizando el coeficiente de correlacion.
(b) Que podemos afirmar de un empleado con una antig
uedad de 15 a
nos?

Estadstica descriptiva

Problema 12
1. En un lago, se ha medido, para diversos valores de la profundidad, el contenido en oxgeno,
en miligramos/litro, obteniendose los siguientes datos .
P rof undidad
Contenido. O

15 20 30
6.5 5.6 5.4

40
6.0

50
4.6

60 70
1.4 0.1

(a) Calcular la media y la varianza asociada a cada variable.


(b) Calcular la covarianza de las dos variables as como el coeficiente de correlacion.
Interpretar los resultados obtenidos.
(c) Realizar el ajuste de mnimos cuadrados del contenido respecto de la Profundidad as
como el ajuste de la profundidad respecto del contenido. Si la relacion proporcionada
por las rectas de regresion es valida, cual sera el valor del contenido de oxgeno a
una profundidad de 45m.

Problema 13
I.3.- Con el fin de determinar si existe relacion entre la cantidad de polmeros de latex incluida
durante el proceso de mezclado de cemento Portland y su resistencia adhesiva a tension,
una empresa encargada de realizar certificaciones de obras toma una muestra de tama
no
10, obteniendo los siguientes resultados:
P olmeros latex (mgr/kg) 13.5 11.0 13.0 11.2 12.0 13.2 12.0 13.5 11.2 13.0
Resistencia (kgf /cm2 )
17.5 16.6 17.2 16.6 17.0 17.3 16.9 17.3 16.8 17.1
(a) Calcular la media y varianza asociada a cada una de las variables.
(b) Calcular la covarianza existente entre ambas variables as como el coeficiente de correlacion.
(c) Realizar un ajuste por mnimos cuadrados de la resistencia respeto a la cantidad de
polmeros a
nadida en la mezcla.
(d) Deducir, suponiendo que la relacion proporcionada por las rectas de regresion es
valida,
(d.1) El valor estimado para la resistencia si la cantidad de polmero agregado es de
11.5mgr/kg.
(d.2) Si un determinado constructor desea que la argamasa tenga una resistencia de
16.5kgf /cm2 , calcular a partir de la recta de regresion correspondiente, cual
debe de ser la cantidad de polmero de latex que se debe a
nadir.

Problema 14

Estadstica descriptiva

1. Se quiere estudiar la relacion entre la proliferacion de una cierta especie de planta silvestre
y la cantidad de lluvia cada. Para ello, se define en varias comunidades autonomas un
coto de prueba de 1 hectarea y se realiza el recuento de ejemplares en el coto. En la
tabla siguiente se han recogido los resultados obtenidos junto con la precipitacion acuosa
registrada ese a
no.
Comunidad
Madrid Extremadura Andaluca Castilla-Leon Murcia
Precipitacion (mm) 429.8
628.6
224.7
484.9
320.5
No de ejemplares:
1250
1702
720
1301
830
(a) Calcular, para esos datos, la media, la varianza as como el coeficiente de variacion
asociada a cada variable.
(b) Calcular la covarianza existente entre ambas variables as como el coeficiente de
correlacion. Interpretar los resultados obtenidos.
(c) Realizar un ajuste por mnimos cuadrados del n
umero de ejemplares respecto a la
precipitacion, y de la precipitacion respecto al n
umero de ejemplares. Comentar la
calidad del ajuste. Si las relaciones proporcionadas por las rectas de regresion son
validas, que n
umero de ejemplares se asociara a una precipitacion de 500mm?

Problema 15
1. Con el fin de estudiar la relacion existente entre la fuerza de torsion aplicada a un tipo
de acero (en miles de libras) y su alargamiento medido en milesimas de pulgadas, se
seleccionaron aleatoriamente 6 probetas de prueba de longitud dada y se sometieron a
distintas cargas. Los resultados que se obtuvieron vienen reflejados en la siguiente tabla:
Torsion aplicada 1 2 3
Alargamiento
14 33 40

4
63

5
76

6
85

(a) A la vista de los resultados, resulta evidente que una mayor Fuerza de Torsion
produce un mayor alargamiento de la probeta. Desde un punto de vista estadstico,
en que se traduce esta informacion?
(b) Realizar un ajuste por mnimos cuadrados que nos permita predecir el alargamiento
de la probeta para distintas Fuerzas de Torsion aplicables.
(c) Deducir, a partir del ajuste que nos proporciona el criterio de mnimos correspondiente, el alargamiento que debe producirse al aplicar una fuerza de torsion de 3500
libras. Podramos predecir el alargamiento si aplicamos 10000 libras?. Razona tu
respuesta.

Problema 16
1. Con el fin de estudiar la congestion de trafico que se produce en una determinada va, se
decide tomar una muestra seleccionando 10 das laborables en una determinada hora y se
anotan tanto el n
umero de vehculos que se encuentran en la va en ese momento como
la velocidad promedio de los vehculos que se encuentran en ese momento en la va. Los
resultados que se obtuvieron vienen reflejados en la siguiente tabla:
Num vehculos
69
56
Velocidad (km/h) 25.4 32.5

62
26.8

119 84
74
11.3 21.3 22.1

73
22.3

90
18.6

38
22
37.2 44.6

10

Estadstica descriptiva
(a) Deducir, en funcion de los valores que se presentan, el signo de la covarianza entre
estas caractersticas.Como podemos interpretar esta informacion?
(b) Si llamamos X=N
um. de vehculos y Y=Velocidad promedio, sabiendo que:
P
P 2
P
P 2
P
xi = 687
xi = 53791
yi = 262.1
yi = 7705.7
xi yi = 15700
realizar un ajuste por mnimos cuadrados de la Velocidad promedio en funcion del
N
umero de vehculos y comentar la bondad del ajuste.
(c) Deducir, a partir del ajuste que nos proporciona el criterio de mnimos correspondiente:
i. Cual sera la velocidad promedio estimada si nos encontramos con 80 vehculos
en la avenida?
ii. Si deseamos regular la velocidad promedio modificando la secuencia de los
semaforos, cuantos vehculos deben encontrarse en la avenida para que la velocidad promedio sea de 30 km/h.?

Problema 17
1. Con el fin de analizar el tiempo de respuesta de una base de datos de consulta se tomaron
15 datos correspondientes a 3 semanas consecutivas obteniendose los siguientes resultados:
Lun Mart Mi
erc Juev Viern
Semana 1 4.32
7.14
9.21
9.71
15.39
Semana 2
5.2
8.37
9.34 10.46
18.9
Semana 3 6.39
8.97
9.51 10.53
21.25
(a) Calcular la media, mediana, cuartiles y desviacion tpica correspondiente a estos
datos.
(b) En funcion de los valores observados, entre que valores podemos decir que se encuentran los datos no atpicos?, existen datos que puedan considerarse atpicos?
(c) Que medida de dispersion utilizaras? Razona tu respuesta.
(d) Con el fin de determinar la relacion entre el tiempo de respuesta de la base
de datos y el n
umero de usuarios se midieron simultaneamente a la obtencion
del tiempo de respuesta, el n
umero de usuarios activos en ese instante, obteniendose
un conjunto de 15 datos cuyo valor medio era 30.73 y cuya varianza era 79.40. El
estudio concluyo con la siguiente relacion lineal entre ambas caractersticas:
T iempo = 0.51 U suarios 5.42
i. Determinar el coeficiente de determinacion asociado al ajuste.
ii. Determinar el n
umero de usuarios activos, si el tiempo de respuesta de servidor
es de 32.

Problema 18

Estadstica descriptiva

11

I.1 Sea x1 , x2 , ......, xn una realizacion muestral de una M.A.S. de tama


no n. Justifica como
queda afectada la media y la varianza muestral en los siguientes casos:
(a) A todas las observaciones se les suma una constante k.
(b) Todas las observaciones se multiplican por una constante k.

Problema 19
1. Despues de la jornada 22 en la liga 02/03, los puntos de la clasificacion quedan como
sigue:
Puntos 44 42 42 39 36 36 32 29 28 28 27 27 27 27 27 26 26 22 22 15
(a) Calcular la mediana y los dos cuartiles asociados a este conjunto de datos.
(b) Realizar un diagrama de caja-bigotes de los datos. Aparecen datos atpicos?
(c) Como interpreta el hecho de que el primer cuartil esta muy proximo a la mediana?
Quien va a ganar la liga?
2. Un ingeniero estudia la relacion entre una variable Y y otra variable X. Para ello dispone
de los valores de Y para 15 valores de X y sabe que la varianza de X vale 3.4. Decide
ajustar una recta de regresion y encuentra la ecuacion siguiente:
y = 2.3x + 5.
(a) Cual es el signo de la correlacion entre X e Y ? Justifica tu respuesta.
(b) Cuanto vale la covarianza de X y de Y ?
(c) Si x = 5.3, cuanto vale y?
(d) Que medida debe el ingeniero calcular para cuantificar la bondad del ajuste? Cuando
se considera que el ajuste es bueno?

Problema 20
Se mide el tiempo que tienen que esperar los usuarios para que llegue el ascensor B en la
planta baja del hospital de Marina. Despues de varios das de recogida de datos, los resultados
obtenidos (en segundos) se presentan en la tabla siguiente:
Tiempos de espera No de usuarios
[0, 125]
66
[125, 250]
21
[250, 375]
10
[375, 500]
3
I.1

1. De cuantos datos disponemos? Representar graficamente la variable mediante un


histograma.

12

Estadstica descriptiva
2. De los modelos de variables aleatorias vistos en clase, escoge uno que pueda describir aproximadamente la distribucion de los valores de esta tabla. Justificar la
respuesta.
3. Utilizando las marcas de clases (es decir el punto medio de cada intervalo en la tabla
de frecuencias) calcula la media y la varianza del conjunto de datos.

Problema 21
I.1 Para tener una buena imagen de la pantalla del ordenador es necesario que la tension de la
rejilla metalica situada detras de la pantalla no sea ni demasiado alta ni demasiado baja.
Por este motivo, durante la produccion el fabricante controla la tension de dicha rejilla.
Los siguientes resultados corresponden a estas mediciones sobre 20 rejillas:
M ediciones de la tensi
on N o de rejillas
257 X < 277
2
277 X < 297
7
297 X < 317
5
317 X < 337
3
337 X < 357
2
357 X < 377
1
Se pide:
I.1

1. Representar graficamente la variable mediante un histograma. Comentar las caractersticas mas relevantes de dicho histograma. Que medidas de centralizacion y
dispersion son mas adecuadas para resumir los datos? Razonar la respuesta.
2. Calcular la tension media de las rejillas analizadas. En que intervalo se sit
ua la
mediana? Cual es el intervalo modal?
3. Para que una rejilla sea apta para su ensamblaje en la pantalla de un ordenador su
tension media debe de situarse en el intervalo [306,328]. Debe el fabricante iniciar
una investigacion del proceso productivo? Razonar la respuesta.

I.2 Con el fin de determinar la relacion existente entre la resistencia de una determinada pieza
de plastico y uno de sus componentes (componente A) se fabrican 10 piezas de prueba,
cada una con una concentracion distinta y se obtienen los siguientes resultados:
P ieza
1
2
3
4
5
6
7
8
9
10
X (% A)
1.5 1.2 1.1 1.0 4.5 5.2 8.7
9.0
9.2
9.5
Y (Rotura) 3.04 2.96 2.66 3.17 9.82 9.68 17.71 18.18 18.32 19.30
donde la variable rotura indica la fuerza empleada a traccion en el instante de su rotura.
A partir de los datos anteriores se obtienen las siguientes cantidades:
X
X
X
X
X
xi = 50.9;
x2i = 384.77;
yi = 104.84;
yi2 = 1577.53;
xi yi = 778.33
1. Realizar un ajuste lineal de la rotura en funcion del contenido en el componente A.
Calcular el valor de r2 y comentar la bondad del ajuste.

Estadstica descriptiva

13

2. Seg
un nuestro modelo, cual sera la resistencia para un 3% de contenido de componente A?
3. Un determinado comprador nos pide que le fabriquemos piezas con un 6% de componente A y nos exige que tengan una resistencia de 10 Nwt a traccion. Podemos
afirmar que somos capaces de cumplir las especificaciones? Razonar la respuesta.

Problema 22
I.1 Que densidad de siembra de maz debe utilizar un agricultor para obtener el maximo
rendimiento? Si crecen pocas plantas obtendra un rendimiento bajo. Por otro lado,
si hay demasiadas plantas, estas competiran entre s por el agua y los nutrientes, y
en consecuencia el rendimiento bajara. Para averiguar cual es la mejor densidad de
siembra, se planta maz con distintas densidades de siembra en 32 parcelas de identicas
caractersticas y se obtienen los siguientes datos:
Y
X
1
2
3
4

[130, 218)

[218, 306)

[306, 394)

3
2
0
0

3
5
7
5

0
0
4
3

X: No de plantas por hectarea (104 ), Y : Rendimiento (Tm. por Ha.).


1. Cual es el n
umero de plantas por hectarea mas habitual? Y el n
umero medio de
plantas por Ha.?
2. Obtener el rendimiento medio por Ha.. Determinar el porcentaje de parcelas cuyo
rendimiento es mayor o igual que el rendimiento medio.
3. Calcular el porcentaje de parcelas, en las que se plantaron mas de 20000 plantas,
cuyo rendimiento por Ha es mayor a 262 Tm/Ha.
4. Con el fin de determinar la relacion entre la rentabilidad por Ha. y el n
umero de
plantas de maz plantadas por Ha., un ingeniero agronomo analiza los anteriores
datos y decide ajustar el siguiente modelo lineal entre las caractersticas X e Y :
Y = 186.56 + 33.2X

con r2 = 0.83

4.1. Cual es el signo del coeficiente de correlacion entre X e Y ? Razona tu respuesta.


4.2. Para una densidad de siembra de 35000 plantas por Ha., cual sera la rentabilidad por Ha. estimada con el modelo? Es fiable esta estimacion? Razona tu
respuesta.
5. Cual sera tu conclusion sobre la densidad de siembra para obtener el maximo
rendimiento?

Problema 23

14

Estadstica descriptiva

I.1 Los datos que a continuacion se detallan corresponden a la produccion (en miles de toneladas)
de hortalizas y frutales en Espa
na durante una campa
na agrcola:
Hortalizas
Esparrago
Guisantes verdes
Habas verdes
Ajos
Judas verdes
Alcachofa
Fresa y Freson
Col repollo
Coliflor

103 T m.
62.8
63.2
69.5
160
261.3
283.7
317.3
332.8
353

Hortalizas 103 T m.
Sanda
815.9
Pimiento
882.8
Cebolla
981.2
Melon
993.1
Lechuga
1041.8
Tomate
3560.4

Frutales
Avellana
Cereza
Ciruela
Albaricoque
Almendra
Platano
Pera
Manzana
Melocoton

103 T m.
16.2
54.4
136.1
149.8
202.6
385.2
599.8
719
896.8

El diagrama de caja y bigotes realizado con Statistix es el siguiente:


1. Colocar en cada lnea del grafico su valor numerico.
2. Comentar las caractersticas mas relevantes del grafico. En ambos diagramas las
cajas aparecen divididas en dos partes desiguales, como interpretas esta situacion?
3. Existen datos atpicos en algunas de las producciones? Que representan?
I.2 En una determinada region se sabe que las precipitaciones cadas dependen de la cantidad
de vegetacion en la zona. Se dispone de los siguientes datos:
X
Y

50 100 150
20 70 100

200 300
150 200

X: n
umero de arboles por Ha., Y : n
umero de litros cados por m2 .
1. Realizar un ajuste por mnimos cuadrados del volumen de agua cada por m2 en
funcion del n
umero de arboles por Ha. Calcular una medida de la bondad del ajuste
realizado.
2. Utilizando la recta ajustada en el apartado anterior, predecir el volumen de agua
cado cuando el n
umero de arboles por Ha. en la zona es 175. Es fiable esta
prediccion? Razona tu respuesta.

Problema 24
I.1 La edad de un arbol se estudia atendiendo al n
umero de anillos en la seccion transversal del
tronco. Con el fin de analizar la edad de los arboles de un determinado bosque, mediante
un proceso de simulacion por ordenador se determina el n
umero aproximado de anillos
en la seccion transversal del tronco seg
un el diametro de este. Para una muestra de 40
arboles se obtienen los siguientes resultados:
No de anillos
No de a
rboles

(0,10]
3

(10,20]
10

(20,30]
18

(30,40]
8

(40,50]
1

Estadstica descriptiva

15

1. Calcular la media y la desviacion tpica correspondiente al n


umero de anillos en la
seccion transversal del tronco. Que tipo de informacion proporcionan acerca del
conjunto de datos?
2. Representar graficamente la variable mediante un histograma. De los modelos de
variables aleatorias que hemos visto, escoge uno que pueda describir aproximadamente el n
umero de anillos en la seccion transversal de un arbol. Razona tu respuesta.
3. Un arbol se considera anciano si el n
umero de anillos en su seccion transversal es
superior a 30. Determinar la proporcion de arboles no ancianos obtenidos en la
muestra.
4. El estudio concluyo con la siguiente relacion entre la edad, en a
nos, de un
arbol
y el n
umero de anillos en la secci
on transversal de su tronco:
Edad = 0.51 N o de anillos + 5.8
(a) Determinar razonadamente el signo de la covarianza entre la edad de un arbol
y el n
umero de anillos de su tronco. Podras dar un valor numerico para ella?
(b) Determinar la edad aproximada para un arbol que se le han contado 24 anillos
en su tronco?

Problema 25
I.2 Se quiere estudiar la relacion entre la rentabilidad del trigo respecto del nivel de nitrogeno
(N). Para ello, se planto trigo en 7 parcelas de tierra de identicas caractersticas y se
les suministraron diferentes niveles de nitrogeno. Los resultados aparecen en la tabla
siguiente:
Unidades (N/acre) (x)
40
60
80 100 120 140 160
Rentabilidad (Tm/acre) (y) 15.9 18.8 21.6 25.2 28.7 30.4 30.7
Se pueden utilizar las cantidades numericas siguientes:
P
P
P 2
P 2
P
xi = 700
yi = 171.3
xi = 81200
yi = 4398.2
xi yi = 18624
1. Ajustar una recta para predecir la rentabilidad del trigo en funcion del nivel de
nitrogeno. Calcular r2 e interpretar su valor.
2. Estimar, utilizando el modelo ajustado en el apartado anterior, la rentabilidad del
trigo cuando el nivel de nitrogeno es de 60 unidades. Es fiable esta prediccion?
Razona tu respuesta.

Problema 26
I.1 Describir las caractersticas globales del siguiente histograma. Indicar de manera razonada
cuales seran las medidas de centralizacion y dispersion mas adecuadas para resumir dicho
conjunto de datos:

16

Estadstica descriptiva

I.2 En julio, las cepas producen racimos de peque


nas bayas, y se quiere utilizar un recuento
de esos racimos para predecir la cantidad de uva que se recogera. En la tabla siguiente
aparece, para varios a
nos, la cosecha de uva en toneladas por acre y la cantidad de racimos
contabilizados en julio:
A
no
1976 1977 1978 1979 1980 1981 1982
No racimos (x) 116
80
125 116 117
93
107
Produccion (y) 4.9
3.9
4.8
4.6
4.7
4.1
4.4
Se pueden utilizar las cantidades numericas siguientes:
P
P
P 2
P 2
P
xi = 754
yi = 31.4
xi = 82724
yi = 141.68
xi yi = 3416
1. Se quiere desarrollar un modelo que explique la produccion de uva respecto del
n
umero de racimos contabilizados en julio. Llevar a cabo el ajuste correspondiente
y comentar su bondad.
2. Si en julio se contabilizaron 122 racimos, cual sera el ingreso esperado de la produccion de uva si en dicho a
no el precio de venta del kilo de la uva es de 1.40 euros?

Problema 27
I.1 Una empresa vitivincola desea realizar un estudio sobre la influencia de las campa
nas
publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a publicidad y
sus ventas en los u
ltimos cinco a
nos.
OS GAST OS EN P U BLICIDAD() V EN T AS()
AN
1996
2.5
200
1997
2.8
221
1998
2.9
230
1999
3.1
239
2000
3.5
248
() Los gastos en publicidad y las ventas vienen en millones de pesetas.
Se pide:
1. Se quiere desarrollar un modelo que explique la evolucion de las ventas en funcion
de los gastos en publicidad. Llevar a cabo el ajuste correspondiente y comentar su
bondad.
2. Predecir las ventas para este a
no 2001, si se tiene previsto invertir en publicidad 4
millones de pesetas.
I.2 Se ha aplicado un test sobre capacitacion laboral a 90 empleados de una industria, obteniendose
los siguientes resultados:
P U N T U ACION ES N o de EM P LEADOS
[38, 44)
7
[44, 50)
8
[50, 56)
15
[56, 62)
27
[62, 68)
18
[68, 74)
9
[74, 80]
6

Estadstica descriptiva

17

Se pide:
1. Representar graficamente la variable mediante un histograma. Comentar las caractersticas
mas relevantes de dicho histograma. Que medidas de centralizacion y dispersion son mas
adecuadas para resumir los datos? Razona tu respuesta.
2. Calcular la puntuacion media obtenida en el test. En que intervalo se sit
ua la mediana?
Cual es el intervalo modal?
3. Que proporcion de empleados tiene una puntuacion mayor o igual a 62?

Problema 28
I.1 Una empresa productora de ctricos constata que las producciones de dos fincas son de
calidad distinta aunque utilizan la misma especie de arboles. Despues de notar que los
dos tipos de suelo son distintos (la finca A esta constituida de suelo fino y homogeneo
mientras que la finca B tiene una mezcla de suelo fino y suelo mas grueso) decide hacer
mediciones de la densidad del suelo en las dos fincas:
FINCA A
FINCA B
85.9 88.2 90.4 91.1 92.7 92.8
86.8 87.5 90.3 91.4 92.4 92.6
93.8 94.1 94.3 96.5 98.5 103.8
93.5 93.9 94.8 94.9 95.0 97.5
1. Realiza en un mismo grafico un diagrama de caja y bigotes de la densidad de la finca
A y la finca B. Comentar las caractersticas mas relevantes.
2. Te parece que la densidad se distribuye sensiblemente de la misma manera para las
dos fincas?
I.2 Una empresa de productos lacteos quiere estudiar la relacion entre el contenido en materia
grasa de la leche de vaca y la cantidad de lluvia caida (a mayor precipitacion acuosa
mejor sera el forraje para la alimentacion del ganado). Los siguientes datos se refieren al
porcentaje de contenido en grasa junto con la precipitacion acuosa registrada durante el
primer semestre del a
no:
contenido de grasa %
precipitacion (l/m2 )

4.2
524

4.13
502

4.14 4.08 3.98


464 484 310

3.92
320

1. Realizar el diagrama de dispersion correspondiente. Cual es el tipo de relacion entre


las dos variables? Se trata de una relacion positiva o negativa?
2. Realizar un ajuste por mnimos cuadrados del contenido de materia grasa respecto
de la precipitacion. Hallar el coeficiente de correlacion e interpretar su valor.
3. Estimar, usando el modelo ajustado en el apartado anterior, el contenido de materia
grasa para un mes con una precipitacion de 450 l/m2 .

Problema 29
La mejora de la tecnologa (mecanizacion, fertilizantes, nuevas variedades de plantones, etc,)
ha dado lugar que la productividad (P ) y el tiempo (t) esten relacionados por la formula P =
et donde y son dos constantes. Supongamos que tenemos n datos de la productividad
y el tiempo, que transformacion de los datos nos lleva a obtener las constantes y ? Realiza
dicha transformacion y propon las formulas para obtener las citadas constantes. (1 pto)

18

Estadstica descriptiva

Você também pode gostar