Você está na página 1de 10

PROYECTO FINAL

Estadística.

Instituto IACC
Desarrollo

1) Utilizando la variable “Tipo de licencia”, se pide:

a) Identifique la población. (1 punto)

La población en estudio es de 180 personas de las comunas de Maipú y Puente Alto de las cuales

48 son mujeres y 132 son hombres y fueron sometidas a un test de que tan nocivo es el alcohol

en la conducción.

b) Clasifique la variable en estudio. (1 punto)

Es una Variable Cualitativa Nominal.

c) Construya un gráfico circular para la variable “Tipo de licencia”. Considere la tabla adjunta en

la hoja de desarrolla. (2 puntos)

Etiquetas de fila Cuenta de ID conductor


A1 29
A2 37
B 114
Total general 180

GRÁFICO TOTAL TIPO DE LICENCIA

A1, 29, 16%

A1
A2, 37, 21% A2

B, 114, 63% B
2) Considerando el histograma que se presenta a continuación:

a) Realice la interpretación del histograma.

Para la interpretación del histograma considere los siguientes cuatro aspectos: la forma de la

distribución (coeficiente de asimetría), el rango de la distribución, la mayor y menor

frecuencia. (2 puntos)

Intervalo MC fi Fi hi Hi Xi*f f*(media_xi)^2 f*(media_xi)^4


22 26 24 8 8 0,044 0,04 192 1.060.045.432 1.404.620.398
26 30 28 19 27 0,106 0,15 532 1.071.919.012 6.047.422.995
30 34 32 39 66 0,217 0,37 1248 4.807.881.481 5.927.108.805
34 38 36 48 114 0,267 0,63 1728 1.147.259.259 2.742.091.267
38 42 40 44 158 0,244 0,88 1760 8.866.054.321 1.786.520.891
42 46 44 19 177 0,106 0,98 836 1.369.163.457 9.866.360.902
46 50 48 2 179 0,011 0,99 96 3.119.446.914 4.865.474.523
50 54 52 1 180 0,006 1,00 52 2.718.834.568 7.392.061.408
180 6392 5.191.938.765 3.720.496.838
Rango de distribución A=4

El Rango mayor es 27%, es 34-38

El Rango menor es 1%, es 50-54

El coeficiente de asimetría es negativo, representada en el grafico por que la concentración

de los datos se encuentra al lado izquierdo.


b) Para la variable “Edad”, interprete las medidas de tendencia central. (2 puntos)

Las medidas de tendencia central de la planilla (Edad), es el tipo datos agrupados.

Edad

Media 36,25
Error típico 0,42441584
Mediana 36
Moda 33
Desviación estándar 5,69413596
Varianza de la muestra 32,4231844
Curtosis 0,01814469
Coeficiente de asimetría -0,11262571
Rango 32
Mínimo 22
Máximo 54
Suma 6525
Cuenta 180

3) Utilizando la información de la base de datos, realice lo siguiente:

a) Construya una tabla bidimensional de frecuencia absoluta que resuma la información con

respecto a las variables “Rango de tiempo” y “Experiencia”. (2 puntos)

Cuenta de ID conductor Etiquetas de columna


Etiquetas de fila Alta Baja Media Total general
0,8 - 1,4 2 1 3 6
1,4 - 2,0 25 8 20 53
2,0 - 2,6 38 15 40 93
2,6 - 3,2 11 3 12 26
3,2 - 3,8 2 2
Total general 76 27 77 180
b) Determine el porcentaje de conductores con experiencia baja o media y si tienen un tiempo

de reacción sobre 1,8 segundos. (1 punto)

Cuenta de ID Etiquetas de
conductor columna
Etiquetas de Total
fila 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,4 general
Alta 2,7% 6,7% 3,3% 4,7% 5,3% 4,0% 3,3% 4,7% 2,0% 1,3% 1,3% 2,7% 0,0% 0,0% 42,0%
Baja 1,3% 0,7% 2,0% 3,3% 0,7% 2,0% 1,3% 0,7% 1,3% 0,7% 0,0% 0,0% 0,0% 0,0% 14,0%
Media 2,7% 5,3% 8,0% 2,0% 6,7% 4,0% 3,3% 2,7% 2,7% 1,3% 0,0% 2,7% 1,3% 1,3% 44,0%
Total general 6,7% 12,7% 13,3% 10,0% 12,7% 10,0% 8,0% 8,0% 6,0% 3,3% 1,3% 5,3% 1,3% 1,3% 100,0%

El porcentaje de conductores con experiencia media y un tiempo de reacción sobre los 1,8

segundo es de un 44% app. Y para los conductores con experiencia baja y un tiempo de reacción

sobre los 1,8 segundos es de un 14% app.

c) Determine el puntaje promedio de los conductores con experiencia media y un tiempo de

reacción de a lo más 2,3 segundos. (1 punto)

El porcentaje promedio de los conductores con experiencia media y un tiempo de reacción de a

lo más 2,3 segundos es de 22,4 app.


4) Considerando que la variable “Tiempo de reacción” que depende de la variable “Nivel

de alcohol”. Con esta información:

a) Construya un gráfico de dispersión que relacione las variables mencionadas. Incluya la línea

de tendencia lineal con su respectivo coeficiente de determinación. (2 puntos)

Y: Tiempo de Reacción

X: Nivel de Alcohol

Grafico de Dispersión y = 9E-05x + 1.2679


R² = 0.0001
3.0

2.5
Tiempo de Reacción

2.0

1.5

1.0

0.5

0.0
0.0 50.0 100.0 150.0 200.0
Nivel de Alcohol

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,921622499
Coeficiente de determinación R^2 0,84938803
R^2 ajustado 0,848541895
Error típico 0,165309655
Observaciones 180
b) Interprete el coeficiente de determinación del modelo de regresión lineal. (2 puntos)

A partir del gráfico anterior se puede comentar que existe una asociación lineal entre las

variables tiempo de reacción y nivel de alcohol.

A medida que aumenta el tiempo de reacción el nivel de alcohol también lo hace de manera

proporcional.

R^2 Se puede comentar que el coeficiente de determinación esta explicado por un 84,94%

Esto quiere decir que el modelo lineal propuesto ajusta de buena manera el comportamiento del

estudio.

El 84,94% de variabilidad esta explicado en el modelo.

c) Utilizando el modelo lineal, estime el tiempo de reacción de un conductor que marcó 1,8

gramos por litro de alcohol en la sangre. (2 puntos)

Y=-0,7074+0,8884*X

X = 1,8

Y = 0,89172

= -0,7074+(0,8884*1,8)

El tiempo de reacción de un conductor que marco 1.8 gramos por litro de alcohol en la sangre es

de 0,8917 app.
5) Considerando que la variable número de conductores seleccionados de un determinado género

en un conjunto de n conductores, es una variable aleatoria con distribución binomial, realice las

siguientes actividades:

a) Construya una tabla de distribución de frecuencias relativas con la variable género. (2 puntos)

Etiquetas de fila Cuenta de ID conductor Etiquetas de fila Cuenta de ID conductor


Femenino 48 Femenino 26,67%
Masculino 132 Masculino 73,33%
Total general 180 Total general 100,00%

b) Si se seleccionan 40 conductores al azar, ¿cuál es la probabilidad de que 25 de ellos sean de

género masculino? (2 puntos)

n 40
k 25
p 0,733333333
Probabilidad 0,088244347 8,82%

La probabilidad de que 25 de ellos sean del género masculino es de un 8,82% app.

c) Si se eligen 35 conductores al azar, ¿cuál es la probabilidad de que a lo más 11 de ellos sean

de género femenino? (2 puntos)

n 35
k 11
p 0,266666667
Probabilidad 0,99999956 100,00%

La probabilidad de que 11 de ellos sean del género femenino es de un 100% app.


6) Suponiendo que la base de datos constituye la población y considerando que la variable

“Tiempo de reacción” de los conductores es una variable aleatoria continua y que se distribuye

normalmente, conteste las siguientes preguntas:

a) ¿Cuál es el promedio y la desviación estándar poblacional de la variable tiempo de reacción de

los conductores? (2 puntos)

Promedio 2,2
Desv. Estandar 0,42358661

b) ¿Cuál es la probabilidad de que un conductor seleccionado al azar tenga un tiempo de reacción

entre 2,1 y 3,2 segundos? (2 puntos)

P(2,1 < X < 3,2) 0,61183159 61,18%

La probabilidad buscada es de un 61,18% app.


Bibliografía

IACC (2018). Regresión lineal. Estadística. Semana 6.