Você está na página 1de 24

ESTADISTICA DESCRIPTIVA

MOMENTO 3

PRESENTADO POR:

MONICA LIZETH MOTTA COD: 1084898516


REINA PAOLA BELTRAN COD: 1088973802
YULI TATIANA BUITRON ROJAS CÓD: 1083895949
CLAUDIA PATRICIA MALES
DIANA CAROLINA BORJA

GRUPO: 6

TUTOR:

MILTON FERNANDO ORTEGON

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

PITALITO-HUILA

NOVIEMBRE- 2016.
INTRODUCCIÓN.

Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes a la
regresión y determinación mediante la realización de ejercicios empleando las medidas de
regresión y correlación lineal simple y múltiple con variables cuantitativas que tienen que ver
con el caso estudiado a cerca de los accidentes de tránsito en la ciudad de Medellín.
JUSTIFICACIÓN.

En el presente informe se compararon datos cuantitativos para determinar su correlación y de


ésta manera analizarla, partiendo de una realidad que conocemos y entendemos se podrán
formular propuestas encaminadas a la transformación de una realidad.

Mediante un proceso gradual de clasificación, organización y tabulación de datos hemos


analizado variables cualitativas y cuantitativas, lo que nos permite en éste momento elaborar un
laboratorio apoyados en el análisis y fórmulas del programa Microsoft Excel.

Además de todo esto el trabajo permite distintas perspectivas que complementan la entrega final,
adquiriendo nuevas experiencias a través de la ejercitación de nuestras habilidades
interpretativas y argumentativas que se reúnen en torno a un tema común en donde prevalece la
objetividad; todo esto a través del trabajo colaborativo en donde asumiendo distintos roles
potencializamos nuestras capacidades y aportamos desde nuestras experiencias y fortalezas, con
responsabilidad y compromiso.
OBJETIVOS.

GENERAL

Determinar la correlación entre dos variables cuantitativas a través de un laboratorio de regresión

y correlación lineal

ESPECÍFICOS

 Analizar datos agrupados para encontrar su relación

 Participar en la consolidación de un trabajo grupal que evidencie los aprendizajes

adquiridos

 Determinar la relación existente entre dos variables cuantitativas a través de las

herramientas Infostat y Excel


LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL.

1-El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno
producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en
un proceso de destilación, de acuerdo con los siguientes datos:

X
(% de Y
Hidrocarburos) (Pureza)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


RENDIMIENTO DEL PRODUCTO DE UN PROCESO QUIMICO
102
y = 14,947x + 74,283
100 R² = 0,8774
98

96
PUREZA

94

92

90

88

86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% DE HIDROCARBURO

Posee tendencia positiva y relación directa entre el % de hidrocarburo y la


pureza puesto que a medida que él % aumenta la pureza también aumenta es
decir que la pureza si depende del % de hidrocarburo. La ecuación matemática
es confiable en un 87,74%.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?

y = 14,947x + 74,283 R² = 0,8774

R²= coeficiente de determinación = 87,74% por lo tanto es


confiable

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,8774 R= 0,93% La correlación es excelente
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

y= pureza.

x= hidrocarburo?.

y= 91,3

91,3= 14,947x+74,283

91,3-74,283=14,947x

17,02/14,947=x

x= 1,13

Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.

2- El número de libras de vapor (y) consumidas mensualmente por una planta química, se
relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron los
siguientes valores de temperatura y consumo anual.

x Temperatura y Consumo de
Mes
(°F) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
CONSUMO MENSUAL DE VAPOR POR UNA PLANTA
QUIMICA
800
y = 9.2087x - 6.3184
CONSUMO DE VAPOR (LB)

700
R² = 0.9999
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
TEMPERATURA °F

Tendencia positiva, existe una relación directa entre la temperatura y el consumo


de vapor, por lo tanto el número de libras de vapor consumidas mensualmente
por una planta química si se relaciona con la temperatura la cual está
representada en °F, su correlación es excelente con un 0,99%, la R² = 99,99 lo
que significa que posee un alto grado de confiabilidad.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?

y = 9,2087x - 6,3184 R² = 0,9999

R²= coeficiente de determinación= 99,99 % lo cual es confiable.


c.
Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,9999%

R= 0,99% La correlación es excelente


d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

y= consumo de vapor?
x= temperatura en °F

x= 70 °F
y= 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9.

Cuando la temperatura es igual a 70 °F el consumo de vapor será 650,9%

3-Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual


al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se
mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación
de punzada. Obsérvese que ambas, X e Y, son variables aleatorias.

x (porcentaje y (umbral de reflejo


de sobrepeso) de flexión
nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
a- Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

O BE S I DAD Y RE S P UE S TA I NDI V I DUAL AL


DO LO R
UMBRAL DE REFLEJO DE

16
14
REFELXIÓN

12 y = -0,0629x + 11,642
R² = 0,1115
10
8
6
4
2
0
0 20 40 60 80 100
% DE SOBREPESO

Tendencia negativa, existe una relación inversa entre % de sobrepeso y el umbral de


reflejo de flexión a medida que aumenta el % de sobrepeso, disminuye el Umbral de
reflejo de flexión, la correlación entre las dos variables es mínima con un 0,33%, también
es posible afirmar que este modelo no es recomendable puesto que posee un grado de
confiabilidad muy bajo por tener un R²= 11,15%.

b- Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?

y = -0,0629x + 11,642

R² = 0,1115

R²= coeficiente de determinación = 11,15 % por lo tanto no es confiable

c-Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

R=coeficiente de correlación

R= raíz cuadrada de 0,1115

R= 0,33% La correlación es mínima


d-¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de
sobrepeso, de 40?

y= umbral de reflejo de flexión nociceptiva?


x= porcentaje de sobrepeso

X= 40 % Sobrepeso
y= (-0,0629) (40)+ 11,642
y= -2,516 + 11,642
y= 9.126

Cuando el porcentaje de sobrepeso es de 40%, el umbral de


reflejo de flexión nociceptiva es de 9,126.

REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

NUMERO DE HERIDOS DEPENDIENTE Y


VELOCIDAD INDEPENDIENTE X

VELOCIDAD NUMERO
(X) DE
HERIDOS
(Y)
66 3
111 2
66 1
80 2
75 8
66 0
45 0
88 4
55 2
70 6
105 4
88 1
69 2
48 0
70 2
83 2
138 3
68 4
77 2
81 5
50 2
88 4
71 2
55 0
78 2
80 1
68 1
74 3
75 4
83 9
65 0
60 3
83 15
95 2
86 2
68 0
55 1
88 0
63 2
70 0
78 4
83 2
138 3
55 0
66 2
108 4
69 1
72 5
74 3
69 6
79 11
65 2
74 3
77 2
51 1
75 4
72 2
77 6
67 4
55 4
40 2
73 3
69 2
70 0
75 1
55 4
69 1
50 3
73 2
38 0
60 3
50 0
100 4
75 2
80 6
95 4
70 1
66 1
69 1
67 4
83 1
70 2
150 2
55 0
66 1
68 6
79 3
79 2
60 0
33 0
85 2
80 4
81 18
62 9
79 2
76 2
80 2
70 1
80 3
83 2
68 2
79 1
79 2
80 8
75 0
66 0
45 2
77 3
81 4
50 2
88 5
71 2
55 4
78 2
67 2
55 3
40 2
73 0
69 1
70 4
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre
las variables.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
Es confiable?

y= 0,033x + 0,3492 R² = 0,0453

R² = coeficiente de determinación= 4,53 % por lo tanto no es


confiable.

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= Coeficiente de correlación
R= Raíz cuadrada de 0,0453

R= 0,21 % No hay correlación

Relacionar la información obtenida con el problema.

En el caso estudiado referente a la accidentabilidad en la Ciudad de Medellín el grado de


confiabilidad entre las variables Velocidad y Número de heridos es de 4,53%, lo cual significa
que no es confiable, no existe correlación entre ellas ya que su coeficiente corresponde a 0,21%,
por lo tanto el número de heridos no depende de la velocidad de los conductores.

INDICES ACCIDENTALIDAD EN MEDELLIN


20
18 y = 0,033x + 0,3492
NUMERO DE HERIDOS

16 R² = 0,0453
14
12
10
8
6
4
2
0
0 20 40 60 80 100 120 140 160
VELOCIDAD
REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE

Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de
investigación.

y x1 x2
NUMERO VELOCIDAD GRADOS DE
DE ALCOHOL
MUERTOS DEL
CONDUCTOR
0 66 1,2
1 111 3,0
1 66 0,0
0 80 0,6
0 75 0,0
2 66 0,0
1 45 3,0
2 88 1,4
0 55 2,1
1 70 0,0
0 105 1,6
3 88 2,2
1 69 3,0
2 48 1,1
1 70 2,4
0 83 0,6
0 138 1,6
1 68 0,0
1 77 0,0
1 81 2,1
0 50 1,4
2 88 2,6
1 71 3,0
3 55 2,7
1 78 0,6
0 80 0,0
1 68 2,9
0 74 0,6
1 75 1,8
2 83 0,0
2 65 1,1
2 60 2,4
1 83 0,6
0 95 0,0
0 86 2,9
2 68 1,3
1 55 1,4
4 88 2,1
0 63 0,8
2 70 0,0
0 78 1,2
2 83 3,0
2 138 0,0
1 55 0,6
0 66 1,9
1 108 2,7
0 69 1,1
1 72 2,4
0 74 0,6
0 69 1,6
1 79 0,0
1 65 1,4
0 74 2,1
1 77 0,8
1 51 1,1
0 75 2,4
0 72 0,0
1 77 1,6
0 67 1,2
1 55 3,0
0 40 2,7
1 73 0,6
0 69 0,0
2 70 3,0
1 75 1,1
1 55 2,4
1 69 0,0
0 50 1,6
0 73 0,0
1 38 0,8
0 60 0,3
2 50 1,1
1 100 2,4
1 75 0,6
0 80 0,0
0 95 1,2
2 70 3,0
0 66 2,7
1 69 0,6
0 67 1,9
1 83 1,1
0 70 0,0
0 150 0,6
2 55 1,6
3 66 2,1
1 68 0,8
0 79 0,5
0 79 2,7
1 60 1,1
2 33 2,4
0 85 0,6
1 80 1,6
2 81 1,4
0 62 2,1
1 79 0,0
2 76 3,0
0 80 0,0
1 70 0,6
0 80 1,9
0 83 1,4
1 68 0,0
1 79 2,7
0 79 0,6
0 80 1,9
2 75 2,5
1 66 3,0
0 45 0,6
0 77 0,0
1 81 2,7
1 50 1,3
1 88 2,1
0 71 0,0
2 55 2,6
1 78 3,0
0 67 2,7
1 55 0,6
0 40 1,9
2 73 3,0
1 69 1,1
1 70 2,4

Realizar el diagrama de dispersión de dichas variables.

RELACIÓN: NUMERO DE MUERTOS Vs


VELOCIDAD
4.5
4
NUEMRO DE MUERTOS

3.5
3
2.5
2
1.5
1
0.5
0
0 20 40 60 80 100 120 140 160
VELOCIDAD
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,264226981
Coeficiente de determinación R^2 0,069815897
R^2 ajustado 0,053915314
Error típico 0,82971621
Observaciones 120

RELACION: NUEMERO DE MUERTOS VS GRADOS DE


ALCOHOL
4.5
NUMERO DE MUERTOS

4
3.5
3
2.5
2
1.5
1
0.5
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
GRADOS DE ALCOHOL

ANÁLISIS DE
VARIANZA
Grados Promedio de
de Suma de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 6,045474917 3,022737458 4,39077596 0,014497109
Residuos 117 80,54619175 0,688428989
Total 119 86,59166667

Coeficie Error Estadísti Probabili Inferior Superior Inferior Superior


ntes típico co t dad 95% 95% 95,0% 95,0%
Intercep 0,693396 0,347756 1,993912 0,048487 0,004682 1,382110 0,004682 1,382110
ción 471 788 107 59 397 544 397 544
- - - -
Variable 0,001870 0,004323 0,432741 0,665999 0,010433 0,006691 0,010433 0,006691
X1 908 386 376 3 148 332 148 332
Variable 0,213837 0,074049 2,887746 0,004623 0,067185 0,360489 0,067185 0,360489
X2 562 969 795 41 483 641 483 641

y= 0,69339+ (-0,00187x1)+0,21383x2

y= 0,69339-0,00187x1+0,21383x2

Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su


relación.

R^2=0,0698*100
R^2=6,98% El modelo matemático es confiable en un 6,98%
R=0,26 No hay correlación entre las variables

Relacionar la información obtenida con el problema.


Los resultados estadísticos obtenidos indican que no hay relación entre las variables: número de
muertos, grados de alcohol y velocidad, esto lo podemos identificar mediante el modelo
matemático de regresión múltiple, y= 0,69339-0,00187x1+0,21383x2, a lo cual solo podemos
obtener un 6,98% de confiabilidad, teniendo en cuenta que el intervalo de correlación es
invalida o no hay correlación alguna. Por consiguiente e claro decir que los muertos dentro de la
accidentalidad en la ciudad de Medellín no dependieron de los grados de alcohol ni la velocidad.
CONCLUSION

Se puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de
los lineamientos expuestos por la universidad nacional abierta y a distancia UNAD,
entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determinada
investigación.
REFERENCIAS BIBLIOGRÁFICAS

 Estadística descriptiva. Campus virtual UNAD

http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900

 Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes

https://www.youtube.com/watch?v=Ktk263q-W-4

 Jeanete Buitrago, Cecilia Cárdenas. Fundamentos de estadística. Universidad Santo

Tomás, 2013

Você também pode gostar