Você está na página 1de 16

100105 – ESTADISTICA DESCRIPTIVA

ACTIVIDAD 10

TRABAJO EN GRUPO COLABORATIVO N°2

Modulo de Estadística Descriptiva

Estudiante
RAFAEL ANTONIO BARCENAS RODRIGUEZ COD 94.395.055
SANDRO MAURICIO ESPAÑA ZUÑIGA COD 94.421.341
EFREN RICARDO PAZ COD 94.399.155
JUAN CARLOS DIAZ COD 94.377.953

Grupo Colaborativo No 401

Tutor
ADRIANA GRANADOS COMBA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA -UNAD


ESCUELA DE CIENCIAS BASICAS, TECNOLOGIA E INGENIERIA
UNIDAD DE CIENCIAS BASICAS
MAYO DE 2012
INTRODUCCION

Con la elaboración de este trabajo se busca reforzar y aplicar los conocimientos


adquiridos que durante el estudio realizado a los temas contenidos en el modulo de
estadística descriptiva desarrollamos.
Busca también que a través de datos suministrados por entidades como el DANE
logremos aplicar y reforzar los conocimientos adquiridos sobre estadística descriptiva
partiendo de la información obtenida durante el censo que se realizo en el año 2005.

JUSTIFICACION

OBJETIVOS

 Desarrollar un taller de ejercicios sobre los contenidos de la unidad 2 del curso de


Estadística Descriptiva, los cuales permitirán profundizar en los temas tratados.
 Aplicar los conceptos aprendidos a algunos de los datos obtenidos en el Censo
2005 realizado por el Departamento Administrativo Nacional de Estadística, DANE.
1. EJERCICIOS

1.1. Realizar un mentefacto conceptual sobre las medidas de dispersión.

1.2. Con el fin de decidir cuantas cajas para la atención a los clientes se necesitaran en
las tiendas que construirán en el futuro, una cadena de supermercados quiso
obtener información acerca del tiempo (minutos) requerido para atender los
clientes. Se recogieron los siguientes datos correspondientes al tiempo de
atención a:

3,6 1,9 2,1 0,3 0,8 0,3 2,5 1,0 1,4 1,8 1,6 1,1 1,8

3,2 3,0 0,4 2,3 1,8 4,5 0,9 0,7 3,1 0,9 0,7 3,1 1,8

2,8 0,3 1,1 0,5 1,2 0,6 1,8 3,0 0,8 1,7 1,4 0,3 1,3

3,6 1,9 2,1 0,3 0,8 0,3 2,5 1,0 1,4 1,8 1,6 1,1 1,8

2,8 0,3 1,1 0,5 1,2 0,6 1,8 3,0 0,8 1,7 1,4 0,3 1,3

Realizar una tabla de distribución de frecuencias, calcular varianza, desviación


estándar y coeficiente de variación. Interprete los resultados.

Según la tabla de datos anterior tenemos:


 Como limite inferior: 0,3
 Como limite superior: 4,5
 Hallamos el Rango que es la diferencia entre el limite superior y el limite
inferior: R = 4,5 – 0,3 = 4,2
 Utilizamos la regla de Sturges para hallar la clase:

 Hallamos la amplitud:

Debemos realizar el respectivo ajuste por que no dio un valor entero, es


decir que:
( )( )

LI-LS Marca
de
clase
X
( ) 28 43,08% 0,7 19,6 0,49 13,72

( ) 24 36,92% 1,7 40,8 2,89 69,36

( ) 9 13,85% 2,7 24,3 7,29 65,61

( ) 3 4,62% 3,7 11,1 13,69 41,07

( ) 1 1,54% 4,7 4,7 22,09 22,09

( ) 0 N/A 0 0 0 0

( ) 0 N/A 0 0 0 0

( ) 0 N/A 0 0 0 0

TOTAL 65 100% 13,5 100,5 46,45 211,85

 Hallamos la media aritmética:


 Hallamos la varianza:
 Hallamos la desviación estándar: √
 Por ultimo determinamos el coeficiente de variación CV:
Conclusión:
Podemos afirmar que hay una gran variación en el grupo de datos ya que la
desviación estándar así lo indica, al ser el coeficiente de variación tan alto
(61,3%) se afirma que la media aritmética no es representativa en la
distribución.

1.3. En un estudio se registra la cantidad de horas de T.V. a la semana que ve un


grupo de niños escogidos de un colegio de la localidad de Puente Aranda:

Horas de T.V. N°. Niños

3-5 16

5-7 13

7-9 9

9-11 6

11-13 4

Total 48

a. Cual es el promedio de horas de tv que ven los niños?


Completo la tabla para obtener más datos:
Marca clase f*x
Horas de T.V. N°. Niños
X
Intervalos frecuencia

3-5 16 33,33% 4 64

5-7 13 27,08% 6 78

7-9 9 18,75% 8 72

9-11 6 12,5% 10 60

11-13 4 8,33% 12 48

Total 48 100% 40 322

b. Calcule el coeficiente de variación, interprete los resultados


Retomamos la tabla anterior y seguimos completándola:
Horas de Marca f*x
N°. Niños
T.V. clase X
frecuencia
Intervalos
3-5 16 33,33% 4 64 16 256

5-7 13 27,08% 6 78 36 468

7-9 9 18,75% 8 72 64 576

9-11 6 12,5% 10 60 100 600

11-13 4 8,33% 12 48 144 576

Total 48 100% 40 322 360 2476

 Hallamos la media aritmética:


 Hallamos la varianza:
 Hallamos la desviación estándar: √
 Por ultimo determinamos el coeficiente de variación CV:

Conclusión:
La media si es representativa de la distribución al no estar tan disperso y
tener un 38,15%

1.4. La compañía de electrodomésticos MABE acaba de terminar un estudio sobre la


configuración posible de tres líneas de ensamblaje para producir el horno
microondas que mas ventas tiene en el mercado. Los resultados acerca del tiempo
en minutos que se demora cada configuración en producir un horno son los
siguientes:
Tiempo promedio 24,8 Desviación estándar
Configuración 1 4,8 min
min
Tiempo promedio 25,5 Varianza 56,25
Configuración 2
min
Tiempo promedio 37,5 Desviación estándar
Configuración 3 min 3,8 min

¿Qué configuración de línea de ensamblaje le presenta mejores resultados a la


empresa? Porque?

De los datos podemos consolidar una tabla:

Configuración 1 Configuración 2 Configuración 3

24,8 min 25,5 37,5

23,04 56,25 14,44

4,8 min 7,5 min 3,8 min

Análisis:
 Analizando las desviaciones (s) de la configuración 1 y 2 varían
mucho.
 En las configuraciones 1 y 2 hay mucha variabilidad.
 La configuración 3 tiene menor coeficiente de variación.
En conclusión optaría por la configuración 3 por tener menor coeficiente de
variación, representando mejor resultado para la empresa.

1.5. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura
186 189 190 192 193 193 198 201 203 205
(X)
Pesos
85 85 86 90 87 91 93 103 100 101
(Y)

Calcular:
a. La recta de regresión de Y sobre X.

Estatura Pesos
(X) (Y) XY
186 85 15810 34596
189 85 16065 35721
190 86 16340 36100
192 90 17280 36864
193 87 16791 37249
193 91 17563 37249
198 93 18414 39204
201 103 20703 40401
203 100 20300 41209
205 101 20705 42025
1950 921 179971 380618

120
y = 1,0217x - 107,14
100 R² = 0,8916

80

60

40

20

0
185 190 195 200 205 210

Series1 Lineal (Series1)

Tomamos la columna de x, y para realizar un grafico en Excel como se indica


en la pagina 165 del modulo de Estadística descriptiva. Obtenemos la ecuación
de la recta:

b. El coeficiente de correlación.
Se toma el valor hallado en la grafica de Excel teniendo 0,8916 es decir que
tiene un alto grado de confiabilidad.

c. Es peso estimado de un jugador que mide 208 cm.


Utilizando la ecuación hallada remplazamos x
Otra manera de realizar el problema seria:

Estatura (X) Pesos(Y) X- (X - X )² Y -Ŷ (X - )(Y -Ŷ)


186 85 -9 81 -7.1 63.9
189 85 -6 36 -7.1 42.6
190 86 -5 25 -6.1 30.5
192 90 -3 9 -2.1 6.3
193 87 -2 4 -5.1 10.2
193 91 -2 4 -1.1 2.2
198 93 3 9 0.9 2.7
201 103 6 36 10.9 65.4
203 100 8 64 7.9 63.2
205 101 10 100 8.9 89
Suma 1950 921 Suma 368 Suma 376
Promedio 195 92.1
Desviación
6.39 6.92
estándar

La regresión de Y sobre X está dada por:

donde
Por lo tanto (X - ) (Y -Ŷ) / (X - X)² = 376/368=1.0217
Ŷ = 92.1
a. La recta de regresión es Y = 92.1 + [1.0217 * (X – 195)]

b. b) El coeficiente de correlación es

r=(376/10)/(6.39*6.92)=0.85

Es muy bueno porque es cercano a 1, esto quiere decir que la ecuación de la


recta es una muy buena regresión lineal para el cálculo del peso de un jugador
basado en su estatura.

c. El peso estimado de un jugador que mide 208cm es de 105.2826


aproximadamente 105 kg.
1.6. A continuación se presentan las ventas nacionales de móviles nuevos de 1992 a
2004 en la siguiente tabla. Obtenga un índice simple para las ventas nacionales
utilizando una base variable:

Año Ventas (millones $)

8,8
1992
9,7
1993

1994 7,3

6,7
1995
8,5
1996

1997 9,2

1998 9,2

8,4
1999
6,4
2000

2001 6,2

5,0
2002
6,7
2003

2004 7,6

Con la tabla anterior:

Ventas Índice
Año (millones base diferencia Observación
$) variable
1992 8,8 100% Las ventas son el 100%
1993 9,7 110,23% 10,23% Aumentaron las ventas
1994 7,3 75,26% -34,97% Disminuyeron las ventas
1995 6,7 101,17% 25,91% Disminuyeron las ventas
1996 8,5 95,48% -5,69% Aumentaron las ventas
1997 9,2 109,50% 14,02% Aumentaron las ventas
1998 9,2 95,48% -14,02% Aumentaron las ventas
1999 8,4 99,98% 4,50% Disminuyeron las ventas
2000 6,4 72,74% -27,23% Disminuyeron las ventas
2001 6,2 96,85% 24,11% Disminuyeron las ventas
2002 5 58,66% -38,19% Disminuyeron las ventas
2003 6,7 129,78% 71,12% Aumentaron las ventas
2004 7,6 66,54% -63,24% Aumentaron las ventas
2. Actividad de investigación
Realizar un recorrido a través de los resultados del Censo General 2005, ingresando a
la página web del DANE.

http://www.dane.gov.co/index.php?option=com_content&view=article&id=307&Itemid=1
24

ACTIVIDAD A REALIZAR

En este segundo trabajo colaborativo, deberán escoger previo acuerdo entre los
integrantes del grupo, de los temas que presenta la página del censo, un grupo de datos
para los cuales se pide calcular:

Medidas de dispersión

Medidas de regresión y correlación

Interpretar los resultados obtenidos

El grupo entregara una conclusión acerca del tema escogido con base en los resultados
obtenidos.

Información estadística DANE.

Valle del Cauca. Indicadores demográficos


1985 - 2005

Tasas medias anuales de


Periodo crecimiento Tasas Implícitas (por mil) Número estimado de: Migrantes netos
(por cien)
Tasa
Crecimiento
Exponencial Geométrico Natalidad Mortalidad Nacimientos Defunciones Total (por
natural
mil)

1985-1990 2,15 2,18 18,95 26,41 7,46 424.039 119.782 41.201 2,57
1990-1995 1,95 1,97 16,75 23,85 7,10 424.107 126.224 48.025 2,70
1995-2000 1,14 1,15 14,23 21,02 6,79 403.447 130.258 -53.496 -2,79
2000-2005 1,05 1,05 12,04 18,50 6,46 375.155 131.049 -32.101 -1,58

Tasa de reproducción
Periodo Tasa de fecundidad Edad media de
(por mujer)
la fecundidad
Global General (por mil
Bruta Neta (años)
(por mujer) mujeres)

1985-1990 1,46 1,37 3,01 101,60 26,66


1990-1995 1,34 1,27 2,76 91,00 26,52
1995-2000 1,20 1,14 2,46 78,20 26,36
2000-2005 1,07 1,03 2,19 67,50 26,22

Relación y correlación

Variables tasa de fecundación y edad media de fecundación

TASA
FECUNDACION EDAD MEDIA DE LA
GLOBAL MUJER FECUNDACION
(X) (AÑOS) (Y)
3,01 26,66
2,76 26,52
2,46 26,36
2,19 26,22

DIAGRAMA DE DISPERSIÓN
26,7 y = 0,5361x + 25,044
26,65 R² = 0,9997
26,6
26,55
Edad media de la
26,5 fecundidad (años) (Y)
26,45
26,4
26,35 Lineal (Edad media de
26,3 la fecundidad (años)
26,25 (Y))
26,2
26,15
0,00 1,00 2,00 3,00 4,00

Análisis.

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es una
muy buena estimación de la relación entre las dos Variables.
El R2 afirma además que el modelo explica el 99,97% de la información y el valor
de r coeficiente de correlación lineal confirma, además el grado de relación entre
las variables:
Tasa de fecundación edad media de fecundidad.

Regresión y correlación variables.

NATALIDAD (X) MORTALIDAD (Y)


26,41 7,46
23,85 7,1
21,02 6,79
18,5 6,46

MORTALIDAD (Y)
7,6
y = 0,1245x + 4,1578
7,4 R² = 0,9979

7,2

7 Mortalidad (y)
Lineal (Mortalidad (y))
6,8

6,6

6,4
0 10 20 30

Análisis

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es una
muy buena estimación de la relación entre las dos variables.
El R2 afirma además que el modelo explica el 99,79% de la información y el valor
de r coeficiente de correlación lineal confirma además el grado de relación entre las
variables:
Natalidad y Mortalidad.
CONCLUSIONES

Con la realización de esta actividad grupal, nos da la oportunidad de profundizar a


través de los ejercicios planteados en la guía de actividades todos los conceptos
adquiridos durante el curso de una forma practica y a su vez nos permite analizar
la importancia de esta en la cotidianidad para aplicarlos en diversos campos como
lo fue la actividad de ingresar a la pagina del DANE, utilizar datos reales de nuestro
país y aplicarle las mediadas de dispersión, correlación y sacar conclusiones.
Es de anotar que al manejar hojas de calculo resulta ser mas fácil la realización de
dichos ejercicios ya que con Excel se optimiza tiempo y se pueden manejar
infinidad de datos.
BIBLIOGRAFIA

Ortegón, M. (2010). Estadística Descriptiva. Ibagué: Universidad Nacional Abierta y a


Distancia.

http://www.dane.gov.co/index.php?option=com_content&view=article&id=307&Itemid=124

Você também pode gostar