Você está na página 1de 33

UNIVERSIDAD N A C I O N A L D E TUCUMN

F A C U L T A D D E FILOSOFA V L E T R A S

L I C E N C I A T U R A E N CIENCIAS D E L A
COMUNICACIN

CATEDRA DE
ESTADISTICA

CARTIILLA DE EJERCICIOS
19 parcial
PROFESOR: Constanza A/mirn

2010

3 0 l & l l 0
U N I V E R S I D A D N A C I O N A L DE T U C U M A N
F a c u l t a d d e Filosofa y L e t r a s
L i c e n c i a t u r a e n C i e n c i a s d e la C o m u n i c a c i n

Estadstica
PROGRAMA 2010
A s i g n a t u r a de 4 a o
Carga h o r a r i a : 4 horas s e m a n a l e s .
Modalidad: cuatrimestral.
Profesor a c a r g o : Constanza C. A l m i r n

Fundamentacin
La estadstica es u n i n s t r u m e n t o til para a y u d a r a una descripcin rigurosa de la
r e a l i d a d , y una h e r r a m i e n t a robusta para la verificacin de relaciones e n t r e
f e n m e n o s . T a n t o es as q u e puede aplicarse al e s t u d i o , si bien con diferente grado
de f i d e l i d a d , de f e n m e n o s q u e p u e d e n m a n i f e s t a r s e c o n variables c u a n t i t a t i v a s o
cualitativas, c o n t i n u a s o discretas. C o m o l e n g u a j e se e n c u e n t r a en todos los
m b i t o s , y su u t i l i d a d cientfica para la verificacin d e hiptesis se e x t i e n d e t a m b i n
al m b i t o de la c o m u n i c a c i n .

Objetivos
a) Preparar e n las tcnicas para recolectar, t r a t a r y clasificar datos, de modo de
conseguir i n f o r m a c i n r e l e v a n t e para d e s c r i b i r f e n m e n o s .
b) B r i n d a r e l e m e n t o s tiles para analizar relaciones e n t r e f e n m e n o s .
c) I n t r o d u c i r e n el uso de c o n h e r r a m i e n t a s para la v a l i d a c i n de inferencias.
d) Entrenar en el uso del l e n g u a j e p e r t i n e n t e , sobre t o d o e n funcin de la tarea de
c o m u n i c a d o r , para q u e el e s t u d i a n t e c u e n t e c o n e l e m e n t o s para e n t e n d e r y
c o m u n i c a r descripciones en l e n g u a j e riguroso.

Contenidos

Unidad I: Organizacin d e los datos


Concepto de estadstica. Aplicaciones. Recoleccin d e d a t o s . Muestras y
Poblaciones. Distribuciones d e frecuencias relativas y absolutas. I n t e r v a l o s .
Representacin grfica. H i s t o g r a m a s . Polgonos de f r e c u e n c i a s . Ojivas

U n i d a d I I : Anlisis d e s c r i p t i v o d e los d a t o s
Medidas de t e n d e n c i a c e n t r a l : m e d i a , m e d i a n a y m o d a - Medidas de d i s p e r s i n :
r a n g o , v a r i a n z a y desviacin e s t n d a r - A s i m e t r a - La c u r v a n o r m a l y el p u n t a j e
estndar.

U n i d a d I I I : Asociacin y correlacin
Relaciones lineales y no lineales; perfectas e i m p e r f e c t a s ; positivas y negativas -
Coeficiente d e correlacin lineal r d e Pearson - Efectos del rango sobre la
correlacin - Datos e x t r e m o s - Causalidad.

Unidad I V : Regresin
Prediccin y relaciones i m p e r f e c t a s - Modelo de regresin lineal s i m p l e - Recta de
regresin por m n i m o s cuadrados - Errores de p r e d i c c i n - Consideraciones
generales - Relacin c o n la r d e Pearson.

1
Unidad V: M u e s t r e o
Muestreo aleatorio - Clculo del t a m a o de la m u e s t r a - Tablas de n m e r o s
aleatorios - Error e s t n d a r de la m u e s t r a - Relacin con el error estndar de
prediccin.

U n i d a d V I : T e s t d e hiptesis
Clculo de probabilidades - Hiptesis estadstica - Error tipo I y e r r o r tipo I I -
Niveles de significacin - La prueba del signo - Potencia - Distribucin binomial -
I n t r o d u c c i n a las pruebas z y t - Ji-cuadrada y otras pruebas no p a r a m t r i c a s .

Metodologa
La a s i g n a t u r a se desarrollar a t r a v s de clases tericas y prcticas. En las
primeras se d e s a r r o l l a r a n los t e m a s p r o p u e s t o s y la o r i e n t a c i n para su estudio. En
las clases prcticas se d e s a r r o l l a r n aplicaciones de los c o n c e p t o s , buscando
ejercitar el r a z o n a m i e n t o y el clculo estadstico. Estas l t i m a s se i m p l e m e n t a r n a
travs de la resolucin o la discusin de prcticos, t a n t o e n el aula c o m o a p a r t i r de
consignas de investigacin c o m o t r a b a j o fuera del a u l a , a ser e n t r e g a d o s a la
ctedra. La respuesta por parte de los a l u m n o s ser seguida m e d i a n t e la revisin
por m u e s t r e o al azar.

Evaluacin
La a s i g n a t u r a se aprobar p o r e x a m e n final, con dos parciales para el proceso de
regularizacin, siguiendo las pautas r e g l a m e n t a r i a s .
Para la evaluacin d e los e x m e n e s parciales y finales se considerarn la
pertinencia d e las respuestas c o n respecto al t e m a r i o , y la correspondencia y
consistencia d e las respuestas c o n los contenidos y criterios desarrollados en la
bibliografa y en las clases. La calificacin de cada- instancia surgir del anlisis
integral del t e m a r i o y las respuestas. El t e m a r i o de los e x m e n e s , parciales o
finales, se e s t r u c t u r a r siguiendo la m o d a l i d a d de p r e g u n t a s abiertas, t e n d i e n d o a
la aplicacin de conceptos y no a la respuesta m e m o r i s t a . Los e l e m e n t o s a
considerar sern la capacidad del a l u m n o para identificar las situaciones planteadas
y los agentes i n t e r v i n i e n t e s , la coherencia general e n t r e los conceptos utilizados en
las diferentes respuestas, la precisin de los clculos necesarios y el tipo de
conclusiones a las q u e puede llegar por la aplicacin de los conceptos p e r t i n e n t e s .

Bibliografa

LEVIN Richard I . , RUBIN David S.,. Estadstica para A d m i n i s t r a c i n y Economa. 7 o

edicin, Pearson Educacin (Prentice Hall). Mxico 2 0 0 4

PAGANO, Robert, "Estadstica para las ciencias del c o m p o r t a m i e n t o " , 7 a edicin,


I n t e r n a t i o n a l T h o m s o n Editores SA d e CV (Mxico DF, 2 0 0 6 ) .

2
UNIVERSIDAD NACIONAL DE TUCUMN
FACULTAD DE FILOSOFA Y LETRAS
LICENCIATURA EN CIENCIAS DE LA COMUNICACIN

2010

ESTADISTICA

T R A B A J O PRACTICO N 1

EL RESUMEN DE L A INFORMACIN

1. Para cada uno de los siguientes casos, determinar si se analiza una poblacin o una
muestra y clasificar la variable que se estudia:

A. En un establecimiento dedicado a la cra de porcinos, se quiere comprobar la


eficacia de un nuevo alimento balanceado. En el establecimiento hay 150 animales y
se los pesa antes y despus de los 20 das que dura esta dieta con el nuevo
alimento.
B. Un fabricante de tuercas deseas hacer un control de calidad de fabricacin; para
ellos escoge 100 tuercas del total de la produccin, que pertenecen a distintas
partidas fabricadas y mide el dimetro interno de cada una.
C. En un club deportivo de 1200 socios, se desea conocer la edad de todos ellos, con el
fin de crear nuevas secciones de gimnasia para diferentes edades.

2. Una empresa automotriz desea hacer un estudio de mercado para determinar los
diferentes tipos de autos que circulan en la ciudad de Rosario. Para ello se instalan distintos
puestos de observacin en cada uno de los barrios que componen esa ciudad. La
observacin se efecta sobre 100 automviles y se analiza las siguientes caractersticas:
marca, modelo, color, cantidad de puertas y velocidad alcanzada al pasar por dichos
puestos.
A. Determinar si el conjunto que se investiga es una poblacin o una muestra
B. Clasificar las distintas variables que se analizan en este procedimiento.

3. Teniendo en cuenta la clasificacin de variables, ejemplifique:

A. variable cualitativa en escala nominal


B. variable cuantitativa en escala de razn
C. variable cuantitativa en escala ordinal
D. variable cuantitativa en escala intervalar
E. variable cualitativa en escala de razn

4. Califique la variable salario y exprsela en escala ordinal y en escala intervalar


11111VI i 1 1 V I 1 1 1 \ 111 i 111111111 l ; l l ; i

SUMATORIA

5. Supngase que tenemos cinco observaciones para las variables x E y de manera que:

X1=2, x2=1, x3 = -3, x4 = 3, x5 = 1

y1=3, y2 = 0, y3 = 5 , y4 = - 1 , y5=2

Calcular cada una de las expresiones que se presentan a continuacin:

a.IX =
b-IY =
C I X Y F
d. Y_^=
e. I y =2

RAZONES Y PORCIENTOS

6. En base al total de alumnos de la UNT por unidad acadmica para los aos 2000 y 2003
realice lo que se pide mas abajo

UNIDAD A C A D E M I C A 2000 2003


Fac. Agronoma y Zootecnia 1225 1382
Fac. de Arquitectura y urbanismo 2464 2472
Fac. de Artes 2017 2939
Fac de Bioqumica Qumica Y Farmacia 3398 3346
Fac de Ciencias Exactas y Tecnologa 2782 4088
Fac. de Cs. Naturales 5946 5578
Fac. de Derecho y Cs. Sociales 1128 1295
Fac. de Educacin Fsica 13992 16789
Fac de Filosofa y Letras 1369 1365
Fac de Medicina y Enfermera 4385 5577
Fac. de Odontologa 6970 7552
Fac. de Psicologa 1779 1511
Fac. de Cs. Econmicas 3175 3868
TOTAL 50.630 57762

Fuente: Direccin de Estadstica de la UNT

Se pide:

a. Determine para los dos perodos la composicin porcentual por facultad del total de
alumnos de la UNT. Exprese dicho valor con un decimal.
b. Calcule la variacin relativa de la cantidad de alumnos de cada facultad y del total de la
UNT entre los aos 2000 y 2003
c. Analice la informacin obtenida y relate las principales conclusiones

-2-
Organizacin de d a t o s y c o n s t r u c c i n de d i s t r i b u c i o n e s de f r e c u e n c i a s de una variable

7. Las edades de los 50 integrantes de un programa de servicio social del gobierno son:

83 51 66 61 82 65 54 56 92 60
65 87 68 64 51 70 75 66 74 68
44 55 78 69 98 67 82 77 79 62
38 88 76 99 84 47 60 42 66 74
91 71 83 80 68 65 51 56 73 55

Utilice estos datos para construir las distribuciones de frecuencia relativa con 7 y 13 intervalos
iguales. La poltica del estado para los programas de servicio social requiere que alrededor del
50% de los participantes tengan ms de 50 aos.

a. Cumple el programa con la poltica?


b. La distribucin de frecuencias relativas de 13 intervalos ayuda a responder el inciso a)
mejor que la distribucin de 7 intervalos?
c. Suponga que el director de servicios sociales desea saber la proporcin de participantes en
el programa que tienen entre 4 5 y 50 aos de edad. A partir de cual distribucin de
frecuencias relativas, de 7 o d e 13 intervalos, puede estimar mejor la respuesta?

8. Un estudio reciente sobre los hbitos de los consumidores de televisin por cable en EEUU
proporciono los siguientes datos:

N u m e r o de N m e r o de horas
canales que ven televisin
comprados por semana
25 14
18 16
42 12
96 6
28 13
43 16
39 9
29 7
17 19
84 4
76 8
22 13
104 6

Ordene los datos. Que conclusin puede deducir de estos datos?

-3-
u u m u u u m
r 3
/^t)Los miembros de una cooperativa de viviendas tienen las siguientes edades: -- v o i b - r o e n o r ^^3 r

42 60 60 38 60 63 21 66 56 57 51 57 44 45 35
30 35 47 53 49 50 49 38 45 28 41 47 42 53 32
P-3G 46
54 38 40 63 48 33 35 61 47 41 55 53 27 20 21 31-40

42 21 39 39 34 45 39 28 54 33 35 43 48 48 27 4A- S o
53 30 29 53 38 52 54 27 27 43 28 63 41 23 58 ZA zo 2.3
56 59 60 40 24 6
8O f 40
so
Elabore una tabla de frecuencias. feo

10. Los datos que se dan a continuacin corresponden a los pesos en Kg. de ochenta
Personas:

6 0 ; 66;77;70;66;68;57;70;66;52;75;65;69;7 1;58;66;67;74; 61
6 3 ; 69;80;59;66;7 0;67;78;75;64;71;8 1;62;64;69;68;72;83; 56
6 5 ; 74;67;54;65;65;69;61;67;73;57;62;67;68;63;67;71;68;7 6
6 1 ; 62;63;76;61;67;6 7;64;72;64;73;79;58;67;71;68;59;69; 70
6 6 ; 62;63;66;

(a) Obtngase una distribucin de datos en intervalos de amplitud 5, siendo el primer intervalo de
[50; 55].
(b) Calclese el porcentaje de personas de peso menor que 65 Kg.
(c) Cuntas personas tienen peso mayor o igual que 70 Kg. pero menor que 85?

El seor Frank, un ingeniero de seguridad de Mars Point Nuclear Powell Generating Station,
elabor una tabla de la temperatura pico del reactor cada da durante el ltimo ao y prepar la
siguiente distribucin de frecuencias:

T e m p e r a t u r a en C Frecuencia
Menos de 500 4
501-510 7
511-520 32
521-530 59
530-540 82
550-560 65
561-570 33
571-580 28
580-590 27
591-600 23
Total 360

Enumere y explique los errores que pueda encontrar en la distribucin del seor Frank
r^cuz^^ S e , <3e^=>Tb? W a c v <z>-\AT-\o ( 2 5 d C o ^ '2*SO

3
12. a) Completen las siguientes tablas de frecuencias que muestran como se distribuyen los
salarios'de los empleados de dos empresas

Salario ($) fac Salario ($) fa fr fac


fa fr fp fp
[300; 500) 15 [200; 500) 33.33
[500; 700) 35 [500; 800) 33 0.22
[700; 900) [800; 1100) 130
[900; 1100) 25.00 rHOO; 1400)
Totales 120 Totales

b) Cul de las empresas paga mayor fraccin de sueldos por debajo de 500?

13. Dada la distribucin siguiente, construyase una tabla estadstica en la que aparezcan las
frecuencias absolutas, las frecuencias relativas y las frecuencias acumuladas relativas crecientes:

xi 1 2 3 4 5 6
fa 5 7 9 6 7 6

14. Las edades de los empleados de una determinada empresa son las que aparecen en la
siguiente tabla:

EDAD N DE EMPLEADOS
Menos de 25 22
Menos de 35 70
Menos de 45 121
Menos de 55 157
Menos de 65 184

Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de frecuencias


acumuladas decrecientes (o ms de).

15. Dada la distribucin de frecuencias:

x 1 2 3 4 5 6
fa 9 22 13 23 8 25

(a) Construyase una tabla en la que aparezcan frecuencias absolutas, frecuencias relativas,
frecuencias acumuladas absolutas crecientes (o menos de) y decrecientes (o ms de).
(b) Represntese mediante un diagrama de barras la distribucin dada y su correspondiente
polgono de frecuencias.
(c) Obtngase el polgono de frecuencias absolutas acumuladas crecientes y decrecientes.

-5-
i

INTERVALOS FRECIENCIAS
DE CLASE ABSOLUTAS
1-10 22
11-20 26
21-30 92
. 31-40 86
41-50 74
51-60 27
61-70 12

17. Dada la siguiente distribucin de frecuencias:

INTERVALOS FRECIENCIAS
DE CLASE ABSOLUTAS

1-3 3
3-5 29
5-7 35
7-9 26
9-11 6
11-13 1

(a) Construyase una tabla en la que aparezcan las marcas de clase, las frecuencias absolutas y
relativas y las frecuencias absolutas acumuladas crecientes (o menos de) y decrecientes (o
ms de).

(b) Represntese la distribucin mediante un histograma y su correspondiente polgono de


frecuencias.

(c) Cual es la amplitud del intervalo? Es cerrado o abierto por derecha?

6
18. Se presenta una distribucin de frecuencias del peso (en libras) de 150 personas que usaron
las aerpsillas para subir a esquiar un cierto da. Construya un histograma con estos datos.

clase Frecuencia
absoluta
75-89 10
90-104 11
105-119 23
120-134 26
135-149 31
150-164 23
165-179 9
180-194 9
195-209 6
210-224 2

a) Qu puede observar en este histograma acerca de los datos que no era aparente en la
distribucin de frecuencias?
b) Si la capacidad de cada aerosilla es de dos personas y no mas de 400 libras de peso total
seguro, Qu puede hacer el operador para maximizar la capacidad de personas en las
canastillas sin exceder la capacidad de peso seguro en una canastilla? Los datos apoyan
tu propuesta?

19. El Central Carolina hospital tiene los siguientes datos que representan el peso en libras de 200
bebes prematuros al m o m e n t o de su nacimiento.

clase Frecuencia
absoluta
0.5-0.9 10
1.0-1.4 19
1.5-1.9 24
2.0-2.4 27
2.5-2.9 29
3.0-3.4 34
3.5-3.9 40
4.0-4.4 17

a) Construya una ojiva que le ayud a responder las siguientes preguntas


b) Cul es el valor medio aproximado en el conjunto de datos original?
c) Si los bebes prematuros de menos de 3.0 libras se mantienen en una incubadora durante
varios das como precaucin, Cul es el porcentaje aproximado de bebes prematuros en este
hospital que necesitaran una incubadora?

7
i

INTERVALOS FRECIENCIAS
DE CLASE ABSOLUTAS
1-10 22
11-20 26
21-30 92
. 31-40 86
41-50 74
51-60 27
61-70 12

17. Dada la siguiente distribucin de frecuencias:

INTERVALOS FRECIENCIAS
DE CLASE ABSOLUTAS

1-3 3
3-5 29
5-7 35
7-9 26
9-11 6
11-13 1

(a) Construyase una tabla en la que aparezcan las marcas de clase, las frecuencias absolutas y
relativas y las frecuencias absolutas acumuladas crecientes (o menos de) y decrecientes (o
ms de).

(b) Represntese la distribucin mediante un histograma y su correspondiente polgono de


frecuencias.

(c) Cual es la amplitud del intervalo? Es cerrado o abierto por derecha?

6
LAS DISTRIBUCIONES DE FRECUENCIA DE DOS V A R I A B L E S

20. Se dispone de 1000 datos apareados relevados de una poblacin de trabajadores de la I


industria textil en diciembre de 2004. Los mismos corresponden a la variable "nivel educacional"
(Primario completo o menos, secundario incompleto, secundario completo o mas) que describe el
mayor nivel alcanzado en educacin al momento de realizarse el estudio y la variable "nivel
laboral" (nivel laboral muy bajo, bajo, alto, muy alto) que describe el nivel mas alto de empleo al
momento de realizarse el estudio.

Primario completo o menos y nivel laboral muy bajo 15%


Secundario incompleto y nivel laboral bajo 16%
Secundario completo o ms y nivel laboral alto 2.4%
Total de primario completo o menos 41%
Primario completo o menos y nivel laboral muy alto 7.5%
Secundario incompleto y nivel laboral alto 5.5%
Total nivel laboral alto 14%
Total nivel laboral bajo 31%
Secundario incompleto y nivel laboral muy alto 13%
Total secundario incompleto 42.5%
Total nivel laboral muy alto 28%

Se pide:

a) Dato apareado en el contexto de este ejercicio. Defina las variables, clasifquelas, defina la
"unidad de anlisis", el tamao de la muestra.
b) Construya la distribucin de frecuencias de dos variables con frecuencias absolutas
c) De la distribucin del punto B transcriba:
I. Las distribuciones marginales
II. Las distribuciones condicionales de x e Y
III. La distribucin conjunta
d) A partir de la distribucin del punto b) calcule:
I. Los porcentajes horizontales
II. Los porcentajes verticales
III. Los porcentajes conjuntos

8
lilUllllVliiwi

2 1 . Prueba de c o n c e p t o s

Escriba sobre la lnea, una V si el enunciado es verdadero o una F si es falso. Las respuestas
correctas se encuentran en el archivo correspondiente en este mismo CD.

1. En comparacin con un arreglo (u ordenamiento) de datos, la distribucin de frecuencias


tiene la ventaja de representar los datos de una manera comprimida.
2. Una ojiva "ms que" tiene forma de S y su inclinacin es hacia abajo y a la derecha.
3. Un histograma es una serie de rectngulos, cada uno proporcional en ancho al nmero
de elementos que caen dentro de una clase especfica de datos.
4. Una sola observacin se conoce como datos puntuales, mientras que una coleccin de
datos se conoce como tabular.
5. Las clases de cualquier distribucin de frecuencias relativas son completamente
incluyentes y mutuamente excluyentes.
6. Cuando una muestra contiene las caractersticas importantes de cierta poblacin en las
mismas proporciones en que se encuentran en sta, se dice que se trata de una muestra
representativa.
7. Una poblacin es una coleccin de todos los elementos que se estn estudiando.
8. Si uniramos los puntos medios de las barras consecutivas de un histograma de
frecuencias con una serie de rectas, estaramos graneando un polgono de frecuencias.
9. Antes de organizar la informacin y analizarla mediante mtodos estadsticos, se le
conoce como datos preprocesados.
10.Una desventaja del ordenamiento de datos es que no nos permite hallar fcilmente los
valores mayor y menor del conjunto de datos.
11.Los datos discretos slo se pueden expresar con nmeros enteros.
12.Como regla general, los estadsticos consideran que una distribucin de frecuencias est
incompleta si tiene menos de 20 clases.
13.Siempre es posible construir un histograma a partir de un polgono de frecuencias.
14.La escala vertical de la ojiva para una distribucin de frecuencias relativas indica la
fraccin del nmero total de observaciones que entran en cada clase.
15.Un ordenamiento de datos se forma clasificando los datos sin procesar con respecto al
tiempo de observacin.
16.Una ojiva "menor que" tiene forma de S y su inclinacin es hacia abajo y a la derecha.
17.Una ventaja de los histogramas, en comparacin con un polgono de frecuencias, es que
muestra con ms claridad cada clase de la distribucin.
18.EI promedio de bateo de un jugador de bisbol se calcula utilizando una muestra.
19.Una distribucin de frecuencias organiza los datos en grupos de valores que describen
una o ms caractersticas de esos datos.
20.A una serie de rectngulos cuyo ancho es proporcional al alcance de los valores dentro
de la clase y cuya altura es proporcional al nmero de elementos que caen dentro de la
clase, se le conoce como polgono de frecuencias.
2 1 . Los anchos de clase de una distribucin de frecuencias son de igual tamao.
9
Caso prctico N 1

EL USO DE LAS ESTADITICAS EN LOS MEDIOS

"Las cifras no mienten, pero el hombre las manipula"


La estadstica puede ser efectivamente, mal usadas. Podemos nombrar numerosos ejemplos del mal uso
intencionado de la estadstica, sobre todo por aquellos que emplean sus habilidades en el campo para servir intereses
particulares, distorsionando y falsificando los datos.

Ejemplo: La ciudad XX realizar sus elecciones para elegir al intendente, una agencia realiz encuestas a una
muestra representativa de electores y los" resultados fueron, 98 electores dijeron estar a favor del candidato A y 100
del candidato B, como no haba casi diferencias en la cantidad de votos de uno y otro, el partido PLK que representa
el candidato B, pidi no mostrar los resultados, pero el editor del diario local le dijo:
- sime permiten SEORES, creo que pudiramos presentarlos resultados de esta manera:

Grfico 1
"Comportamiento de la intencin de votos 198 electores de la ciudad XX"

100,5

CanfdatoA candidatos

-A lo que contest el partido PKL, me gusta!!!

Si el grfico que representa la intencin de votos hubiera sido el Grfico 2, El partido PLK hubiera aceptado la
publicacin? Por qu?, Uno de los grficos esta mal confeccionado?, que diferencia hay? Qu aspectos faltaran
indicar en el grfico?

Grfico 2
"Comportamiento de la intencin de votos 198 electores de la ciudad XX"

Candidato A Candidato B

En esta ocasin te dejo a vos que escribas la MORALEJA.


10
lUIilllllVlt
UNIVERSIDAD NACIONAL DE TUCUMN
FACULTAD DE FILOSOFA Y LETRAS
LICENCIATURA EN CIENCIAS DE LA COMUNICACIN
2010

ESTADISTICA

T R A B A J O PRCTICO N 2

Anlisis de datos univariante

1. Calcule la media aritmtica, la mediana y la moda. Se analiz el IVA que se aplica, en diversos
pases europeos, a la compra de obras de arte. Los resultados obtenidos fueron los siguientes:

PAIS IVA
Espaa 0.16
Italia 0.20
Blgica 0.06
Holanda 0.06
Alemania 0.07
Portugal 0.17
Luxemburgo 0.06
Finlandia 0.22

2. Con los mismos datos del ejercicio anterior vamos a calcular los cuartiles.

3. Calcula la media, la varianza, la desviacin estndar tras encuestar a 25 familias sobre el


nmero de hijos que tenan, se obtuvieron los siguientes datos,

N de
hijos(Xi) 0 1 2 3 4

N de
familias(fa) 5 6 8 4 2

11
l \1 V i l V I l V I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I

4. Distribucin de las puntuaciones en una escala de hostilidad, de 160 sujetos de


Una muestra, ha sido la siguiente:

Xi U
0 a 10 8
10 a 20 22
20 a 30 32
30 a 40 44
40 a'50 28
50 a 60 20
60 a 70 6

a) Entre que valores se encuentra el 50% central de los individuos?


b) Calcule el percentil 27.
c) A partir de que puntuacin se encuentra el 12% de los sujetos ms hostiles?
d) Si descontamos el 15 % de los individuos menos hostiles y el 15% de los ms hostiles En q u
intervalo de puntuacin se encuentran los restantes?

5. Para el ejercicio n 9 del TP N 1, calcule la media y la desviacin estndar. Interprete los


resultados

6. Explique las similitudes y diferencias de estas distribuciones:

Edad fa Edad fa
20-29 14 20-29 43
30-39 17 30-39

40-49 22 40-49

50-59 18 50-59

60-69 9 60-69 37
Total 80 Total 80

7. En una pregunta del CIS sobre la edad hasta la que consideran convenientes los padres
controlar los programas y el tiempo de televisin de los hijos, la media fue de 15,4 aos y la
desviacin tpica d e 2 , 1 1 . Teniendo en cuenta que las respuestas se distribuyen aproximadamente
como la curva normal y que van de los 7 a los 24 aos, calcular:
A-Cuantos respondieron que la edad debe ser hasta los 13 aos
B-Cuantos dijeron q u e debe estar entre 14 y 17 aos.
C-Cuantos respondieron que debe estar por encima de los 19 aos

8. Las dos m u e s t r a n que siguen corresponden a los precios al publico , en pesos, de los modelos
de pantalones d e d o s locales de un Shopping center

Local A Local B
32 40 25 55 65 15 25 35 15 28 32

12
a. Calculen el precio promedio y mediano de cada local. Interpreten su respuesta.
b. Aumenten en los dos locales el precio de los pantalones en un 15%. Calculen la media de
los nuevos precios y comprenla con la anterior.
c. Disminuyan cada uno de los precios originales en 5$. Calculen la media de los nuevos
precios y comprenla con el promedio original.
d. Sobre la base de lo observado en b) y c) respondan a las siguientes preguntas.
i. Si el local C vende pantalones con un precio promedio de 23$, y decide liquidar
sus existencias disminuyendo el precio de cada modelo en $2,5, Cul ser el
nuevo precio promedio?
ii. Cul ser el precio promedio si, en cambio, decide aumentarlos en 22%?

9. En una fbrica de galletitas se midi durante un mes completo el consumo diario de harina. Los
datos obtenidos fueron ordenados en la siguiente tabla de frecuencias.

Kilogramos [0; 100) [100; 200) [200; 300) [300; 400)


Frecuencia 7 9 4 10

a. Aproximen el valor de la mediana y los cuarteles. Interpreten los resultados


b. Aproximen la cantidad mxima de harina que utilizan el 35% de los das de menor
consumo.
c. Aproximen la cantidad mnima de harina que utilizan el 2 0 % de los das de mayor consumo.

En una cmara frigorfica de una fabrica se tomaron 30 mediciones de temperatura (en C) en


distintos momentos del da:

3.4 3.2 3.5 3.8 3.4 3.8 3.2 3.2 3.1 3.4 3.1 3.7 3.7 3.8 3.1
3.4 3.7 3.5 3.1 3.6 3.7 3.8 3.6 4.0 4.0 3.2 3.2 3.1 3.1 3.8

a. Calcule la media y el desvo estndar.


b. Calculen el coeficiente de variacin (CV) y comprenlo con el de la otra cmara que tiene la
empresa, que dio una temperatura promedio de 3C y un desvo estndar de0.35C
c. Calculen el rango

d. Cuantas veces esta el desvo estndar contenido en el rango, aproximadamente?

ASIMETRA
( f i ) Dadas las clases 0-50, 50-100, 100-150, 150-200, 200-250, 250-300, 300-350, proporcionar
una asignacin de frecuencias que de lugar a una distribucin:
a. Simtrica
b. Asimtrica a fa derecha
c. Asimtrica a la izquierda

13
12. En una gran empresa se ha llevado a cabo un estudio sobre los salarios de los empleados en
el mes de octubre de 2004. Los datos obtenidos se resumen en la siguiente tabla:

Salarios en pesos Mujeres Hombres


250 a menos de 500 99 202
500 a menos de 750 202 231
750 a menos de 1000 246 687
1000 a menos de 1250 121 833
1250 a menos de 1750 131 567
1750 a menos de 2000" 21 101
2000 a menos de 2250 8 38
2250 a menos de 2500 4 21
2500 a menos de 2750 1 14
833 2694

Se pide:

a) Calcule el sueldo promedio (media aritmtica) de los hombres e interprete.


b) Cul es el sueldo mas frecuente entre las mujeres?
c) Es la distribucin del sueldo de las mujeres ms dispersa que la de los
hombres? Justifique
d) A partir del sueldo promedio (media aritmtica) de cada grupo, calcule el sueldo
promedio (media aritmtica) de todos los empleados.
e) A partir de la varianza de cada grupo, calcule la varianza de todos los
empleados.
f) Suponga que para el mes de diciembre de 2004 se les otorg a las mujeres un
aumento del 15% y loas hombres un aumento de $100. Cul ser el nuevo
valor del sueldo promedio?

13. Los datos sin agrupar mostrados a continuacin son los gastos por electricidad y gas durante
el mes de julio de 2004 de 50 departamentos de un edificio de propiedad horizontal de Tucumn:

Datos s i n agrupar cle gastos d e electricidad y gas


en j u io de 2004 en $;
96 171 202 178 147 142 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 ,149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
208 119 183 151 114 135 191 137 129 158

Se pide:

a) Forme una distribucin de frecuencias con una amplitud de 20 pesos, comenzando la


primera en 80.
b) Grafique la distribucin anterior.
c) Qu proporcin de departamentos gastaron entre 120 y menos de 160 pesos?
d) Sin hacer clculos determine el valor aprox. De la media, mediana y moda.
e) Qu valores tomaron los coeficientes de asimetra de de Bowley y Pearson?
14
Prueba de conceptos

14. Escriba sobre la lnea, una V si el enunciado es verdadero o una F si es falso.


1. El valor de cada observacin del conjunto de datos se toma en cuenta cuando
calculamos su mediana.
2. Cuando la poblacin est sesgada positiva o negativamente, a menudo es preferible
utilizar la mediana como mejor medida de posicin, debido a que siempre cae entre la
media y la moda.
3. Las medidas de tendencia central de un conjunto de datos se refieren al grado en que las
observaciones estn dispersas.
4. Una medida de lo puntiagudo de una curva de distribucin es el sesgo.
5. Con un conjunto de datos no agrupados, la moda se utiliza con ms frecuencia como
medida de tendencia central.
_S. Si organizamos las observaciones de un conjunto de datos en orden descendente, el
dato puntual que se encuentra en medio es la mediana del conjunto de datos.
7. Cuando se trabaja con datos agrupados, podemos calcular una media aproximada si
suponemos que cada valor de una clase dada es igual a su punto medio.
8. El valor que ms se repite en un conjunto de datos se conoce como media aritmtica.
9. Si la curva de cierta distribucin tiene el extremo ms largo hacia la izquierda de la
escala de medicin del eje horizontal, se dice que la distribucin est negativamente
sesgada.
lO.Despus de agrupar un conjunto de datos en cierto nmero de clases, podemos
identificar la clase mediana como la que tiene el mayor nmero de observaciones.
11.Una media calculada a partir de un conjunto de datos agrupados siempre da una buena
estimacin del valor real, aunque rara vez es exacto.
12.Podemos calcular una media para cualquier conjunto de datos, si tenemos su
distribucin de frecuencias.
13.La moda siempre se encuentra en el punto ms alto de la grfica de una distribucin de
datos.
14.EI nmero de elementos de una poblacin se denota por n.
15.Para un arreglo de datos con 50 observaciones, la mediana ser el valor de la
observacin nmero 25 del arreglo.
16.Los valores extremos de un conjunto de datos tienen un fuerte efecto sobre la mediana.
17.La diferencia entre las observaciones ms alta y ms baja de un conjunto de datos se
conoce como media geomtrica.
18.La dispersin de un conjunto de datos da una idea de la confiabilidad de la medida de
tendencia central.
19.La desviacin estndar es igual a la raz cuadrada de la varianza.
20.La diferencia entre las observaciones ms alta y ms baja de un conjunto de datos se
conoce como el rango cuartil.
21.El rango intercuartil se basa slo en dos valores tomados del conjunto de datos.
15
_22.La desviacin estndar se mide en las mismas unidades que las observaciones del
conjunto de datos.
_23.Un fractil es una posicin en una distribucin de frecuencias en la que una proporcin (o
fraccin) de los datos se encuentra en ella o arriba de ella.
2 4 L a varianza, al igual que la desviacin estndar, toma en cuenta todas las observaciones
del conjunto de datos.
.25.EI coeficiente de variacin es una medida absoluta de la dispersin.
_26.La medida de dispersin* que con ms frecuencia utilizan los especialistas en estadstica
es la desviacin estndar.
_27.Una de las ventajas de las medidas de dispersin es que cualquier estadstico que mide
variacin absoluta, tambin mide variacin relativa.
_28.Una desventaja al utilizar el rango para medir la dispersin es que no toma en cuenta la
naturaleza de las variaciones entre la mayora de las observaciones.
29. La varianza indica la distancia promedio a la media de cualquier observacin del
conjunto de datos.
30. Cada poblacin tiene una varianza que se simboliza con s . 2

31. De acuerdo con el teorema de Chebyshev, no ms del 1 1 % de las observaciones de una


poblacin puede tener resultados estndar de la poblacin mayores que 3 o menores
que - 3 .
32. El rango intercuartil es un ejemplo especfico de un rango interfractil.
.33.Es posible medir el rango de una distribucin de extremo abierto.
34.El rango intercuartil mide el rango promedio de la cuarta parte ms baja de una
distribucin.

LA CURVA NORMAL Y EL PUNTAJE ESTANDAR: variables aleatorias c o n t i n u a s

15. En una pregunta de una encuesta llevada a cabo el la ciudad de San Miguel de Tucumn
durante octubre de 2009 acerca la edad hasta la que consideran convenientes los padres controlar
los programas y el tiempo de televisin de los hijos, la media fue de 15,4 aos y la desviacin
tpica de 2,11. Teniendo en cuenta que las respuestas se distribuyen aproximadamente como la
curva normal y que van de los 7 a los 24 aos.

Se pide: ,

A-Cuantos respondieron que la edad debe ser hasta los 13 aos


B-Cuantos dijeron que debe estar entre 14 y 17 aos.
C-Cuantos respondieron que debe estar por encima de los 19 aos

16
16. Utilicen la tabla de la distribucin normal estndar para hallar los siguientes valores:

a) P ( Z < 1 . 2 5 ) = f)P(Z>1.86) =
b) P (Z < -2.33) = g) P ( - 1 . 2 3 < Z < 2 . 1 4 ) =
c) P (Z < 0) = h) P ( - 2 . 1 5 < Z < - 0 . 0 5 ) =
d) P ( Z > 1 . 4 5 ) = )P(-1.25<ZS-2.33) =
e) P (Z > -2.05) =

17. Hallen Zopara que se cumpla cada una de las siguientes igualdades:

a) P (Z < Z ) =0.3372
0 b) P (Z < Z ) =0.2389
0 c) P (Z > Zo) = 0.5120

18. Si X: N (20; 5), calculen las siguientes probabilidades

a) P(X>22)= d) P(12<X<23)=
b) P(x<16)= e) P(X<32)=
c) P(X>14)= f) P(10<X<30)=

19. En una fbrica se envasan paquetes de harina cuyo peso tiene distribucin normal con un
promedio de 1020 g. y un desvo estndar de 20g.

a) Calculen la probabilidad de que un paquete tomado al azar pese ms de 1050g.


b) Si las asociaciones de defensa al consumidor consideran defectuosos un paquete cuando
tiene menos de 950g., calculen la proporcin de paquetes defectuosos que se producen

20. Un fabricante de multiprocesadora quiere extender el perodo de garanta de sus productos


para competir en este aspecto con las otras marcas de plaza. Para ello sabe que el tiempo de
duracin, sin fallas, de estos artefactos tiene una distribucin normal con media 26 meses y desvo
de 5 meses.

a) Calculen la probabilidad de que una multiprocesadora funciones sin fallar durante 3 aos o
mas.
b) Calculen la probabilidad de que una multiprocesadora falle antes de los 15 meses de uso.
c) Qu duracin deber poner en la garanta para arreglar en garanta menos del 3% de los
artefactos que produce?

2 1 . Gustavo que es bilogo, esta realizando una investigacin sobre el Chaetophractus Villosus,
una especie de armadillo comnmente llamado peludo. En experiencias anteriores, los cientficos
pudieron investigar que el peso promedio de un macho adulto es de 2.02kg y un desvo de 0.1 kg.
Gustavo deber medir y pesar una muestra de al menos 10 de ellos para confirmar estos datos.
Sobre la base de los valores anteriores, y suponiendo una distribucin normal, determinen las
siguientes probabilidades.

17
a) La probabilidad de que el primer animal que estudie pese menos de 1 .9 Kg.
b) La probabilidad de que el primer animal que estudie pese mas de 2.3 Kg. ^ menor que
c) La probabilidad de que los dos primeros animales que estudie tengan u p
1.85 Kg. Cada uno.

j A inc autos que estn en la


22. Un estudio de un municipio dio como resultado que la antigedad ae ios. ? ^ ^ aos.
2

calle responden a una distribucin normal con una media de 10 aos y un de decidieron
Como la cantidad de autos en la calle hace que el transito se torne muy P ^ antigedad
restringir la antigedad permitida para los autos que transiten por las avenidas.
debern exigir como mximo para retirar de circulacin al 2 0 % de los automovi e
23. En una panadera, la demanda de pan tiene una distribucin aproximadamente normal con
una media de 720 piezas de pan y un desvo de 30 piezas.

a) Calculen la probabilidad de que un cierto da se vendan menos de 750 P ^ ^ . g g ^ f '


3 1 1

b) Cuntas piezas debern producir para que el pan alcance el 9 5 % de las ^ p ?


e z a s

c) Produciendo esa cantidad, Cul es la probabilidad de que sobren mas de

18
r ,& a u-fi u y ; y & -s'fs' stss; &- & u * * * > c

UNIVERSIDAD N A C I O N A L D E TUCUMAN
F A C U L T A D D E F I L O S O F I A V LETRAS
L I C E N C I A T U R A E N CIENCIAS D E L A
COMUNICACIN

CATEDRA DE ESTADISTICA

C A R T I L L A D E EJERCICIOS

22 P A R C I A L

P R O F E S O R : CONSTANZA A L M I R O N

2010

***

19
UNIVERSIDAD NACIONAL DE TUCUMN
FACULTAD DE FILOSOFA Y LETRAS
LICENCIATURA EN CIENCIAS DE LA COMUNICACIN

2010

ESTADISTICA

T R A B A J O P R C T I C O N 3

P R O B A B I L I D A D C O N P O R C E T A N J E S Y D I S T R I B U C I O N DE F R E C U E N C I A S

EJERCICIO 1 :

Los Ministerios de Educacin y Economa estn realizando un estudio conjunto para determinar la
relacin entre el nivel de c o n s u m o y el grado de estudio alcanzado. Basndose en una muestra de
1000 personas, se confeccion la siguiente Tabla para estimar probabilidades:

Educacin
Primaria Secundario Terciaria Univeritaria Posgrado
e Alto - - 20 45 85 150

Medio 26 39 195 325 65 650


o Bajo 74 61 35 30 - 200
U 100 100 250 400 150 1000

(a) Determine la probabilidad conjunta de que un individuo tenga ingresos altos y tenga
estudios de postgrado.
(b) Halle la probabilidad marginal de que un individuo tenga estudios primarios solamente.
(c) Halle la probabilidad marginal de que el consumo de un individuo sea medio.
(d) Halle la probabilidad conjunta de que una persona tenga un nivel de consumo medio y
posea estudios universitarios.

EJERCICIO 2:

Considere un pas donde el 6 0 % de sus habitantes perciben ingresos bajos, el 3 5 % ingresos


medios y slo el 5% ingresos altos. La Secretara de Turismo est estudiando la relacin entre el
nivel de ingresos y los viajes que realizan los individuos en las vacaciones: no viajan, viajan dentro
del pas o viajan al exterior. De los de clase alta, todos viajan al exterior. De los de clase media, el
2 0 % viaja dentro del pas, otro 2 0 % viaja al exterior y el restante 6 0 % no viaja en sus vacaciones.
Finalmente, de los habitantes de clase baja, el 4 0 % no viaja, mientras que el resto viaja dentro del
pas. Determine la probabilidad de que un individuo de la poblacin, seleccionado al azar, viaje
dentro del pas en sus vacaciones.

20
EJERCICIO 3:

En una comunidad, donde el 6 0 % de sus habitantes son Catlicos, el gobierno est estudiando la
posibilidad de legalizar el aborto. Para ello realiz un plebiscito, en el cual un sexto de los catlicos
estuvo en favor del aborto y tres cuartos de los no catlicos estuvo en favor del aborto. Determine
la probabilidad de que un miembro de la poblacin, seleccionado al azar, est en favor del aborto.

ASOCIACION Y CORRELACION

EJERCICIO 1 :

Al gerente del departamento de adquisiciones de una organizacin bancaria grande le gustara


estudiar la relacin existente entre la cantidad de facturas que deben ser procesadas y el tiempo
que insume este tipo de trabajo. Se relevaron datos para 30 das hbiles con los resultados
siguientes

DIA N DE TIEMPO DIA N DE TIEMPO


FACTURAS EMPLEADO FACTURAS EMPLEADO
PROCESADAS (HORAS) PROCESADAS (HORAS)
1 149 2.1 16 169 2.5
2 60 1.8 17 190 2.9
3 188 2.3 18 233 3.4
4 19 0.3 19 289 4.1
5 201 2.7 20 45 1.2
6 58 1.0 21 193 2.5
7 77 1.7 22 70 1.8
8 222 3.1 23 241 3.8
9 181 2.8 24 103 1.5
10 30 1.0 25 163 2.8
11 110 1.5 26 120 2.5
12 83 1.2 27 201 3.3
13 60 0.8 28 135 2.0
14 25 0.4 29 80 1.7
15 173 2.0 30 29 0.5

Se pide:

a) Proponga utilizando su conocimiento sobre las variables, cual seria la posible relacin que
existira entre ellas. Justifique su respuesta.
b) A partir de los datos construya un diagrama de dispersin y explique, la relacin que existe
entre las variables. Puede observar el sentido de la relacin?
c) Construya la distribucin de frecuencias a dos variables en un cuadro 2 x 2 . Para el nmero
de facturas procesadas divida la muestra en menos o igual a 100 y en mas de 100 y para
el tiempo empelado, divida la muestra hasta 2 horas y mas de 2 horas. Analice mediante el
test de Chi cuadrado (con un a = 0.05) si en la distribucin existe o no asociacin entre las
variables que se investigan.

21
EJERCICIO 2:

Una agencia de publicidad intenta determinar la composicin demogrfica del mercado para un
nuevo producto. Seleccionaron al azar 75 personas de cada uno de 5 grupos de edad y les
presentaron el producto. Los resultados de la encuesta son los siguientes:

Actividad futura 18-29 30-39 40-49 50-59 60-69


Compra frecuente 12 18 17 22 32
Compra alguna vez 18 25 29 24 30
Nunca compra 45 32 29 29 13

1. Desarrolle una tabla de frecuencias observadas y esperadas


2. Calcule el valor Chi cuadrado
3. Establezca la hiptesis nula y alternativa
4. Si el nivel de significancia es de 0.01. Debe rechazarse la hiptesis nula?

EJERCICIO 3:

La siguiente tabla muestra las frecuencias absolutas y las frecuencias esperadas entre el peso de
los recin nacidos y la condicin de fumadora de la madre para un grupo de 2000 gestantes de la
maternidad:

Recin nacido de bajo peso


Gestante S No Total
Fumadora 43 (18.5) 207 (231.5) 250
No fumadora 105(129.5) 1645(1620.5) 1750
Total 148 1852 2000

Se p i d e :

1. Calcule el valor Chi cuadrado


2. Establezca la hiptesis nula y alternativa
3. Si el nivel de significancia es de 0.05. Debe rechazarse la hiptesis nula de
independencia?

EJERCICIO 4:

Un estudio compaa "XX" ha indicado que la independencia asumida entre la edad de los
empleados y la tasa de ausentismo es en realidad falsa y que, si bien las tablas no contienen
errores, hay una relacin entre la edad y las ausencias registradas. Determine mediante un test
Chi - cuadrado (con un a = 0.05) si existe asociacin entre las variables bajo estudio.

Ausentismo
Bajo Medio Alto
18-25 11 10 4 25
25-35 25 7 3 35
T3 35-55 35 2 3 40
UJ
Mayor a 55 14 6 0 20
85 25 10 120

22
' - * " 'i ill "W fWl mu n>i m. .,T*
M

o o i

UNIVERSIDAD NACIONAL. DE TUCUMAN


FACULTAD DE FILOSOFA Y LETRAS
LICENCIATURA EN CIENCIAS DE LA COMUNICACIN
2010

ESTADISTICA c.

T R A B A J O PRCTICO N 4
R e g r e s i n lineal

EJERCICIO 1 :

Usando los datos a continuacin


1. Trace el diagrama de dispersin
2. Desarrolle la ecuacin de estimacin que mejor describa a los datos
3. Pronostique y para X = 5, 6, 7

X 16 6 10 5 12 14
Y -4.4 8.0 2.1 8.7 0.1 -2.9

EJERCICIO 2:

Supongamos que Y representa el nivel de gasto de una familia tipo y que X representa el nivel de
ingreso disponible. Interprete los coeficientes en cada una de las rectas que se presentan a
continuacin:
(a) Y=0+X +

(b) Y=-l+-X + s
2
(c) Y=3--X +s
4

Nota: interprete valor negativos de Y como prstamos de dinero.

EJERCICIO 3:
Calcule la covarianza entre X e Y y la correlacin a partir de los siguientes datos:

f>,.=15,7 f > , = 38,65 f> / 0 , , =51,37

;=1x , 2 =21,11 /=1x 2 =126,09

Explique en ambos casos el concepto y escriba la frmula correspondiente. Realice el test de


significatividad de la correlacin.

23
EJERCICIO 4:

En una materia de esta facultad el profesor tomo dos exmenes y esta interesado en saber si las
calificaciones del segundo e x a m e n , estn relacionadas con las calificaciones del primero. Las
notas de ambos exmenes se presentan a continuacin:

ESTUDIANTE EXAMEN 1 EXAMEN 2


1 6 6
2 7.5 10
3 7 8
4 7.2 6.8
5 5.4 7.3
6 8.3 9.7
7 8 8.5
8 6.5 9

Se pide: realice el diagrama de dispersin y calcule el coeficiente de correlacin de Pearson.


Concluya sobre que relacin existe entre ambas variables

EJERCICIO 5:

Los datos que se presentan a continuacin surgen la ecuacin y = 3 + 2.x. Con ello, estime la
recta de regresin lineal y calcule el coeficiente de correlacin entre las variables:

X 2 4 5 6 8 9
Y 7 11 13 15 19 21

Explique sus resultados.

EJERCICIO 6: Error e s t n d a r y c o e f i c i e n t e de d e t e r m i n a c i n

Dado el siguiente conjunto de datos


1. Desarrolle la ecuacin de estimacin que mejor describa a los datos
2. Calcule el error estndar de la estimacin e interprtelo
3. Calcule el coeficiente de determinacin de la muestra e interprtelo

X 56 48 42 58 40 39 50
Y 45 38.5 34.5 46.1 33.3 32.1 40.4

24
t & & 9 9 9 + 999 9 9 9 9 9* 9 9 * * & & G QQi

EJERCICIO 7:

A partir de la informacin contenieren el siguiente cuadro, calcule una recta que relacione los
datos de tasa de inters y un ndice de PBI del pas A X X B .
1 V

Tasa de inters
i Indice
2,0% 113
3,0% 125
2,5% 117
4,0% 131
3,0% 123
1,0% 102
1,5% 105
2,0% 110
3,5% 129
4,5% 140
2,0% 116
0,5% 101

Responda los siguientes puntos:


(d) Calcule la covarianza y la correlacin entre la tasa de inters y el ndice de PBI.
(e) Cul es el valor de la tasa de inters si el ndice fuese nulo?
(f) Cul es el valor esperado de la tasa de inters si el ndice fuese 150?
(g) Cul es el valor esperado de la tasa de inters si el ndice fuese 115?
(h) Si la tasa de inters esperada es de 2%, cul es ndice observado?
(i) Relacione el promedio de la tasa de inters y el promedio del ndice a travs de os
coeficientes de la ecuacin de la recta.

EJERCICIO 8:

Utilizando los siguientes datos, calcule la covarianza entre X e Y, el coeficiente de correlacin y el


coeficiente de determinacin del modelo.

X Y Y
1 2,6 0,4
2 4,8 6,9
3 .15,2 13,4
1 1,5 0,4
2 5,9 6,9
3 9,2 13,4
4 24,1 19,9
2 5,6 6,9
3 14,7 13,4
4 17,9 19,9
5 33,9 26,4

25
EJERCICIO 9:

En una universidad, el C o n s t a Acadmico desea ver qu relacin hay entre las horas de estudio
y la cantidad de materias aprobadas en un ao. Para ello, se encuesta a 30 estudiantes y se les
consulta cuntas horas estudia por da en promedio y cuntas materias aprob el ltimo ao. Se
sabe que un alumno puede aprobar desde 0 materias hasta 6 en el mismo ao:

Horas de Estudio 1,5 0,5 1 2 1 0,5 3 2 1,5 1,75 1,5 2 3 0,5


Materias aprobadas 3 1 1 2 1 2 5 6 2 6 3 2 4 6

0,25 1,5 2,25 4 4,5 2 3,25 2,5 1 1 0,75 0,5 0,75 0,75 3,75 3
0 3 0 1 2 5 2 1 2 2 3 6 2 1 6 6

(j) El Consejo Acadmico de esta Universidad debe concluir que a mayor cantidad de horas
de estudio ms materias aprobadas? Diga qu errores de especificacin, errores lgicos,
comete el Consejo al intentar explicar esta relacin a travs de este modelo. En caso de ser
posible, estime la recta de regresin correspondiente.
(k) Hay variables que podran ser agregadas al modelo?
(I) Hay otros factores que expliquen la cantidad de materias aprobadas?

EJERCICIO 10:

Sea el siguiente modelo de regresin lineal simple y Px +, en donde la variable x


= a +

representa "horas trabajadas" e y "sueldo mensual", del cual se obtuvo la siguiente recta de
regresin:

Y = 2 0 0 + 3x +,
c

Se pide: Si las horas se incrementan en dos horas, indique los nuevos valores de a y (3. Justifique
su respuesta algebraicamente.

EJERCICIO 1 1 :

De las 10 familias de San Miguel de T u c u m n se conoce el ingreso neto por mes y el gasto en
bienes de consumo, ambos en miles de pesos:

Ingreso Neto Gastos en


mensual (X) bienes de Se Pide:
consumo
a) Calcule el coeficiente de correlacin de Pearson
1.3 1.0
b) Realice el diagrama de dispersin y en base al mismo, indique si
1.5 1.2
1.4 1.2 las variables se relacionan y el sentido. Justifique.
0.8 0.8 c) Describa el modelo de regresin lineal en X a utilizar en este
1.7 1.5 caso.
3.3 1.5 d) Calcule la recta de regresin correspondiente al modelo
1.2 1.0 escogido en el punto a).
1.9 1.6
e) Calcule e interprete el coeficiente de determinacin de Pearson
2.1 1.4
2.8 1.6

26
P r u e b a de c o n c e p t o s

Escriba sobre la lnea, una V si el enunciado es verdadero o una F si es falso.

1. El anlisis de regresin se usa para describir qu tan bien una ecuacin de estimacin describe
la relacin que se est estudiando.
2. Dado que la ecuacin para una recta es V = 26 - 24X, podemos decir que la relacin de Y con X
es directa y lineal.
3. Un valor i cercano a cero indica una fuerte correlacin entre X y Y.
2

4. Los anlisis de regresin y correlacin se usan para determinar relaciones de causa y efecto.
5. El coeficiente de correlacin de la muestra, r, es simplemente Ur , y no podemos interpretar su
2

significado directamente como un porcentaje de algn tipo.


6. El error estndar de la estimacin mide la variabilidad de los valores observados alrededor de la
ecuacin de regresin.
7. La recta de regresin se deriva de una muestra y no de toda la poblacin.
8. Podemos interpretar el coeficiente de determinacin de la muestra como la cantidad de la
variacin en Y que explica la recta de regresin.
9. Las lneas trazadas a cada lado de la recta de regresin a + 1 , 2 y 3 veces el valor del error
estndar de la estimacin se denominan lneas de confianza.
10. La ecuacin de estimacin es vlida slo en el mismo intervalo que el dado por los datos
originales de la muestra para los cuales se desarroll.
11. En la ecuacin Y = a + bX para la variable dependiente V y la variable independiente X, la
ordenada Ves Jb.
12. Si una lnea se ajusta a un conjunto de puntos mediante el mtodo de mnimos cuadrados, los
errores individuales positivos y negativos respecto a la lnea suman cero.
13. Si s = 0-para una ecuacin de estimacin, debe estimar perfectamente la variable dependiente
e

en los puntos observados.


14. Supongamos que la pendiente de una ecuacin de estimacin es positiva. Entonces el valor de r
debe ser la raz cuadrada positiva de r .
2

15. Si r = 0.8, entonces la ecuacin de regresin explica el 80% de la variacin total en la variable
dependiente.
16.'EI coeficiente de correlacin es el porcentaje de la variacin total de la variable dependiente
explicada por la regresin/
17. El error estndar de la estimacin se mide perpendicularmente desde la recta de regresin ms
que sobre el eje Y
18. Al elevar al cuadrado los errores individuales, el mtodo de mnimos cuadrados magnifica todas
las desviaciones respecto a la recta de regresin estimada.
19. Una ecuacin de regresin no puede ser vlida al ampliarse fuera del intervalo de la muestra de
la variable independiente.
20. Un valor i mide slo la fuerza de una relacin lineal entre las dos variables X y Y.
2

21. Un valor pequeo de r implica que no existe una relacin de causa-efecto significativa entre X y
2

Y.

27
C A T E D R A DE ESTADISTICA
CIENCIAS DE LA COMUNICACIN
PROF. CONSTANZA ALMIRON

DISTRIBUCION DE P R O B A B I L I D A D N O R M A L E S T A N D A R

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4834 0.4838 0.4842 0.4846
0.4830 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4875 0.4878 0.4881
0.4868 0.4871 0.4884 0.4887 0.4890
2.3 0.4893 0.4896
0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920
0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940
0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955
0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966
0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975
0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982
0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987
0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
DISTRIBUCION CHI- C U A D R A D O

Probabilidac de un valor superior - Alfa (a)


Grados
0,1 0,05 0,025 0,01 0,005
libertad
1 2,71 3,84 ': 5,02 6,63 7,88
2 4,61 5,99" 7,38 9,21 10,60
3 6,25 7,81 9,35 , 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00

Você também pode gostar