Você está na página 1de 6

LISTA DE EXERCCIOS ESTATSTICA I (BIOLOGIA) Anlise Bidimensional / Regresso Linear

1. Numa pesquisa sobre rotatividade de mo-de-obra, para uma amostra de 40 pessoas foram observadas duas variveis: nmero de empregos nos ltimos dois anos (X) e salrio mais recente, em nmero de salrios mnimos (Y). Os resultados foram: Indivduo X Y 1 1 6 2 3 2 3 2 4 4 3 1 5 2 4 6 2 1 7 3 3 8 1 5 9 10 11 12 13 14 15 16 17 18 19 20 2 3 2 3 1 2 3 4 1 2 2 2 2 2 5 2 6 6 2 2 5 5 1 1

Indivduo 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 2 3 4 1 2 3 4 1 4 3 2 1 4 2 4 3 1 3 2 2 X 4 2 1 5 4 2 1 5 4 3 2 1 1 6 2 1 4 2 3 5 Y a. Usando a mediana, classifique os indivduos em dois nveis, alto e baixo, para cada uma das variveis, e construa a distribuio de frequncias conjunta das duas classificaes. b. Qual a porcentagem das pessoas com baixa rotatividade e ganhando pouco? c. Qual a porcentagem das pessoas que ganham pouco? d. Entre as pessoas com baixa rotatividade, qual a porcentagem das que ganham pouco? e. A informao adicional dada no tem (d) mudou muito a porcentagem observada em (c) ? O que isso significa? f. Verifique se h relao entre as variveis rotatividade e salrio. g. Qual o valor de 2 e do coeficiente de contingncia para estes dados? h. Construa a tabela de frequncias conjuntas para as variveis X e Y. i. Construa o grfico de disperso destes dados. j. Calcule o coeficiente de correlao. Baseado neste nmero voc diria que existe dependncia entre as duas variveis? Respostas: (a) Temos que md ( X ) = 2,0 e md (Y ) = 2,5 . Assim,

Y X Baixo Alto Total


(b)

Baixo 1 (0,025) 19 (0,475) 20 (0,50)

Alto 7 (0,175) 13 (0,325) 20 (0,50)

Total 8 (0,20) 32 (0,80) 40 (1,00)

Da tabela, tem-se que 2,5% dos indivduos encontram-se nessas condies.

(c) (d) (e)

50%. Dentre as pessoas com baixa rotatividade, 12,5% ganham pouco. A probabilidade em (c) foi bastante modificada. Isto indica que a maioria das pessoas que ganham pouco tm rotatividade.

2. Uma companhia de seguros analisou a frequncia com que 2000 segurados (1000 homens e 1000 mulheres) usaram o hospital. Os resultados foram: Homens Mulheres Usaram o hospital No usaram o hospital a. b. c. d. Respostas:
(a) (b) (c) A proporo de homens entre os indivduos que usaram o hospital : 100

100 900

150 850

Calcule a proporo de homens entre os indivduos que usaram o hospital. Calcule a proporo de homens entre os indivduos que no usaram o hospital. O uso do hospital independe do sexo do segurado? Encontre uma medida de dependncia entre as variveis.

250

= 0,4

A proporo de homens entre os indivduos que no usaramo hospital : 900 Tabela do total de colunas. Usaram o hospital No usaram o hospital

1750

= 0,514

100 (0,10) 150 (0,15) 0,25 900 (0,90) 850 (0,85) 0,75 1,00 1,00 1,00 Independentemente do sexo, 25% das pessoas usam e 75% no usam o hospital. Essas porcentagens deveriam ser iguais nas duas colunas e no so. Portanto, o uso do hospital depende do sexo do segurado.

3. No estudo de uma certa comunidade verificou-se que: (I) A proporo de indivduos solteiros de 0,4. (II) A proporo de indivduos que recebem at 10 salrios mnimos de 0,2. (III) A proporo de indivduos que recebem at 20 salrios mnimos de 0,7. (IV) A proporo de indivduos casados entre os que recebem mais de 20 salrios mnimos de 0,7. (V) A proporo de indivduos que recebem at 10 salrios mnimos entre os solteiros de 0,3.

a. b.

Construa a distribuio conjunta das variveis estado civil e faixa salarial e as respectivas distribuies marginais. Voc diria que existe relao entre as duas variveis consideradas?

Respostas:
(a) Estado Civil Solteiro Casado Total Menos de 10 SM 0,12 0,08 0,20 Salrio Entre 10 e 20 SM 0,19 0,31 0,50 Mais de 20 SM 0,09 0,21 0,30 Total 0,40 0,60 1,00

(b) Considere-se a tabela do total de colunas: Salrio Estado Civil Menos de 10 SM Entre 10 e 20 SM Mais de 20 SM Total Solteiro 0,60 0,38 0,30 0,40 Casado 0,40 0,62 0,70 0,60 Total 1,00 1,00 1,00 1,00 Pelas diferenas entre as propores marginais e as do interior da tabela, parece haver relao entre as variveis.

4. Uma pesquisa para verificar a tendncia dos alunos a prosseguir os estudos, segundo a classe social do respondente, mostrou o seguinte quadro: Pretende continuar? Sim No Classe Social Mdia 220 280 Total Baixa 380 720 800 1200

Alta 200 200

a. Voc diria que a distribuio de respostas afirmativas igual a de respostas negativas? b. Existe dependncia entre os dois fatores? D uma medida quantificadora da dependncia. c. Se dos 400 alunos da classe alta 160 escolhessem continuar e 240 no, voc mudaria sua concluso? Justifique. Respostas: (a) Tabela dos totais de colunas. Classe social Pretende continuar? Alta Mdia Baixa Total Sim 0,50 0,44 0,38 0,40 No 0,50 0,56 0,72 0,60 H evidncias de que a distribuio das respostas afirmativas e negativas no coincidem. (b) Tabela dos valores observados e esperados: Classe social Pretende continuar? Alta Mdia Sim 200 (160) 220 (200) No 200 (240) 280 (300)

Baixa 380 (440) 720 (660)

Total 800 1200

=
2

(oi ei )2
ei

= 10,00 + 2,00 + 8,18 + 6,67 + 1,33 + 5,45 = 33,63

Existe dependncia entre as variveis. (c) Se houvesse tal modificao, a dependncia entre as variveis seria apenas menor ( 2 = 7,01 ).

5. Lanam-se, simultaneamente, uma moeda de um real e uma de um quarto de dlar. Em cada tentativa anotou-se o resultado obtido, cujos dados esto resumidos na tabela. Nmero de caras e coroas em 100 lanamentos de uma moeda de 1 real e de 1/4 de dlar Cara (moeda de 1 real) 24
28 52

Cara (moeda 1/4 de dlar) Coroa (moeda 1/4 de dlar) Total

Coroa (moeda de 1 real) 22


26 48

Total
46 54 100

a. Estes dados sugerem que os resultados da moeda de um real e as de 1/4 de dlar esto associados? b. Atribua para ocorrncia de cara o valor 0, e para a ocorrncia de coroa o valor 1. Chamando de X 1 o resultado da moeda de um real e de X 2 o resultado do quarto de dlar, calcule a correlao entre X 1 e X 2 . Esta medida est de acordo com a resposta que voc deu anteriormente?

Respostas: (a)
Tabela dos valores observados e dos observados: Cara Coroa Cara 24 (23,92) 22 (22,08) Coroa 28 (28,08) 26 (25,92) Total 52 48 Total 46 54 100

2 =

(oi ei )2
ei

= 0,0002 + 0,0002 + 0,0002 + 0,0002 = 0,0008

Logo, no h associao entre os resultados das moedas de um real e de um quarto de dlar.


(b)

O coeficiente de correlao linear entre as variveis X1 e X2 0, pois X1 e X2 so independentes. Esse resultado est de acordo com o resultado do item anterior

6. Os dados referem-se ao ndice de inflao (y) de 1967 a 1979: Ano (x) Inflao (y) a. b. c. d. 1967 128 1969 192 1971 277 1973 373 1975 613 1977 1236 1979 2639

Faa o grfico de y em relao a t (onde t=0 corresponde a 1973). Encontre as estimativas para o modelo f (t ) = + t . De acordo com o modelo, qual seria a previso de inflao para 1981 ? Voc teria alguma restrio em adotar o modelo linear neste caso?

Respostas: (b) f (t ) = 779,7 + 355,6 t (onde t=0 corresponde a 1973) ; (c) 2202; (d) Sim, pois o grfico / sugere uma funo quadrtica.
7. A velocidade v de um corpo em queda livre foi determinada em funo do tempo t . Desprezando a resistncia do ar, a relao esperada entre v e t v = g t onde g a acelerao da gravidade local. Os resultados da experincia so mostrados na tabela: t (s) v (m/s) 0,00 0,00 0,05 0,71 0,10 0,96 0,15 1,69 0,20 2,10 0,25 2,54 0,30 2,81 0,35 3,57 0,40 3,90
a. Estabelea a equao de regresso linear v = g t . Construa o diagrama de disperso e trace a reta de regresso. b. A partir dos dados, qual a estimativa para a acelerao da gravidade local g ?
2 Respostas: (a) Equao de regresso: v = 9,99 t ; (b) g 9,99 m s

8. A tabela abaixo apresenta uma amostra com os pesos de 10 pais e de seus filhos mais velhos. Peso dos pais (x) Peso dos filhos (y)

60 63

65 64

70 71

68 69

63 63

69 68

71 73

64 63

66 64

64 62

Calcular o coeficiente de correlao linear entre os pesos dos pais e dos filhos.

Resposta: r = 0,9011

9. Os dados a seguir so a mdia das notas x e salrios mensais y de estudantes que obtiveram bacharelado em administrao. Mdia das notas Salrio Mensal (US$) 2,6 2800 3,4 3100 3,6 3500 3,2 3000 3,5 3400 2,9 3100 a. Obtenha a equao de regresso para estes dados. b. Calcule a Soma de Quadrados Total
SQT = ( yi y )
i =1 n 2

a Soma dos Quadrados devida Regresso


SQR = ( yi y )
i =1 n 2

e a Soma dos Quadrados devida ao Erro


SQE = ( yi yi ) = SQT SQR .
2 i =1 n

c. Calcule o coeficiente de determinao r 2 . Interprete este resultado. d. Qual o valor do coeficiente de correlao da amostra?

Respostas: (a) y = 1290, 5 + 581,1x ; (b) SQT = 335000 ; SQR = 249864,86 ; SQE = 85135,14 . (c) 2 r = 0, 746 . A reta de mnimos quadrados explica 74,6% da soma de quadrados total; (d) r = +0,8637 .

Você também pode gostar