Você está na página 1de 8

UNIVERSIDADE FEDERAL DA BAHIA

INSTITUTO DE MATEMÁTICA E ESTATÍSTICA - IME


DEPARTAMENTO DE ESTATÍSTICA
ESTATÍSTICA V - MATA44
Docente: Nívea Bispo

Lista de Exercícios 1

1. As Figuras 1 e 3, a seguir, estão publicadas no artigo “Hábito de fumar entre estudantes de


medicina da Universidade Federal de Pelotas, Brasil: Comparação entre as prevalências de 1986 e
1991. Menezes, AMB. et al., Cadernos de Saúde Pública, 10, no.2, p.164-170. 1994”. Quais os
principais problemas identificados nestas figuras?

2. Num estudo sobre a associação entre tromboembolismo e tipo sangüíneo, participaram 200
usuárias de contraceptivo oral. Dessas mulheres, 55 tinham tromboembolismo. Quanto ao grupo
sanguíneo, o tipo A foi o mais numeroso, com 83 mulheres, seguido dos grupos O e B, com 79 e 27
mulheres, respectivamente. Das pacientes sadias, 70 eram do grupo O, 51 do grupo A e 19 do
grupo B.
a) A partir dessas informações, construa uma tabela de contingência (múltipla entrada).
b) Utilizando a tabela no item a), compare os dois grupos de mulheres (sadias e doentes) de forma
gráfica e/ou numérica, não esquecendo de escrever uma breve descrição.

3. Para facilitar um projeto de ampliação da rede de esgoto de certa região de uma cidade, as
autoridades tomaram uma amostra de tamanho 25 dos 270 quarteirões que compõem a região, e
foram encontrados os seguintes números de casas por quarteirão:

2 3 10 13 14
18 20 21 22 22
26 29 29 30 32
45 48 52 58 59
66 68 75 78 80
Referência: Bussab, W. O. e Morettin, P. A. Estatística Básica. Pág 40.
Calcule:
a) A amplitude do número de casas por quarteirão.
b) Os números médio e mediano de casas por quarteirão. O que podemos falar sobre a
simetria?
c) Qual o número de casas em 25% dos quarteirões amostrados? E o percentil 90 aponta
quantas casas por quarteirão?
d) Quais representações gráficas seriam mais adequadas para apresentar os resultados?
e) Se optasse por uma tabela, qual seria o melhor tipo de representação?

4. Um hospital maternidade está planejando a ampliação dos leitos para recém nascidos. Para tal,
fez um levantamento dos últimos 50 nascimentos obtendo a informação sobre o número de dias
que os bebês permanecem no hospital, antes de terem alta. Os dados, já ordenados, são
apresentados a seguir:
1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5,
5, 5, 5, 5, 6, 7, 7, 8, 15.

a) Calcule a média, moda e mediana.


b) Utilize alguma medida de variabilidade para avaliar a dispersão destes dados. Justifique sua
escolha.
c) 25% dos bebês considerados no levantamento permaneceram quanto tempo internados? A
remoção do último bebê (que passou mais tempo internado) muda o valor calculado
anteriormente?
d) Você identifica algum valor excepcional dentre os que foram observados? Se sim, remova-o e
recalcule os itens (a) e (b). Comente as diferenças encontradas.
e) Dentre as medidas de posição calculadas em (a), discuta quais delas seriam mais adequadas
para resumir esse conjunto de dados.
5. Complete a seguinte tabela de distribuição de freqüências e responda os itens a seguir:
Quociente de inteligência de alunos de determinada escola. Bahia. 1999.
QI ni fi (%) Fi
68 – 80 25 5.00 25
80 - A 137 27.40 D
92 - 104 238 47.60 400
104 - 116 B 16.40 482
116 – 128 18 3.60 500
TOTAL 500 C ..
Fonte: Secretaria da Escola

a) Complete o seguinte parágrafo: “A análise do QI dos alunos da escola estudada mostrou que
_________ escolares apresentaram um QI entre 92 e 104; ______ % apresentaram um
QI inferior a 104; e ________% apresentaram um QI entre 116 e 128.
b) Que gráfico você sugeriria para apresentação dos dados acima? Por quê? Faça um esboço do
gráfico sugerido.

6. Os dados a seguir são relativos ao peso ao nascer (g) de recém nascidos com síndrome de
desconforto idiopático grave. Algumas crianças vieram a óbito(*) e outras sobreviveram.
Responda:

a) Os recém nascidos são descritos segundo quais características?


b) Como você classificaria, segundo sua natureza de mensuração, cada variável?
c) Calcule a média e mediana do peso entre os 2 grupos de recém-nascidos (os que sobreviveram e
os que vieram a óbito). Interprete os resultados obtidos.
c) Classifique a variável peso ao nascer em duas categorias: baixo peso (< 2500g) e não baixo peso
(2500g ou +). Faça uma tabela bidimensional, cruzando as variáveis: condição do recém-nascido
(sobrevivente ou não sobrevivente) e peso ao nascer (baixo peso e não baixo peso). Você diria que
há relação entre o peso e a condição desses recém-nascidos?
7. Os resultados abaixo foram usados para descrever a eficácia e a tolerabilidade de 2 drogas ao
longo de 5 meses de tratamento.
Tabela 1. Efeitos colaterais ao longo do
estudo.

Efeito Droga 1 Droga 2

Colateral n % n %

não 131 61,22 144 65,45

sim 83 38,79 76 34,54

Tabela 2. Variação da pressão arterial entre


o fim e o início do estudo.

Variação Droga 1 Droga 2

Pressão n % n %

0 |-- 5 9 4.20 5 2.27

5 |-- 10 35 16.36 29 13.18

10 |-- 20 115 53.74 125 56.82

20 |-- 30 54 25.23 56 25.46

30 |-- 40 1 0.47 5 2.27

Figura 1. Histogramas da variação da pressão arterial entre o fim e o início do estudo


para cada uma das drogas empregadas.

a) Com a finalidade de melhorar a apresentação dos resultados, descreva em palavras, que


possíveis alterações você julgaria necessárias em cada uma das tabelas e na Figura.
b) Com base nos resultados da Tabela 3, você diria que a distribuição da pressão arterial para os
pacientes que tomaram a droga B é simétrica?
c) Qual dos grupos apresentou uma dispersão maior na variação da pressão?

Tabela 3. Medidas descritivas da variação da


pressão arterial entre o fim e o início do
estudo.
Droga Média DP Mediana
1 15,58 6,09 15,49
2 16,82 6,37 17,43

8. O tempo (em meses) entre a remissão de uma doença (cura) e a recidiva (recaída) de 48
pacientes de uma determinada clínica médica foi registrado. Um sumário dos dados é
apresentado a seguir, para homens e mulheres, juntamente com o boxplot.

summary(mulheres)
Min. Q1 Q2 Média Q3 Max.
2.00 7.00 11.50 11.17 15.00 19.00

summary(homens)
Min. Q1 Q2 Média Q3 Max.
3.00 12.00 15.50 15.38 20.25 25.00

a) É correto afirmar que o tempo entre a


remissão e a recidiva para ambos os grupos é simétrica? Justifique sua resposta.
b) Qual dos grupos apresenta uma maior variabilidade, segundo o gráfico?
c) É possível calcular alguma medida de dispersão a partir do sumário dado e da análise gráfica?
Se sim, comente qual seria e a calcule. Interprete os resultados.
d) Com base no gráfico, estabeleça uma breve comparação entre os sexos, quanto ao tempo
compreendido entre a remissão e a recidiva.

9. Os resultados abaixo referem-se a uma análise descritiva obtida no programa estatístico


Minitab e contém informações sobre as medidas de Diâmetro (em polegadas), Altura (em pés) e
Volume (em pés³) de 31 árvores.
Variável n Média Mediana desvio-padrão
Diâmetro 31 13.248 12.90 3.138
Altura 31 76.00 76.00 6.37
Volume 31 30.17 24.20 16.44
Variável Mínimo Máximo Q1 Q3
Diâmetro 8.300 20.60 11.00 16.00
Altura 63.00 87.00 72.00 80.00
Volume 10.20 77.00 19.10 38.30

a) Classifique as variáveis sob estudo;


b) 50% das árvores apresentam medidas de diâmetro, altura e volume inferior a qual valor,
respectivamente? E se considerarmos 75% das árvores?
c) Considerando os valores obtidos da média e mediana, comente a distribuição das medidas de
altura destas árvores. Faça o mesmo para as medidas de volume e de diâmetro;
d) Calcule os coeficientes de variação. As árvores sob estudo são mais parecidas se levarmos em
conta seus diâmetros, alturas ou volumes? Justifique.

10. Com o objetivo de estudar a influência de uma dieta no ganho de peso de crianças prematuras
(com pesos entre 1500g e 2000g), foram investigados dois grupos de crianças, compostos de 50
crianças cada grupo, e submetidas a diferentes dietas (dietas 1 e 2) durante 10 dias. Foram
investigadas também as seguintes características: peso ao nascer, peso após 10 dias e classe
social. As informações foram coletadas a partir de mães que fizeram o pré-natal no Hospital
WWW, de Salvador, em 1998.

Utilizando o Box-plot, verifique se há alguma indicação de que uma dieta foi mais eficiente do que
a outra, utilizando as variáveis peso ao nascer e diferença no peso após dez dias, segundo a dieta
utilizada nas crianças prematuras.
11. Agrônomos desenvolveram uma variedade de milho, com quantidades maiores do aminoácido
essencial lysine. Num teste da qualidade da proteína deste milho, um grupo experimental de 20
pintos, com um dia de vida, foram alimentados com uma ração milho-soja, que continha alto teor
de lysine, e um grupo controle de 20 pintos recebeu a mesma dieta, porém com milho comum. Os
ganhos de peso (em gramas) após 21 dias foram analisados.

a) Cite e classifique as duas variáveis deste estudo.


b) Com base na média e mediana, de ambos os grupos, você diria que a distribuição dos pesos é
simétrica ou assimétrica?
c) Qual dos dois grupos apresentou maior dispersão no ganho de peso? Qual a medida de
dispersão utilizada para responder tal pergunta? Apresente os valores utilizados para esta análise.
d) Calcule o coeficiente de variação para ambos os grupos e interprete o resultado.
e) É correto afirmar que 25% dos pintos tiveram um ganho de peso superior a 401,24 gramas no
grupo controle e 429,25 no grupo experimental, após os 21 dias?
f) Que análise gráfica representaria melhor esta comparação entre os grupos, no que se refere ao
ganho de peso?

Std Deviation = desvio-padrão

12. A tabela a seguir contém informações sobre a população de recém-nascidos, segundo o sexo e
a condição de vivo ou natimorto (feto que morreu dentro do útero ou durante o parto). Utilizando
uma medida apropriada, avalie se existe associação entre sexo e condição de vivo ou natimorto.
Interprete o resultado obtido.
13. Deseja-se investigar se há relação entre o nível da função pulmonar (medido pela FEV) e a
idade em um grupo de pacientes. O que você pode concluir utilizando os resultados abaixo?

Você também pode gostar