Você está na página 1de 6

Bioestatística CBNC-11: Segunda Prova Parcial

por Dr. Patricio Hernáez (pahernaez@gmail.com)

Data: 30 de julho de 2021


Nome: Letícia Carvalho e Maria Luiza Lima
Pontuação total: 66 pontos
Nota:

I.- Perguntas de resposta curta (2 pontos cada, 36 pontos total)

1.- Qual desses números não pode ser uma probabilidade?


(x) a) -0.00001 Resposta: Não existe probabilidade negativa.
b) 0.5
(x) c) 1.001 Resposta: Valores de probabilidade só variam entre 0 e 1.
d) 0
e) 1
f) 20%

2.- Um dado é lançado 4 vezes. Encontrar a probabilidade de que um número par seja
lançado.

Resposta: Dos números presentes em um dado, 3 são pares, em 6 números, logo a


resposta é,
3/6 + 3/6 + 3/6 + 3/6 = 12/24 = ½.

3.- Considere o espaço amostral S = {1,2,3,4,5,6} e os seguintes eventos: E1 = {4,5,6},


E2 = {1,2,3} e E3 = {1,2,5,6}. Encontrar:

a) P(E1)= 3/6 = 1/2

b) P(E1∪ E3)= P(E1) + P(E3) - P (E1 ∩ E3)


P(E1) = 0,5
P(E3) = 4/6 = 0,6666666666666667
P (E1 ∩ E3) = 2/6 = 0,3333333333333333

P(E1) + P(E3) - P (E1 ∩ E3)


= 0,5 + 0,6666666666666667 + 0,3333333333333333
= 1,5

4.- O jogador de futebol Neymar tem um 87% de sucesso de acertar lançamentos


penaltis. Se ele efetua 5 lançamentos seguidos durante a final da copa do mundo; qual é
a probabilidade de acertar 3 dos 5 lançamentos?

Resposta: A probabilidade é de 52,2% pois;


0,87 x 3/5 = 0,522.
5.- Uma jarra contém 3 bolas vermelhas, 17 verdes e 8 brancas. Se uma bola for retirada
do recipiente ao acaso, qual é a probabilidade de que essa bola seja branca?

Resposta: O número total de bolas na jarra é, para achar a probabilidade de retirar uma
bola da cor branca pegamos o número de bolas brancas e dividimos pelo total, assim a
probabilidade é de 28,57% pois;
8/28 = 0,2857= 28,57%.

6.- Queremos saber o valor de P quando x é maior a 8, quando a probabilidade de


sucesso é de 0.57 para um total de 40 experimentos aleatórios e independentes.
Dica: Distribuição Binomial

Resposta: Utilizando os cálculos no RStudio chegamos a probabilidade usando a função


pbinom, e o valor de P é;
> pbinom(8,40,0.57)
[1] 1.943808e-06

7.- Suponha que o número de camarões superviventes de predadores numa determinada


área de cultivo por dia tenha uma média de 5 camarões vivos. Qual é a probabilidade de
que em um mês (30 dias) o número de camarões superviventes seja 150?

Resposta: Em dia 5 camarões sobrevivem, logo em 30 dias espera-se que o índice de


sobrevivência seja de 30x5=150 camarões em média, não é certeza de que essa valor irá
se concretizar, logo a probabilidade é de aproximadamente 97,5%.

8.- Suponha que, em média, 5 falhas ocorram diariamente em uma linha de montagem e
que o número de falhas diárias é uma variável aleatória X que segue uma distribuição de
Poisson. Encontrar:
a.- Qual é a probabilidade de obter exatamente três falhas em um dia?
Resposta: A probabilidade é de 14%
P (X=3)
=e^-5 x 5^3 / 3!
= 125 / 6 x e^5
= 0,14.

b.- Qual é a probabilidade de obter exatamente cinco falhas em três dias?


Resposta: A probabilidade é de 26%

9.- Qual é a diferença entre métodos estatísticos paramétricos e não paramétricos?

Resposta: Os métodos paramétricos buscam amostras com distribuição normal, com


ênfase em dimensões maiores a 30 pois a distribuição se aproxima da normal. Enquanto
métodos não paramétricos são menos exigentes em seus requisitos, sendo ideias para
pequenas amostras, porém, possuem a desvantagem de serem menos eficazes que os
métodos paramétricos, que apresentam maior número de dados.
10.- Nomeie um teste para comparação de mais de duas amostras com distribuição não
normal.
Resposta: O teste de Friedman é ideal para essa comparação entre amostras com
distribuição não normal.

11.- Numa distribuição normal padrão os parámetros são mu e sigma, cujos valores são,
respectivamente:
Resposta: O valor de mu é equivalente à média e o de sigma equivalente ao desvio
padrão.

12.- Num teste de bondade de ajuste você compara o que?


Resposta: A comparação é feita a partir da discrepância entre os valores obtidos e os
valores que foram previstos com base em cálculos anteriores de probabilidade.

13.- Nomeie um teste paramétrico para comparar duas amostras pareadas


Resposta: Teste t, também conhecido como paired t test.

14.- O gerente de produção de uma empresa está interessado em saber se o tempo médio
que um produto leva na linha de montagem é de 15 minutos. Formular a hipótese nula e
hipótese alternativa para um teste de duas caudas:
Resposta: Hipótese 0: mu=15
Hipótese 1:mu>15

15.- Uma fundação de saúde que estuda as causas do câncer de pulmão está interessada
em testar se a proporção de fumantes é de 50%. Defina sua hipótese nula.
Resposta: H0: p=50%.

16.- Estamos interessados em saber se o nível de colesterol de homens (h) e mulheres


(m) é o mesmo. O nível médio de colesterol para homens é 177 mg/dL e 173 mg/dL
para mulheres. O desvio padrão para homens é de 32 mg/dL e para mulheres é de 28
mg/dL. O número de homens e mulheres no estudo é 70 e 65, respectivamente.
Responda:
[OBS: não é necessário desenvolver exercícios]
a) Formular a hipótese nula e a hipótese alternativa.
Resposta: H0: mu = 177
H1: mu < 177

b) Assumindo alfa = 0.05, com quais valores da estatística correspondente ao teste


escolhido, você rejeitaria a hipótese nula?

Resposta: Caso o valor P for maior que 0.05, podemos afirmar que a diferença entre as
duas médias não será significativa, resumindo, existe uma grande probabilidade de que
foi causado pelo acaso. Porém, caso o valor P seja menor que 0,01, iremos afirmar que a
diferença entre a média de 2 é altamente significativa, ou seja, existe uma pequena
probabilidade de que a diferença encontrada nas médias das amostra 1 e 2 seja causada
por erro de amostragem. Um valor de P que seja entre 0.01 e 0.05, é chamado de
região de fronteira, a distinção é considerada significativa, porém não muito. Diante
disso, seria mais apropriado coletar mais dados antes de chegar a uma conclusão de
fato.

17.- O valor de F na análise paramétrica de variância representa:

Resposta: Nas análises paramétricas de variância, o F tem um valor próximo de 1.

18.- Numa análise de variância de uma via para 6 tratamentos e 10 dados por cada
tratamento os graus de liberdade estarão definidos por: k-1 e n-6, que será igual a:
Resposta: trt<-read_excel(“anova.xlsx”)
aov.trt<-aov(variedad2~variedad1, data=trt
aov:trt
summary(aov.trt)

Df Sum Sq Mean sq F value Pr(>F)


variedad1 1 389330 389330 347 1.14e-09***
Residuals 11 12343 1122
---
signif. codes: 0´***’ 0.001 ´**’ 0.001 ´*’ 0.05 ´.’ 0.1 ´ ’ 1

II.- Exercícios (30 pontos)


1.- Fumar .... Principal causa de câncer de pulmão?.... Considere o seguinte: 85% dos
pacientes com câncer de pulmão são fumantes. Se chamamos F=fumante e C=câncer de
pulmão, então a probabilidade de que um paciente seja fumante dado que tenha câncer
no pulmão se define pela seguinte expressão: P(F/C)= 0.85. Considerando isso, qual
seria a probabilidade de uma pessoa escolhida pelo acaso que seja fumante tenha câncer,
é dizer P(C/F). Para calcular isso, usar a seguinte fórmula:
P(C/F)= P(F/C) P(C)/ P(F), onde P(F)=0.193 e P(C)=0.001225 (4 pontos)

Resposta: Utilizando a fórmula obtemos que


P(C/F) = 0.85(0.001225/0.193)
P(C/F) = 0.0054%

2.- Suponha que a probabilidade de uma larva de camarão corrupto (Callichirus


corruptus) recrutar numa praia de areia litoral de São Paulo seja de 0.34. Se coletamos
uma amostra composta de 10 armadilhas de luz instaladas de forma aleatória na Baía de
Santos (2 pontos cada):
Dica: Distribuição Binomial

a.- Encontrar a distribuição de probabilidade da variável aleatória (X) que representa o


número de larvas de camarão corrupto que vai cair nas armadilhas da amostra total
(graficar a distribuição de densidade da variável).
Resposta:
b.- Encontrar o número esperado de larvas que cairia nas armadilhas da amostra.
Resposta:
E=P*n
E=10*0.34= E=3,4
Logo, o número esperado de larvas que cairiam nas armadilhas é 3.

c.- Encontrar a variância de X.


Resposta: V=pqn
V=0.34*0.66*10
V=2.244

d.- Qual é a probabilidade de haver pelo menos 4 armadilhas com larvas de camarão?
Resposta: [1] 0.4589388

e.- Qual é a probabilidade de que haja no máximo 3 armadilhas com larvas de camarão?
Resposta: [1] 0.5410612

3.- Em um estudo da diversidade de peixes na região de Ubatuba, foram quantificadas


as espécies encontradas em 10 pontos da Baía de Ubatuba. Os pesquisadores obtiveram
que no total (nos 10 pontos) havia 222 peixes da espécie A, 279 da espécie B, 251 da
espécie C, 232 da espécie D e 266 da espécie E. Os pesquisadores se preocupam, pois
que a espécie A é o principal objeto de pesquisa do grupo. Sugere-se também que as
espécies de peixes não estão uniformemente distribuídas no setor estudado. Escolha e
realize um teste apropriado em R para determinar se a hipótese acima é verdadeira ou
não. Interprete seus resultados (6 pontos).

Resposta: Bartlett's K-squared = 4.0539, df = 4, p-value = 0.3988


Nesse caso, o valor de p-value obtido é maior que 0.05, ou seja, a hipótese nula é aceita.
O que torna a hipótese verdadeira é que a variância entre os pontos ocorre de maneira
independente.
4.- Queremos avaliar a eficácia de diferentes doses de um fertilizante nitrogenado
adicionado em diferentes tipos de substrato. Para fazer isso, 25 plantas são selecionadas
aleatoriamente e distribuídas aleatoriamente em 5 tipos de terreno. O primeiro é um solo
normal sem nenhum tratamento, o segundo é um solo com baixo teor de N, o terceiro é
um solo sem N, o quarto é um solo normal com uma certa dose de fertilizante e o quinto
é o mesmo fertilizante em outra dose. O teor de peso seco das plantas ao final dos
tratamentos é (10 pontos):
Procedimento de ajuda:
ps <-c (180, 173, 175, 182, 181, 172, 158, 167, 160, 175, 163, 170, 158, 162, 170, 158, 146, 160, 171,
155, 147, 152, 143, 155, 160)
tratamento <- c(rep("T1",5), rep("T2",5), rep("T3",5), rep("T4",5), rep("T5",5))
pesos<-data.frame(ps, tratamento);pesos
boxplot(ps~factor(tratamento),pesos) ## Graficando

Dica: se você for copiar e colar, tome cuidado porque pode haver conflito entre as
aspas.

Os tratamentos têm o mesmo efeito? Explique e justifique seus resultados.

Resposta: Não, os tratamentos não apresentam o mesmo efeito pois nas análises do solo
sem tratamento o peso seco das plantas foi maior quando comparado aos valores de T2
que tinha pouco nitrogênio. Os valores de T3 apresentaram dados semelhantes aos de
T2 e em T4 e T5 também houveram efeitos diferentes, pois os pesos secos foram
distintos.

Você também pode gostar