Você está na página 1de 13

VERIFICAÇÃO DE APRENDIZAGEM

Disciplina BIOESTATÍSTICA
Aluno: ANA NERY Data: 17/12/2021

Questão 1 (valor 5,0). Cada ítem vale 1,0.


a) Uma amostra aleatória de 3 variedades produziu os dados abaixo. Construir uma
tabela que sumariza as frequências da distribuição da variável BIOMASSA SECA
ALTURA para as 3 variedades. Apresentar graficamente (pode usar o Excel ou Bioestat).

Resposta: Aqui o aluno deve seguir as regras para resumir os dados em tabela, estabelecendo a
quantidade de classes utilizando a regra de Sturges, estabelecendo a amplitude de intervalo de
classes e computando a frequência.
Roteiro para arrumação de dados para análise:
1. Listagem dos dados brutos
2. Arrumação dos dados em ordem de grandeza (rol)
3. Determinação das observações mínima e máxima
4. Cálculo da amplitude total das observações (valor máximo – valor mínimo)
5. Escolha de uma escala apropriada para incluir todas as observações
6. Dividir a escala em um número conveniente de intervalos iguais para abranger todas as
observações. Geralmente um número de classes/categorias entre 5 e 10 é suficiente.
7. Construir uma distribuição de frequência em tabela, para tanto deve-se computar cada
observação na classe apropriada, observando que as classes/categorias devem ter limites bem
definidos (quando tratar-se de variáveis quantitativas), serem mutuamente exclusivas e de
mesma amplitude.
8. Representar graficamente. O gráfico recomendado depende da variável, neste caso
poderia usar um histograma (variáveis contínuas). Neste estágio pode começar pensando sobre a
forma da distribuição observada e a análise dos dados.
9. Examinar a forma da distribuição para escolher as medidas apropriadas – Estatística
Descritiva. Ver APOSTILA SOBRE MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) E
DE DISPERSÃO (VARIAÇÃO)
10. Conhecendo a forma da distribuição observada, pode escolher a(s) prova(s)
estatísticas(s) para fazer comparações entre amostras ou populações.

Tabela 1: Rol da altura das 3 variedades.


Ro Var1² Var2² Var3²
l Var1 Var2 Var3
1 14,2 201,64 17,9 320,41 8,7 75,69
2 14,2 201,64 18,5 342,25 8,9 79,21
3 14,3 204,49 19,0 361 9,2 84,64
4 14,5 210,25 19,0 361 9,3 86,49
5 15,3 234,09 19,5 380,25 9,5 90,25
6 15,3 234,09 20,0 400 9,6 92,16
7 15,5 240,25 20,0 400 9,7 94,09
8 15,9 252,81 20,5 420,25 9,8 96,04
9 16,1 259,21 21,5 462,25 9,8 96,04
10 16,5 272,25 21,5 462,25 9,8 96,04
11 16,5 272,25 21,6 466,56 10,1 102,01
12 16,7 278,89 ∑x= ∑x²= 10,5 110,25
13 17,9 320,41 ∑x= ∑x²=
14 17,9 320,41
15 18,1 327,61
∑x= ∑x²=
Fonte: Autoria própria, 2021.

Tabela 2: Dados da altura das 3 variedades.


Var1 Var2 Var3
Valor mínimo 14,2 17,9 8,7
Valor máximo 18,1 21,6 10,5
Amplitude total 3,9 (Bioestat= 4) 3,7 (Bioestat= 4) 1,8 (Bioestat= 2)
Fonte: Autoria própria, 2021.

Var1: Nº de classes= 1+3,3.1,17=4,8 Amp. do interv. de classes= 0,78


Var2: Nº de classes= 1+3,3.1,04=4,4 Amp. do interv. de classes= 0,74
Var3: Nº de classes= 1+3,3.1,07=4,5 Amp. do interv. de classes= 0,36

Tabela 3: Frequência da Altura da Variedade 1.

Limites das Centro da Frequência Frequência Frequência Frequência


classes classe absoluta relativa (%) acumulada acumulada
(abaixo de) (acima de)
13,8—|14,7 14,2 4 26,5 4 15
14,7—|15,6 14,9 3 20 7 11
15,6—|16,5 15,7 2 13,5 9 8
16,5—|17,4 16,5 3 20 12 6
17,4—|18,4 17,3 3 20 15 3
Total - 15 100 - -
Fonte: Autoria própria, 2021.

Figura 1: Frequência da Altura da Variedade 1. Fonte: Autoria própria, 2021.

Tabela 4: Frequência da Altura da Variedade 2.

Limites das Centro da Frequência Frequência Frequência Frequência


classes classe absoluta relativa (%) acumulada acumulada
(abaixo de) (acima de)
17,5—|18,2 17,9 1 9,1 1 11
18,2—|19 18,6 1 9,1 2 10
19—|19,7 19,3 3 27,2 5 9
19,7—|20,4 20 2 18,3 7 6
20,4—|21,2 20,8 1 9,1 8 4
21,2—|21,9 21,5 3 27,2 11 3
Total - 11 100 - -
Fonte: Autoria própria, 2021.

Figura 2: Frequência da Altura da Variedade 2. Fonte: Autoria própria, 2021.

Tabela 5: Frequência da Altura da Variedade 3.

Limites das Centro da Frequência Frequência Frequência Frequência


classes classe absoluta relativa (%) acumulada acumulada
(abaixo de) (acima de)
8,5—|8,8 8,7 1 8,3 1 12
8,8—|9,2 9 1 8,3 2 11
9,2—|9,6 9,4 3 25 5 10
9,6—|9,9 9,7 5 41,8 10 7
9,9—|10,3 10,1 1 8,3 11 2
10,3—|10,6 10,4 1 8,3 12 1
Total - 12 100 - -
Fonte: Autoria própria, 2021.
Figura 3: Frequência da Altura da Variedade 3. Fonte: Autoria própria, 2021.

b) Com base na distribuição apresentada acima determinar MODA e o valor que


divide a distribuição de frequência ao meio (usar fórmula para dados agrupados).
Localizar no gráfico.
Resposta: Ver Apostila SOBRE MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) E
DE DISPERSÃO (VARIAÇÃO).

Tabela 6: Moda e Mediana da altura para as Variedades 1, 2 e 3.

Variedades Moda Mediana


1 14,2 15
Fonte: Autoria própria, 2021.
2 19 20
3 9,8 9

Figura 4: Moda e Mediana das Variedades 1, 2 e 3. Fonte: Autoria própria, 2021

c) Calcular MÉDIA ARITMÉTICA, DESVIO PADRÃO, VARIÂNCIA, ERRO


PADRÃO e COEFICIENTE DE VARIAÇÃO (usando os dados brutos) para as 3
variedades.
Resposta: Ver Apostila sobre MEDIDAS DE TENDÊNCIA CENTRAL (POSIÇÃO) E DE
DISPERSÃO (VARIAÇÃO).
Tabela 7: Medidas de tendência central e de dispersão da altura, número de folhas e biomassa seca
para as Variedades 1, 2 e 3.

Var1 Var2 Var3


Alt NºFol Biom Alt NºFol Biom Alt NºFol Biom
Média
15,46 5,13 7,46 19,54 7,18 10,63 9,00 3,83 6,66
Aritmética
Variância 1,55 1,98 0,40 1,67 0,96 0,87 3,65
0,42 0,36
Desvio Padrão 1,24 1,40 0,63 1,29 0,98 0,93 1,91
0,65 0,60
Erro Padrão 0,32 0,36 0,16 0,39 0,29 0,27 0,57
0,18 0,17
Coeficiente de 24,45
8,06% 27,42% 8,57% 6,62% 13,67% 17,97% 6,70% 9,77%
Variação %
Fonte: Autoria própria, 2021.

d) Determinar se a altura BIOMASSA SECA varia significativamente entre as 3


variedades. Se uma diferença existe, determinar quais variedades diferem
significativamente entre si. Observação: Você deve mostrar suas hipóteses e o
procedimento formal segundo seu roteiro sobre Aplicação de Provas Estatísticas nas
Ciências Biológicas. Explicar suas conclusões.

Resposta: Aqui vc deve indicar qual prova estatística é mais apropriada para comparação de 3
médias. Neste caso, seria uma ANOVA, uma extensão do teste “T” para comparação de mais de
2 médias.
Vc deve seguir o Roteiro “O EMPREGO DE PROVAS ESTATÍSTICAS NA PESQUISA”. O
procedimento usualmente seguido envolve vários passos, ou estágios relacionamos a seguir, na
ordem de execução listados abaixo:
1 - Definir a hipótese de nulidade (H ) e a hipótese alternativa (H ).
0 A

2 - Escolher uma prova estatística (com seu modelo estatístico associado) para provar H Dentre0.

as várias provas que poderiam ser aplicadas a determinado projeto de pesquisa, escolher aquela
cujo modelo mais se aproxime das condições da pesquisa (em termos de suposições que
qualificam o emprego da prova) e cujas exigências quanto as mensurações sejam satisfeitas
pelas medidas utilizadas na pesquisa.
3 - Especificar um nível de significância (alfa/ a) e um tamanho de amostra (N).
4 - Determinar (ou supor determinada) a distribuição amostral da prova estatística sob H . 0

5 - Com base em (2), (3) e (4) definir área de rejeição.


6 - Calcular o valor da prova estatística, utilizando os dados obtidos da(s) amostra(s). Se tal
valor estiver fora na região de rejeição, a decisão será que H não pode ser rejeitada ao nível de
0

significância escolhido. 
7 – Tomar a Decisão de aceitar ou rejeitar a Hipótese de Nulidade.
8 - Conclusão

H0: x 1=x 2= x 3
HA: não ( x 1 ≠ x 2 ≠ x 3)
ou
HA: pelo menos uma média é diferente

Tabela 8: Valores de x e x² para a biomassa seca das 3 variedades.

Var1 Var2 Var3


x x² x x² x x²
6,9 47,61 10,9 118,81 7,6 57,76
7,8 60,84 13 169 6,9 47,61
8 64 8,3 68,89 7,4 54,76
8,6 73,96 8,2 67,24 7,3 53,29
8,8 77,44 9,1 82,81 7,2 51,84
7,4 54,76 11,6 134,56 6,9 47,61
8,3 68,89 12,1 146,41 6,7 44,89
7,7 59,29 9,6 92,16 7,1 50,41
7,6 57,76 13,2 174,24 6,3 39,69
7,4 54,76 12,5 156,25 8,1 65,61
8,7 75,69 12,8 163,84 7,4 54,76
8,2 67,24 6,7 44,89
8 64
7,3 53,29
8,2 67,24
Fonte: Autoria própria, 2021.

Tabela 9: Computações preliminares da biomassa seca das 3 variedades.

Variedades 1 2 3
∑x 118,9 121,3 85,6
∑x² 946,77 1.374,21 613,12
(∑x)² 14.137,21 14.713,69 7.327,36
(∑ x )²
942,48 1.337,60 610
n
n 15 11 12
Média 7,46 10,63 6,66
Variância 0,40 3,65 0,42
Desvio Padrão 0,63 1,91 0,65
Fonte: Autoria própria, 2021.

COMPUTAÇÕES PRELIMINARES
1. Grande total=somatório das observações
∑∑x= 325,8
2. Somatório de cada observação ao quadrado
∑∑x²= 2.952,1
3. Somatório do total de cada grupo ao quadrado, cada um dividido pelo tamanho
da amostra

∑ [
(∑ x)²
n ]
= 2.890,08
4. Grande total ao quadrado, dividido pelo tamanho da amostra
(∑ ∑ x )² 106.145,64
TC= = =2.793,30
∑n 38
5. Somatório total dos quadrados = Quantidade (2) – Quantidade (4)
SQtotal= 2.952,1 – 2.793,30 = 158,8
6. Somatório dos quadrados entre grupos = Quantidade (3) – Quantidade (4)
SQentre= 96,78
7. Somatório dos quadrados dentro dos grupos = SQ total - SQentre = Quantidade (5) –
Quantidade (6)
SQdentro= 62,02

Tabela 10: ANOVA. ns= não significativo.


QM F
FONTES DE VARIAÇÃO gL SQ
(variância)
Entre grupos 2 656.61 328,30
Dentro dos grupos 35 42.46 1.21 271,32
Total 37 699,07

Teste t: Diferença t (p)


Médias ( 1 e 2) = 3.1697 6.8946 < 0.001
Médias ( 1 e 3) = 0.8 1.7835 ns
Médias ( 2 e 3) = 3.9697 8.2114 < 0.001
Fonte: Autoria própria, 2021.

Decisão: Rejeitar H0, pelo menos 1 média é diferente.

Resposta: Existe pelo menos uma média que difere significativamente dos demais (p
<0,01), a nível de alfa 0,05.

e) Calcular o GRAU DE ASSOCIAÇÃO entre ALTURA e BIOMASSA SECA para a


variedade 2 3 e estabelecer a EQUAÇÃO DE REGRESSÃO entre essas variáveis (pode
usar o Bioestat). Você deve mostrar suas hipóteses e o procedimento formal segundo seu
roteiro sobre Aplicação de Provas Estatísticas nas Ciências Biológicas. Explicar suas
conclusões.
Resposta: Neste caso, vc estará verificando a magnitude e o sentido da associação entre as 2
variáveis. A escolha do teste estatístico depende do tipo de variável. Como trata-se de uma
variável contínua, na escala de Razão, pode-se aplicar uma prova paramétrica.Veja Apostila
COEFICIENTE DE CORRELAÇÃO DE PEARSON r.

Se for usar o BioEstat, para análise da correlação veja o que recomenda o manual na página 85 e
86. 
No caso da equação de regressão, pode também usar o BioEstat ou seguir nossa apostila
ANÁLISE DE REGRESSÃO LINEAR SIMPLES. No teste de Regressão a finalidade é
determinar a dependência de uma variável em relação à chamada variável independente ou
preditora, pressupondo que elas assumam um modelo linear. No manual BioEstat, páginas 215 e
216, recomenda-se entrar com os valores da variável Y (dependente) na 1ª coluna, e na 2ª
coluna, os escores da variável X (independente).
Vc deve seguir o Roteiro “O EMPREGO DE PROVAS ESTATÍSTICAS NA PESQUISA”, já
mencionado no ítem anterior, seguindo os estágios na ordem de execução recomendada.
Figura 2: Escolha do teste e equação para a resolução da letra e na questão 2.

H0: r=0
HA: r≠0

Tabela 11: Dados do Bioestat


para Correlação de Pearson r
para a altura x biomassa seca da Decisão: Rejeitar H0, pois r<0, e dado o p-valor 0,4692,
variedade 3.
existe uma relação significativa entre as variáveis
N (pares) 12 testadas.
r (Pearson) -0.231
IC 95% -0.71 a 0.39
Resposta: Com base no valor obtido de r=-0,23, a nível
R² 0.0536
de α 0,05, podemos considerar que entre a altura e a
t -0.7524
biomassa seca há uma relação moderada negativa.
GL 10
(p) 0.4692
Poder 0.05 0.1735
Fonte: Autoria própria, 2021.

f) Determinar a porcentagem da variância na biomassa que é explicada pela variação na


altura para esta variedade.
Resposta: trata-se do Coeficiente de Determinação

Nessa relação, 5% (r²=0,05) da variação da biomassa pode ser explicada pela variação
da altura, na variedade 3. E 95% da variância na biomassa não pode ser explicada pela
variação na altura para a variedade 3.
Unidade Variedade 1 Variedade 2 Variedade 3
amostral
Altura Número Biomassa Altura Número Biomassa Altura Número Biomassa
(cm) de folhas seca (g) (cm) de folhas seca (g) (cm) de folhas seca (g)

1 14,2 3 6,9 20,0 7 10,9 9,8 4 7,6

2 15,5 4 7,8 21,5 8 13,0 9,3 5 6,9

3 15,9 3 8 18,5 8 8,3 8,9 4 7,4

4 17,9 5 8,6 17,9 7 8,2 9,2 6 7,3

5 18,1 6 8,8 19,0 6 9,1 8,7 4 7,2

6 14,3 4 7,4 20,5 7 11,6 9,8 3 6,9

7 16,7 6 8,3 19,5 5 12,1 10,1 4 6,7

8 15,3 7 7,7 19,0 8 9,6 9,5 3 7,1

9 15,3 5 7,6 21,6 8 13,2 9,6 3 6,3

10 14,5 4 7,4 20,0 8 12,5 9,7 4 8,1

11 17,9 7 8,7 21,5 7 12,8 10,5 3 7,4

12 16,5 6 8,2 9,8 3 6,7

13 16,1 6 8,0

14 14,2 4 7,3

15 16,5 7 8,2
Questão 2 (valor 3,0). Os dados abaixo referem-se ao número de formigueiros em parcelas
de 1 m².
Unidade Habitat
amostral
Floresta cerrado

1 9 12

2 6 14

3 4 15

4 6 13

5 7 14

6 10 13

7 9 10

8 5 15

9 9 10

10 6 13

a) Calcule a Média Aritmética, Variância, desvio Padrão e Erro padrão para cada
habitat (pode usar o Bioestat).
Resposta: Como na questão 1.c. ver Apostila sobre MEDIDAS DE TENDÊNCIA CENTRAL
(POSIÇÃO) E DE DISPERSÃO (VARIAÇÃO).

Tabela 12: Medidas de tendência central e de dispersão para os habitats Floresta e Cerrado.
Floresta Cerrado
Média 7.1 12.9
Desvio Padrão 2.02 1.79
Erro Padrão 0.64 0.56
Variância 4.1 3.21
Fonte: Autoria própria, 2021.

b) Nosso tamanho amostral é muito pequeno. Talvez essas diferenças tenham surgido
apenas por acaso ou por amostragem aleatória. Aplique um teste estatístico para decidir
se essas diferenças são significativas ou não.

Resposta: Vc deve aplicar um teste de comparação entre médias, indicar o teste mais
adequado para variáveis quantitativas na escala de Razão. Vc deve seguir o Roteiro O
EMPREGO DE PROVAS ESTATÍSTICAS NA PESQUISA, já mencionado no ítem anterior,
seguindo os estágios na ordem de execução recomendada.

H0: tobs = ttab


HA: tobs ≠ ttab

gL: 18
tobs
(7,1−12,9 ) 5,8 5,8 5,8 5,8 5,8
¿ = = = = = =6,82

√ ( 10−1 ) .4,1+ ( 10−1 ) .3,21


10+10−2
.0,2
√ 9.4,1+9.3,21
18
.0,2
√ 65,79
18
.0,2
√ 3,65.0,2 √ 0,73 0,85

tobs= 6,82
ttab= 2,10

Decisão: tobs > ttab = Rejeitar H0.

Resposta: As médias entre o número de formigueiros das parcelas da Floresta diferem


significativamente, a nível de α 0,05, das médias do número de formigueiros das
parcelas do Cerrado.

Questão 3 (valor 2,0). Verificar se a distribuição dos grupos sanguíneos em índios sul-
americanos difere significativamente nas 3 populações. Mostrar suas hipóteses e o
procedimento formal segundo seu roteiro sobre aplicação de provas estatísticas nas
ciências biológicas. Explicar suas conclusões.

Resposta: aqui temos uma análise bivariada (2 variáveis, em uma tabela de contingência 3X4).
Devemos usar uma técnica estatística inferencial, não-paramétrica (estamos trabalhando com
variáveis na escala nominal), para comprovar se existe diferença significativa no número
observado de casos em determinada categoria e o respectivo número esperado, baseado na
hipótese de nulidade.
Vc deve seguir os passos dos roteiros O EMPREGO DE PROVAS ESTATÍSTICAS NA
PESQUISA e também a apostila QUI-QUADRADO.

  Grupos sanguíneos  
Totais
A AB B O
linhas
Pop1 25 13 25 63 126 H0: X²obs = X²tab
Pop2 22 11 22 57 112
Pop3 28 14 28 70 140
HA: X²obs ≠ X²tab
Totais 75 38 75 190
378
colunas

E1: 126.75/378= 25 E7: 126.75/378= 25


22,2
E2: 112.75/378=
2 E8: 112.75/378= 22,22
27,7
E3: 140.75/378=
7 E9: 140.75/378= 27,77

12,6
E4: 126.38/378=
6 E10: 126.190/378= 63,33
11,2
E5: 112.38/378=
5 E11: 112.190/378= 56,29
14,0
E6: 140.38/378=
7 E12: 140.190/378= 70,37

Aplicação da fórmula:

( 25−25 )2 (13−12,66)² (25−25)² (63−63,33)² (22−22,22)²


x² = 25 + 12,66 + 25
+
63,33
+
22,22
+

(11−11,25) ² (22−22,22) ² (57−56,29)² (28−27,77) ² (14−14,07)²


+ + + + +
11,25 22,22 56,29 27,77 14,07
(28−27,77)² (70−70,37)²
+
27,77 70,73
0,00 0,11 0,00 0,10 0,04 0,06 0,04 0,50 0,05 0,00
x² = +
25 12,66 +
25 + + + + + +
63,33 22,22 11,25 22,22 56,29 27,77 14,07+
0,05 0,13
+ +
27,77 70,73

x² = 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00 + 0,00
x² = 0,0

gL=(m-1).(n-1) = (3-1).(4-1)

gL=2.3

gL=6

x²obs = 0,00
x²tab = 1,64
Decisão: x²obs < x²tab, entretanto, cai dentro da área de aceitação = Aceitar Ho.

Resposta: A distribuição dos grupos sanguíneos em índios sul-americanos não difere


significativamente nas 3 populações, a nível de α 0,05.

Você também pode gostar