Escolar Documentos
Profissional Documentos
Cultura Documentos
Pgina
I Introduo................................................................................................................. 1
1 Populao e amostra......................................................................................................... 2 2 Intervalo de confiana da mdia da populao ................................................................ 4 3 Comparao das mdias de duas amostras Teste t ........................................................ 6 4 Testes normalidade da distribuio e homogeneidade das varincias........................ 9 5 Teste t para amostras relacionadas (emparelhadas) ...................................................... 10 6 Testes a variveis no paramtricas Teste de ajustamento do Qui-Quadrado ............ 12 7 Teste de independncia (Pearson) do Qui-Quadrado. Tabelas de contingncia ............ 14
IV Anlise multivariada............................................................................................ 57
21 Anlise factorial de componentes principais................................................................ 57 22 Anlise de clusters........................................................................................................ 62
Bibliografia .................................................................................................................. 69
I Introduo
1 Populao e amostra
A estatstica uma cincia que recorre a tcnicas quantitativas para avaliar e estudar as incertezas e os seus efeitos no planeamento e interpretao de experincias e de observaes de fenmenos da natureza e da sociedade. Estatstica descritiva. Captulo da estatstica em que se utiliza um conjunto de tcnicas analticas que tem por objectivo resumir os dados recolhidos numa dada investigao a relativamente poucos nmeros e grficos. Estatstica indutiva. Captulo da estatstica que tem como objectivo averiguar at que ponto se podem generalizar e validar os resultados encontrados numa amostra relativa a uma populao. (Inferncia estatstica). Biometria. Desenvolvimento e aplicao dos mtodos estatsticos ao delineamento, anlise e interpretao, das experincias de agricultura e biologia.
Populao
Amostra
Estatstica descritiva
Caracterstica da populao:
Estatstica indutiva
Caractersticas da amostra:
Amostra de uma populao com distribuio normal Uma populao com distribuio normal pode ser caracterizada pela mdia e pela varincia: N (, 2). A amostra, ao acaso, dessa populao pode-se caracterizar por N ( x , s2). Considerando uma amostra proveniente de uma populao com distribuio normal: Populao Amostra Mdia Desvio padro Varincia Erro padro Coeficiente de varincia Exerccio 1 Considerando N (15,4) calcular a probabilidade de x 11 Z 2 / n (/) *100
x
s s2 = ( x - x )2/(n-1) s/n (s/ x ) *100
(11-15) /2 -2
logo
P=0,5-0,4772=0,0228=2,28%
z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4
0.00 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 0.4987 0.4990 0.4993 0.4995 0.4997
0.01 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.4778 0.4826 0.4864 0.4896 0.4920 0.4940 0.4955 0.4966 0.4975 0.4982 0.4987 0.4991 0.4993 0.4995 0.4997
0.02 0.0080 0.0478 0.0871 0.1255 0.1628 0.1985 0.2324 0.2642 0.2939 0.3212 0.3461 0.3686 0.3888 0.4066 0.4222 0.4357 0.4474 0.4573 0.4656 0.4726 0.4783 0.4830 0.4868 0.4898 0.4922 0.4941 0.4956 0.4967 0.4976 0.4982 0.4987 0.4991 0.4994 0.4995 0.4997
0.03 0.0120 0.0517 0.0910 0.1293 0.1664 0.2019 0.2357 0.2673 0.2969 0.3238 0.3485 0.3708 0.3907 0.4082 0.4236 0.4370 0.4484 0.4582 0.4664 0.4732 0.4788 0.4834 0.4871 0.4901 0.4925 0.4943 0.4957 0.4968 0.4977 0.4983 0.4988 0.4991 0.4994 0.4996 0.4997
0.04 0.0160 0.0557 0.0948 0.1331 0.1700 0.2054 0.2389 0.2704 0.2995 0.3264 0.3508 0.3729 0.3925 0.4099 0.4251 0.4382 0.4495 0.4591 0.4671 0.4738 0.4793 0.4838 0.4875 0.4904 0.4927 0.4945 0.4959 0.4969 0.4977 0.4984 0.4988 0.4992 0.4994 0.4996 0.4997
0.05 0.0190 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3513 0.3749 0.3944 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 0.4798 0.4842 0.4878 0.4906 0.4929 0.4946 0.4960 0.4970 0.4978 0.4984 0.4989 0.4992 0.4994 0.4996 0.4997
0.06 0.0239 0.0636 0.1026 0.1406 0.1772 0.2123 0.2454 0.2764 0.3051 0.3315 0.3554 0.3770 0.3962 0.4131 0.4279 0.4406 0.4515 0.4608 0.4686 0.4750 0.4803 0.4846 0.4881 0.4909 0.4931 0.4948 0.4961 0.4971 0.4979 0.4985 0.4989 0.4992 0.4994 0.4996 0.4997
0.07 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.4418 0.4525 0.4616 0.4693 0.4756 0.4808 0.4850 0.4884 0.4911 0.4932 0.4949 0.4962 0.4972 0.4979 0.4985 0.4989 0.4992 0.4995 0.4996 0.4997
0.08 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3529 0.3810 0.3997 0.4162 0.4306 0.4429 0.4535 0.4625 0.4699 0.4761 0.4812 0.4854 0.4887 0.4913 0.4934 0.4951 0.4963 0.4973 0.4980 0.4986 0.4990 0.4993 0.4995 0.4996 0.4997
0.09 0.0359 0.0753 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 0.4441 0.4545 0.4633 0.4706 0.4767 0.4817 0.4857 0.4890 0.4916 0.4936 0.4952 0.4964 0.4974 0.4981 0.4986 0.4990 0.4993 0.4995 0.4997 0.4998
x = 13
n=9
s2 = ( x - x )2/(n-1) = 0,26
Para GL = 8 e P0,05 ( tabela Student* t, para bi caudal) resulta t(8) = 2,306 I.C.(95%) = x t * Se = 13 2,306 * 0,17 = 13 0,392 12,61 a 13,39 Existe uma forte probabilidade da mdia da % da protena deste alimento se situar entre 12,6% e 13,4% Excel / Exerccio 2 Ferramentas - Anlise de dados - Estatstica descritiva - Nvel de confiana 95%
SPSS / Exerccio 2 Anlise Estatstica descritiva - Explore Estatstica Intervalo de confiana 95%
XA - XB tem uma mdia igual a x1 x2 e uma varincia igual a 12/n1+ 22/n2 A estimativa de 1 - 2 baseia-se em x1 x2 Hiptese nula, H0: 1 = 2 Varincia ponderada Hiptese alternativa, H1: 1 2 (aceite se P <0,05) Sp2 =
(n1 1) s1 + (n2 1) s2 n1 + n2 2
Valor de t
t=
x1 x 2 sp (
2
Diferena entre as mdias Erro padro para comparao entre as mdias GL = (12-1) + (12-1) = (24-2) = 22
1 1 + ) n1 n2 Sp2 = 26,58
x1 = 26,75
x2 =21,99
Teste t
t(22) = 2,26 implica P < 0,05 logo, h evidncia para rejeitar H0 e aceitar H1
Logo, existe evidncia para sugerir que a variedade A mais produtiva que a variedade B. Com um intervalo de confiana de 95% pode-se estimar que a variedade A ser mais produtiva entre 0,40 e 9,12 t/ha do que a variedade B.
x1 x2 t(22)
s p (1 / n1 + 1 / n2 )
(26,75-21,99) 2,074 * 2,1 = 4,76 4,36 = 0,40 e 9,12 O intervalo de confiana de 99% j conteria o zero, ou seja, o ponto em que x1 = x2 A diferena significativa mnima (LSD - Least Significant Difference) (P <0,05) entre as mdias das duas variedades igual ao erro padro multiplicado pelo valor de t para 22 graus de liberdade e o valor de P = 5%, isto , 2,1*2,074 = 4,36 t/ha. Assume-se a normalidade da distribuio. (Normalidade) Assume-se que as varincias das duas populaes so iguais. (Homogeneidade da varincia)
6
Excel / Exerccio 3 Ferramentas Analisar dados Teste T duas amostras com varincias iguais
SPSS / Exerccio 3 Anlise Comparar mdias Teste T para amostras independentes definir grupos
0.025 0,05 *
0.01 0,02
0.005 0,01
**
12.70620 31.82052 4.30265 3.18245 2.77645 2.57058 2.44691 2.36462 2.30600 2.26216 2.22814 2.20099 2.17881 2.16037 2.14479 2.13145 2.11991 2.10982 2.10092 2.09302 2.08596 2.07961 2.07387 2.06866 2.06390 2.05954 2.05553 2.05183 2.04841 2.04523 2.04227
6.96456 4.54070 3.74695 3.36493 3.14267 2.99795 2.89646 2.82144 2.76377 2.71808 2.68100 2.65031 2.62449 2.60248 2.58349 2.56693 2.55238 2.53948 2.52798 2.51765 2.50832 2.49987 2.49216 2.48511 2.47863 2.47266 2.46714 2.46202 2.45726
63.65674 636.6192 9.92484 5.84091 4.60409 4.03214 3.70743 3.49948 3.35539 3.24984 3.16927 3.10581 3.05454 3.01228 2.97684 2.94671 2.92078 2.89823 2.87844 2.86093 2.84534 2.83136 2.81876 2.80734 2.79694 2.78744 2.77871 2.77068 2.76326 2.75639 2.75000 31.5991 12.9240 8.6103 6.8688 5.9588 5.4079 5.0413 4.7809 4.5869 4.4370 4.3178 4.2208 4.1405 4.0728 4.0150 3.9651 3.9216 3.8834 3.8495 3.8193 3.7921 3.7676 3.7454 3.7251 3.7066 3.6896 3.6739 3.6594 3.6460
SPSS Teste homogeneidade das varincias (teste de Levene) Anlise Comparar mdias One-Way ANOVA Opes Teste homogeneidade
Teste t
Considere que os dados das variedades de couve A e B referidas no exerccio anterior estavam emparelhados porque cada par de dados era proveniente de um campo diferente. Neste teste a hiptese nula H0: (1 - 2) = 0 ou H0: 1 = 2 enunciada como: H0: D = 0 em que D representa a diferena entre os dois valores de cada par. D sD n
2
Valor de t
t (n-1) =
t (11) =
logo, P <0,01
Verifica-se que a evidncia de que a variedade A mais produtiva do que a variedade B mais forte quando as amostras so tratadas como emparelhadas (P <0,01) do que quando as amostras foram tratadas como independentes (P <0,05) apesar da reduo de 22 para 11 no nmero de graus de liberdade. Com um intervalo de confiana de 95% pode-se estimar que a variedade A ser mais produtiva entre 2,29 e 7,22 t/ha do que a variedade B.
xD t(11)
A diferena significativa mnima (LSD) para comparao entre as mdias das duas variedades seria 2,2 * 1,122 = 2,47 t/ha
10
Excel / Exerccio 4 Ferramentas Analisar dados Teste T duas amostras emparelhadas para mdias
SPSS / Exerccio 4 Anlise Comparar mdias Teste T para amostras emparelhadas Seleccionar o par de variveis para a lista de variveis pares.
11
No transporte de tomate para a indstria utilizaram-se novas embalagens para verificar se o nmero de frutos que resistiam intactos ao transporte aumentava relativamente relao de trs tomates resistentes para cada tomate danificado, como era habitual. Numa amostra colhida ao acaso de 300 tomates verificaram-se que 85 foram danificados ficando 215 intactos. Testar a hiptese nula da relao entre frutos resistentes e frutos danificados ser 3:1. Clculo do Qui-Quadrado
2 =
(Observado Esperado) 2 Esperado Esperado 225 75 300 (O-E) -10 +10 0 (O-E)2 / E 0,44 1,33 1,77
2 = 1,77 (n.s.)
Como se verifica pela tabela do Qui-Quadrado no h evidncia para rejeitar a hiptese nula e aceitar que as novas embalagens sejam mais resistentes do que as anteriores.
Exerccio 6
Num teste ao sabor de mas assadas numa forma tradicional (T) ou num novo mtodo (N) foram entregues a cada participante trs maas, das quais, 2T e 1N, e solicitou-se que identificassem a maa que diferia das outras duas. Dos 60 participantes, 28 seleccionaram a maa correcta. Ser que este teste suporta a hiptese nula (H0) de que os dois grupos de maa so indistinguveis pelo sabor? Ou haver evidncia para aceitar a hiptese alternativa (H1). Classe T N Total Observado 32 28 60 Esperado 40 20 60 (O-E) -8 +8 0 (O-E)2 / E 1,6 3,2
2 = 4,8* Aceita-se H1
12
SPSS / Exerccio 5 Data Weight cases Frequency variable Anlise Testes no paramtricos chi-square Valores esperados
SPSS / Exerccio 6
13
Valor de 2 =
Utilizam-se tabelas de consistncia. Os valores esperados resultam do valor = (Total da linha * Total da coluna) / Total global
Exerccio 7
Para testar a hiptese que afirma que o aparecimento de lceras gstricas ou cancros do estmago independente do consumo de cerveja, vinho ou gua, analisaram-se 8766 indivduos, ao acaso, e obtiveram-se os seguintes resultados:
Tabela de contingncia 3X3 lcera Cerveja Vinho gua Total da coluna 983 679 134 1796 Cancro 383 416 84 883 Saudvel 2892 2625 570 6087 Total da linha 4258 3720 788 Total global 8766
Frequncias esperadas 872,4 428,9 2956,7 762,2 374,7 2583,1 161,4 79,4 547,2
Desvios (O-E) 110,6 -45,9 -64,7 -83,2 41,3 -27,4 4,6 41,9 22,8
(O-E)2 / E 14,02 4,91 9,08 4,65 4,55 0,27 1,42 0,68 0,95
40,53***
G.L. = (3-1)*(3-1) = 2*2 = 4 Aceita-se H1: Existe associao entre as doenas referidas e o tipo de bebidas consumidas.
14
SPSS / Exerccio 7 Data Weight cases Frequency variable Anlise Estatstica descritiva Crosstabs Statistics Chi-square (Cells Counts: observed, expected; Residuals: unstandardized)
15
0.010
0.00016 0.0201 0.115 0.297 0.554 0.872 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.90 9.54 10.2 10.9 11.5 12.2 12.9 13.6 14.3 15.0 15.7 16.4 17.1 17.8 18.5 22.2 25.9
0.025
0.00098 0.0506 0.216 0.484 0.831 1.24 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.3 11.0 11.7 12.4 13.1 13.8 14.6 15.3 16.0 16.8 17.5 18.3 19.0 19.8 20.6 24.4 28.4
0.05
0.0039 0.103 0.352 0.711 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.1 10.9 11.6 12.3 13.1 13.8 14.6 15.4 16.2 16.9 17.7 18.5 19.3 20.1 20.9 21.7 22.5 26.5 30.6
0.10
0.0158 0.211 0.584 1.06 1.61 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.1 10.9 11.7 12.4 13.2 14.0 14.8 15.7 16.5 17.3 18.1 18.9 19.8 20.6 21.4 22.3 23.1 24.0 24.8 29.1 33.4
0.95
3.84 5.99 7.81 9.49 11.1 12.6 14.1 15.5 16.9 18.3 19.7 21.0 22.4 23.7 25.0 26.3 27.6 28.9 30.1 31.4 32.7 33.9 35.2 36.4 37.7 38.9 40.1 41.3 42.6 43.8 45.0 46.2 47.4 48.6 49.8 55.8 61.7
0.99 0.995
6.63 9.21 11.3 13.3 15.1 16.8 18.5 20.1 21.7 23.2 24.7 26.2 27.7 29.1 30.6 32.0 33.4 34.8 36.2 37.6 38.9 40.3 41.6 43.0 44.3 45.6 47.0 48.3 49.6 50.9 52.2 53.5 54.8 56.1 57.3 63.7 70.0 7.88 10.6 12.8 14.9 16.7 18.5 20.3 22.0 23.6 25.2 26.8 28.3 29.8 31.3 32.8 34.3 35.7 37.2 38.6 40.0 41.4 42.8 44.2 45.6 46.9 48.3 49.6 51.0 52.3 53.7 55.0 56.3 57.6 59.0 60.3 66.8 73.2
16
II Anlise de varincia
8 Delineamento experimental completamente casualizado.
A colocao aleatria (ao acaso) dos tratamentos nos talhes experimentais e a repetio dos tratamentos so requisitos para uma boa experincia. A casualizao dos tratamentos aumenta a preciso porque diminui o erro padro para comparao entre as respectivas mdias. No delineamento experimental completamente casualizado (completely randomized design) os talhes so distribudos para cada repetio de cada tratamento completamente ao acaso.
t-1
t(r-1)
sp2
tr-1
2 ( x ) )
r = n de repeties
n n = tr = n de talhes
Numa experincia para comparar 4 variedades de melo utilizaram-se 6 talhes (6 repeties) para cada variedade. Os tratamentos localizaram-se, aleatoriamente, nos 24 talhes. Pretendese testar se as produtividades das 4 variedades so iguais, e caso sejam diferentes avaliar essas diferenas, assumindo que os dados provm de populaes com distribuies normais e com varincias idnticas. Os resultados da produo (t/ha) foram os seguintes: Variedade A 25,12 17,25 26,42 16,08 22,15 15,92 B 40,25 35,25 31,98 36,52 43,32 37,1 C 18,3 22,6 25,9 15,05 11,42 23,68 D 28,05 28,55 23,20 31,68 30,32 37,58 179,38 (643,69) 5475,33 (19010,77) 29,90 22,49 22,49) / 4 = 22,76 (Total)
Produo
(x 2 ) x s2 Sp2
122,94 224,42 116,95 2629,23 8472,09 2434,12 20,49 37,4 19,49 22,04 15,61 30,91 = (22,04 + 15,61 + 30,91 +
17
Soma dos quadrados Variao total = 19010,77 - (643,69)2/24 = 1746,74 Variao entre tratamentos = [ (122,942 ++ 179,382) ]/6 (643,69)2/24 = 1291,48 Variao residual = 1746,74 - 1291,48 = 455,26 ANOVA Origem da variao Entre tratamentos Residual Variao total
gl
ss
ms
4 1 = 03 4 (6-1) = 20 24 - 1 = 23
430,49 22,76
s2 = n
22,76 = 1,95 6
1 1 s2 n + n = 2 1
2s 2 = 6
22,76 = 2,75 3
10 Teste F
Para um teste global sobre se as variedades deram produtividades iguais pode-se calcular o valor de F pelo quociente entre a mdia quadrtica dos tratamentos e a mdia quadrtica do erro (varincia do erro). O valor de F obtido pode ser testado recorrendo tabela F para o nmero de graus de liberdade dos tratamentos (horizontal) e os graus de liberdade do erro (vertical). H0: 1= 2= 3= 4 Tabela F H1: As mdias no so iguais logo, P<0,001
Existe forte evidncia para aceitar que existem diferenas de produtividade entre as variedades testadas. Tabela das mdias Variedade Produtividade (t/ha) A 20,5 B 37,4 C 19,5 D 29,9
Erro padro para comparao entre duas mdias = 2,75 t/ha LSD = 2,09 * 2,75 = 5,75 t/ha Evidncia sobre as mdias de produtividade: A=C < D < B 18
10
11
12
15
20
30
40
50
10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.70 8.66 8.62 8.59 8.58 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.86 5.80 5.75 5.72 5.70 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.62 4.56 4.50 4.46 4.44 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.94 3.87 3.81 3.77 3.75 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.51 3.44 3.38 3.34 3.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.22 3.15 3.08 3.04 3.02 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.01 2.94 2.86 2.83 2.80 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.85 2.77 2.70 2.66 2.64 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.72 2.65 2.57 2.53 2.51 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.62 2.54 2.47 2.43 2.40 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.40 2.33 2.25 2.20 2.18 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.20 2.12 2.04 1.99 1.97 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.13 2.09 2.01 1.93 1.84 1.79 1.76 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.04 2.00 1.92 1.84 1.74 1.69 1.66 3.18 2.79 2.56 2.40 2.29 2.20 2.13 2.07 2.03 1.99 1.95 1.87 1.78 1.69 1.63 1.60 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.95 1.92 1.84 1.75 1.65 1.59 1.56
34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 26.87 26.69 26.50 26.41 26.35 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 14.20 14.02 13.84 13.75 13.69 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 9.72 7.56 9.55 7.40 9.38 7.23 9.29 7.14 9.24 7.09
12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 5.99 5.91 5.86 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.20 5.12 5.07 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.65 4.57 4.52 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.25 4.17 4.12
9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 3.94 3.86 3.81 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.70 3.62 3.57 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.21 3.13 3.08 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.78 2.69 2.64 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.39 2.30 2.25 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.20 2.11 2.06 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.79 2.70 2.56 2.42 2.27 2.10 2.01 1.95 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.03 1.94 1.88
19
2
61.25 37.12 27.00 21.69 18.49 16.39 14.91 13.81 12.97 11.34
3
56.18 33.20 23.70 18.77 15.83 13.90 12.55 11.56 10.80
4
53.44 31.09 21.92 17.20 14.39 12.56 11.28 10.35
5
51.71 29.75 20.80 16.21 13.49 11.71 10.48
6
50.53 28.84 20.03 15.52 12.86 11.13
7
49.66 28.16 19.46 15.02 12.40 10.70
8
49.00 27.65 19.03 14.63 12.05 10.37
9
48.48 27.25 18.69 14.33 11.77 10.11
10
48.05 26.92 18.41 14.08 11.54
15
46.76 25.91 17.56 13.32 10.84
20
46.10 25.40 17.12 12.93 10.48
30
45.43 24.87 16.67 12.53 10.11
50
44.88 24.44 16.31 12.20
9.80 8.26 7.19 6.42 5.83 4.70 3.77 2.98 2.64 2.44 2.32
9.89 8.75 7.92 7.29 6.08 5.08 4.24 3.87 3.67 3.54
9.24 8.13 7.32 6.71 5.54 4.56 3.75 3.40 3.20 3.08
8.90 7.80 7.01 6.41 5.25 4.29 3.49 3.15 2.95 2.83
8.55 7.47 6.68 6.09 4.95 4.01 3.22 2.87 2.68 2.56
Excel / Exerccio 8 Ferramentas Analisar dados ANOVA: Factor nico Seleccionar o intervalo
20
SPSS / Exerccio 8 Anlise Comparar mdias One-way ANOVA Seleccionar a varivel e o factor
SPSS / Exerccio 8 Anlise Comparar mdias One-way ANOVA PHM comparisons - LSD
21
(Exerccio 8:
SPSS / Exerccio 8 Anlise Comparar mdias One-way ANOVA PHM comparisons Tukey B, Tukey HSD
22
23
gl
2 2
ss
ms
2 2
b-1 t-1
(x ) B1 + B2 + ... + Bb t n
2 2 2
msB/s2
2
(x ) T1 + T2 + ... + Tb b n
Por subtraco x
2 2 ( x )
msT/s2 sp2
(b-1)(t-1) n-1
Exerccio 9
Efeito da temperatura e da humidade relativa na perda de peso de uma salada de quarta gama. Experincia com um factor e trs nveis (tratamentos) de factor. Factor: Controlo ambiental; Tratamentos: Frio (F), Humidade (H), Frio e Humidade (FH). Delineamento experimental de blocos casualizados (4 blocos * 3 tratamentos). Resultados: Perda de peso (g) de 20 embalagens em 8 dias. Tratamento/Bloco F H FH Total 1 359 372 330 1061 2 337 340 288 965 3 373 343 295 1011 4 302 341 313 956 Total 1371 1396 1226 3993
24
SS total = (3592++3132) - 39932/12 SS residual = SS total - (SS bloc. + SS trat.) ANOVA Origem da variao Blocos Tratamentos Residual Total gl 3 2 6 11
ms 2106 387
F 5,44*
Hiptese nula: As perdas de peso so iguais com qualquer dos tratamentos. Como F corresponde a um valor de P <0,05 rejeita-se H0 e aceita-se que as perdas de peso possam diferir com os tratamentos. Mdia geral = 3993/12 = 332,8 Coeficiente de varincia =
O coeficiente de varincia uma medida de preciso relativa. Normalmente, esperam-se valores de coeficientes de varincia da ordem dos 5% ou menos quando o ambiente controlado, 10% em culturas de campo e 20% ou mais em grandes experincias com animais. Tabela das mdias Tratamento Perdas de peso (g) F 343 H 349 FH 306
2 * 387 = 13,9 g 4
Teste t entre a mdia do tratamento F e a mdia do tratamento FH: t = (343-306)/13,9 = 2,66 logo P <0,05 o que implica que as perdas de peso tenham sido menores com o tratamento FH do que com o tratamento F. LSD = t(6) * 13,9 = 2,447 * 13,9 = 34 g Teste de Waller-Duncan: F=H > FH ou F(a), H(a), FH(b)
Concluso: No h diferenas significativas entre as perdas de peso da salada de quarta gama com os tratamentos F ou H, mas existe evidncia (P <0,05) de que o tratamento FH resulta em perdas de peso menores do que qualquer dos outros tratamentos.
25
SPSS / Exerccio 9 Anlise General linear model Univariate Colocar a varivel dependente e os factores Modelo- Custom All 2-way colocar os factores no modelo
Options: Seleccionar observed power (que deve ser >0,8 para se rejeitar H0 com certeza) SPSS / Exerccio 9 Anlise General linear model Univariate Post Hoc Waller-Duncan
26
Existe interaco entre dois factores quando a aco de um no permanece constante para qualquer nvel do outro factor e vice-versa. Assim se a interaco for significativa os resultados de um factor dependem do nvel do outro factor. Produo Var. A Var. B
A forma como se interpretam os resultados de uma experincia factorial depende da existncia ou no de uma interaco significativa e neste caso, da interaco ser muito menor, ou no, do que os efeitos principais: 1 Se no existir interaco significativa as concluses baseiam-se directamente nas mdias dos efeitos principais. Assim, suficiente comparar as mdias dos nveis de cada factor. 2 Se existir interaco significativa mas o valor F da interaco for muito inferior ao valor F dos efeitos principais as concluses devero basear-se na comparao entre as mdias dos efeitos principais e na comparao entre as mdias de tratamentos de cada nvel de factor. 3 Se a interaco for significativa e com um valor de F semelhante, ou superior, do que o valor F dos efeitos principais as concluses baseiam-se apenas na comparao entre mdias dos tratamentos j que aqui os efeitos principais de cada factor so de menor importncia.
27
Conduziu-se uma experincia com morangueiros em estufim para investigar a produo de 4 variedades e 3 datas de cobertura. Utilizou-se um delineamento experimental de blocos casualizados, com estrutura factorial de tratamentos e com 4 blocos. Os resultados encontram-se expressos em toneladas de morango por 3000m2 de estufim. Data de cobertura Fevereiro Variedade I V R F G V R F G V R F G 10,2 11,1 6,8 5,3 8,0 9,7 8,6 3,4 2,0 10,9 2,2 2,1 80,3 II 10,1 9,8 9,5 7,5 9,7 7,9 9,6 4,2 6,1 8,4 4,9 0,9 88,6 Blocos III 12,1 8,6 9,5 4,6 12,0 10,3 9,5 7,3 4,8 6,5 4,4 3,4 93,0 IV 12,3 9,4 10,3 7,3 7,8 11,2 10,0 7,6 6,7 9,2 3,6 2,3 97,7 Total 44,7 38,9 36,1 24,7 37,5 39,1 37,7 22,5 19,6 35,0 15,1 8,7 359,6
Maro
Abril
Total
ANOVA Inicial Ignorando a estrutura factorial e tratando a experincia como um factor com 12 tratamentos. SPSS - Anlise General linear model Univariate Colocar a varivel dependente e os factores Modelo- Custom All 2-way colocar os factores no modelo (igual ao exerccio 9)
Dependent Variable: PRODUO Origem BLOCO TRATAMEN Error ss 13,692 356,012 69,453 df 3 11 33 ms 4,564 32,365 2,105 F 15,378 Sig. ,000
Pode-se rejeitar H0: as mdias dos tratamentos so iguais, e aceitar que existem diferenas significativas entre os tratamentos. Neste caso procede-se a uma anlise de varincia mais detalhada.
28
Considerando: A = Factor A; B = Factor B; a = n de nveis de A; b = n de nveis de B A1 = nvel 1 do factor A; TA1 a soma de todos os resultados do tratamento A1 t o n de tratamentos (a*b); r o n de (repeties) blocos; n o n de talhes ANOVA mais detalhada Origem Blocos (a-1) Tratamentos (b-1) (a-1)(b-1) Residual (erro) Total (T A1 + T A2 + ...) (x )2 rb n
2 2
gl
ss
TB1 + TB 2 + ... (x )2 ra n
2 2
Por subtraco
Tabela interaco nos dois sentidos Data de cobertura V Fevereiro Maro Abril Total 44,7 37,5 19,6 101,8 R 38,9 39,1 35 113,0 Variedades F 36,1 37,7 15,1 88,9 G 24,7 22,5 8,7 55,9 Total 144,4 136,8 78,4 359,6
Clculo da soma dos quadrados dos efeitos principais 101,82 + ... + 55,92 2694 SS variedades = 12 Clculo da soma dos quadrados da interaco SS tratamentos = SS variedades + SS coberturas + SS interaco SS interaco = 356,02 152,69 163,01 = 40,32 144,42 + ... + 78,42 SS coberturas = 2694 16
29
ANOVA Origem Blocos Variedades Coberturas Var.*Cob. Erro Total gl 3 3 2 6 33 47 ss 13,69 152,69 163,01 40,32 69,45 439,16 ms 4,57 50,90 81,50 6,72 2,10 F 24,2 38,7 3,2 P <0,001*** <0,001*** <0,05*
Rejeitam-se as hipteses de que as variedades ou as datas de cobertura no influenciam as produes de morango, mas tambm, que no exista interaco entre os dois factores. Os resultados apresentam-se, ento, numa tabela de mdias dos tratamentos nos dois sentidos. Tabela das mdias dos tratamentos (t morango / 3000m2 de estufim) Data de cobertura V Fevereiro Maro Abril Mdia 11,2 9,4 4,9 8,5 R 9,7 9,8 8,8 9,4 Variedades F 9,0 9,4 3,8 7,4 G 6,2 5,6 2,2 4,7 Mdia 9,0 8,5 4,9 7,5
Erro padro para comparao entre duas mdias e diferenas significativas mnimas: Variedades Datas de cobertura Tratamentos Sumrio dos resultados: A produo de morangos de cada variedade no variou significativamente entre as datas de cobertura de Fevereiro e Maro mas, com a excepo da variedade R, diminuiu com a data de cobertura de Abril. A variedade R foi a mais produtiva quando os morangueiros foram cobertos em Abril, e a variedade G foi a menos produtiva nas datas de cobertura de Fevereiro e Maro. (Todas as afirmaes esto baseadas num nvel de significncia em que P<0,05).
2 s 2 / 12 = 0,59 2 s 2 / 16 = 0,51
LSD = t(33) * Se = 2,04 * 0,59 = 1,2 LSD = t(33) * Se = 2,04 * 0,51 = 1,04 LSD = t(33) * Se = 2,04 * 1,03 = 2,1
2s 2 / 4 = 1,03
30
SPSS / Exerccio 10 Anlise General linear model Univariate Colocar a varivel dependente e os factores. Construir o Modelo - Custom colocar os blocos, factores e interaco no modelo. Construir o grfico das mdias com o respectivo intervalo de confiana 95%
Tests of Between-Subjects Effects Dependent Variable: PRODUO Source Model BLOCO VARIEDAD COBERTUR VARIEDAD * COBERTUR Error Total Type III Sum of Squares 3063,707a 13,692 152,685 163,007 40,320 69,453 3133,160 df 15 3 3 2 6 33 48 Mean Square 204,247 4,564 50,895 81,503 6,720 2,105 F 97,046 2,168 24,182 38,725 3,193 Sig. ,000 ,110 ,000 ,000 ,014
31
Delineamento experimental de blocos casualizados com estrutura factorial (3 factores) Factores: N, P, K Nveis de factor: 1 e 2 Tratamentos = 23 = 8 Tratamentos: N1P1K1, N1P1K2, N1P2K1, N1P2K2, N2P1K1, N2P1K2, N2P2K1, N2P2K2 Considere os seguintes resultados de produo de alface (t/ha) N 1 1 1 1 2 2 2 2 P 1 1 2 2 1 1 2 2 K 1 2 1 2 1 2 1 2 B1 15,20 17,10 16,20 18,40 19,10 19,40 18,70 36,30 B2 15,90 16,30 22,20 17,20 22,10 27,70 28,30 32,20 B3 17,20 17,30 17,60 19,30 24,30 22,50 23,10 33,20 B4 21,40 21,20 23,00 22,10 25,00 27,10 26,90 34,50
Anlise General linear model Univariate Colocar a varivel e os factores. Construir o Modelo - Custom colocar os blocos, factores e interaces.
32
Tests of Between-Subjects Effects Dependent Variable: PRODUO Source BLOCO N P K N*P N*K P*K N*P*K Error Type III Sum of Squares 108,307 471,245 114,005 64,980 31,205 63,845 25,920 43,245 108,782 df 3 1 1 1 1 1 1 1 21 Mean Square 36,102 471,245 114,005 64,980 31,205 63,845 25,920 43,245 5,180 F 6,969 90,972 22,008 12,544 6,024 12,325 5,004 8,348 Sig. ,002 ,000 ,000 ,002 ,023 ,002 ,036 ,009
A resposta de 6 variedades de alface a 3 formas de mobilizao do solo foi investigada atravs de um delineamento experimental do tipo split-plot com 4 blocos. Os talhes principais corresponderam s formas de mobilizao (X, Y, Z), e cada talho principal foi dividido em 6 pequenos talhes correspondentes s 6 variedades (A, B, C, D, E, F). Os resultados expressos em t/ha foram os seguintes: Mobilizao Variedade
A B C D E F A B C D E F A B C D E F I 11,8 8,3 9,2 15,6 16,2 9,9 71,0 9,7 5,4 12,1 13,2 16,5 12,5 69,4 7,0 5,7 3,3 12,6 12,6 10,2 51,4 II 7,5 8,4 10,6 10,8 11,2 10,8 59,3 8,8 12,9 15,7 11,3 11,1 14,3 74,1 9,1 8,4 6,9 15,4 12,3 11,6 63,7
Blocos
III 9,7 11,8 11,4 10,3 14,0 4,8 62,0 12,5 11,2 7,6 11,0 10,8 15,9 69,0 7,1 6,1 1,0 14,2 14,4 10,4 53,2 IV 6,4 8,5 7,2 14,7 11,5 9,8 58,1 9,4 7,8, 9,4 10,7 8,5 7,5 53,3, 6,3 8,8 2,6 11,3 14,1 12,2 55,3 Total 35,4 37,0 38,4 51,4 52,9 35,3 40,4 37,3 44,8 46,2 46,9 50,2 29,5 29,0 13,8 53,5 53,4 44,4
Total de X Y
Total de Y Z
Total de Z
33
Anlise dos talhes principais Mobilizao X Y Z Total I 71,0 69,4 51,4 191,8 II 59,3 74,1 63,7 197,1 Blocos III 62,0 69,0 53,2 184,2 IV 58,1 53,3 55,3 166,7 Total 250,4 265,8 223,6 739,8
Considerando: A = Factor A (main-plot); B = Factor B (split-plot); a = n de nveis de A; b = n de nveis de B A1 = nvel 1 do factor A; TA1 a soma de todos os resultados do tratamento A1 t o n de tratamentos (a*b); r o n de (repeties) blocos; n o n de talhes Y = Resultados dos talhes principais; y = Resultados dos talhes pequenos ANOVA Talhes principais Origem gl
2 2
ss B1 + B2 + ... (x ) ab n
2 2 2
ms
sa2
FC =
(x )2
n
739,82 = 7601,44 72
ms
19,00
7,26
2,62
Total
34
Anlise dos pequenos talhes Variedade A B C D E F Total X 35,4 37,0 38,4 51,4 52,9 35,3 250,4 Mobilizao Y 40,4 37,3 44,8 46,2 46,9 50,2 265,8 Z 29,5 29,0 13,8 53,5 53,4 44,4 223,6 Total 105,3 103,3 97,0 151,1 153,2 129,9 739,8
ANOVA Pequenos talhes Origem gl Grandes talhes Efeito principal, B Interaco AB Erro (b) Total (b-1)
2
ss
ms
(TB1 + TB 2 + ...) (x ) ra n
2 2 2 2
sb2
ss
110,92
ms
5 10 45 71
3,24**
227,27
Total
35
Tabela das mdias Variedade A B C D E F Mdia X 8,8 9,2 9,6 12,8 13,2 8,8 10,4 Mobilizao Y 10,1 9,3 11,2 11,6 11,7 12,6 11,1 Z 7,4 7,2 3,4 13,4 13,4 11,1 9,3 Mdia 8,8 8,6 8,1 12,6 12,8 10,8 10,3
Erros padro para comparao entre duas mdias Se Mobilizao Variedade 2 variedades para a mesma mobilizao 2 variedades de diferentes mobilizaes 2 sa / 24 = 0,78 2 sb / 12 = 0,91 2 sb / 4 = 1,59 2 sb / 4 = 1,59
2 2 2 2
gl 6 45 45 45
2 2
2(5sb + sa ) / 4 * 6 = 1,65
nveis do factor correspondente aos talhes pequenos. Neste caso, no se podem efectuar testes t exactos porque as mdias quadrticas de ambos os erros esto envolvidas.
Sumrio dos resultados: (i) A ANOVA dos talhes principais no evidenciou a existncia de diferenas significativas na produo de alface em funo dos tipos de mobilizao experimentados. A ANOVA dos pequenos talhes revela que existem diferenas significativas na produo entre as diferentes variedades. As diferenas entre as variedades dependeram do tipo de mobilizao utilizado porque a interaco entre as variedades e os tipos de mobilizao foi significativa. Para o tipo de mobilizao X as melhores variedades foram a D e E; as diferenas entre variedades com a mobilizao Y foram pequenas; para a mobilizao Z as variedades D, E e F produziram mais do que as variedades A, B e C.
36
SPSS / Exerccio 12 Proceder anlise de varincia com blocos e dois factores (= exerccio 10): Anlise - General linear model Univariate Colocar a produo na varivel dependente, e colocar os blocos e os factores (mobilizao e variedades) nos factores fixos. Construir o modelo. Posteriormente seleccionar Paste e acrescentar:
/TEST = mobiliza VS bloco*mobiliza uma linha antes de /DESIGN .
Nesta ltima linha incluir bloco*mobiliza no texto, na ordem em que pretenda que aparea no output. Finalmente seleccionar Run para obter o Output.
UNIA NOVA produo BY bloco mobiliza variedad /METHOD = SSTYPE(3) /INTERCEP T = INCLUDE /CRITE RIA = ALPHA (.05)
37
Test Results Dependent Variable: PRODUO Source Contrast Errora Sum of Squares 38,003 43,566 df 2 6 Mean Square 19,002 7,261 F 2,617 Sig. ,152
a. BLOCO * MOBILIZA
Dependent Variable: PRODUO Source Efeito principal A Erro (a) df 2 6 Mean Square F Sig. ,152
2,617 7,261
Tests of Between-Subjects Effects Dependent Variable: PRODUO Source Corrected Model Intercept BLOCO MOBILIZA BLOCO * MOBILIZA VARIEDAD MOBILIZA * VARIEDAD Error Total Corrected Total Type III Sum of Squares 535,118a 7601,445 29,343 38,003 43,566 260,508 163,698 227,277 8363,840 762,395 df 26 1 3 2 6 5 10 45 72 71 Mean Square 20,581 7601,445 9,781 19,002 7,261 52,102 16,370 5,051 F 4,075 1505,060 1,937 3,762 1,438 10,316 3,241 Sig. ,000 ,000 ,137 ,031 ,222 ,000 ,003
Tests of Between-Subjects Effects Dependent Variable: PRODUO Source Type III Sum of Squares 260,508 163,698 227,277 762,395 df 5 10 45 71 Mean Square 52,102 16,370 F Sig. ,000 ,003
10,316 3,241
5,051
38
b=
[( x x )( y y )] Sxy = 2 Sxx ( x x )
xy n = (x )2 x 2 n ( xy )
a = y bx =
y (bx ) n
n = n de pares (x, y)
ou
H0: y no depende de x
gl 1 n-2 n-1
ss
ms
F F = t2
(Sxy )2 / Sxx
Por subtraco
Syy = y 2 (y ) / n
2
( )
r2 = Coeficiente de determinao (proporo da varincia explicada pela regresso) (1 - r2) = variabilidade no explicada pela regresso
a + bx t * Se
1 ( x x )2 s2 + Sxx n 1 ( x x )2 s 2 1 + + Sxx n
Mdio
Isolado
39
Probabilidade P 0.05 0.997 0.950 0.878 0.811 0.755 0.707 0.666 0.632 0.602 0.576 0.553 0.532 0.514 0.497 0.482 0.01 1.000 0.990 0.959 0.917 0.875 0.834 0.798 0.765 0.735 0.708 0.684 0.661 0.641 0.623 0.606 0.001 1.000 0.999 0.991 0.974 0.951 0.925 0.898 0.872 0.847 0.823 0.801 0.780 0.760 0.742 0.725
Probabilidade P 0.05 0.468 0.456 0.444 0.433 0.423 0.381 0.349 0.325 0.304 0.288 0.273 0.250 0.232 0.217 0.195 0.01 0.590 0.575 0.561 0.549 0.457 0.487 0.449 0.418 0.393 0.372 0.354 0.325 0.302 0.283 0.254 0.001 0.708 0.693 0.679 0.665 0.652 0.597 0.554 0.519 0.490 0.465 0.443 0.408 0.380 0.357 0.321
Exerccio 13
Considere que o avano em dias (y) no amadurecimento de maas foi avaliado para doses crescentes de etileno (x) obtendo-se os seguintes resultados: y 6 9 13 12 14 18 x 1 2 3 4 5 6 Teste se o amadurecimento dependeu da dose de etileno. Estime a respectiva regresso linear. n=6
(x) = 21 (y) = 72
(xy) = 289
SS regresso = (Sxy)2 / Sxx = 372 / 17,5 = 78,23 b = 37 / 17,5 = 2,114 a = [72 (21*2,114)] / 6 = 4,6 y = 4,6 + 2,114 x
F = MS regresso / MS residual = (78,23/1) / (7,77/4) = 40,27 R2 = SS regresso / SS total = 78,23 / 86 = 0,91 Resultado: O amadurecimento (y) dependeu (P <0,01) da dose de etileno (x). Mais de 90% da varincia no amadurecimento explicada atravs da recta de regresso y = 4,6 + 2,114 x
40
Inserir Grfico Disperso Intervalo de dados (x, y) Adicionar linha de tendncia Linear. Opes: Mostrar equao e mostrar valor de r2.
41
SPSS / Exerccio 13 Anlise Regresso Linear. Colocar variveis: dependente (y) e independente (x) Statistics: Estimates, model fit.
42
17 Regresso no linear
Exemplo de curvas: quadrtica, cbica, exponencial, logstica, hiperblica, etc.
Exerccio 14 (Equao quadrtica)
Considere que o avano em dias (y) no amadurecimento de maas foi avaliado para doses crescentes de etileno (x) obtendo-se os seguintes resultados: y x 2 1 8 2 13 3 17 4 19 5 21 6 22 7 23 8 23 9
Teste se o amadurecimento dependeu da dose de etileno. Compare a regresso linear com a regresso quadrtica. Excel / Exerccio 14 Inserir Grfico Disperso Intervalo de dados (x, y) Adicionar linha de tendncia Linear. Opes: Mostrar equao e mostrar valor de r2.
10
10
Dose de etileno
Note-se que igualando a zero a primeira derivada da curva obtm-se o valor de x correspondente ao mximo valor de y. SPSS / Exerccio 14 Anlise Regresso Linear. Colocar variveis: dependente (y) e independente (x) Statistics: Estimates, model fit.
ANOVA Sum of Squares 380,017 56,206 436,222
Model 1
df 1 7 8
F 47,328
Sig. ,000
43
Anlise Regresso Curve estimation. Colocar variveis: (y) e (x), o modelo quadrtico e a ANOVA
Anlise Regresso no linear. Colocar varivel (y), os parmetros e o modelo. Opes: Mtodo de Levenber - Marquardt
44
Considere o peso de bactrias (y) em funo do tempo (x) y 1 2 4 8 16 32 64 128 x 1 2 3 4 5 6 7 8 Verifique se a equao exponencial se adapta a estes resultados. Efectue a transformao logartmica dos resultados e teste a regresso linear nos resultados obtidos.
Inserir grfico de disperso, adicionar linha de tendncia, incluir equao e r2 Formatar linha de tendncia para uma equao do tipo exponencial e para polinmios de 2 e 3 ordens (equaes quadrtica e cbica).
y 1 ln(y) 0 x 1
2 0,7 2
4 1,4 3
8 2,1 4
16 2,8 5
32 3,5 6
160 120 80 40 0 0 2 4
Dias
5 4 3 2 1 0 -1 0 2 4
Dias
R =1
R =1
10
10
45
Aplicar quando:
yi forem contagens de nmeros pequenos yi forem contagens e alguns yi forem iguais a zero
a disperso dos yi elevada, e as varincias proporcionais s mdias a disperso dos yi elevada e alguns yi forem iguais a zero Os yi forem muito prximos de zero Os yi forem propores ou percentagens dispersas
1 y +1
arcsen
( y)
Aplicar quando: -1 y 1
(1 y )1 / 2 1 (1 y )3 / 2
3
0y1
46
A transformao matemtica de variveis pode ser realizada numa folha de clculo aplicando a frmula que se pretende para a transformao. No SPSS pode ser feita atravs do menu
Transform seguido de Compute.
47
19 Regresso mltipla
A anlise de regresso mltipla baseia-se no modelo: y = B0 + B1 x1 + B2 x2 ++ Bm xm + e e relaciona o comportamento da varivel y com a funo linear constituda pelo grupo B0 + B1 x1 + B2 x2 ++ Bm xm Os valores de Bj so parmetros que especificam a natureza da relao sendo e o erro casual.
Exerccio 16
Considere que se pretendia investigar se o consumo de gua (y) dependia do consumo de alimento (x1), do exerccio fsico (x2), ou de ambos, e que os resultados do consumo de gua (ml), do consumo de alimentos (g) e do caminho percorrido a p (km), registados para 12 indivduos num determinado perodo de tempo, eram os seguintes: gua (ml) Alimento (g) Km 175 342 252 362 284 219 229 260 90 2 150 114 152 122 117 114 117 5 6 9 6 7 4 6 88 55 0 132 254 199 72 0 106 2 93 0
SPSS / Exerccio 16 Quando se efectua a regresso linear simples (y = a + bx) do consumo de gua em relao ao consumo de alimento (F=218,5***), ou em relao ao percurso percorrido (F=16,6**), verifica-se que o consumo de gua dependeria quer de um factor quer do outro.
48
No entanto, quando se efectua a regresso linear mltipla (y = a + bx1 + cx2), colocando a varivel dependente e ambas as variveis independentes (factores) no modelo e utilizando o mtodo ENTER verifica-se que o valor de c no significativo.
Coefficientsa Unstandardized Coefficients B Std. Error -83,077 28,141 3,031 ,345 -3,257 3,187 Standardized Coefficients Beta 1,084 -,126
Model 1
(Constant) ALIMENTO KM
Anlise regresso linear colocar varivel dependente e variveis independentes Grfico interactivo scatter plot 3D colocar variveis
49
Quando se utiliza o mtodo STEPWISE, a varivel que se refere ao percurso percorrido logo excluda do modelo. Isto porque apesar desta ter um efeito significativo sobre o consumo de gua quando o modelo no inclui o efeito do consumo de alimento, no tem um efeito significativo quando a modelo j est a incluir o consumo de alimento.
Coefficientsa Unstandardized Coefficients B Std. Error -63,513 20,671 2,733 ,185 Standardized Coefficients Beta ,978
Model 1
(Constant) ALIMENTO
t -3,073 14,784
Model 1
KM
Beta In -,126a
t -1,022
Sig. ,333
Acontece que existe uma elevada correlao entre estes dois factores (consumo de alimento e percurso percorrido) e que a aparente dependncia do consumo de gua do percurso percorrido se atribui a esta correlao. Donde se conclui que o consumo de gua dependeu apenas do consumo de alimento, expressando-se essa relao atravs da equao: Consumo de gua (ml) = -63,5 + 2,73 (consumo de alimento, g)***
A interaco entre as variveis independentes x1 e x2 pode ser avaliada atravs da incluso no modelo do produto entre os factores, por exemplo, atravs de um modelo que se expresse por: y = a + bx1 + cx2 + d x1x2 No presente exerccio a interaco entre os dois factores seria, tambm, excluda, por no ter um efeito significativo no consumo de gua.
Excluded Variables Collinearity Statistics Tolerance ,286 ,229
Model 1
KM INTERAC
t -1,022 -,699
A regresso mltipla pode ser resolvida, tambm, atravs de regresso no linear no SPSS, escrevendo o modelo (aps identificar os parmetros) no mdulo de regresso no linear, dentro da anlise de regresso.
50
20 - Modelos de regresso
Introduo modelao
A matemtica um instrumento indispensvel para a compreenso dos fenmenos. utilizada para analisar as partes de um sistema ou as interaces entre essas partes. tambm utilizada para auxiliar a efectuar a sntese das partes ou previses quantitativas sobre o comportamento do sistema em diferentes condies, ambientais ou scio-econmicas, nomeadamente, pelo recurso a modelos de simulao. Os modelos matemticos conceptuais ou tericos distinguem-se dos modelos empricos ou estatsticos, uma vez que estes so desenvolvidos para descrever os resultados da experimentao, ou para testar hipteses cientficas, enquanto que aqueles pretendem simular o comportamento do sistema com base em referncias cientficas consideradas como verdadeiras. A anlise estatstica no prova nada. No entanto, oferece-nos um meio para avaliar o nvel de probalidade das nossas hipteses (formalizadas em equaes matemticas) serem verdadeiras ou falsas, ou para avaliar o nvel de probabilidade das nossas equaes de regresso serem consideradas verdadeiras para descrever os resultados, ou no. No entanto, a anlise estatstica relaciona-se apenas com as hipteses que levantamos, as quais, podem no ser as mais indicadas. Por isso, necessrio definir correctamente os objectivos antes de se comear a investigar.
A utilizao de relaes empricas em modelos de simulao.
Se conseguirmos construir um modelo que descreva de forma razovel o sistema que pretendemos representar, descrio essa que se concretiza por equaes matemticas correspondentes aos anunciados das premissas que consideramos verdadeiras sobre sistema, ento deveremos conseguir simular o comportamento do sistema sob a aco de diferentes condies ambientais. Os modelos de simulao do crescimento vegetal, por exemplo, desenvolvidos com diversos objectivos, tais como, previso de produes, escolha de cultivares, planeamento de prticas culturais ou melhoramento vegetal, utilizam frequentemente relaes empricas entre o crescimento vegetal e os factores ambientais. Nestas relaes empricas utiliza-se com frequncia a acumulao trmica com base em registos metereolgicos; a disponibilidade de azoto mineral; ou a precipitao e a evapotranspirao para calcular as necessidades de rega. No entanto, geralmente difcil distinguir o papel das interaces entre os vrios factores, o que implica a construo destes modelos com vrios factores. Por outro lado, estabelecem-se vulgarmente relaes empricas entre os factores ambientais e a produo comercial sem que, no entanto, se estabeleam quaisquer relaes entre esses factores ambientais e os fenmenos biolgicos, tais como, a fotossntese, o metabolismo, a translocao e a distribuio dos assimilados, ou sobre a respirao ou a regulao hormonal, processos que determinam a produo. Por isso, difcil optimizar estes modelos com vrios factores ambientais ou aplic-los de forma alargada e grandes reas geogrficas.
Anlise de crescimento
Crescimento o aumento de tamanho do indivduo ou o aumento no nmero de indivduos e, est quase sempre associado com um aumento na complexidade com que o indivduo, ou a comunidade de indivduos, est organizada. Imagine que inocula um meio de cultura com uma nica bactria que acabou de resultar de uma diviso bacteriana, e que quando uma desta bactrias se divide, cada bactria resultante 51
alcana o peso da progenitora. Se considerarmos o peso w da progenitora, obtm-se o peso 2w. Consideremos ainda que o aumento de peso em cada gerao linear. Assim, o tempo que levou a passar do peso w para 2w, ser igual aquele que necessrio para passar de 2w para 4w, e assim sucessivamente. A este tipo de crescimento chamamos exponencial e pode ser representado atravs da seguinte equao matemtica: W = w exp (t) em que, W o peso da cultura no tempo t, w o peso da primeira clula e a constante de crescimento. Se aplicarmos os logaritmos a ambas as partes da equao obtm-se uma relao simples: ln (W)= ln (w) + t At agora considerou-se apenas a situao em que os nutrientes, bem como as restantes condies ambientais, no implicam qualquer restrio ao crescimento bacteriano. Obviamente, o crescimento no pode continuar indeterminadamente. Ou as bactrias esgotaro os nutrientes disponveis no meio, ou produziro suficientes produtos txicos que provocaro o abrandamento do crescimento. Em organismos mais complexos como as plantas e os animais, o nmero de clulas capazes de crescer e de se dividirem diminui com o tempo assim que as clulas se diferenciam e as suas funes biolgicas se tornam mais especficas e restritas. Normalmente, o crescimento das plantas e dos animais diminui assim que o seu tamanho aumenta at, eventualmente, parar o crescimento quando amadurecem. Existem vrias formas de descrever este crescimento. Podemos observar a equao matemtica que descreve as variaes no peso das plantas ou animais com o tempo, sem considerar o sentido biolgico da equao. Por exemplo, podemos descrever estas variaes atravs de um polinmio do tipo: W= a+ bt + ct sem se atribuir qualquer sentido biolgico s constantes a, b, c. Esta descrio emprica do crescimento pode ter vrias utilizaes ao oferecer-nos uma descrio antecipada dos acontecimentos. No entanto, nada nos diz sobre o porqu dos acontecimentos. Podemos, em contrapartida, observar a equao que relaciona, por exemplo, as variaes nas taxas de crescimento da planta ou animal com o seu peso, e, posteriormente tentar perceber as implicaes biolgicas da equao ento utilizada. Neste caso chamamos crescimento relativo. A taxa de crescimento relativo de uma planta ou animal a taxa de crescimento dividida pelo seu peso. Isto , a taxa de crescimento por unidade de peso. Quando uma planta cresce exponencialmente, o peso da planta em qualquer tempo t, Wt, pode ser relacionado com o seu peso inicial no tempo t=0, correspondendo a W0, e a constante de crescimento , da seguinte forma: Wt = W0 exp(t) A taxa de crescimento da planta em qualquer tempo t, dW/dt, pode ser obtida atravs da derivada da equao de crescimento em relao ao tempo da seguinte forma: dW/dt = W0 exp(t) multiplicando ambos os lados da equao por (1/Wt) obtm-se: (dW/dt) / Wt = [W0 exp(t)] / [W0 exp(t)] = A constante de crescimento igual taxa de crescimento relativo da planta. Durante o crescimento exponencial a taxa de crescimento relativo da planta , portanto, constante, mas uma das caractersticas das plantas que quantos maiores so, menores se tornam as suas taxas de crescimento relativo.
52
No estudo da mineralizao do azoto podem-se aplicar modelos como: Nm = N0 (1 e-kt) Em que N0 representa o azoto potencialmente mineralizvel no tempo zero, Nm o azoto mineralizado no tempo t, e k a constante de mineralizao. Este modelo, explica a mineralizao lquida mas no explica a imobilizao (ou mineralizao negativa). Contudo, se expandirmos o modelo para: Nm = N0 [1 exp(-k1t -k2t2)] torna-se possvel prever a mineralizao, mas tambm, quantificar o tempo necessrio para a mineralizao liquida ocorrer, quando exista um fase inicial de imobilizao do azoto, porque s ocorre mineralizao liquida quando Nm positivo, isto , quando: [1 exp(-k1t -k2t2)] > 0 (-k1t -k2t2) < 0