Você está na página 1de 65

LCE 602 - Estatstica Experimental (aulas prticas)

Escola Superior de Agricultura Luiz de Queiroz Departamento de Cincias Exatas - ESALQ/USP Maro de 2002
(verso 3,14159265)

Antonio Augusto Franco Garcia Dcio Barbin Snia Maria De Stefano Piedade

LCE 602 - Estatstica Experimental


Este texto destina-se aos alunos matriculados na referida disciplina, devendo servir como um guia para as aulas prticas, que so realizadas com auxlio do pacote estatstico SAS (Statistical Analysis System), em sua verso 6.12. Propositalmente, os resultados fornecidos pelo pacote no so apresentados, para que o aluno motive-se a executar e estudar os programas aqui apresentados. Recomenda-se que o aluno observe atentamente cada resultado, interpretando-o corretamente. A maioria dos programas discutida nas aulas, e desse modo espera-se que esse material facilite a assimilao do contedo das aulas prticas. A resoluo dos exerccios propostos fundamental para entendimento dos assuntos aqui abordados. Os conjuntos de dados apresentados esto disponveis no site do curso na Internet. Crticas e sugestes, bem como correo de eventuais erros no material, sero bem recebidas.

C ri a o d e d a ta s e t s

Criao de data sets


A seguir, apresentamos diversos programas que ilustram a criao de data sets seguindo as regras do SAS. Esses arquivos tm extenso .SD2 e so apagados automaticamente no final de cada sesso do SAS, sendo gravados no diretrio WORK definido pelo programa. Contudo, isso pode ser alterado pelo usurio, conforme ser apresentado, resultado em data sets permantes. Alguns deles mostram como a entrada incorreta dos dados pode afetar completamente as anlises estatsticas a serem realizadas posteriormente. Lembre-se que cada data set criado deve ser visualizado com auxlio da procedure proc print, que no est includa na maioria dos programas.
data teste1; input trat $ bloco PESO; cards; A 1 100 A 2 130 B 1 99 B 2 145 ; data teste2; input trat $ 1 bloco 3 PESO 5-7; cards; A 1 100 A 2 130 B 1 99 B 2 145 ; data; input trat $ bloco PESO; cards; A 1 100 A 2 130 B 1 99 B 2 145 ; data; input trat $ bloco PESO @@; cards; A 1 100 A 2 130 B 1 99 B 2 145 ; data; do trat='A', 'B';

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

C r i a o d e d a ta s e t s input bloco PESO; output; end; cards; 1 100 1 99 2 130 2 145 ; data; do trat=1 to 2; do bloco=1 to 2; input PESO; output; end; end; cards; 100 130 99 145 ; data; input trat $ bloco PESO; cards; A23456789 1 100 A23456789 2 130 B23456789 1 99 B23456789 2 145 ; data; length trat $ 9; input trat $ bloco PESO; cards; A23456789 1 100 A23456789 2 130 B23456789 1 99 B23456789 2 145 ; data; input trat $ bloco PESO; if bloco <=1 then CONJUNTO=100; else CONJUNTO=200; cards; A 1 100

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

A l te r a e s n o D a t a St e p

A 2 130 B 1 99 B 2 145 ; data; input trat $ bloco PESO; if trat='A' then delete; cards; A 1 100 A 2 130 B 1 99 B 2 145 ; input trat $ bloco PESO; if PESO=100 then PESO=333; cards; A 1 100 A 2 130 B 1 99 B 2 145 ;

Ateno
Note que muitos data sets podem levar a resultados inadequados ou inesperados. Dessa forma, nessa parte do programa, em que estamos aprendendo como o SAS interpreta os dados, devemos observar atentamente como essas instrues devem ser escritas. Exerccio 1
1. 2. 3.

Quantos data sets foram criados? Quais seus nomes e contedos? Indique, dentre os diversos programas apresentados, aqueles em que os data sets criados apresentaram problemas. Mostre como eles podem ser corrigidos.

Alteraes no Data Step


Nos programas apresentados no item anterior, vimos algumas formas de efetuar operaes e/ou alterar os dados no momento da criao dos data sets. Essa parte dos programas, L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l 3

A l te r a e s n o D a ta S te p

denominada Data Step, permite que o usurio defina novas variveis, efetue operaes com as j existentes, etc. A seguir, apresentamos alguns programas que exemplificam essas possibilidades. A primeira linha define opes para as sadas: no apresentar data, no numerar as pginas, apresentar 72 caracteres por linha (linesize).
options nodate nonumber ls=72; data notas; input aluno $ 1-14 sexo $ P1 P2 curso $; media=(P1+2*P2)/3; if media >=5 then result='aprov'; else result='reprov'; cards; Joaquim Silva M 4.9 5.1 AG Pedro Aleixo M 3.8 2.5 AG Ana Maria F 7.8 8.3 FL Helena Souza F 8.4 4.3 AG Mario Pinheiro M 6.4 7.3 FL ; proc print; title 'Dados para verificao'; run; proc sort; by media; run; proc print; title 'Dados ordenados pela mdia final'; run; proc means; title 'Mdia das notas de cada prova'; var P1 P2 media; run;

Tabela 1. O pe r ad o re s a r i tm ti c o s
Ope r ado r ** * / + O pe ra o Exponenciao Multiplicao Diviso Adio Subtrao

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

S i n ta xe g e ra l da s p r oce du r e s d o SAS

Tabela 2. O pe r ad o re s pa r a c o m p a ra e s
Operador Ope r ado r = ^= > >= < <= Signific ado Igual Diferente Maior Maior ou igual Menor Menor ou igual

Exerccio 2
1.

Acrescente dois aos alunos ao conjunto j mencionado:

Carlos Alberto M 3.3 3.6 FL Adriana Souza e Silva F 5.0 4.5 AG


2.

Faa alteraes no programa de forma que os resultados considerem o fato de que, se a mdia final for menor que 5.0, porm maior ou igual a 3.0, o aluno pode realizar uma prova de recuperao.

Dica
Procure entender muito bem a estrutura if-then-else, til para programao.

Sintaxe geral das procedures do SAS


Algumas procedures (procedimentos) do SAS foram apresentadas nos dois itens anteriores. Todas elas tm a seguinte forma geral:
PROC NOMEDAPROCEDURE <lista de opes>; COMANDO / opes do comando; COMANDO / opes do comando;

Podemos obter a sintaxe das procedures do SAS atravs dos menus. Por exemplo, utilizamos a procedure MEANS, cuja sintaxe (usando Help / SAS System Help: Main Menu / Modeling and Analysis Tools / Data Analysis / MEANS):

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

S i n ta xe ge r a l d as p r oce d u r e s do SAS

PROC MEANS <option-list> <statistic-keyword-list>; VAR variable-list; BY variable-list; CLASS variable-list; FREQ variable; WEIGHT variable; ID variable-list; OUTPUT <OUT= SAS-data-set> <output-statistic-list> <MINID|MAXID <(var-1<(id-list-1)> <...var-n<(id-list-n)>>)>=name-list>;

Outras procedures muito usadas:


PROC SORT DATA= SAS-data-set OUT= SAS-data-set NODUPLICATES|NODUPREC|NODUP NODUPKEY EQUALS|NOEQUALS REVERSE FORCE ASCII EBCDIC DANISH|NORWEGIAN FINNISH|SWEDISH NATIONAL SORTSEQ= collating-sequence SORTSIZE= memory-specification TAGSORT Host Options; BY <DESCENDING> variable ... ; PROC PRINT DATA= SAS-data-set DOUBLE NOOBS UNIFORM LABEL SPLIT= 'split-character' N ROUND HEADING= direction ROWS= page-format WIDTH= column-width; VAR variable-list; ID variable-list; BY variable-list; PAGEBY BY-variable; SUMBY BY-variable;

/* required */

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E s ta t s ti ca d e scr i ti va

SUM variable-list;

Exemplo 1 - Apresentamos a seguir dados de altura de plantas de milho obtidas em dois experimentos (ex1 e ex2, ver aula terica). Calcular, para cada um deles, a varincia, o desvio padro, o erro-padro da mdia, o coeficiente de variao, a mdia (com intervalo de confiana).
data teor2; input ex1 ex2; datalines; 203 203 208 198 198 199 200 200 202 201 192 202 197 197 ; proc print; title 'Dados usados na aula terica'; run; proc means var std stderr cv mean clm; title 'Estatsticas de interesse'; run;

Estatstica descritiva
Uma forma de obter diversas estatsticas, incluindo testes para normalidade, grficos ramoe-folhas, etc, com uso da proc univariate, cuja sintaxe :
PROC UNIVARIATE DATA= SASdataset NOPRINT PLOT FREQ NORMAL PCTLDEF= value VARDEF= DF|WEIGHT|WGT|N|WDF ROUND= roundoff unit...; VAR variables; BY variables;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E s ta t s ti ca d e s cri t iv a FREQ variable; WEIGHT variable; ID variables; OUTPUT OUT= SASdataset keyword= names...;

Exemplo 2 - Dados de pesos de colmos de uma certa variedade de cana-de-acar. Calcular a mdia e a varincia, construir o grfico ramo-e-folhas e um histograma, testar se os dados tm distribuio normal (dados disponveis no arquivo EXEMP2.TXT). Interpretar os demais resultados.
data pratica; input PESO@@; cards; 16.89 11.84 15.21 17.90 14.60 18.94 16.65 15.73 18.19 16.04 12.03 14.00 15.30 15.49 13.47 16.83 12.14 17.69 17.03 16.44 ;

18.69 17.38 16.72 16.86 15.72 14.74 11.53 15.47 12.54 13.58

16.51 12.56 14.41 17.87 16.68 16.68 19.13 11.63 18.73 10.46

18.97 13.73 13.23 15.45 17.76 12.39 15.01 16.22 17.02 16.89

proc univariate normal plot; title 'Estatstica descritiva'; run; proc chart; title 'Histograma'; vbar PESO; run;

Nota:
A procedure chart permite a construo de grficos de baixa resoluo. No caso, utilizou-se o comando vbar (barras verticais), sendo tambm possvel o emprego do comando hbar (barras horizontais). A sintaxe da PROC CHART :
PROC CHART DATA= SAS-data-set LPI= p FORMCHAR (index list) = 'formchar-string'; BY <variable-list>;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Ve r i fi c a n do a s p re s su p o si e s do m o d e lo

VBAR variable-list </ <option-list>>; HBAR variable-list </ <option-list>>; BLOCK variable-list </ <option-list>>; PIE variable-list </ <option-list>>; STAR variable-list </ <option-list>>;

Exerccio 3
1. 2.

Alterar (com programao) um dos dados do peso de cana-de-acar para 5.0 kg, simulando um valor discrepante (ou outlier). Fazer uma anlise exploratria desses dados, interpretando os resultados.

Verificando as pressuposies do modelo


Apresentaremos a seguir programas que ilustram a possibilidade de verificar trs das quatro pressuposies assumidas para realizao da anlise de varincia (questes 3, 5 e 6 abaixo). O teste de no-aditividade do modelo ser apresentado no captulo 9. Exemplo 3 - Um pesquisador pretende comparar 4 variedades de pssego quanto ao enraizamento de estacas (ver aula terica), instalado segundo o delineamento inteiramente ao acaso (arquivo EXEMP3.TXT). 1. Fazer uma anlise exploratria dos dados de cada tratamento separadamente. 2. Construir um grfico da disperso dos dados para cada tratamento. 3. Verificar se h homogeneidade de varincias. 4. Verificar se h presena de valores discrepantes atravs da anlise de resduos. 5. Testar se os resduos tm distribuio normal. 6. Verificar se os resduos so independentes. 7. Testar a hiptese de igualdade das mdias dos tratamentos.
options nodate nonumber ps=60 ls=72; data exemp3; input trat ESTACAS; cards; 1 2 1 2 1 1 1 1 1 0 2 1 2 0

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Ve r i fi ca n do a s p re s su p o si e s d o m od e l o 2 2 2 3 3 3 3 3 4 4 4 4 4 ; 0 1 1 12 10 14 17 11 7 9 15 8 10

proc print; title 'Dados para verificao'; run; proc sort; by trat; run; proc print; title 'Dados ordenados por tratamento'; run; title 'Anlise exploratria com box-plot - questo 1'; proc univariate normal plot; by trat; var ESTACAS; run; title 'Disperso dos dados para cada tratamento - questo 2'; proc plot; plot ESTACAS*trat; run; title 'Verificao de homog. de varincias (Hartley)- questo 3'; proc means mean var CV; by trat; var ESTACAS; run; title 'ANAVA sem transformao, para obteno dos res. padronizados'; proc glm; class trat; model ESTACAS = trat; output out=RESIDUOS PREDICTED=PREDITOS RESIDUAL=RESIDUOS STUDENT=RES_PAD;

10

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Ve r i fi c a n do a s p re s su p o si e s do m o d e lo

run; title 'Exame dos resduos - valores discrepantes'; proc print data=RESIDUOS; run; proc univariate data=RESIDUOS normal plot; title 'Valores discrepantes, teste de normalidade'; var RESIDUOS; run; title 'Grfico dos resduos padronizados - independncia'; proc plot; plot RES_PAD*PREDITOS; run; title 'Anlise de varincia sem transf. (iguald. trat.) - questo4'; proc anova; class trat; model ESTACAS = trat; means trat;/* solicita o clculo das mdias por tratamento*/ run;

Comentrios:
1.

O data set EXEMP3.SD2 foi criado sem usar recursos de programao. Evidentemente, o leitor pode usar outras formas que lhe sejam convenientes, como por exemplo:

data exemp3; do trat=1 to 4; input ESTACAS @; output; end; cards; 2 1 12 7 2 0 10 9 1 0 14 15 1 1 17 8 0 1 11 10 ; proc print; title 'Outra forma de criar o data set'; run;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

11

Ve r i fi ca n do a s p re s su p o si e s d o m od e l o

claro que os programas apresentados continuam vlidos. 2. O comando by requer que os dados estejam ordenados para a varivel que ser colocada aps esse comando. Caso isso no tenha ocorrido, pode-se antes aplicar a PROC SORT para conseguir tal ordenao. 3. O comando OUTPUT OUT=RESIDUOS, includo na proc glm, solicitou a criao de um data set com o nome RESIDUOS. Esse data set contm apenas as variveis solicitadas: valores preditos (PREDICTED=PREDITOS), resduos associados a cada observao (RESIDUAL=RESIDUOS) e resduos padronizados (STUDENT=RES_PAD). Os nomes colocados aps o sinal de igual so arbitrrios, tomados de forma a facilitar sua identificao. 4. Note que a PROC PRINT, a PROC MEANS e a PROC UNIVARIATE da ltima parte do programa continham o nome das variveis para as quais esses procedimentos devem ser executados (aps o comando VAR).

Algumas procedures usadas:


PROC ANOVA DATA= SAS-data-set MANOVA MULTIPASS OUTSTAT= SAS-data-set; CLASS variables; MODEL dependents=effects / options; ABSORB variables; BY variable-list; FREQ variable; MANOVA H= effects E= effect M= equations... MNAMES= names PREFIX= name / options; MEANS effects / options; REPEATED factorname levels(levelvalues) transformation<,...> / options; TEST H= effects E= effect; PROC GLM options ; CLASS variable-list; MODEL dependents= independents / options; ABSORB variable-list; BY variable-list; FREQ variable; ID variable-list; WEIGHT variable; CONTRAST 'label' effect values... / options; ESTIMATE 'label' effect values... / options; LSMEANS effects / options; MANOVA H= effects E= effect M= equations... MNAMES= names PREFIX= name / options; MEANS effects / options; OUTPUT OUT= SAS-data-set keywords= names... ; RANDOM effects / options; REPEATED factorname levels (levelvalues)

/* required */ /* required */

/* required */

12

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Tr a ns fo rm a o d e da d o s

transformation<,...> / options; TEST H= effects E= effect / options;.

Exerccio 4 Um pesquisador deseja comparar 12 novos meios de cultura quanto ao desenvolvimento do fungo Metharizium anisopliae, usado no controle biolgico da cigarrinha das pastagens. Para tanto, instalou um experimento segundo o delineamento inteiramente casualizado, com 4 repeties, e mediu o crescimento do fungo atravs do dimetro das colnias. Baseando-se nos dados da Tabela 1 (arquivo EXERC4.TXT), pede-se: 1. Fazer uma anlise exploratria dos dados para cada tratamento. 2. Testar a hiptese de igualdade das mdias dos tratamentos com um nvel de significncia de 5% (anlise de varincia), sem transformao de dados. 3. Refazer o item anterior manualmente, indicando os clculos envolvidos. 4. Verificar a pressuposio de homogeneidade de varincias, atravs do teste do F mximo e do grfico dos resduos padronizados x valores estimados. 5. Verificar a pressuposio de normalidade dos resduos, atravs de anlises grficas e do teste de Shapiro-Wilk (proc univariate). Tabela 3. D i m e tr o d a s c o l ni a s .
Tra tame n to s Meio 1 Meio 2 Meio 3 Meio 4 Meio 5 Meio 6 I 0,31 0,82 0,43 0,45 0,29 0,92 II 0,45 1,10 0,45 0,71 0,40 0,61 I II 0,46 0,88 0,63 0,66 0,23 0,49 IV 0,43 0,72 0,76 0,62 0,36 1,24 Tr at ame nt os Meio 7 Meio 8 Meio 9 Meio 10 Meio 11 Meio 12 I 0,44 0,56 0,22 0,30 0,23 0,30 II 0,35 1,02 0,21 0,37 0,25 0,36 III 0,31 0,71 0,18 0,38 0,24 0,31 IV 0,40 0,38 0,23 0,29 0,22 0,33

Fo nte: Modifi ca do de Barbos a, J.C. 1984

Transformao de dados
Antes de apresentarmos exemplos sobre transformao de dados, vejamos como os comandos SET e MERGE podem auxiliar para realizarmos alteraes em data sets existentes.
data exp1; input local $ var $ alt_plt; datalines;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

13

Tr a ns fo rm a o d e d a do s Pirac Pirac Pirac Pirac ; M N O P 185 196 200 189

data exp2; input local $ var $ alt_plt; datalines; Araras P 180 Araras O 176 Araras N 177 Araras M 182 ; data tudo1; set exp1 exp2; run; proc print data=tudo1; title 'Comando SET'; run; data exp3; input var $ alt_plt; datalines; M 185 N 196 O 200 P 189 ; data exp4; input var $ alt_esp; datalines; P 80 O 76 N 77 M 82 ; proc sort data=exp3; by var; run; proc sort data=exp4; by var; run; data tudo2; merge exp3 exp4;

14

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Tr a ns fo rm a o d e da d o s

by var; pos_rel=alt_esp/alt_plt; run; proc print; title 'Comando MERGE'; run;

Ateno:
1.

2.

Verifique atentamente a possibilidade de inserir instrues em data sets j criados, como foi feito na obteno da varivel pos_rel, criada a partir dos data sets exp3 e exp4. Foi necessrio ordenar os data sets exp3 e exp4 com o uso da proc sort, antes de executar o comando MERGE.

Veremos agora como alterar um data set criado com uso do comando INFILE, que permite a leitura de arquivos com extenso .PRN, gravados em algum diretrio de interesse. Arquivos com essa extenso so do tipo texto formatado (separado por espaos). O arquivo usado denominado PRATICA4.PRN (disponvel no site) e refere-se ao exemplo 3. Evidentemente, o diretrio deve ser alterado para a situao especfica. A forma de obter qual transformao pode ser aplicada ser apresentado futuramente.
data aula4; infile 'O:\AUGUSTO\PRATICA4.PRN'; input trat $ ESTACAS; run;

A transformao desejada pode ser obtida da seguinte forma:


title 'Anlise com transformao'; data aula5; set aula4; EST_TRAN=SQRT(ESTACAS+0.5); run; title 'Dados transformados - raiz quadrada (SQRT)'; proc print; run; title 'Anlise de varincia dos dados transformados'; proc glm data=aula5; class trat; model EST_TRAN=trat;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

15

Tr a ns fo rm a o d e d a do s output out=RES_TRAN PREDICTED=PREDITOS RESIDUAL=RESTRANS STUDENT=RESTPAD; run; title 'Resduos dos dados transformados'; proc print data=RES_TRAN; run; proc plot; plot RESTPAD*PREDITOS; run; proc univariate normal plot; var RESTPAD; run;

Nota:
Algumas funes do SAS muito teis para efetuar transformao de dados so (x=argumento): SQRT(X) (raiz quadrada), LOG(X) (logaritmo neperiano), LOG10(X), ARSIN(X) (arco-seno).

Transformao estabilizadora da varincia


Realizada com base na regresso linear log ( ) = log + log , ou seja, entre o logaritmo da varincia e o logaritmo da mdia. O valor do (coeficiente angular) determinar a transformao a ser realizada (Tabela 4). :
2

16

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Tr a ns fo rm a o d e da d o s

Tabela 4. T r an sfor m a e s es ta biliz a dor a s d a va r i ncia


Rela o e nt re a var i n cia
2 ( Y ) 2

e a m dia ( )

0 1 2 3

= 1 -2
1 1/2 0 -1/2

Tr an sf or ma o

y = y

Obs e rv a o

Y constante Y Y Y Y
2 2 2 2 1

nenhuma

y = y
*

12

Dados de contagem (Poisson)

y = log y y = y y = y
* * * 1 2

1= -----y

4 -

-1 -

1 = -y
Dados com dist. binomial expressos como fraes (0 y 1 )

y = arcsen y

Fo nte: Mont gom ery, D.C. (1991) D e sign and a nalysis of experiment s

Exemplo 4 - Aplicando essa metodologia para estudar a transformao dos dados de enraizamento de estacas (exemplo 3), fazendo inicialmente o teste do F mximo, teremos:
options nodate nonumber ps=60 ls=72; data exemp4; input trat $ ESTACAS; cards; A 2 A 2 A 1 A 1 A 0 B 1 B 0 B 0 B 1 B 1 C 12 C 10 C 14 C 17 C 11 D 7 D 9 D 15 D 8 D 10 ;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

17

Tr a ns fo rm a o d e d a do s

title 'Anlise de varincia e resduos'; proc glm; class trat; model ESTACAS = trat; output out=residuos PREDICTED=PREDITOS RESIDUAL=RESIDUOS STUDENT=RES_PAD; run; title 'Exame dos resduos'; proc print data=residuos; run; title 'Verificao da normalidade (Shapiro-Wilk), anlise grfica'; proc univariate normal plot; var RES_PAD; run; title 'Teste do F mximo - Hartley'; proc means noprint data=residuos; var ESTACAS; by trat; output out=var_med MEAN=MEDIA VAR=VARIANC; run; data fmax; set var_med; run; proc means noprint data=fmax; var VARIANC; output out=razao MIN=VMIN MAX=VMAX; run; data hartley; set razao; FMAX=VMAX/VMIN; run; title 'Valor do F mximo'; proc print data=hartley; var VMIN VMAX FMAX; run; title 'Anlise grfica dos resduos - independncia'; proc plot data=residuos; plot RES_PAD*PREDITOS; run; title 'Seleo emprica da transf. estabilizadora da varincia'; data transf; set var_med;

18

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

Tr a ns fo rm a o d e da d o s

LMEDIA=LOG(MEDIA); LVAR=LOG(VARIANC); run; title 'Obteno dos valores de alfa e beta usando regresso'; proc reg data=transf; model LVAR=LMEDIA; run; title 'Grfico LOG(media) vs LOG(varincia)'; proc plot; plot LVAR*LMEDIA; run; title 'Anava com transformao'; data anava; set exemp4; ESTAC_T=(ESTACAS)**(0.5); run; proc glm data=anava; class trat; model ESTAC_T=trat; output out=RESTRAN PREDICTED=PRED_T STUDENT=RES_T; run; title 'Anlise de resduos dos dados transformados'; proc univariate normal plot data=RESTRAN; var RES_T; run; proc plot data=RESTRAN; plot RES_T*PRED_T; run;

Notas
1.

2.

A forma usada para clculo do F mximo mais trabalhosa que a apresentada no captulo 5, mas permite a obteno da razo diretamente, embora tambm seja necessrio o uso da tabela. Foram criados diversos data sets, com os seguintes nomes e contedos: EXEMP4: dados originais RESIDUOS: valores preditos, resduos e resduos padronizados VAR_MED: mdias e varincias por tratamento FMAX: o prprio data set var_med HARTLEY: clculo do F mximo, maior e menor varincia TRANSF: logaritmos da mdias e das varincias L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l 19

Te s te s d e c om p a ra e s m l ti p l a s

ANAVA: dados transformados RESTRAN: valores preditos e resduos padronizados dos dados transformados 3. Utilizou-se a PROC REG, cuja sintaxe
PROC REG options; label: MODEL dependents= regressors / <options>; BY variable-list; FREQ variable; ID variable; VAR variable-list; ADD variable-list; DELETE variable-list; REWEIGHT <condition|ALLOBS> </options> | <STATUS|UNDO>; WEIGHT variable; label: MTEST <equation1, ... equationk / options>; OUTPUT OUT= SAS-data-set keyword= names ...; PAINT <condition|ALLOBS> </options> | <STATUS|UNDO>; PLOT <yvariable1*xvariable1> <=symbol1>,... <yvariablek*xvariablek> <=symbolk> </options>; PRINT <options ANOVA MODELDATA>; REFIT; RESTRICT equation1, ... equationk; label: TEST equation1, ... equationk / option;

Exerccio 5
1. 2. 3.

Obtenha a transformao estabilizadora da varincia adequada para os dados do exerccio 4. Refaa a anlise de varincia usando essa transformao. Analise os resduos dos dados transformados. As pressuposies de homogeneidade de varincias, independncia e distribuio normal dos resduos esto satisfeitas?

Testes de comparaes mltiplas


Ainda considerando o mesmo exemplo:
options nodate nonumber ps=60 ls=72; data exemp4b; input trat $ ESTACAS@@; ESTAC_T=(ESTACAS)**(0.5); cards; A 2 A 2 A 1 A 1 A 0

20

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os i n te ir a m e nt e a o a ca so c om n m e ro d i fe r e n te de re p e ti e s p or t ra ta m e n to

B 1 C 12 D 7 ;

B 0 C 10 D 9

B 0 C 14 D 15

B 1 C 17 D 8

B 1 C 11 D 10

proc glm; title 'Anlise de variancia dos dados transformados, com testes'; class trat; model ESTAC_T=trat; means trat / tukey; means trat / tukey alpha=0.01; means trat / duncan; means trat / duncan alpha=0.01; contrast 'A_B vs C_D' trat 1 1 -1 -1; contrast 'A vs B' trat 1 -1 0 0; contrast 'C vs D' trat 0 0 1 -1; run;

Nota:
1. 2.

Note que usamos o mesmo data set, criado aqui de outra forma. O SAS possui diversas opes que podem ser includas aps o comando means (no caso, usamos Tukey e Duncan, com nveis alpha=0.05 - default - e 0.01, alm dos contrastes):
BON DUNNETT GABRIEL NOSORT SMM | GT2 WELCH CLDIFF DUNNETTL HOVTEST= REGWF SNK CLM DUNNETTU HTYPE= REGWQ T | LSD DEPONLY E= KRATIO= SCHEFFE TUKEY

ALPHA= DUNCAN ETYPE= LINES SIDAK WALLER

Ensaios inteiramente ao acaso com nmero diferente de repeties por tratamento


Seguindo o que foi apresentado no texto bsico desse curso, consideraremos que houve perda de 3 parcelas. Devemos codificar esses valores no data set atravs de pontos (.), um para cada valor perdido. O data step pode ser:
options nodate nonumber ps=60 ls=72; data parcper; input trat $ ESTACAS;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

21

E n sa i o s i n te i r a me nt e a o a cas o co m n m e ro d i fe r e n te de re p e t i e s p o r tr at a m e nt o datalines; A A A A A B B B B B C C C C C D D D D D ;

2 2 1 . 0 1 0 0 1 1 12 10 14 . . 7 9 15 8 10

Podemos proceder a anlise normalmente, como feito anteriormente. Aplicaremos (pelas razes j discutidas) a transformao y + 0, 5 . A anlise dos resduos pode ser feita normalmente, da mesma maneira. Vale lembrar que essa notao para observaes perdidas tambm pode ser usada para eliminar dados discrepantes, detectados pela anlise dos resduos.
title 'Anlise de varincia e resduos'; proc glm; class trat; model ESTACAS = trat; output out=residuos PREDICTED=PREDITOS RESIDUAL=RESIDUOS STUDENT=RES_PAD; run; title 'Exame dos resduos'; proc print data=residuos; run; title 'Verificao da normalidade (Shapiro-Wilk), anlise grfica'; proc univariate normal plot; var RES_PAD; run; title 'Anlise grfica dos resduos';

22

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os i n te ir a m e nt e a o a ca so c om n m e ro d i fe r e n te de re p e ti e s p or t ra ta m e n to

proc plot; plot RES_PAD*PREDITOS; run; title 'Teste do F mximo - Hartley'; proc means noprint data=residuos; var ESTACAS; by trat; output out=var_med MEAN=MEDIA VAR=VARIANC; run; proc print data=var_med; run; data fmax; set var_med; run; proc means noprint data=fmax; var VARIANC; output out=razao MIN=VMIN MAX=VMAX; run; data hartley; set razao; FMAX=VMAX/VMIN; run; title 'Valor do F mximo'; proc print data=hartley; var VMIN VMAX FMAX; run; title 'Seleo emprica da transf. estabilizadora da varincia'; data transf; set var_med; LMEDIA=LOG(MEDIA); LVAR=LOG(VARIANC); run; title 'Obteno do valor de alfa'; proc reg data=transf; model LVAR=LMEDIA; run; title 'Grfico LOG(media) vs LOG(varincia)'; proc plot; plot LVAR*LMEDIA; run; title 'Anava com transformao'; data anava; set pratica7; ESTAC_T=(ESTACAS+0.5)**(0.5); run;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

23

E n sa i o s i n te i r a me nt e a o a cas o co m n m e ro d i fe r e n te de re p e t i e s p o r tr at a m e nt o proc glm data=anava; class trat; model ESTAC_T=trat; output out=RESTRAN PREDICTED=PRED_T STUDENT=RES_T; run; title 'Anlise de resduos dos dados transformados'; proc univariate normal plot data=RESTRAN; var RES_T; run; proc plot data=RESTRAN; plot RES_T*PRED_T; run; title 'Testes de Tukey - desbalanceado'; proc glm data=anava; class trat; model ESTAC_T=trat; means trat / tukey; means trat / tukey lines; /*Opes para Tukey, escolher uma*/ lsmeans trat / adjust=tukey PDIFF=all; run;

Notas:
1.

2.

A ltima linha de comando permite a obteno de mdias de mnimos quadrados para o efeito trat. possvel associ-la opo ADJUST, em que so feitos ajustes para os nveis de significncia das comparaes mltiplas. PDIFF solicita a impresso dos nveis de significncia (p-values). Quando h nmero diferente de repeties por tratamento, o SAS usa a mdia harmnica do nmero de repeties de cada tratamento para determinar a diferena mnima significativa, se for usada a opo LINES (ver final do programa).

Exerccio 6 Um ensaio visando verificar a micropropagao do capim limo sob diferentes nveis de BAP foi conduzido, segundo o delineamento inteiramente casualizado (dados no arquivo EXERC6.SAS).

24

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i o s e m bl o co s ca sua l i za d o s

Tabela 5. N m e ro d e b r o t o s p o r p er f i l h o , e m me i o s c o m d i f er e nt es n v e i s d o r eg u l a d o r d e c r es c i m en t o B A P, 30 d i a s a p s a i n tr o d u o d o p er f i l h o n o m e i o .
Nveis de BAP I: 0,5 mg II: 1,0 mg III: 2,0 mg IV: 3,0 mg 3 4 2 9 4 2 4 Nmer N mer o de br ot os 1 2 3 2 2 7 2 5 4 6 7 10

Fo nte: Ada ptado de Latado, R.R. ( 1999) - CENA/USP

Pede-se: 1. Fazer a anlise de varincia para a varivel nmero de brotos. Apresentar o quadro da forma usual. 2. Testar se os resduos tm distribuio normal. 3. Representar os resduos num grfico de caixa (box-plot) e num diagrama ramo-efolhas. 4. Verificar se h dados discrepantes, pela anlise dos resduos. 5. Fazer um grfico dos valores preditos vs resduos padronizados. Verificar se h indcios da necessidade de transformao dos dados. 6. Testar se h homogeneidade de varincias pelo teste do F mximo. 7. Fazer uma regresso linear entre o logaritmo das mdias e o logaritmo das varincias. H relao linear entre elas? Em caso afirmativo, qual o valor de deve ser usado para aplicar a transformao estabilizadora da varincia? Qual transformao sugerida? 8. Refazer a anlise de varincia (com teste de Tukey) e dos resduos usando a transformao proposta (se necessrio). Verificar se ela foi efetiva.

Ensaios em blocos casualizados


Veremos a seguir um exemplo de anlise de um experimento instalado no delineamento blocos ao acaso. Os programas permitem tambm a verificao de algumas pressuposies da anlise de varincia. Exemplo 5 - Um pesquisador deseja estudar o comportamento de nove porta-enxertos para a laranjeira Valncia: Tangerina Sunki (1), Limo rugoso nacional (2), Limo rugoso da Flrida (3), Tangerina Clepatra (4), Citrange-troyer (5), Trifoliata (6), Tangerina cravo (7), Laranja caipira (8) e Limo cravo (9). Foram medidos dados de produo aos 12 anos de idade (detalhes na aula terica). O data set pode ser criado da seguinte maneira (arquivo EXEMP5.SAS): L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l 25

E n sa i o s e m bl oc os c a s u al i z a do s

options nodate nonumber ps=60 ls=78; proc format; value trat 1='Tangerina sunki' 2='Limo rugoso nacional' 3='Limo rugoso da Flrida' 4='Tangerina Clepatra' 5='Citrange-troyer' 6='Trifoliata' 7='Tangerina cravo' 8='Laranja caipira' 9='Limo cravo'; run; data exemp5; do trat=1 to 9; do bloco=1 to 3; input PRODUCAO@; output; end; end; format trat trat.; datalines; 145 155 166 200 190 190 190 175 186 180 160 156 206 165 170 250 271 230 ;

183 186 208 130 160 130 164 190 193

proc print; title1 'Dados para verificao'; title2 '(uso da proc format)'; run;

Nota:
Aproveitamos o exemplo para introduzir o uso da PROC FORMAT, que pode ser muito til para a identificao dos tratamentos, dentre outras aplicaes. Sua sintaxe :
PROC FORMAT CNTLIN= SAS-data-set CNTLOUT= SAS-data-set FMTLIB LIBRARY= libref<.catalog-name> MAXLABELEN= n MAXSELEN= n NOREPLACE NOTSORTED

26

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i o s e m bl o co s ca sua l i za d o s

PAGE; VALUE name <(format-option-list)> range-='formatted-value-1' <...range-n='formatted-value-n'>; PICTURE name <(format-option-list)> range-1='picture-1' <(picture-option-list)> <...range-n='picture-n' <(picture-option-list-n)>>; INVALUE name <(informat-option-list)> <'>range1<'> =informattedvalue-1 <...<'>range-n<'>=informatted-value-n>; SELECT entry_list; EXCLUDE entry_list;

A seguir, da mesma forma que para exemplos anteriores, verificaremos se h homogeneidade de varincias pelo teste do F mximo de Hartley. Para o exemplo em questo, o valor tabelado com k = 9 e v = 2 (5%) F = 475 .
title1 'Teste do F mximo - Hartley'; title2; proc glm noprint; class trat bloco; model PRODUCAO = trat bloco; output out=RESIDUOS residual=residuo student=res_pad predicted=preditos; run; proc means noprint data=RESIDUOS; var residuo; by trat; output out=VARIANC var=varian; run; proc means noprint data=VARIANC; var varian; output out=RAZAO MIN=VMIN MAX=VMAX; run; data hartley; set razao; FMAX=VMAX/VMIN; run; proc print; run;

Note que foi usada a opo NOPRINT na PROC GLM e na PROC MEANS, com o objetivo de evitar sadas desnecessrias nesse ponto da anlise. O teste de Shapiro-Wilk para a normalidade dos resduos pode ser feito da seguinte maneira:
title 'Teste de normalidade dos residuos'; proc univariate normal plot data=residuos;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

27

E n sa i o s e m bl oc os c a s u al i z a do s var residuo; run;

A independncia dos resduos pode ser verificada graficamente com o seguinte programa:
title 'Independncia dos resduos'; proc plot data=residuos; plot res_pad*preditos; run;

Teste de no-aditividade de Tukey (1 gl)


Agora, apresentaremos um programa que permite fazer o teste de no-aditividade do modelo de Tukey, com 1 grau de liberdade.
title 'Aditividade do modelo'; proc means data=exemp5 nway noprint; class trat; var PRODUCAO; output out=trat_m mean=medtrat; run; proc means data=exemp5 nway noprint; class bloco; var PRODUCAO; output out=bloco_m mean=medbloco; run; proc means data=exemp5 nway noprint; var PRODUCAO; output out=geral_m mean=medgeral; run; proc sort data=exemp5; by trat; run; data temp1; merge exemp5 trat_m; by trat; run; proc sort data=exemp5; by bloco;

28

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i o s e m bl o co s ca sua l i za d o s

run; data temp2; merge exemp5 bloco_m; by bloco; run; data temp3; set geral_m; do trat=1 to 9; /*CUIDADO*/ do bloco=1 to 3; /*CUIDADO*/ output; end; end; run; proc sort data=temp1; by trat bloco; proc sort data=temp2; by trat bloco; proc sort data=temp3; by trat bloco; run; data tudo; merge temp1 temp2 temp3; by trat bloco; keep trat bloco PRODUCAO medtrat medbloco medgeral; run; data tudo2; set tudo; tratest=medtrat-medgeral; blocoest=medbloco-medgeral; keep trat bloco PRODUCAO tratest blocoest; run; proc print; title1 'Valores para Tukey 1 gl no-aditividade'; run; proc glm data=tudo2; title1 'Anlise de varincia'; title2 'com Tukey 1 gl para no-aditividade'; title3 'OBS: considerar apenas tratest*blocoest'; class trat bloco; model PRODUCAO = trat bloco tratest*blocoest/SS3; output out=tukey_p predicted=tukeypre; run; proc plot; title1; title2;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

29

E n sa i o s e m bl oc os c a s u al i z a do s title3; plot tukeypre*tratest/vpos=40; run;

Finalmente, aps verificar que as pressuposies da anlise foram atendidas, podemos realizar a anlise de varincia com o teste de Tukey.
title 'Anlise de varincia - teste de Tukey'; title2; title3; proc glm data=exemp5; class trat bloco; model PRODUCAO=trat bloco; means trat/tukey; run;

Ateno
1.

2.

Percebe-se que o modelo matemtico considerado foi y ij = m + t i + b j + e ij , diferente dos exemplos referentes ao delineamento inteiramente ao acaso. Isso faz que os comandos CLASS e MODEL, na PROC GLM, sejam acrescidos desse novo efeito considerado no modelo. muito importante que isso seja observado, uma vez que o SAS realizaria a anlise (erroneamente) mesmo que indicssemos incorretamente o modelo. Desse modo, muito importante que verifiquemos atentamente qual foi o delineamento empregado, para indicar ao SAS o modelo adequado. A aditividade do modelo foi testada, o que no havia sido feito nos exemplos anteriores. A elaborao do programa est alm dos objetivos desse curso, mas ele pode ser usado em situaes reais, apenas alterando o nmero de tratamentos e blocos.

Exerccio 7 Um experimento de competio de variedades de cana-de-acar foi conduzido em 1999, com a finalidade de verificar qual(is) delas pode(m) ser recomendadas para plantio (arquivo: EXERC7.XLS). Para tanto, foi conduzido um experimento em blocos ao acaso. Pede-se: 1. Verificar se os resduos tm distribuio normal. Represent-los num diagrama ramoe-folhas e num grfico de caixas. 2. Verificar graficamente se h independncia dos resduos. 3. Testar se h homogeneidade de varincias pelo teste do F mximo. 4. Fazer o teste de no-aditividade do modelo.

30

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os e m bl oc os cas u a l i za d os co m p a r ce l a s p e r di d a s

5. 6. 7.

Observar os resduos padronizados e verifique se h algum(ns) valores discrepantes. Em caso afirmativo, elimin-lo(s) e refazer os itens 1 a 4. H necessidade de realizar tranformao dos dados? Em caso afirmativo, qual seria a transformao indicada? Fazer a anlise de varincia, tranformando os dados se necessrio. Recomendar a(s) variedade(s) mais produtivas para plantio, com base no teste de Tukey.

Tabela 6. Pr o d u o d e ge n ti po s d e c a na -d e -a c ar e m to n /h a nu m e n sa i o em b l o c o s a o ac a s o .
Gen Gen tipo RB72454 RB835054 RB835486 RB845210 RB845257 RB855002 RB855036 RB855113 RB855453 RB855536 RB855546 RB855584 RB865230 bloc bl oc o I 147,857 138,571 121,429 150,000 159,286 127,143 172,143 161,429 136.429 148,571 159,286 160,714 177,143 b l oc o II 141,429 134,286 128,571 128,571 149,286 137,857 157,857 150,714 132,143 142,857 144,286 162,143 172,143 b lo c o III 141,429 137,143 127,857 140,000 156,429 137,143 161,429 150,714 134,286 137,857 158,571 165,714 176,429 bl oc o IV 143,571 130,714 114,286 138,571 141,429 127,143 145,714 156,429 125,000 142,857 156,429 160,714 169,286

Fo n te : Pro gr ama de M e lho r ame n to Ge n tico d a Can a- de - a c ar (PM GCA) , UF SCar, Araras . 2000

10

Ensaios em blocos casualizados com parcelas perdidas


Antes de iniciarmos a anlise desse tipo de experimento, veremos como criar data sets permanentes. Vale lembrar que, at o momento, criamos data sets que so automaticamente apagados pelo SAS sempre que uma sesso se encerra. Dessa forma, caso desejemos mant-los, devemos torn-los permanentes. Essa abordagem muito comum em publicaes sobre o SAS, sendo tambm muito usada por usurios avanados para a troca de arquivos. A obteno desses arquivos possvel com o uso do comando LIBNAME, seguido de um nome que identificar o diretrio que conter o data set permanente, e depois do caminho indicando onde o arquivo ser gravado. Por exemplo,

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

31

E n sa i o s e m bl oc os c a s u al i z a do s c om p a rce l a s p e rd i da s

libname local 'O:\augusto\';

cria a libname com nome local, especificando o diretrio O:\augusto\, no qual gravamos diversos arquivos teis nesse curso. evidente que o leitor pode alterar esse diretrio da forma que lhe for mais conveniente, como por exemplo, C:\Meus Documentos\Estatstica Experimental\Programas no SAS\ Datasets permanentes\. Agora, basta especificar os data sets que sero permanentes, incluindo o nome da libname antes do nome do data set:
data local.pratica9;

Este comando criar um data set de nome pratica9, gravado no diretrio O:\AUGUSTO\ e que no ser apagado no final da sesso. O nome do data set permanente definido aps o ponto, sendo a parte anterior (local, no caso) o nome da libname. Os data sets permanentes tm extenso .SD2 e s podem ser lidos no prprio SAS (no so arquivos do tipo texto). Uma vez que esses arquivos esto prontamente disponveis, podemos iniciar a prxima sesso do SAS com o seguinte procedimento (sem ser necessrio criar novamente os data sets):
libname local 'O:\augusto\'; proc print data=local.pratica9; title 'Dados para verificao'; run;

Notas:
1.

2.

Esse tipo de arquivo permanente muito til quando a criao do data set correto muito laboriosa, sendo possvel retomar a anlise em sesses posteriores com os arquivos j criados. Lembre-se que os usurios da rede do Departamento de Cincias Exatas no tm permisso para gravar arquivos no drive O:\AUGUSTO\ e, portanto, os programas aqui apresentados devem ser adaptados situao especfica.

Voltemos agora ao exemplo 5. Imaginemos que a parcela do tratamento 7 no bloco 2 foi perdida. O data set (permanente) pode ser criado da seguinte maneira:
options nodate nonumber ps=62 ls=78; libname local 'R:\'; proc format; value trat 1='(1) Tangerina sunki' 2='(2) Limo rugoso nacional' 3='(3) Limo rugoso da Flrida' 4='(4) Tangerina Clepatra'

32

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os e m bl oc os cas u a l i za d os co m p a r ce l a s p e r di d a s

run;

5='(5) 6='(6) 7='(7) 8='(8) 9='(9)

Citrange-troyer' Trifoliata' Tangerina cravo' Laranja caipira' Limo cravo';

data local.pratic9a; do trat=1 to 9; do bloco=1 to 3; input PRODUCAO@; output; end; end; format trat trat.; datalines; 145 155 166 200 190 190 190 175 186 180 160 156 206 . 170 250 271 230 ;

183 186 208 130 160 130 164 190 193

proc print data=local.pratic9a; title 'Dados para verificao'; run;

Conforme discutido em aula, em funo dessa perda de parcelas, a ordem de entrada dos efeitos do modelo altera os resultados, j que as SQs do tipo I e III so diferentes. A anlise de varincia pode ser feita da seguinte maneira:
title1 'Anlise de varincia - teste de Tukey'; title2 '(ateno para a ordem dos efeitos no modelo)'; proc glm data=local.pratic9a; class trat bloco; model PRODUCAO=trat bloco; means trat/tukey; means trat/tukey lines; /*escolha uma das opes para means*/ run; title1 'Anlise de varincia - teste de Tukey'; title2 '(ateno para a ordem dos efeitos no modelo)'; proc glm data=local.pratic9a; class trat bloco; model PRODUCAO=bloco trat; means trat/tukey lines; run;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

33

E n sa i o s e m bl oc os c a s u al i z a do s c om p a rce l a s p e rd i da s

Ateno:
Compare as sadas com as anlises feitas na aula terica. So muito comuns erros nesse tipo de anlise. Foram empregadas aqui duas ordens para os efeitos no modelo Exerccio 8
1. 2. 3.

Apresente o quadro da maneira usual (aula terica) para os programas acima, selecionando os resultados adequados. Examine os graus de liberdade fornecidos pelo SAS. Eles esto levando em conta a perda de uma parcela? Justifique. Como a ordem dos efeitos no modelo afeta as anlises de varincia feitas pelo SAS?

Com base no exerccio 8, conclui-se que a anlise de varincia correta pode ser feita da seguinte maneira:
title1 'Anlise de varincia, Tukey (med. ajust.)'; title2; proc glm data=local.pratic9a; class trat bloco; model PRODUCAO=bloco trat; lsmeans trat/adjust=tukey PDIFF=all; run;

Na aula terica foi apresentada a frmula para clculo da parcela perdida, de forma a minimizar a SQresduo: y = 193 . Substituindo esse valor no data set, teremos
title1 'Anlise de varincia com valor da parc. perd.'; data local.parcper1; set local.pratic9a; if PRODUCAO=. then PRODUCAO=193; run; proc print; run; title2 '(cuidado: SQtrat no est corrigida)'; proc glm data=local.parcper1; class trat bloco; model PRODUCAO=bloco trat; run;

Cuidado
A soma de quadrados de tratamentos no est corrigida, e tambm no foi subtrado um grau de liberdade do resduo. Essa forma de anlise, substituindo a parcela perdida, no

34

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os e m bl oc os cas u a l i za d os co m p a r ce l a s p e r di d a s

necessria quando usamos o SAS para as anlises, sendo aqui apresentada apenas com finalidade didtica. Para o caso de duas parcelas perdidas (ver aula terica):
data local.pratic9b; do trat=1 to 9; do bloco=1 to 3; input PRODUCAO@; output; end; end; format trat trat.; datalines; 145 155 166 200 190 190 . 175 186 180 160 156 206 . 170 250 271 230 ;

183 186 208 130 160 130 164 190 193

proc print data=local.pratic9b; title 'Dados para verificao'; run; title 'Anlise de varincia, Tukey (med. ajust.)'; proc glm data=local.pratic9b; class trat bloco; model PRODUCAO=bloco trat; lsmeans trat/adjust=tukey PDIFF=all; run;

Exerccio 9 Os resultados apresentados a seguir (Tabela 5) referem-se a um experimento em blocos ao acaso para comparar prognies de milho quanto produtividade de gros (kg/10 m2)(arquivo: EXERC9.SD2, data set permanente). Pede-se: 1. Testar se os resduos tm distribuio normal 2. Represente os resduos num diagrama ramo-e-folhas 3. Represente os resduos num grfico de caixas. 4. Testar se h homogeneidade de varincias pelo teste do F mximo. 5. Observe os resduos padronizados e verifique se h algum(ns) valor(es) discrepante(s). 6. Caso houver valor(es) discrepante(s), elimin-lo usando programao no Data Step, e refazer os itens 1, 2 e 3. L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l 35

E n sa i o s e m qu ad r ad o s l a ti n o s

Qual a importncia em fazer essas anlises propostas nos itens 1 a 5? Justifique. 8. H necessidade de realizar transformao dos dados? Por que? 9. Caso haja essa necessidade, qual seria a transformao a ser realizada? 10 . Que tipo de soma de quadrados (I ou III) mais indicada para analisar estatisticamente os dados desse experimento? Justifique. 11 . Fazer a anlise de varincia, tranformando os dados se necessrio. Comparar as prognies com base no teste de Tukey. 12 . Compare as prognies tambm com o teste de Duncan.
7.

Tabela 7. P r o d u ti v i d a d e d e g r o s d e m i l h o e m k g/ 10 m 2 .
Pr o g n i e I II III g Pr o g n i e I II III

1 2 3 4 5 6 7 8 9 10

16,1 17,6 20,5 22,5 18,5 18,8 17,4 23,7 19,8 21,9

17,1 17,0 16,5 19,8 18,4 20,5 20,1 17,1 15,5

15,8 14,5 16,2 15,4 16,0 17,6 19,1 16,8 15,7

11 12 13 14 15 16 17 18 19 20

17,1 28,9 22,5 20,7 16,3 18,8 20,3 22,1 20,4

23,4 20,0 16,2 18,9 17,4 16,9 15,5 20,8 23,0

15,0 22,4 20,4 15,2 19,3 15,8 15,1 16,2 18,6

Fo nte: Ada ptado de Ve ncovsky e Barriga, 1992

11

Ensaios em quadrados latinos


Os ensaios em quadrados latinos levam em conta o controle local, aplicado em dois sentidos. Como exemplo, vejamos o experimento apresentado na aula terica. Exemplo 6 - Um ensaio para comparao de 5 variedades de cana-de-acar, A, B, C, D e E, foi conduzido em um quadrado latino. Foi avaliada a produo, em kg/parcela. Os valores obtidos podem ser usados para a criao do arquivo da seguinte forma (arquivo EXEMP6.SAS):
options nodate nonumber data latino; input linha coluna trat datalines; 1 1 D 1 2 A 1 3 B ps=65 ls=78; $ PROD; 432 518 458

36

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E ns ai o s e m q u a d ra d os l a ti n o s

1 4 C 583 1 5 E 331 2 1 C 724 2 2 E 478 2 3 A 524 2 4 B 550 2 5 D 400 3 1 E 489 3 2 B 384 3 3 C 556 3 4 D 297 3 5 A 420 4 1 B 494 4 2 D 500 4 3 E 313 4 4 A 486 4 5 C 501 5 1 A 515 5 2 C 660 5 3 D 438 5 4 E 394 5 5 B 318 ; proc print; title 'Dados para verificao'; run;

A anlise de algumas pressuposies da anlise de varincia feita de forma anloga ao que j foi apresentado.
title 'Anlise de varincia e resduos'; proc glm noprint; class trat; model PROD = linha coluna trat; output out=residuos PREDICTED=PREDITOS RESIDUAL=RESIDUOS STUDENT=RES_PAD; run; title 'Exame dos resduos'; proc print data=residuos; run; title 'Verificao da normalidade grfica'; proc univariate normal plot; var RES_PAD; run; (teste Shapiro-Wilk), anlise

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

37

E n sa i o s e m qu ad r ad o s l a ti n o s

title 'Anlise grfica dos resduos'; proc plot; plot RES_PAD*PREDITOS; run; title 'Teste do F mximo - Hartley'; proc sort; by trat; run; proc means noprint data=residuos; var PROD; by trat; output out=var_med MEAN=MEDIA VAR=VARIANC; run; proc print data=var_med; run; data fmax; set var_med; run; proc means noprint data=fmax; var VARIANC; output out=razao MIN=VMIN MAX=VMAX; run; data hartley; set razao; FMAX=VMAX/VMIN; run; title 'Valor do F mximo'; proc print data=hartley; var VMIN VMAX FMAX; run;

A anlise de varincia (com Tukey) pode ser feita da seguinte forma:


proc glm data=latino; title 'Anlise de varincia'; class linha coluna trat; model PROD = linha coluna trat; means trat/tukey; run;

38

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

En s ai o s f a to ri a i s

Nota:
Veja como simples analisar experimentos usando a PROC GLM. Porm, deve-se estar atento quanto ao modelo matemtico que deve ser empregado. No caso: y ijk = m + l i + c j + t k ( i, j ) + e ijk . Exerccio 10 Os dados abaixo referem-se a um experimento para avaliao de variedades de trigo, plantadas num quadrado latino (arquivo EXERC10.XLS). Pede-se: 1. Fazer a anlise de varincia. 2. Indicar a(s) melhor(es) variedade(s), usando o teste de Duncan. 3. Caso utilizssemos outro critrio para as comparaes mltiplas, como por exemplo o de Tukey, as concluses seriam diferentes? Qual o motivo? 4. Cite vantagens e desvantagens desse delineamento experimental.

Tabela 8. P r o d u o d e t r i go d e 4 v ar i e d a d e s ( k g/ p a r c el a ) .
L i nh as 1 1 2 3 4 C=10,5 B=11,1 D=5,8 A=11,6 2 D=7,7 A=12,0 C=12,2 B=12,3 as C o l un a s 3 B=12,0 C=10,3 A=11,2 D=5,9 4 A=13,2 D=7,5 B=13,7 C=10,2

Fo n t e : S t ee l e Tor r i e, 1 9 6 0

12

Ensaios fatoriais
Neste tipo de ensaio, so avaliadas combinaes entre os nveis de diferentes fatores. Se todas as combinaes forem consideradas, temos os fatoriais completos. Essas combinaes so ento avaliadas segundo delineamentos adequados, como por exemplo, blocos casualizados. Dessa forma, o modelo matemtico empregado deve ser adequado situao em questo, devendo ser cuidadosamente definido pelo pesquisador. Por exemplo, no caso de termos dois fatores (A e B) com dois nveis cada, teremos 2 x 2 = 4 tratamentos, que, se forem avaliados segundo delineamento inteiramente ao acaso, implicaro no seguinto modelo matemtico: y ijk = m + a i + b j + abij + e ijk . Por outro lado, se L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l 39

E n sa i o s f a to ri a i s

o delineamento for blocos ao acaso, o modelo ser y ijk = m + a i + b j + ab ij + r k + e ijk (em que r k o efeito de blocos, no includo no modelo anterior). Exemplo 7 - Um experimento foi instalado com o objetivo de estudar a influncia do aparelho e do operador dele na medio de alturas de rvores de Eucaliptus saligna aos 7 anos de idade. Foram avaliados 5 diferentes aparelhos, por 4 operadores (fatorial 5 x 4), em 10 rvores (cada rvore foi considerada como um bloco) (maiores detalhes: ver aula terica). No SAS, a criao do data set fica (arquivo EXEMP7.SAS):
options nodate nonumber ps=65 ls=78; data fatorial; input trat apar oper bloco ALTURA@@; datalines; 1 1 1 1 22.40 1 1 1 1 1 3 23.60 1 1 1 1 1 5 19.10 1 1 1 1 1 7 16.55 1 1 1 1 1 9 21.10 1 1 2 2 1 1 22.90 2 2 2 2 1 3 23.95 2 2 2 2 1 5 21.40 2 2 2 2 1 7 16.90 2 2 2 2 1 9 22.00 2 2 3 3 1 1 23.50 3 3 3 3 1 3 23.75 3 3 3 3 1 5 19.50 3 3 3 3 1 7 17.50 3 3 3 3 1 9 20.00 3 3 4 4 1 1 22.50 4 4 4 4 1 3 23.20 4 4 4 4 1 5 21.00 4 4 4 4 1 7 17.80 4 4 4 4 1 9 20.60 4 4 5 5 1 1 21.45 5 5 5 5 1 3 23.35 5 5 5 5 1 5 19.95 5 5 5 5 1 7 17.45 5 5 5 5 1 9 22.00 5 5 6 1 2 1 22.65 6 1 6 1 2 3 23.00 6 1 6 1 2 5 20.25 6 1 6 1 2 7 17.25 6 1 6 1 2 9 19.75 6 1 7 2 2 1 23.00 7 2 7 2 2 3 22.50 7 2 7 2 2 5 22.25 7 2 7 2 2 7 18.00 7 2 7 2 2 9 20.50 7 2 8 3 2 1 22.00 8 3

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2

2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2

20.85 21.00 19.80 14.75 14.30 21.40 22.25 21.00 14.85 15.00 21.00 20.75 19.50 14.50 14.00 20.50 21.00 18.90 14.30 14.20 19.20 20.35 19.35 14.45 14.75 20.65 20.75 19.80 15.00 14.25 20.70 20.95 20.75 14.75 15.25 19.50

40

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

En s ai o s f a to ri a i s

8 8 8 8 9 9 9 9 9 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 13 13 13 13 13 14 14 14 14 14 15 15 15 15 15 16 16 16 16 16 17 17 17 17 17 18 18

3 3 3 3 4 4 4 4 4 5 5 5 5 5 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 1 1 1 1 1 2 2 2 2 2 3 3

2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4

3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3

23.25 21.25 17.75 20.50 22.90 24.60 21.20 18.70 21.50 21.45 23.20 19.95 17.35 21.80 22.50 23.10 21.00 16.60 20.75 22.50 23.00 22.75 17.20 22.35 22.75 22.75 20.50 17.25 21.50 21.75 21.75 20.50 16.35 20.85 21.35 23.20 20.00 17.50 21.90 21.25 22.25 18.00 17.25 21.00 22.10 22.35 19.75 16.70 20.85 21.25 22.10

8 8 8 8 9 9 9 9 9 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 13 13 13 13 13 14 14 14 14 14 15 15 15 15 15 16 16 16 16 16 17 17 17 17 17 18 18

3 3 3 3 4 4 4 4 4 5 5 5 5 5 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 1 1 1 1 1 2 2 2 2 2 3 3

2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4

4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4 6 8 10 2 4

20.50 19.75 14.75 14.25 21.20 21.50 20.00 15.00 14.20 18.90 20.25 19.20 14.35 14.65 21.25 20.60 19.50 14.35 14.10 21.00 21.75 20.35 14.85 16.00 20.50 19.50 19.75 14.25 14.25 19.35 19.50 19.00 14.10 13.85 19.20 20.30 19.30 14.40 14.80 21.25 21.25 20.00 14.65 14.25 21.60 21.75 20.65 15.75 15.40 21.50 21.70

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

41

E n sa i o s f a to ri a i s 18 18 18 19 19 19 19 19 20 20 20 20 20 ; 3 3 3 4 4 4 4 4 5 5 5 5 5 4 4 4 4 4 4 4 4 4 4 4 4 4 5 7 9 1 3 5 7 9 1 3 5 7 9 19.75 18.20 21.25 21.90 22.75 19.70 18.45 20.75 21.20 23.30 19.90 17.40 22.00 18 18 18 19 19 19 19 19 20 20 20 20 20 3 3 3 4 4 4 4 4 5 5 5 5 5 4 4 4 4 4 4 4 4 4 4 4 4 4 6 8 10 2 4 6 8 10 2 4 6 8 10 19.75 14.60 14.75 21.00 20.75 20.00 14.30 15.10 18.90 20.30 19.30 14.50 14.40

proc print; title 'Dados para verificao'; run;

Uma anlise inicial (opcional) para verificar a existncia de diferenas entre os tratamentos, sem considerar o esquema fatorial (modelo matemtico y ij = m + t i + bj + e ij ), :
proc glm; title 'Anlise de varincia sem discriminar os fatores'; class trat bloco; model ALTURA = trat bloco; run;

Ateno:
Usualmente, a coluna referente aos tratamentos (de 1 a 20, no caso) no includa no arquivo. Isso foi feito aqui com apenas com finalidades didticas. Evidentemente, se no houver a varivel classificatria tratamentos, essa anlise apresentada acima no possvel. J a anlise considerando os fatores ( y ijk = m + a i + bj + ab ij + r k + e ijk ):
proc glm; title 'Anlise de varincia discriminando os fatores'; class apar oper bloco; model ALTURA = apar oper apar*oper bloco; run;

42

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

En s ai o s f a to ri a i s

Uma vez que nessa anlise a interao entre operadores e aparelhos foi significativa, podemos estudar se h diferena entre os operadores para cada aparelho (com Tukey):
proc glm; title 'Anlise de varincia na presena de interao I'; class apar oper bloco; model ALTURA = apar oper apar*oper bloco; lsmeans apar*oper/slice=apar adjust=tukey PDIFF=all; run;

Caso desejemos estudar se h diferena entre os aparelhos para cada operador (com Tukey):
proc glm; title 'Anlise de varincia na presena de interao II'; class apar oper bloco; model ALTURA = apar oper apar*oper bloco; lsmeans apar*oper/slice=oper adjust=tukey PDIFF=all; run;

Nota:
Na presena de interao significativa, o pesquisador deve definir qual a melhor forma de complementar o estudo, j que diferentes decomposies so possveis (deve-se tomar cuidado com o nvel conjunto de significncia). Exerccio 11 Os dados apresentados na tabela a seguir referem-se a um experimento fatorial 2 x 3 inteiramente casualizado (9 repeties). Faa a anlise de varincia correta e interprete os resultados (dados no arquivo EXERC11.SAS).

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

43

E n sa i o s f a to ri a i s d a s s r i e s 2 n e 3 n

Tabela 9. Cr e sc i m e nt o d e r a m o s d e a gr i o ( c m ) a p s u ma se m a na d e c u l ti v o em s o l u o nu t r i ti v a .
Hor as de luz/ dia perat tur Tem pe rat u ra no tu r na

baixa 8
3,5 4,0 3,0 2,5 4,5 5,5 3,5 3,5 3,0 5,0 6,0 5,0 3,0 3,0 2,5 4,5 4,0 4,0 5,5 4,5 6,5

alta
8,5 6,0 9,0 5,5 6,0 3,5 8,5 9,0 8,5 6,5 7,0 8,0 6,0 8,5 4,5 9,0 7,0 7,0 7,0 7,0 7,0 6,5 6,5 8,5 9,5 7,0 9,0

12

5,0 5,5 4,0

16

4,5 5,0 5,0

Fo n t e : D ad o s f i ct c i o s

13

Ensaios fatoriais das sries 2n e 3n


Conforme apresentado nas aulas tericas, esses ensaios tm grande aplicao na rea agronmica, principalmente em ensaios de adubao N-P-K. Caso no seja empregada a tcnica de confundimento, a anlise desses ensaios feita da mesma maneira que apresentada no item anterior. Tomemos como exemplo um ensaio fatorial 2 3 . Exemplo 8 - Um experimento em blocos casualizados no esquema fatorial 2 foi instalado para estudar efeitos da adubao na produo da cultura do cafeeiro. O programa com os dados para a anlise fica
options nodate nonumber ps=65 ls=72; data exemp8; input N P K bloco PROD@@; cards;
0 0 0 0 1 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1 1 1 1 1 1 1 1 1 31.8 25.6 36.2 37.1 35.3 51.5 43.8 47.0 0 0 0 0 1 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1 2 2 2 2 2 2 2 2 40.5 32.4 37.8 53.0 39.0 66.1 32.7 49.9 0 0 0 0 1 1 1 1 0 0 1 1 0 0 1 1 0 1 0 1 0 1 0 1 3 3 3 3 3 3 3 3 25.7 39.6 40.9 36.4 36.0 51.7 43.3 50.9 0 0 0 0 1 1 1 1
3

0 0 1 1 0 0 1 1

0 1 0 1 0 1 0 1

4 4 4 4 4 4 4 4

25.7 48.9 44.8 43.0 33.5 52.0 41.8 49.1

0 0 0 0 1 1 1 1

0 0 1 1 0 0 1 1

0 1 0 1 0 1 0 1

5 5 5 5 5 5 5 5

37.2 20.6 32.4 19.7 28.2 56.5 31.9 71.7

0 0 0 0 1 1 1 1

0 0 1 1 0 0 1 1

0 1 0 1 0 1 0 1

6 6 6 6 6 6 6 6

45.3 33.7 38.4 30.4 42.4 58.2 37.7 39.6

proc print;

44

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E ns ai o s f a to ri a is d as s r i e s 2 n e 3 n

title 'Dados para verificao'; run; proc glm; title 'Anlise de varincia'; class N P K bloco; model PROD = N|P|K bloco; * model PROD = N P K N*P N*K P*K N*P*K bloco; run;

Note:
O modelo matemtico adotado y ijkl = m + ni + p j + kk + np ij + nkik + pkjk + npk ijk + bl + e ijkl .
proc glm; title 'Anlise com interao I'; class N P K bloco; model PROD = N|P|K bloco; lsmeans N*K/slice=K ADJUST=TUKEY PDIFF=ALL; run; proc glm; title 'Anlise com interao II'; class N P K bloco; model PROD = N|P|K bloco; lsmeans N*K/slice=N ADJUST=TUKEY PDIFF=ALL; run;

Comentrios:
Veja que nesses modelos em que h combinaes de nveis de fatores possvel simplificar sua indicao no SAS. Assim, so equivalentes
model PROD = N|P|K bloco;

e
model PROD = N P K N*P N*K P*K N*P*K bloco;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

45

E n sa i o s f a to ri a i s d a s s r i e s 2 n e 3 n

sendo necessrio obviamente especificar somente um deles. Nesse exemplo, a interao N x K foi a nica significativa, e desse modo efetuou-se a decomposio apenas dentro de N e de K. Em outras situaes, o leitor pode facilmente escolher a anlise de interesse. Exemplo 9 - Vejamos agora um outro exemplo (hipottico) para um fatorial 2 3 (sem confundimento) (arquivo EXEMP9.SAS).
data exemp9; input N P K bloco bloco2 cards; 1 0 0 1 1 34.5 1 0 0 2 2 0 0 1 1 1 23.8 0 0 1 2 2 1 1 1 1 1 46.5 1 1 1 2 2 0 1 0 1 1 35.9 0 1 0 2 2 1 0 1 0 ; 1 0 0 1 0 0 1 1 1 1 1 1 5 5 5 5 44.0 32.8 52.9 36.0 1 0 1 0 1 0 0 1 0 0 1 1 2 2 2 2 6 6 6 6

PROD@@; 39.3 31.4 50.2 36.5 32.8 41.5 65.3 53.4 1 0 1 0 1 0 1 0 0 0 1 1 1 0 0 1 0 1 1 0 0 0 1 1 3 3 3 3 3 3 3 3 3 3 3 3 7 7 7 7 36.7 39.0 51.9 42.8 43.2 26.7 52.7 35.8 1 0 1 0 1 0 1 0 0 0 1 1 1 0 0 1 0 1 1 0 0 0 1 1 4 4 4 4 4 4 4 4 4 4 4 4 8 8 8 8 34.3 49.8 50.1 45.0 42.9 26.5 52.1 43.1

proc print; title 'Dados para verificao'; run; proc glm; title 'Anlise de varincia usual'; class N P K bloco; model PROD = N|P|K bloco; run; proc glm; title 'Anlise de varincia com interao'; class N P K bloco; model PROD = N|P|K bloco; lsmeans N*K/slice=K; lsmeans N*K/slice=N; run;

Ateno:
Nesse exemplo, h no arquivo uma varivel denominada bloco2, que ser usada a seguir. No momento, deve ser ignorada. Fica claro que esse tipo de anlise muito simples. A decomposio da(s) interao(es) significativa(s) fica(m) como exerccio para o leitor.

46

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E ns ai o s f a to ri a is d as s r i e s 2 n e 3 n

Confundimento
Vejamos agora como realizar essa anlise caso tenha sido empregada a tcnica de confundimento. Para tanto, usaremos a varivel bloco2, correspondente aos blocos usando confundimento, e no mais bloco, como na anlise acima. Recomenda-se que o leitor compare as diferenas entre os resultados das duas anlises, prestando tambm muita ateno para as diferenas que existem na restrio casualizao. evidente que, em situaes reais, o experimento usar ou no a tcnica de confundimento; aqui usamos bloco e bloco2 com o intuito de fazer que o leitor consiga diferenciar essas situaes.
proc glm; title 'Anlise de varincia com confundimento'; class N P K bloco2; model PROD = bloco2 N|P|K/SS1; run;

Esse comando SS1 colocado no modelo indica que estamos pedindo apenas as somas de quadrado do tipo 1, adequadas a esse caso. essencial que bloco2 (blocos com confundimento) seja colocado antes dos demais efeitos do modelo, para que os ajustes sejam feitos para os blocos. Verifique que o SAS colocar 0 graus de liberdade para a interao tripla, j que ela est confundida com o efeito de blocos e no pode ser estudada separadamente. Na presena de interao dupla, teremos:
proc glm; title 'Anlise com interao e confundimento I'; class N P K bloco2; model PROD = bloco2 N|P|K/SS1; lsmeans N*K/slice=K ADJUST=TUKEY PDIFF=ALL; run; proc glm; title 'Anlise com interao e confundimento II'; class N P K bloco2; model PROD = bloco2 N|P|K/SS1; lsmeans N*K/slice=N ADJUST=TUKEY PDIFF=ALL; run;

Exerccio 12
1.

Faa croquis mostrando a disposio do experimento apresentado no exemplo 9, sem aplicar o confundimento (usando a varivel bloco) e com a aplicao do confundimento (usando bloco2).

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

47

E n sa i o s f a to ri a i s d a s s r i e s 2 n e 3 n

Exemplo 10 - Os dados a seguir referem-se produo de algodo herbceo, em kg/ha, num 3 ensaio fatorial 3 adubao N-P-K, em blocos ao acaso, com confundimento (arquivo EXEMP10.SAS).
options nodate nonumber ps=65 ls=72; data prat11; input N P K bloco PROD@@; cards; 0 0 0 1 868 0 0 0 2 319 0 1 2 1 951 0 1 2 2 521 0 2 1 1 694 0 2 1 2 868 1 0 1 1 972 1 0 1 2 486 1 1 0 1 1319 1 1 0 2 1139 1 2 2 1 812 1 2 2 2 868 2 0 2 1 951 2 0 2 2 1076 2 1 1 1 1493 2 1 1 2 1146 2 2 0 1 1076 2 2 0 2 1215 0 0 0 1 1 1 2 2 2 0 0 0 1 1 1 2 2 2 ; 0 1 2 0 1 2 0 1 2 0 1 2 0 1 2 0 1 2 1 0 2 2 1 0 0 2 1 2 1 0 0 2 1 1 0 2 3 3 3 3 3 3 3 3 3 5 5 5 5 5 5 5 5 5 625 1319 1042 729 764 806 1285 972 1042 465 833 1069 1215 729 660 1076 1250 1076 0 0 0 1 1 1 2 2 2 0 0 0 1 1 1 2 2 2 0 1 2 0 1 2 0 1 2 0 1 2 0 1 2 0 1 2 1 0 2 2 1 0 0 2 1 2 1 0 0 2 1 1 0 2 4 764 4 1042 4 729 4 833 4 1215 4 625 4 604 4 1153 4 729 6 6 6 6 6 6 6 6 6 1181 729 660 937 1083 625 972 1139 1264

proc print; title 'Dados para verificao'; run;

O programa para a anlise


proc glm; title 'Anlise de varincia com confundimento'; class N P K bloco;

48

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E ns ai o s f a to ri a is d as s r i e s 2 n e 3 n

model PROD = bloco N P K N*P N*K P*K N*P*K/SS1; run;

Exerccio 13 A tabela abaixo apresenta as produes, em kg/ha, de parcelas de um experimento fatorial 3 2 de adubao, em blocos casualizados. Os fatores so N, P e K (presentes ou ausentes). O nmero 1 representa a testemunha (sem adubo), N indica presena apenas de nitrognio e ausncia dos demais elementos, e assim por diante (arquivo EXERC13.SAS). Tabela 10. P ro d u o ( t/ h a ) d e u m ex p e r i m en to d e a d u b a o d e m i l h o ( f a t o r ia l
2 ).
1 Bloco 1 Bloco 2 Bloco 3 Bloco 4 1,32 2,12 1,75 2,35 N 1,80 2,20 2,95 2,96 P 1,66 2,66 1,73 2,58 NP 1,72 3,85 2,62 3,00 K 2,58 3,56 2,86 2,75 NK 2,72 3,20 2,25 2,75 PK 2,26 2,08 1,95 2,70 NPK 2,95 3,28 2,40 3,35
3

Fo n te : Pi me n te l Go me s, 1987

Pede-se: 1. Criar o arquivo SAS adequado para analisar esses dados. 2. Obtenha tambm um data set permanente. 3. Fazer a anlise de varincia 4. Por que a presena de interao significativa requer que sejam feitos estudos de um fator dentro dos nveis do outro com o qual interagiu? 5. Efetue as recomendaes de adubao para N, P e K (se necessrio, especificando em que nveis dos fatores a recomendao vlida). Exerccio 14 A seguir so apresentados resultados de um experimento de adubao de cana-de-acar, com confundimento de 2 graus de liberdade da interao tripla (arquivo EXERC14.TXT).

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

49

U s o d a r e gr e s s o na a n li s e d e va r i n ci a

Tabela 11. Pr o d u o d e c a n a -d e -a c a r ( t /h a ) d e u m ex p e r i m en to f a to r i a l (b l o c o s casualizados) com confundimento.


Tra t. Rep .1 37,0 42,6 68,4 33,5 45,7 49,7 36,2 47,4 59,0 Re p. 2 29,3 37,0 64,4 28,6 61,3 52,8 35,2 55,4 56,2 Trat . Re p. 1 60,2 57,6 76,0 42,8 63,4 58,2 56,6 69,1 59,4 Re p. 2 39,1 19,5 66,0 27,7 63,0 53,4 30,5 49,5 43,2 Tra t Re p. 1 28,3 66,6 66,8 32,6 63,4 71,1 41,3 50,2 55,4 Re p. 2 24,3 41,8 55,1 37,0 50,8 56,8 36,9 67,2 69,5

000 012 021 101 110 122 202 211 200

001 010 022 102 111 120 200 212 221

002 011 020 100 112 121 201 210 222

Fo n te : Pi me n te l Go me s, 1987
1. 2.

Criar o arquivo SAS com esses dados e fazer a anlise de varincia Fazer os desdobramentos necessrios, com teste de Tukey, interpretando os resultados das anlises.

14

Uso da regresso na anlise de varincia


Em diversas situaes prticas temos que os nveis dos fatores so quantitativos. Nesse caso, diversos autores recomendam o estudo de regresses, normalmente mais informativo que os testes de comparaes mltiplas (ver aula terica). No caso do exemplo 10, temos que os nveis de N, P e K so quantitativos, sendo recomendvel efetuar esse estudo. Embora K no tenha apresentado F significativo, apresentaremos aqui a regresso apenas por razes didticas. Nesse caso, so criadas variveis auxiliares indicando o grau do polinmio a ser considerado. Note que agora devem ser especificados os nveis de cada fator (por exemplo, N com nveis 0-40-80), o que no foi feito no exemplo anterior (arquivo: EXEMP10b.SAS).
options nodate nonumber ps=65 ls=72; data; input N P K bloco PROD@@;
LINEAR_N=N; QUAD_N=N*N; LINEAR_P=P; QUAD_P=P*P; LINEAR_K=K; QUAD_K=K*K;

cards; 0 0

868

319

50

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

U so da re gr e ss o n a a n li s e de v ar i n ci a

0 0 40 40 40 80 80 80 0 0 0 40 40 40 80 80 80 0 0 0 40 40 40 80 80 80 ;

60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120

120 60 60 0 120 120 60 0 60 0 120 120 60 0 0 120 60 120 60 0 0 120 60 60 0 120

1 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 3 5 5 5 5 5 5 5 5 5

951 694 972 1319 812 951 1493 1076 625 1319 1042 729 764 806 1285 972 1042 465 833 1069 1215 729 660 1076 1250 1076

0 0 40 40 40 80 80 80 0 0 0 40 40 40 80 80 80 0 0 0 40 40 40 80 80 80

60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120 0 60 120

120 60 60 0 120 120 60 0 60 0 120 120 60 0 0 120 60 120 60 0 0 120 60 60 0 120

2 2 2 2 2 2 2 2 4 4 4 4 4 4 4 4 4 6 6 6 6 6 6 6 6 6

521 868 486 1139 868 1076 1146 1215 764 1042 729 833 1215 625 604 1153 729 1181 729 660 937 1083 625 972 1139 1264

proc print; title 'Dados para verificao'; run;

Ateno:
As variveis auxiliares criadas foram LINEAR_N, QUAD_N, LINEAR_P, QUAD_P, LINEAR_K,
QUAD_K.

O programa para a anlise de varincia j foi apresentado:


proc glm; title 'Anlise de varincia com confundimento'; class N P K bloco; model PROD = bloco N P K N*P N*K P*K N*P*K/SS1; run;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

51

U s o d a r e gr e s s o na a n li s e d e va r i n ci a

Vejamos agora os programas que possibilitam testar os componentes lineares e quadrticos para N, P e K:
proc glm; title 'Anava tipo I com confundimento e regresses'; class N P K bloco; model PROD = bloco LINEAR_N QUAD_N LINEAR_P QUAD_P LINEAR_K QUAD_K N*P N*K P*K N*P*K/SS1; run;

Ateno:
Devemos, necessariamente, usar as somas de quadrado do tipo I. O efeito de blocos e os demais no modelo devem estar na ordem indicada acima. A obteno da funo de primeiro grau associando os nveis de N e a produo pode ser obtida com o seguinte programa:
proc reg; title 'Equao de primeiro grau para N'; model PROD = LINEAR_N; run;

J a funo de segundo grau para P obtida com


proc reg; title 'Equao de segundo grau para P'; model PROD = LINEAR_P QUAD_P; run;

Nota:
Optamos por essas funes com base no resultado da anlise de varincia, que deve ser cuidadosamente interpretado pelo leitor. Note que no foi feito nenhum teste de comparaes mltiplas. importante ressaltar que as interaes no foram significativas. Caso isso no tivesse ocorrido, seriam necessrios desdobramentos. Exerccio 15 Os dados abaixo referem-se a um experimento (hipottico) estudando a influncia do nmero de dias e quantidade de um dado fungicida na quantidade de matria seca

52

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

U so da re gr e ss o n a a n li s e de v ar i n ci a

produzida por plantas de uma hortalia. O delineamento foi blocos casualizados (arquivo no fornecido). Tabela 12. Da d o s r es u l ta n te s d o e x pe ri m e nt o
Dias Di as Qu an tidade fu ng Quantidade d e fung icida Blo B lo c o 1 15,7 9,8 7,9 18,0 13,6 8,8 Bl B l o co 2 14,6 14,6 10,3 17,4 10,6 8,2 Bl oc o 3 16,5 11,9 9,7 15,1 11,8 11,3 Bl B l o co 4 14,7 12,4 9,6 14,4 13,3 11,2

0 4 8

10

0 4 8

1. 2. 3. 4.

Crie o arquivo SAS adequado. Faa a anlise de varincia, desdobrando a interao, se necessrio. Faa um estudo usando regresso para os fatores onde h diferena entre os nveis. Apresente a(s) funo(es) ajustadas. Discuta os resultados detalhadamente, explicando o significado das funes encontradas.

Exerccio 16 Os dados abaixo referem-se a um experimento de adubao de milho em blocos ao acaso. Os tratamentos constaram de adubao com 0, 25, 50, 75 e 100 kg/ha de P2O5 (arquivo EXERC16.XLS). Tabela 13. Pr o d u o d e m i l h o , e m k g/p a rc el a , d e u m e x p e r i m en to d e a d u b a o d e
m i l ho .
0 3,38 5,77 4,90 4,54 25 7,15 9,78 9,99 10,10 50 10,07 9,73 7,92 9,48 75 9,55 8,95 10,24 8,66 10 0 9,14 10,17 9,75 9,50

Fo n te : Pi me n te l Go me s, 1987
1. 2. 3.

Faa a anlise de varincia. Faa um estudo usando regresso para os fatores onde h diferena entre os nveis. Apresente a(s) funo(es) ajustadas. Discuta os resultados, explicando o significado das funes encontradas

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

53

E n sa i o s e m p ar c e l a s su b di v i d i da s

15

Ensaios em parcelas subdivididas


Exemplo 11 - Apresentamos a seguir os dados referentes a % de brix no caldo de um experimento de aplicao de maturadores de cana-de-acar (aula terica). O delineamento empregado foi blocos ao acaso com 3 parcelas. De cada parcela, foram coletadas amostras aps 0, 2, 4, 6, 8 e 10 semanas de aplicao dos maturadores (arquivo EXEMP11.SAS).
data; input trat $ epoca bloco BRIX@@; cards; T1 0 1 17.70 T1 0 2 17.50 T1 0 3 T1 0 5 17.30 T1 0 6 17.60 T1 0 7 T1 2 1 16.95 T1 2 2 18.60 T1 2 3 T1 2 5 19.40 T1 2 6 18.55 T1 2 7 T1 4 1 18.95 T1 4 2 18.10 T1 4 3 T1 4 5 19.20 T1 4 6 18.90 T1 4 7 T1 6 1 18.65 T1 6 2 18.50 T1 6 3 T1 6 5 20.10 T1 6 6 18.75 T1 6 7 T1 8 1 19.70 T1 8 2 20.20 T1 8 3 T1 8 5 20.55 T1 8 6 20.25 T1 8 7 T1 10 1 20.75 T1 10 2 19.00 T1 10 3 T1 10 5 19.45 T1 10 6 21.70 T1 10 7 T2 0 1 T2 0 5 T2 2 1 T2 2 5 T2 4 1 T2 4 5 T2 6 1 T2 6 5 T2 8 1 T2 8 5 T2 10 1 T2 10 5 T3 0 1 T3 0 5 T3 2 1 T3 2 5 T3 4 1 T3 4 5 T3 6 1 T3 6 5 T3 8 1 T3 8 5 T3 10 1 T3 10 5 ; 16.83 17.75 17.70 19.48 18.00 20.70 18.68 20.03 19.55 20.80 15.56 20.45 16.63 17.26 17.18 18.61 18.05 19.03 18.50 19.48 20.65 20.28 19.90 20.62 T2 0 2 T2 0 6 T2 2 2 T2 2 6 T2 4 2 T2 4 6 T2 6 2 T2 6 6 T2 8 2 T2 8 6 T2 10 2 T2 10 6 T3 0 2 T3 0 6 T3 2 2 T3 2 6 T3 4 2 T3 4 6 T3 6 2 T3 6 6 T3 8 2 T3 8 6 T3 10 2 T3 10 6 16.96 16.90 17.56 18.20 18.05 18.85 18.83 19.63 19.38 20.42 17.18 19.92 17.70 17.18 17.75 18.26 18.20 18.91 19.53 18.95 20.90 20.25 23.96 20.33 T2 0 3 T2 0 7 T2 2 3 T2 2 7 T2 4 3 T2 4 7 T2 6 3 T2 6 7 T2 8 3 T2 8 7 T2 10 3 T2 10 7 T3 0 3 T3 0 7 T3 2 3 T3 2 7 T3 4 3 T3 4 7 T3 6 3 T3 6 7 T3 8 3 T3 8 7 T3 10 3 T3 10 7

17.95 17.40 17.05 17.80 17.60 18.25 19.65 19.25 19.70 19.80 19.85 19.10 17.25 16.70 18.17 18.58 18.55 18.41 17.65 18.70 18.10 19.33 19.00 20.00 17.52 17.43 17.65 18.00 18.57 18.48 19.08 18.77 18.68 19.27 19.08 20.06

T1 0 4 T1 0 8 T1 2 4 T1 2 8 T1 4 4 T1 4 8 T1 6 4 T1 6 8 T1 8 4 T1 8 8 T1 10 4 T1 10 8 T2 0 4 T2 0 8 T2 2 4 T2 2 8 T2 4 4 T2 4 8 T2 6 4 T2 6 8 T2 8 4 T2 8 8 T2 10 4 T2 10 8 T3 0 4 T3 0 8 T3 2 4 T3 2 8 T3 4 4 T3 4 8 T3 6 4 T3 6 8 T3 8 4 T3 8 8 T3 10 4 T3 10 8

17.90 17.75 18.00 18.05 18.35 18.70 18.30 17.40 19.70 18.70 20.80 18.25 18.22 17.19 17.72 18.14 19.52 19.20 20.40 19.71 20.85 21.10 19.40 19.65 17.52 16.52 17.55 16.56 19.57 17.73 19.03 16.54 18.55 15.60 19.03 18.85

54

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os e m p a rce l a s su bd iv i di d a s

proc print; title 'Dados para verificao'; run;

O modelo matemtico y ijk = m + a i + b j + e ij + s k + as ik + e ijk (ver aula terica). O programa para realizar a anlise de varincia pode ser:
proc glm; title 'Anlise de varincia - parc. subd.'; class trat epoca bloco; model BRIX = bloco trat trat*bloco epoca epoca*trat; test h=trat e=trat*bloco; * means trat/tukey e=trat*bloco; /*apenas para indicao*/ * means epoca/tukey; /*apenas para indicao*/ run;

Note que, como agora temos dois resduos envolvidos, necessrio usar um artifcio na indicao do modelo: como a soma de quadrados da interao entre tratamentos e blocos coincide nesse caso com a soma de quadrados do resduo (a), especificamos esse efeito no modelo, devendo contudo indicar que a fonte de variao tratamentos deve ser testada com esse resduo (comando test h=trat e=trat*bloco). O SAS testa todas as fontes de variao automaticamente com o resduo do modelo (no caso, resduo b), o que incorreto para tratamentos. Note que blocos foram testados com o resduo b, uma vez que no especificamos outro testador. Caso tivssemos interesse nesse teste, deveramos especificar como testador o resduo a.

Cuidado
O programa apresenta o teste de Tukey para os tratamentos das parcelas, especificando que o resduo correto o Resduo (a), alm do teste para as subparcelas (Resduo b, feito automaticamente). Contudo, na presena de interao significativa, como o caso, devemos fazer o desdobramento da interao, e no esse teste, aqui mostrado apenas para exemplificar com deve ser especificado o resduo na ausncia de interao significativa. Consideremos o estudo de pocas dentro de tratamentos (efeito das subparcelas dentro dos efeitos das parcelas):
proc glm; title 'Anava - poca dentro de trat.'; class trat epoca bloco; model BRIX = bloco trat trat*bloco epoca epoca*trat; lsmeans epoca*trat/slice=trat; * test h=trat e=trat*bloco;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

55

E n sa i o s e m p ar c e l a s su b di v i d i da s run;

Note que o teste F para tratamentos est incorreto, pois est usando o Resduo (b) como testador. A linha com o asterisco mostra como corrigir o problema. Lembre-se que o asterisco desliga o processamento da linha em questo, devendo ser retirado caso haja interesse em process-la. Para estudar tratamentos dentro de pocas (efeito da parcela dentro dos efeitos das subparcelas):
proc glm; title 'Anava - trat. dentro de poca'; class trat epoca bloco; model BRIX = bloco trat epoca epoca*trat; lsmeans epoca*trat/slice=epoca adjust=tukey PDIFF=all; run;

Ateno
H, nesse segundo desdobramento, a necessidade de realizar uma combinao dos resduos (ver aula terica). Optamos aqui por adotar o procedimento recomendado por Perecin et al. (2000) para essa anlise no SAS. Para tanto, suprimimos o Resduo (a) (tratamentos x blocos) do modelo. Vejamos agora como fazer um estudo usando regresso sobre os nveis de poca, dentro de cada tratamento, uma vez que a interao foi significativa. Novamente, faremos uso de variveis auxiliares: EpDtr1 significa pocas dentro do tratamento 1; X1EpDtr1, ser a varivel auxiliar para ajuste linear ( x ) em funo das pocas dentro do tratamento 1; X2EpDtr1, ser a varivel auxiliar para ajuste quadrtico ( x ) para pocas dentro do tratamento 1; As demais variveis auxiliares tm significado anlogo; Note que epoca uma varivel j presente no data set. Exceto pela presena dessas variveis, o data set ficar idntico ao j criado no exemplo 11.
data subdiv; input trat $ epoca bloco BRIX@@; if trat='T1' then EpDtr1=epoca; ELSE EpDtr1=100; if trat='T2' then EpDtr2=epoca; ELSE EpDtr2=100; if trat='T3' then EpDtr3=epoca; ELSE EpDtr3=100;
2 1

56

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

E n sa i os e m p a rce l a s su bd iv i di d a s

X1EpDtr1=EpDtr1; X2EpDtr1=EpDtr1*EpDtr1; X1EpDtr2=EpDtr2; X2EpDtr2=EpDtr2*EpDtr2; X1EpDtr3=EpDtr3; X2EpDtr3=EpDtr3*EpDtr3; cards; T1 0 1 T1 0 5 T1 2 1 T1 2 5 T1 4 1 T1 4 5 T1 6 1 T1 6 5 T1 8 1 T1 8 5 T1 10 1 T1 10 5 T2 0 1 T2 0 5 T2 2 1 T2 2 5 T2 4 1 T2 4 5 T2 6 1 T2 6 5 T2 8 1 T2 8 5 T2 10 1 T2 10 5 T3 0 1 T3 0 5 T3 2 1 T3 2 5 T3 4 1 T3 4 5 T3 6 1 T3 6 5 T3 8 1 T3 8 5 T3 10 1 T3 10 5 ; 17.70 17.30 16.95 19.40 18.95 19.20 18.65 20.10 19.70 20.55 20.75 19.45 16.83 17.75 17.70 19.48 18.00 20.70 18.68 20.03 19.55 20.80 15.56 20.45 16.63 17.26 17.18 18.61 18.05 19.03 18.50 19.48 20.65 20.28 19.90 20.62 T1 0 2 T1 0 6 T1 2 2 T1 2 6 T1 4 2 T1 4 6 T1 6 2 T1 6 6 T1 8 2 T1 8 6 T1 10 2 T1 10 6 T2 0 2 T2 0 6 T2 2 2 T2 2 6 T2 4 2 T2 4 6 T2 6 2 T2 6 6 T2 8 2 T2 8 6 T2 10 2 T2 10 6 T3 0 2 T3 0 6 T3 2 2 T3 2 6 T3 4 2 T3 4 6 T3 6 2 T3 6 6 T3 8 2 T3 8 6 T3 10 2 T3 10 6 17.50 17.60 18.60 18.55 18.10 18.90 18.50 18.75 20.20 20.25 19.00 21.70 16.96 16.90 17.56 18.20 18.05 18.85 18.83 19.63 19.38 20.42 17.18 19.92 17.70 17.18 17.75 18.26 18.20 18.91 19.53 18.95 20.90 20.25 23.96 20.33 T1 0 3 T1 0 7 T1 2 3 T1 2 7 T1 4 3 T1 4 7 T1 6 3 T1 6 7 T1 8 3 T1 8 7 T1 10 3 T1 10 7 T2 0 3 T2 0 7 T2 2 3 T2 2 7 T2 4 3 T2 4 7 T2 6 3 T2 6 7 T2 8 3 T2 8 7 T2 10 3 T2 10 7 T3 0 3 T3 0 7 T3 2 3 T3 2 7 T3 4 3 T3 4 7 T3 6 3 T3 6 7 T3 8 3 T3 8 7 T3 10 3 T3 10 7 17.95 17.40 17.05 17.80 17.60 18.25 19.65 19.25 19.70 19.80 19.85 19.10 17.25 16.70 18.17 18.58 18.55 18.41 17.65 18.70 18.10 19.33 19.00 20.00 17.52 17.43 17.65 18.00 18.57 18.48 19.08 18.77 18.68 19.27 19.08 20.06 T1 0 4 T1 0 8 T1 2 4 T1 2 8 T1 4 4 T1 4 8 T1 6 4 T1 6 8 T1 8 4 T1 8 8 T1 10 4 T1 10 8 T2 0 4 T2 0 8 T2 2 4 T2 2 8 T2 4 4 T2 4 8 T2 6 4 T2 6 8 T2 8 4 T2 8 8 T2 10 4 T2 10 8 T3 0 4 T3 0 8 T3 2 4 T3 2 8 T3 4 4 T3 4 8 T3 6 4 T3 6 8 T3 8 4 T3 8 8 T3 10 4 T3 10 8 17.90 17.75 18.00 18.05 18.35 18.70 18.30 17.40 19.70 18.70 20.80 18.25 18.22 17.19 17.72 18.14 19.52 19.20 20.40 19.71 20.85 21.10 19.40 19.65 17.52 16.52 17.55 16.56 19.57 17.73 19.03 16.54 18.55 15.60 19.03 18.85

proc print; title 'Dados para verificao'; run;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

57

E n sa i o s e m p ar c e l a s su b di v i d i da s

O estudo das regresses pode ser feito com o seguinte programa:


proc glm; title 'Anava - poca dentro de trat. com reg. linear e quadrtica'; class trat epoca bloco EpDtr1 EpDtr2 EpDtr3; model BRIX = bloco trat trat*bloco X1EpDtr1(trat) X2EpDtr1(trat) EpDtr1(trat) X1EpDtr2(trat) X2EpDtr2(trat) EpDtr2(trat) X1EpDtr3(trat) X2EpDtr3(trat) EpDtr3(trat)/SS1; run;

Fato:
Esse programa no simples, e seu entendimento est alm dos objetivos desse curso. Porm, pode ser usado em situaes reais, com as adaptaes necessrias. O programa est no arquivo EXEMP11b.SAS. A obteno das funes lineares e quadrticas mais simples. Note que necessrio criar novos data sets selecionando apenas os dados de cada tratamento. A escolha do grau do polinmio baseou-se na anlise de varincia realizada com o programa apresentado acima.
data trat1; set subdiv; if trat='T1'; run; proc reg data=trat1; title 'Equao de primeiro grau para trat1'; model BRIX = X1EpDtr1; run; data trat2; set subdiv; if trat='T2'; run; proc reg data=trat2; title 'Equao de segundo grau para trat2'; model BRIX = X1EpDtr2 X2EpDtr2; run; data trat3; set subdiv; if trat='T3'; run; proc reg data=trat3; title 'Equao de primeiro grau para trat3'; model BRIX = X1EpDtr3;

58

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

A n li s e d e g ru p o s de e xp e r i m e nt o s

run;

Exerccio 17 Os dados a seguir referem-se a um experimento com parcelas subdivididas, sendo as parcelas referentes a mtodos de irrigao e as subparcelas a espaamentos. O delineamento foi blocos ao acaso (arquivo EXERC17.XLS). Tabela 14. D ad o s ( a l tu r a d e p l an t as ) d e u m ex p er i m e nt o em bl o c o s a o a c a so c o m p a r c e l as s u b d i v i d i d a s .
Ir ri ga o A Bloc B l oc o e sp. esp. 1 58 77 38 52 e sp. esp. 2 44 59 30 34 I rr i ga o B e sp. esp. 1 85 90 73 77 e sp. esp. 2 59 68 45 55 Ir r i ga o C e sp. esp. 1 66 93 67 64 es p. 2 54 75 53 48

I II III IV

Fo nte: Vieira, 1999.


1.

Fazer a anlise de varincia adequada, com teste de Tukey.

16

Anlise de grupos de experimentos


No caso de diversos experimentos semelhantes serem repetidos em diversas condies, como, por exemplo, diversos locais, anos, pocas, etc, podemos usar essa tcnica de anlise. No SAS, essas anlises so relativamente simples se os experimentos repetidos forem iguais. Para tanto, basta especificar corretamente qual o modelo matemtico a ser usado. Exemplo 12 - Trs experimentos para comparao de plantas de Eucaliptus grandis quanto altura (metros) aos 7 anos de idade foram realizados nas localidades de Araraquara, Bento Quirino e Mogi-Gua (Fonte: Eng. Agron, L. C. Costa Coelho, Tupi, SP). O delineamento empregado foi blocos ao acaso (dados no arquivo EXEMP12.SAS). Os resultados podem ser colocados num nico arquivo:
options nodate nonumber ps=65 ls=72; data conjunta; length local $ 12; input local $ trat $ bloco ALTURA@@; datalines;

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

59

A n l i s e d e g ru po s d e e x p e ri m e n to s ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU ; T1 T1 T2 T2 T3 T3 T4 T4 T5 T5 T6 T6 T1 T1 T2 T2 T3 T3 T4 T4 T5 T5 T6 T6 T1 T1 T2 T2 T3 T3 T4 T4 T5 T5 T6 T6 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 20.3 23.5 21.7 16.7 22.0 24.4 20.8 21.3 21.5 22.1 19.6 18.7 10.2 9.1 16.1 10.9 17.7 14.2 13.5 11.2 20.5 11.3 12.0 12.3 22.7 22.9 22.6 20.7 21.4 22.5 25.0 23.3 26.4 28.0 20.6 19.4 ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA ARARAQUARA BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO BENTOQUIRINO MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU MOGI_GUACU T1 T1 T2 T2 T3 T3 T4 T4 T5 T5 T6 T6 T1 T1 T2 T2 T3 T3 T4 T4 T5 T5 T6 T6 T1 T1 T2 T2 T3 T3 T4 T4 T5 T5 T6 T6 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 2 4 19.6 19.1 19.3 18.5 24.9 20.8 23.0 24.9 22.3 21.9 17.7 22.0 11.7 8.1 10.8 10.3 13.1 11.0 14.4 12.8 12.5 12.2 13.0 10.6 21.4 22.0 21.4 20.8 21.7 19.4 23.6 24.8 26.4 27.3 23.5 21.9

proc print; title 'Dados para verificao'; run;

E a anlise para cada local pode ser


proc sort; by local; run;

60

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

A n li s e d e g ru p o s de e xp e r i m e nt o s

proc glm; title 'Anlises individuais'; by local; class trat bloco; model ALTURA = bloco trat; run;

Finalmente, podemos fazer a anlise de varincia conjunta:


proc glm; title 'Anlise conjunta I'; class local trat bloco; model ALTURA = local bloco(local) trat trat*local; run; proc glm; title 'Anlise conjunta II'; class local trat bloco; model ALTURA = local bloco(local) trat trat*local; lsmeans trat*local/slice=local; run;

Notas:
1. 2.

O segundo programa deve ser usado quando a interao for significativa. No primeiro programa, indicou-se bloco(local), que significa blocos dentro de locais, pois a numerao em cada local arbitrria (I, II, etc), no tendo nenhuma relao com a numerao em outro local.

Exerccio 18 Os dados contidos no arquivo EXERC18.SAS e apresentados na Tabela 15, referem-se a experimentos em blocos ao acaso para avaliao de 20 prognies de milho em dois locais (Fonte: Geraldi, I.O.; 2000 - Departamento de Gentica, ESALQ/USP). Pede-se: 1. Fazer as anlises de varincia em cada local. 2. Fazer a anlise de varincia conjunta. 3. Recomendar as prognies superiores. 4. Qual foi o modelo matemtico empregado? (se necessrio, pesquise na bibliografia)

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

61

B i bl i og ra f ia r e co m e n da d a

Tabela 15. D a d o s d e a v a l i a o d e 2 0 p r o g n i es d e m i l ho em bl o c o s a o a c a s o , em
d o i s l o c a i s . P r o d u o e m g /p a r c e l a .
LOCA L 1 LOCA L 2

I
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 251 198 186 121 159 141 232 161 277 144 153 195 159 203 204 166 185 183 214 141

II
192 200 156 147 173 167 242 168 253 142 142 176 155 198 187 142 199 149 198 141

I II
262 153 182 181 142 169 160 155 289 137 149 277 157 183 199 163 183 151 186 176

I
218 150 206 162 176 166 180 204 332 270 158 221 224 282 248 203 147 211 220 136

II
227 153 226 172 263 147 194 229 243 207 163 204 259 279 224 297 223 226 245 155

II I
316 172 234 183 182 204 220 232 273 278 189 205 225 361 184 293 154 258 218 218

Fo nte: G eraldi, 2000

17

Bibliografia recomendada
Alves, M. C. SAS Bsico. Srie Didtica Ciagri n 9. ESALQ/USP, Piracicaba, SP. 1990. Barbin, D. Planejamento e Anlise Estatstica de Experimentos Agronmicos. Apostila. Departamento de Matemtica e Estatstica, ESALQ/USP, Piracicaba, SP. 1994. Cody, R.P.; Smith, J.K. Applied Statistics and the SAS Programming Language. 3rd ed. Elsevier Science Publishing Co., New York. 1991. 403p. Diiorio, F.C. SAS Applications Programming: A Gentle Introduction. Duxbury Press, California. 1997. 684 p.

62

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

B ib l io g ra fi a re com e n d a da

Garcia, A.A.F.; Geraldi, I.O. Alguns Programas no SAS. Publicao didtica. Departamento de Cincias Exatas, ESALQ/USP, Piracicaba, SP. Julho de 2000. 6p. Garcia, A.A.F.; Iemma, A.F. Introduo ao SAS/IML. Publicao didtica. Departamento de Cincias Exatas, Escola Superior de Agricultura "Luiz de Queiroz". Maro de 2000. 20p. Iemma, A. F. Que hipteses estatsticas testamos atravs do SAS em presena de caselas vazias. Sci. Agric. 52(2): 210-220, 1995. Latour, D.; Littell. Advanced General Linear Models with an Emphasis on Mixed Models - Course Notes. SAS Institute Inc., Cary, NC. 1996. Littell, R. C.; Milliken, G. A.; Stroup, W. W.; Wolfinger, R. D. SAS System for Mixed Models. SAS Institute Inc., Cary, NC. 1996. Perecin, D.; Malheiros, E. B.; Pereira, G. T. Variveis auxiliares para expressar desdobramentos de graus de liberdade e contrastes com o programa SAS. Anais da 45 Reunio Anual da Regio Brasileira da Sociedade Internacional de Biometria. Universidade Federal de So Carlos, So Carlos, SP. 2000. p.137-140. Piedade, S. M. S. Aulas prticas de Estatstica Experimental, 1 semestre de 2000. Publicao didtica. Departamento de Cincias Exatas, ESALQ/USP, Piracicaba, SP. Reyes, A. E. L. SAS - Estatstica Bsica. Srie Didtica Ciagri n 17. ESALQ/USP, Piracicaba, SP. 1990. SAS/STAT Users Guide, Version 6, Fourth Edition, vol. 1 e 2. SAS Institute Inc., Cary, NC. 1994. Scott, R.A.; Milliken, G.A. A SAS program for analysing augmented randomized complete block design. Crop Science 33: 865-867, 1993. Zocchi, S.S.; Barbin, D. LCE 602 - Estatstica Experimental, 2 semestre de 1999. Publicao didtica. Departamento de Cincias Exatas, ESALQ/USP, Piracicaba, SP.

L C E 6 0 2 - E st a t st i c a E x p e r i m e n t a l

63

Você também pode gostar