Você está na página 1de 13

III SAEPRO 2007 - UFV

Comparao de testes paramtricos e no paramtricos aplicados em


delineamentos experimentais
Gustavo Mello Reis (UFV) gustavo_epr@yahoo.com.br
Jos Ivo Ribeiro Jnior (UFV) jivo@dpi.ufv.br

RESUMO: Para comparar mais de dois nveis de um fator de interesse sob os delineamentos
inteiramente (DIC) e em blocos casualizados (DBC), podem ser usados os testes no
paramtricos de Kruskal-Wallis e Friedman, respectivamente, alm do teste F da anlise de
varincia (A.OVA). Com base na simulao de mil amostras com 5, 10 e 25 repeties por
amostra, foram estimados os alarmes falso () e verdadeiro (poder) sob as distribuies
normal, lognormal e binomial, para Ho verdadeira e falsa, respectivamente. As estimativas
desses alarmes se referem s propores dos p-valores menores ou iguais a cada valor de
terico, no intervalo de 0 1 nas duas hipteses. Desse modo, para um DIC, foram
plotados num grfico de disperso, as estimativas de pelos testes F da A.OVA e de
Kruskal-Wallis em funo do terico, sendo o mesmo feito para as estimativas do poder
(Pd) destes testes. Para um DBC, de acordo com os testes F da A.OVA e de Friedman, foram
adotados os mesmos procedimentos. De acordo com os grficos construdos, concluiu-se que
o teste F, tanto para o DIC quanto para o DBC, proporcionou estimativas do Pd maiores que
a dos testes no paramtricos.
Palavras-chave: Testes de hipteses; Comparao; Delineamentos experimentais.
1. Introduo
A formulao de hipteses tem sido muito empregada em pesquisas de diversas reas
do conhecimento. Para decidir se uma determinada hiptese confirmada por um conjunto de
dados, necessrio ter um procedimento objetivo para aceitar ou rejeitar a hiptese (SIEGEL
& CASTELLAN, 2006).
Segundo Shimakura, mtodos estatsticos so utilizados para o planejamento e
conduo de um estudo, descrio dos dados e para tomada de decises, onde pode-se citar os
testes de hipteses que se baseiam nos riscos associados s mesmas.
Quando formulamos uma deciso sobre Ho podem ocorrer dois erros distintos. O
primeiro, designado por erro tipo I, consiste em rejeitar a hiptese nula quando ela
verdadeira. O segundo, designado por erro tipo II, consiste em aceitar Ho quando ela falsa.
A estes erros esto associados uma probabilidade: P(rejeitar Ho | Ho verdadeira) = ;
P(aceitar Ho | Ho falsa) = (CMARA & SILVA, 2001).
Os testes de hipteses se dividem em paramtricos e no paramtricos. Os
paramtricos so aqueles que utilizam os parmetros da distribuio, ou uma estimativa
destes, para o clculo de sua estatstica. Normalmente, estes testes so mais rigorosos e
possuem mais pressuposies para sua validao. J os no paramtricos utilizam, para o
clculo de sua estatstica, postos atribudos aos dados ordenados e so livres da distribuio
de probabilidades dos dados estudados.
Segundo Moore & McCabe (2002), os testes de hipteses esto entre os tipos mais
comuns de inferncia. Percebe-se que os testes de hipteses paramtricos so os mais
utilizados, muitas vezes devido ao no conhecimento dos seus concorrentes no paramtricos.

III SAEPRO 2007 - UFV

No entanto, segundo Siegel & Castellan (2006), a validao dos resultados dos testes
paramtricos depende da verificao de suas pressuposies, como por exemplo a
normalidade dos dados, pressuposio bsica para aplicao da maioria dos testes
paramtricos.
Desse modo, interessante verificar at que ponto os resultados dos testes
paramtricos sero prejudicados quando a pressuposio de normalidade no venha a ser
satisfeita.
2. Testes de hipteses aplicveis em delineamentos experimentais
O teste paramtrico, sob normalidade, mais usual em experimentos com um fator, com
mais de dois nveis de interesse, o F da anlise de varincia (ANOVA), que pode ser
realizado segundo os delineamentos inteiramente casualizado (DIC) e em blocos casualizados
(DBC).
O teste no paramtrico de Kruskal-Wallis foi introduzido por estes autores, Kruskal e
Wallis, em 1952, como um competidor ou um substituto do teste F da ANOVA segundo um
IDC (CAMPOS, 1976). Assim como a maioria dos testes no paramtricos, este tambm
dispe as respostas dos tratamentos que sero comparados na forma de postos. Quanto maior
for a diferena entre a soma dos postos, maior ser a evidncia de que exista diferena entre
os mesmos. Mesmo no precisando da exigncia de normalidade ou de outra distribuio
qualquer para as populaes estudadas, o teste exige que a distribuio dos erros a mesma
para todos os nveis. Como alternativa no paramtrica ao teste F da ANOVA, segundo o
DBC, existe o teste de Friedman.
3. Objetivo
O presente trabalho teve como objetivo principal comparar a eficincia entre os
mtodos paramtricos e no paramtricos aplicveis em comparaes mltiplas, para dados
sob a presena de normalidade ou no. A comparao foi feita atravs das estimativas do erro
e do poder do teste (Pd), em que a probabilidade de rejeitar a hiptese Ho quando ela
verdadeira (alarme falso) e Pd a probabilidade de rejeitar a hiptese Ho quando ela falsa
(alarme verdadeiro).
4. Metodologia empregada
4.1. Simulao dos dados
Para estimar o e o Pd, foi analisado o quadrado do parmetro phi (2) que, segundo
Montgomery & Runger (2003), est relacionado ao parmetro delta () de no centralidade.
Foi adotado 2 = 0 (Ho verdadeira) para estudar o estimado e 2 = 4 (Ho falsa) para
estudar o Pd estimado, de acordo com a seguinte frmula:
a

n i2
2 =

i =1

a 2

, em que:

n = n de repeties (DIC) = n de blocos (DBC);


i = efeito do tratamento i;
a = n de mdias a serem testadas;
2 = varincia do erro experimental.

III SAEPRO 2007 - UFV

Os parmetros n (n de repeties) e a (n de mdias a serem testadas) foram


especificados em a = 5 (nveis) e n = 5, 10 ou 25. J os parmetros i e 2 foram estabelecidos
de forma a obter 2 = 0 e 2 = 4, para as hipteses Ho falsa e veradeira, respectivamente.
No primeiro caso, para obter 2 = 0, basta adotar i = 0, i, i = {1, 2, 3, 4, 5}. J no
segundo caso, para obter 2 = 4, deve-se combinar os valores dos is com os valores de 2.
a

Logo, pode-se obter o valor do

2
i

atravs da equao de 2, da seguinte forma:

i =1
a

n i2
2 =

i =1

a 2

i2 =

=>

i =1

a 2 2
n

Neste estudo foram simulados dados por meio da imposio de que i 0 para
somente um tratamento. Logo, para a = 5 e 2 = 4, tem-se 1 = 2 = 3 = 4 = 0 , sendo a
equao utilizada para estimar 5 igual a:
(0 2 + 0 2 + 0 2 + 0 2 + 52 ) =

5 2 4
n

=>

5 =

20 2
n

=>

5 =

20
n

No caso do DBC, primeiro foi realizada a simulao da distribuio com os


parmetros de interesse, assim como no DIC, para depois somar a estes, os efeitos dos blocos
e, em seguida, o erro aleatrio relacionado a cada valor. O efeito do bloco foi representado
pela adio de 40 unidades em relao ao bloco anterior.
Os efeitos do erro aleatrio foram simulados de acordo com as seguintes distribuies:
Os parmetros que regem as trs distribuies e tambm o tamanho da amostra (n),
foram analisados em diferentes situaes com o objetivo de verificar qual o efeito que estes
parmetros tm sobre o e o Pd estimados.
Para os dados simulados a partir da distribuio lognormal, foram considerados os
parmetros l = ln() e l = / , de forma aproximada.
A confiabilidade deste estudo se baseia na quantidade de amostras simuladas. Para a
construo de cada grfico ilustrado foram simuladas quinhentas mil amostras e aplicados
duzentos mil testes. Desconsiderando as simulaes em fase de teste e outras que tiveram que
ser refeitas para alguma alterao, para a realizao deste estudo foram simuladas dez milhes
e quinhentas mil amostras e aplicados quatro milhes e duzentos mil testes.

4.2. Realizao dos Testes


Como a probabilidade de rejeitar Ho quando esta verdadeira (2 = 0) e o Pd a
probabilidade de rejeitar Ho quando esta falsa (2 = 4), a estimao destes foi realizada por
meio de 1000 amostras simuladas de cada distribuio estudada. Em seguida foram aplicados
os testes estatsticos paramtricos, F da ANOVA DIC (ADIC) e da ANOVA DBC (ADBC), e
no paramtricos, de Kruskal-Wallis (K-W) e de Friedman (Fr). Os parmetros utilizados na
simulao dos dados foram aqueles utilizados na formulao das hipteses Hos. Para
aplicao do teste binomial, foram realizadas algumas manipulaes nos dados simulados.
Primeiro foi realizada uma subtrao dos valores da amostra simulada pela mdia
populacional (). Em seguida foi atribudo o valor 1 para os valores positivos e 0 para os
valores negativos, sendo os valores nulos descartados. Por fim, o teste binomial foi aplicado
nova amostra de zeros e uns, sendo p = 0,5 a hiptese nula (Ho).

III SAEPRO 2007 - UFV

4.3. Programa R
As simulaes dos dados, a aplicao dos testes e as estimativas do e do Pd, foram
realizados utilizando-se o programa gratuito R. No programa, foram programadas funes
para gerar os dados de acordo com os parmetros de interesse e para aplicar os testes sobre os
dados criados, armazenando o p-valor de cada teste, para as 1000 amostras de cada
distribuio.
Com os 1000 p-valores retornados de cada teste e de acordo com o de referncia
variando de 0 a 1 em intervalos de 0,001, foram contabilizados quantas amostras foram
rejeitadas no respectivos valores de que, pela definio, o estimado ( ), para 2 = 0, ou
seja, a probabilidade de rejeitar a hiptese nula quando esta verdadeira (alarme falso) e, o Pd
estimado ( Pd ), para 2 = 4, ou seja, a probabilidade rejeitar a hiptese nula quando esta
falsa (alarme verdadeiro).
Para obter valores mais precisos do e do Pd estimados, a funo foi programada,
tambm, para repetir o processo de simulao dos dados, aplicao dos testes e estimao do
e do Pd, por 100 vezes e, em seguida, calcular a mdia dos 100 valores encontrados para
cada de referncia. Assim, com mais preciso, a mdia encontrada, em cada caso, ser o e
o Pd estimados, que foram salvos em arquivos do tipo csv.

4.4. Grfico de disperso


Para melhor avaliar o e o Pd estimados, foram plotados grficos de disperso da
probabilidade acumulada, onde para 2 = 0 permitiu estudar o estimado (eixo y) em funo
do de referncia (eixo x) e, para 2 = 4, foi estudado o Pd estimado (eixo y) em funo do
de referncia (eixo x), para todos os testes aplicados.
Sendo a distncia no eixo x ( de referncia), entre um par ordenado e outro, de apenas
0,001, estes pares foram ligados por linhas para reproduzir a continuidade destes valores, ou
seja, ao invs de mostrar inmeros pontos consecutivos que distam entre si de apenas 0,001,
foi exibida uma linha contnua que percorre todo o digrama de disperso.
Os grficos de disperso da probabilidade acumulada, foram construdos no programa
comercial Microsoft Excel, contendo uma linha representativa de cada teste em estudo, para
cada uma das trs distribuies.

4.5. Anlise dos grficos


Para a anlise do erro , primeiro foi comparada uma situao com o aumento do
desvio padro (), para as distribuies de probabilidades normal e lognormal. Para a
binomial, fez-se referncia ao coeficiente de variao (CV), ao invs do , porque a mdia
nem sempre era mantida. J para o CV ( / ), esta variao na mdia ser considerada. Neste
caso, tem-se = nb p (1 p) e = nb x p. Note que para indicar o nmero de itens
avaliados na distribuio binomial, foi utilizado o smbolo nb, com objetivo de diferenci-lo
do smbolo n que, neste estudo, representa o tamanho da amostra simulada. Em seguida, foi
avaliado um aumento do tamanho da amostra simulada (n).
Para anlise do Pd , teve uma comparao a mais em relao ao , que a comparao
do desvio para cima da mdia ( positivo) com o desvio para baixo da mdia ( negativo),
sendo as outras iguais s utilizadas para o .
As discusses para , ser feita com base em s de referncia no intervalo de 0 a
0,20, o qual exibido no grfico. J para o Pd, os s de referncia exibidos estaro no

III SAEPRO 2007 - UFV

intervalo de 0 a 0,30. Estes intervalos foram escolhidos de forma a obter uma melhor
comparao visual dos testes, e, tambm, por abranger a maior parte dos estudos.
Para facilitar a indicao dos parmetros simulados em cada grfico, considere como
apresentado na Tabela 1, para i variando de 1 a 4.
TABELA 1. Parmetros das distribuies

Distribuio 8ormal

Distribuio Log8ormal

Distribuio Binomial

ni = n5 = n

ni = n5 = n

ni = n5 = n

i = ; 5 = +

li = l = ln(); l5 = ln( + )

nbi = nb5 = nb

i =

li = l /; l5 /(+ )

pi = p; p5 = p + p

Onde: =

p (1 p)
20
20
e, p = p
, sendo p =
.
n
n
nb

Em que p o desvio padro do parmetro p da distribuio binomial.


Note que quando = 0, para o estudo de alfa, tem-se i = 5 (normal), li = l5 e li =
l5 (lognormal) e quando p = 0, pi = p5 (binomial).
5. Resultados e Discusses
5.1. Alfa

Observando os grficos a seguir, pode-se perceber certa semelhana entre os


resultados obtidos para o DIC e DBC, sendo as especificaes dos testes de Kruskal-Wallis
(K-W), e Friedman (Fr), semelhantes para as distribuies normal, lognormal e binomial.
Ao aumentar o ou o CV, observa-se nas Figuras 1 e 2 (normal), 4 e 5 (lognormal) e 7
e 8 (binomial), que no houve grandes alteraes para o estimado em todos os testes.
Percebe-se tambm, que ao aumentar o n de 5 para 25, observa-se nas Figuras 1 e 3
(normal), 4 e 6 (lognormal) e 7 e 9 (binomial), que h um aumento nas estimativas de para
os testes no paramtricos, K-W e Fr, tanto que estes passam a ter s estimados semelhantes
aos observados para a ANOVA (ADIC e ADBC), sendo esta pouco influenciada pelo
aumento de n. De todo modo, todas as estimativas de esto prximas aos valores tericos.

0,20

0,20

0,15

0,15

0,10

ADIC

estimado

estimado

5.1.1. Distribuio 8ormal

0,10

ADBC

K-W
0,05

0,00
0,00

K-W
0,05

0,00
0,05

0,10

0,15

0,20

de referncia

0,00

0,05

0,10

0,15

0,20

de referncia

FIGURA 1 - Amostras simuladas com n = 5, = 1000, = 30, = 0

0,20

0,20

0,15

0,15

0,10

ADIC

estimado

estimado

III SAEPRO 2007 - UFV

0,10

ADBC

K-W

K-W

0,05

0,00
0,00

0,05

0,05

0,10

0,15

0,00
0,00

0,20

0,05

de referncia

0,10

0,15

0,20

de referncia

0,20

0,20

0,15

0,15

0,10

ADIC

estimado

estimado

FIGURA 2 - Amostras simuladas com n = 5, = 1000, = 150, = 0

0,10

ADBC

K-W

K-W

0,05

0,05

0,00
0,00

0,00
0,05

0,10

0,15

0,20

0,00

0,05

de referncia

0,10

0,15

0,20

de referncia

FIGURA 3 - Amostras simuladas com n = 25, = 1000, = 30, = 0

0,20

0,20

0,15

0,15

0,10

ADIC

estimado

estimado

5.1.2. Distribuio Log8ormal

0,10

ADBC

K-W
0,05

0,00
0,00

K-W
0,05

0,05

0,10

0,15

0,20

0,00
0,00

de referncia

0,05

0,10

0,15

0,20

de referncia

FIGURA 4 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = 0

0,20

0,20

0,15

0,15

0,10

ADIC

estimado

estimado

III SAEPRO 2007 - UFV

0,10

ADBC

K-W

K-W

0,05

0,05

0,00
0,00

0,00
0,05

0,10

0,15

0,20

0,00

0,05

de referncia

0,10

0,15

0,20

de referncia

0,20

0,20

0,15

0,15

0,10

ADIC

estimado

estimado

FIGURA 5 - Amostras simuladas com n = 5, l = ln(1000), l = 150/1000, = 0

0,10

ADBC

K-W

K-W

0,05

0,05

0,00
0,00

0,00
0,05

0,10

0,15

0,20

0,00

0,05

de referncia

0,10

0,15

0,20

de referncia

FIGURA 6 - Amostras simuladas com n = 25, l = ln(1000), l = 30/1000, = 0

0,20

0,20

0,15

0,15

0,10

ADIC
K-W

0,05

0,10

ADBC
K-W

0,05

0,00
0,00

estimado

estimado

5.1.3. Distribuio Binomial

0,00
0,05

0,10

0,15

0,20

0,00

de referncia

0,05

0,10

0,15

0,20

de referncia

FIGURA 7 - Amostras simuladas com n = 5, nb = 1000, p = 0,1, p = 0

0,20

0,20

0,15

0,15

0,10

ADIC
K-W

estimado

estimado

III SAEPRO 2007 - UFV

0,05

ADBC
K-W

0,05

0,00
0,00

0,10

0,00
0,05

0,10

0,15

0,20

0,00

0,05

de referncia

0,10

0,15

0,20

de referncia

0,20

0,20

0,15

0,15

0,10

ADIC
K-W

0,05

0,10

ADBC
K-W

0,05

0,00
0,00

estimado

estimado

FIGURA 8 - Amostras simuladas com n = 5, nb = 100, p = 0,1, p = 0

0,00
0,05

0,10

0,15

0,20

0,00

de referncia

0,05

0,10

0,15

0,20

de referncia

FIGURA 9 - Amostras simuladas com n = 25, nb = 1000, p = 0,1, p = 0

5.2. Poder

Para a estimao do PD, a semelhana observada entre o DIC e DBC est relacionada
ao comportamento dos testes, quando se altera as variveis em estudo. De forma geral, as
estimativas do Pd dos testes utilizados no DBC foram menores que aquelas obtidas no DIC,
em todas as situaes estudadas. Entretanto, essa diferena foi maior entre os testes no
paramtrico.
Entre as distribuies, a semelhana observada com relao ao aumento de n, de 5
para 10, em que as estimativas do Pd dos testes aumentaram significativamente, sendo os
aumentos ocorridos nos testes no paramtricos, maiores que nos paramtricos, mas no
suficiente para alcanar o Pd dos ltimos que foram sempre superiores em todos os casos
estudados.
As mudanas no desvio da mdia, para baixo e para cima, provocado em um dos
tratamentos (), no alterou o Pd dos testes sob distribuio normal (Figuras 10 e 11), como j
era de se esperar, j que uma distribuio simtrica. Para a distribuio lognormal
(Figuras14 e 15), observa-se uma pequena queda no Pd dos testes no paramtricos, K-W e

III SAEPRO 2007 - UFV

Fr, ao provocar um desvio para baixo da mdia. J para a distribuio binomial (Figuras 18 e
19) percebe-se um maior Pd para ambos os testes ao provocar um desvio para baixo da mdia.
Para um aumento no na distribuio normal (Figuras 10 e 12), no houve mudana
significativa na estimativa do Pd dos testes. J para a distribuio lognormal (Figuras 14 e
16), percebeu-se uma ligeira diminuio no Pd do teste F da ADIC e da ADBC e um ligeiro
aumento no Pd dos testes K-W e Fr. Esta diferena pode ser explicada pelo maior
distanciamento da distribuio normal ao aumentar o l da distribuio lognormal. No
entanto, o teste F continuou tendo maior Pd para < 0,20, que abrange a maior parte dos
estudos. J para a distribuio binomial (Figuras 18 e 20), houve uma diminuio no Pd dos
testes ao aumentar o CV. Novamente, esta alterao se deve ao maior distanciamento da
distribuio normal ao diminuir o nb (aumento de CV) da distribuio binomial. No entanto, a
distncia entre o Pd do teste F (ADIC e ADBC) e os testes no paramtricos, K-W e Fr,
aumentou. Portanto, este distanciamento da normalidade beneficiou o teste paramtrico,
diferentemente do esperado.

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

Poder estimado

Poder estimado

5.2.1. Distribuio 8ormal

0,90
0,85

ADBC

0,80

K-W

0,75

0,75

0,70
0,00 0,05 0,10 0,15 0,20 0,25 0,30

0,70
0,00

0,05

de referncia

0,10

0,15

0,20

0,25

0,30

de referncia

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

0,75
0,70
0,00 0,05

Poder estimado

Poder estimado

FIGURA 10 - Amostras simuladas com n = 5, = 1000, = 30, = 60

0,90
0,85

ADBC

0,80

K-W

0,75
0,70
0,10

0,15

0,20

0,25 0,30

0,00

de referncia

0,05

0,10

0,15

0,20

0,25

0,30

de referncia

FIGURA 11 - Amostras simuladas com n = 5, = 1000, = 30, = -60

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

Poder estimado

Poder estimado

III SAEPRO 2007 - UFV

0,75

0,90
0,85

ADBC

0,80

K-W

0,75

0,70

0,70

0,00 0,05

0,10

0,15

0,20

0,25 0,30

0,00

0,05

de referncia

0,10

0,15

0,20

0,25

0,30

de referncia

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

Poder estimado

Poder estimado

FIGURA 12 - Amostras simuladas com n = 5, = 1000, = 150, =300

0,75

0,90
0,85

ADBC

0,80

K-W

0,75

0,70
0,00 0,05

0,70
0,10

0,15

0,20

0,25 0,30

0,00

0,05

de referncia

0,10

0,15

0,20

0,25

0,30

de referncia

FIGURA 13 - Amostras simuladas com n = 10, = 1000, = 30, = 30 2

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

0,75

0,90
0,85

ADBC

0,80

K-W

0,75

0,70
0,00

Poder estimado

Poder estimado

5.2.2. Distribuio Log8ormal

0,05

0,10

0,15 0,20

0,25

0,30

0,70
0,00 0,05 0,10

de referncia

0,15 0,20

0,25

0,30

de referncia

FIGURA 14 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = 60

10

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

Poder estimado

Poder estimado

III SAEPRO 2007 - UFV

0,90
0,85

ADBC

0,80

K-W

0,75

0,75

0,70
0,00 0,05 0,10 0,15 0,20 0,25 0,30

0,70
0,00 0,05 0,10

de referncia

0,15 0,20

0,25

0,30

de referncia

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

Poder estimado

Poder estimado

FIGURA 15 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = -60

0,75

0,85

ADBC

0,80

K-W

0,75

0,70
0,00

0,90

0,70
0,05

0,10

0,15 0,20

0,25

0,30

0,00

0,05

de referncia

0,10

0,15 0,20

0,25

0,30

de referncia

1,00

1,00

0,95

0,95

0,90
0,85

ADIC

0,80

K-W

0,75

0,90
0,85

ADBC

0,80

K-W

0,75

0,70
0,00

Poder estimado

Poder estimado

FIGURA 16 - Amostras simuladas com n = 5, l = ln(1000), l = 150/1000, = 300

0,70
0,05

0,10

0,15 0,20

de referncia

0,25

0,30

0,00

0,05

0,10

0,15 0,20

0,25

0,30

de referncia

FIGURA 17 - Amostras simuladas com n = 10, l = ln(1000), l = 30/1000, = 30 2

11

III SAEPRO 2007 - UFV

1,00

1,00

0,95

0,95

0,90
ADIC

0,85

K-W

0,80

Poder estimado

Poder estimado

5.2.3. Distribuio Binomial

0,75

ADBC

0,85

K-W

0,80
0,75

0,70
0,00

0,90

0,70
0,05

0,10

0,15

0,20

0,25

0,30

0,00 0,05

de referncia

0,95

0,95

0,90
ADIC

0,85

K-W

0,80

Poder estimado

Poder estimado

1,00

0,75

0,25 0,30

0,90
ADBC

0,85

K-W

0,80
0,75
0,70

0,10 0,15 0,20

0,25 0,30

0,00 0,05

de referncia

0,10

0,15

0,20

0,25 0,30

de referncia

FIGURA 19 - Amostras simuladas com n = 5, nb=1000, p=0,1, p =

1,00

1,00

0,95

0,95

0,90
ADIC

0,85

K-W

0,80

Poder estimado

Poder estimado

0,20

0,36
1000

1,00

0,75
0,70
0,00 0,05

0,15

de referncia

FIGURA 18 - Amostras simuladas com n = 5, nb=1000, p=0,1, p =

0,70
0,00 0,05

0,10

0,36
1000

0,90
ADBC

0,85

K-W

0,80
0,75

0,10 0,15 0,20

0,25 0,30

0,70
0,00 0,05

de referncia

FIGURA 20 - Amostras simuladas com n = 5, nb=100, p=0,1, p =

0,10

0,15

0,20

0,25 0,30

de referncia

0,36
100

12

1,00

1,00

0,95

0,95

0,90
ADIC

0,85

K-W

0,80

Poder estimado

Poder estimado

III SAEPRO 2007 - UFV

0,75
0,70
0,00 0,05

0,90
ADBC

0,85

K-W

0,80
0,75

0,10 0,15 0,20

0,25 0,30

0,70
0,00 0,05

0,10

de referncia

0,15

0,20

0,25 0,30

de referncia

FIGURA 21 - Amostras simuladas com n = 10, nb=1000, p=0,1, p =

0,18
1000

6. Concluses

O teste paramtrico F da ANOVA obteve resultados mais satisfatrios que os testes


no paramtricos de Kruskal-Wallis e de Friedman, mesmo para situaes que se distanciam
da normalidade. Pode-se observar um maior Pd para o teste F no intervalo estudado (
0,20), alm de que os valores de estimados por este teste foram muito prximos ao de
referncia, em todos os casos estudados.
Resultado semelhante foi obtido por Feir & Toothaker (1974), onde eles concluram
que o teste de Kruskal-Wallis tem seu Pd afetado pela diminuio do tamanho da amostra e,
tambm, pela diminuio da varincia, para baixos nveis de significncia (), sendo o teste F
da ANOVA capaz de se adaptar melhor s diferentes situaes.
A mudana dos parmetros das distribuies lognormal e binomial provocam maiores
alteraes no comportamento dos testes em relao distribuio normal, principalmente para
os testes no paramtricos.
Em sntese, no h necessidade de substituir o teste paramtrico F pelos seus
respectivos competidores no paramtricos na ausncia de normalidade.
Referncias
CMARA, F. G. & SILVA, O. Estatstica No Paramtrica - Testes de Hipteses e Medidas de Associao.
Departamento de Matemtica - Universidade dos Aores, Ponta Delgada, 2001.
CAMPOS, H. Estatstica experimental no paramtrica. 2 ed. Escola Superior de Agricultura Luiz de Queiroz,
USP. Piracicaba, 1976.
FEIR, BETTY J. & TOOTHAKER, LARRY E. The ANOVA F-Test Versus The Kruskal-Wallis Test: A
Robustness Study. Artigo publicado em: Annual Meeting of the American Educational Research Association.
Chicago, 1974.
MONTGOMERY, D.C. & RUNGER, G.C. Estatstica aplicada e probabilidade para engenheiros. Traduo de
Vernica Calado. 2a ed. Rio de Janeiro: Editora LTC, 2003.
MOORE, D. S. & MCCABE, G. P. Introduo prtica da estatstica. 3 ed. Rio de Janeiro: Editora LTC, 2002.
SIEGEL, S. & CASTELLAN JR., N. J. Estatstica no-paramtrica para cincias do comportamento. Traduo
de Sara Ianda Correa Carmona. 2 ed. Porto Alegre: Editora Artmed, 2006.
SHIMAKURA, S. E. Bioestatstica A. Departamento
http://leg.ufpr.br/~shimakur/CE055/. Acesso em: 29/08/2007.

de

Estatstica,

UFPR.

Disponvel

em:

13

Você também pode gostar