Escolar Documentos
Profissional Documentos
Cultura Documentos
RESUMO: Para comparar mais de dois nveis de um fator de interesse sob os delineamentos
inteiramente (DIC) e em blocos casualizados (DBC), podem ser usados os testes no
paramtricos de Kruskal-Wallis e Friedman, respectivamente, alm do teste F da anlise de
varincia (A.OVA). Com base na simulao de mil amostras com 5, 10 e 25 repeties por
amostra, foram estimados os alarmes falso () e verdadeiro (poder) sob as distribuies
normal, lognormal e binomial, para Ho verdadeira e falsa, respectivamente. As estimativas
desses alarmes se referem s propores dos p-valores menores ou iguais a cada valor de
terico, no intervalo de 0 1 nas duas hipteses. Desse modo, para um DIC, foram
plotados num grfico de disperso, as estimativas de pelos testes F da A.OVA e de
Kruskal-Wallis em funo do terico, sendo o mesmo feito para as estimativas do poder
(Pd) destes testes. Para um DBC, de acordo com os testes F da A.OVA e de Friedman, foram
adotados os mesmos procedimentos. De acordo com os grficos construdos, concluiu-se que
o teste F, tanto para o DIC quanto para o DBC, proporcionou estimativas do Pd maiores que
a dos testes no paramtricos.
Palavras-chave: Testes de hipteses; Comparao; Delineamentos experimentais.
1. Introduo
A formulao de hipteses tem sido muito empregada em pesquisas de diversas reas
do conhecimento. Para decidir se uma determinada hiptese confirmada por um conjunto de
dados, necessrio ter um procedimento objetivo para aceitar ou rejeitar a hiptese (SIEGEL
& CASTELLAN, 2006).
Segundo Shimakura, mtodos estatsticos so utilizados para o planejamento e
conduo de um estudo, descrio dos dados e para tomada de decises, onde pode-se citar os
testes de hipteses que se baseiam nos riscos associados s mesmas.
Quando formulamos uma deciso sobre Ho podem ocorrer dois erros distintos. O
primeiro, designado por erro tipo I, consiste em rejeitar a hiptese nula quando ela
verdadeira. O segundo, designado por erro tipo II, consiste em aceitar Ho quando ela falsa.
A estes erros esto associados uma probabilidade: P(rejeitar Ho | Ho verdadeira) = ;
P(aceitar Ho | Ho falsa) = (CMARA & SILVA, 2001).
Os testes de hipteses se dividem em paramtricos e no paramtricos. Os
paramtricos so aqueles que utilizam os parmetros da distribuio, ou uma estimativa
destes, para o clculo de sua estatstica. Normalmente, estes testes so mais rigorosos e
possuem mais pressuposies para sua validao. J os no paramtricos utilizam, para o
clculo de sua estatstica, postos atribudos aos dados ordenados e so livres da distribuio
de probabilidades dos dados estudados.
Segundo Moore & McCabe (2002), os testes de hipteses esto entre os tipos mais
comuns de inferncia. Percebe-se que os testes de hipteses paramtricos so os mais
utilizados, muitas vezes devido ao no conhecimento dos seus concorrentes no paramtricos.
No entanto, segundo Siegel & Castellan (2006), a validao dos resultados dos testes
paramtricos depende da verificao de suas pressuposies, como por exemplo a
normalidade dos dados, pressuposio bsica para aplicao da maioria dos testes
paramtricos.
Desse modo, interessante verificar at que ponto os resultados dos testes
paramtricos sero prejudicados quando a pressuposio de normalidade no venha a ser
satisfeita.
2. Testes de hipteses aplicveis em delineamentos experimentais
O teste paramtrico, sob normalidade, mais usual em experimentos com um fator, com
mais de dois nveis de interesse, o F da anlise de varincia (ANOVA), que pode ser
realizado segundo os delineamentos inteiramente casualizado (DIC) e em blocos casualizados
(DBC).
O teste no paramtrico de Kruskal-Wallis foi introduzido por estes autores, Kruskal e
Wallis, em 1952, como um competidor ou um substituto do teste F da ANOVA segundo um
IDC (CAMPOS, 1976). Assim como a maioria dos testes no paramtricos, este tambm
dispe as respostas dos tratamentos que sero comparados na forma de postos. Quanto maior
for a diferena entre a soma dos postos, maior ser a evidncia de que exista diferena entre
os mesmos. Mesmo no precisando da exigncia de normalidade ou de outra distribuio
qualquer para as populaes estudadas, o teste exige que a distribuio dos erros a mesma
para todos os nveis. Como alternativa no paramtrica ao teste F da ANOVA, segundo o
DBC, existe o teste de Friedman.
3. Objetivo
O presente trabalho teve como objetivo principal comparar a eficincia entre os
mtodos paramtricos e no paramtricos aplicveis em comparaes mltiplas, para dados
sob a presena de normalidade ou no. A comparao foi feita atravs das estimativas do erro
e do poder do teste (Pd), em que a probabilidade de rejeitar a hiptese Ho quando ela
verdadeira (alarme falso) e Pd a probabilidade de rejeitar a hiptese Ho quando ela falsa
(alarme verdadeiro).
4. Metodologia empregada
4.1. Simulao dos dados
Para estimar o e o Pd, foi analisado o quadrado do parmetro phi (2) que, segundo
Montgomery & Runger (2003), est relacionado ao parmetro delta () de no centralidade.
Foi adotado 2 = 0 (Ho verdadeira) para estudar o estimado e 2 = 4 (Ho falsa) para
estudar o Pd estimado, de acordo com a seguinte frmula:
a
n i2
2 =
i =1
a 2
, em que:
2
i
i =1
a
n i2
2 =
i =1
a 2
i2 =
=>
i =1
a 2 2
n
Neste estudo foram simulados dados por meio da imposio de que i 0 para
somente um tratamento. Logo, para a = 5 e 2 = 4, tem-se 1 = 2 = 3 = 4 = 0 , sendo a
equao utilizada para estimar 5 igual a:
(0 2 + 0 2 + 0 2 + 0 2 + 52 ) =
5 2 4
n
=>
5 =
20 2
n
=>
5 =
20
n
4.3. Programa R
As simulaes dos dados, a aplicao dos testes e as estimativas do e do Pd, foram
realizados utilizando-se o programa gratuito R. No programa, foram programadas funes
para gerar os dados de acordo com os parmetros de interesse e para aplicar os testes sobre os
dados criados, armazenando o p-valor de cada teste, para as 1000 amostras de cada
distribuio.
Com os 1000 p-valores retornados de cada teste e de acordo com o de referncia
variando de 0 a 1 em intervalos de 0,001, foram contabilizados quantas amostras foram
rejeitadas no respectivos valores de que, pela definio, o estimado ( ), para 2 = 0, ou
seja, a probabilidade de rejeitar a hiptese nula quando esta verdadeira (alarme falso) e, o Pd
estimado ( Pd ), para 2 = 4, ou seja, a probabilidade rejeitar a hiptese nula quando esta
falsa (alarme verdadeiro).
Para obter valores mais precisos do e do Pd estimados, a funo foi programada,
tambm, para repetir o processo de simulao dos dados, aplicao dos testes e estimao do
e do Pd, por 100 vezes e, em seguida, calcular a mdia dos 100 valores encontrados para
cada de referncia. Assim, com mais preciso, a mdia encontrada, em cada caso, ser o e
o Pd estimados, que foram salvos em arquivos do tipo csv.
intervalo de 0 a 0,30. Estes intervalos foram escolhidos de forma a obter uma melhor
comparao visual dos testes, e, tambm, por abranger a maior parte dos estudos.
Para facilitar a indicao dos parmetros simulados em cada grfico, considere como
apresentado na Tabela 1, para i variando de 1 a 4.
TABELA 1. Parmetros das distribuies
Distribuio 8ormal
Distribuio Log8ormal
Distribuio Binomial
ni = n5 = n
ni = n5 = n
ni = n5 = n
i = ; 5 = +
li = l = ln(); l5 = ln( + )
nbi = nb5 = nb
i =
li = l /; l5 /(+ )
pi = p; p5 = p + p
Onde: =
p (1 p)
20
20
e, p = p
, sendo p =
.
n
n
nb
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
0,05
0,00
0,00
K-W
0,05
0,00
0,05
0,10
0,15
0,20
de referncia
0,00
0,05
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,00
0,00
0,05
0,05
0,10
0,15
0,00
0,00
0,20
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,05
0,00
0,00
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
0,05
0,00
0,00
K-W
0,05
0,05
0,10
0,15
0,20
0,00
0,00
de referncia
0,05
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,05
0,00
0,00
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,05
0,00
0,00
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
K-W
0,05
0,10
ADBC
K-W
0,05
0,00
0,00
estimado
estimado
0,00
0,05
0,10
0,15
0,20
0,00
de referncia
0,05
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
K-W
estimado
estimado
0,05
ADBC
K-W
0,05
0,00
0,00
0,10
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
K-W
0,05
0,10
ADBC
K-W
0,05
0,00
0,00
estimado
estimado
0,00
0,05
0,10
0,15
0,20
0,00
de referncia
0,05
0,10
0,15
0,20
de referncia
5.2. Poder
Para a estimao do PD, a semelhana observada entre o DIC e DBC est relacionada
ao comportamento dos testes, quando se altera as variveis em estudo. De forma geral, as
estimativas do Pd dos testes utilizados no DBC foram menores que aquelas obtidas no DIC,
em todas as situaes estudadas. Entretanto, essa diferena foi maior entre os testes no
paramtrico.
Entre as distribuies, a semelhana observada com relao ao aumento de n, de 5
para 10, em que as estimativas do Pd dos testes aumentaram significativamente, sendo os
aumentos ocorridos nos testes no paramtricos, maiores que nos paramtricos, mas no
suficiente para alcanar o Pd dos ltimos que foram sempre superiores em todos os casos
estudados.
As mudanas no desvio da mdia, para baixo e para cima, provocado em um dos
tratamentos (), no alterou o Pd dos testes sob distribuio normal (Figuras 10 e 11), como j
era de se esperar, j que uma distribuio simtrica. Para a distribuio lognormal
(Figuras14 e 15), observa-se uma pequena queda no Pd dos testes no paramtricos, K-W e
Fr, ao provocar um desvio para baixo da mdia. J para a distribuio binomial (Figuras 18 e
19) percebe-se um maior Pd para ambos os testes ao provocar um desvio para baixo da mdia.
Para um aumento no na distribuio normal (Figuras 10 e 12), no houve mudana
significativa na estimativa do Pd dos testes. J para a distribuio lognormal (Figuras 14 e
16), percebeu-se uma ligeira diminuio no Pd do teste F da ADIC e da ADBC e um ligeiro
aumento no Pd dos testes K-W e Fr. Esta diferena pode ser explicada pelo maior
distanciamento da distribuio normal ao aumentar o l da distribuio lognormal. No
entanto, o teste F continuou tendo maior Pd para < 0,20, que abrange a maior parte dos
estudos. J para a distribuio binomial (Figuras 18 e 20), houve uma diminuio no Pd dos
testes ao aumentar o CV. Novamente, esta alterao se deve ao maior distanciamento da
distribuio normal ao diminuir o nb (aumento de CV) da distribuio binomial. No entanto, a
distncia entre o Pd do teste F (ADIC e ADBC) e os testes no paramtricos, K-W e Fr,
aumentou. Portanto, este distanciamento da normalidade beneficiou o teste paramtrico,
diferentemente do esperado.
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,90
0,85
ADBC
0,80
K-W
0,75
0,75
0,70
0,00 0,05 0,10 0,15 0,20 0,25 0,30
0,70
0,00
0,05
de referncia
0,10
0,15
0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
0,75
0,70
0,00 0,05
Poder estimado
Poder estimado
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,10
0,15
0,20
0,25 0,30
0,00
de referncia
0,05
0,10
0,15
0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,70
0,00 0,05
0,10
0,15
0,20
0,25 0,30
0,00
0,05
de referncia
0,10
0,15
0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,00 0,05
0,70
0,10
0,15
0,20
0,25 0,30
0,00
0,05
de referncia
0,10
0,15
0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,00
Poder estimado
Poder estimado
0,05
0,10
0,15 0,20
0,25
0,30
0,70
0,00 0,05 0,10
de referncia
0,15 0,20
0,25
0,30
de referncia
10
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,90
0,85
ADBC
0,80
K-W
0,75
0,75
0,70
0,00 0,05 0,10 0,15 0,20 0,25 0,30
0,70
0,00 0,05 0,10
de referncia
0,15 0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,75
0,85
ADBC
0,80
K-W
0,75
0,70
0,00
0,90
0,70
0,05
0,10
0,15 0,20
0,25
0,30
0,00
0,05
de referncia
0,10
0,15 0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,00
Poder estimado
Poder estimado
0,70
0,05
0,10
0,15 0,20
de referncia
0,25
0,30
0,00
0,05
0,10
0,15 0,20
0,25
0,30
de referncia
11
1,00
1,00
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
0,75
ADBC
0,85
K-W
0,80
0,75
0,70
0,00
0,90
0,70
0,05
0,10
0,15
0,20
0,25
0,30
0,00 0,05
de referncia
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
1,00
0,75
0,25 0,30
0,90
ADBC
0,85
K-W
0,80
0,75
0,70
0,25 0,30
0,00 0,05
de referncia
0,10
0,15
0,20
0,25 0,30
de referncia
1,00
1,00
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
0,20
0,36
1000
1,00
0,75
0,70
0,00 0,05
0,15
de referncia
0,70
0,00 0,05
0,10
0,36
1000
0,90
ADBC
0,85
K-W
0,80
0,75
0,25 0,30
0,70
0,00 0,05
de referncia
0,10
0,15
0,20
0,25 0,30
de referncia
0,36
100
12
1,00
1,00
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
0,75
0,70
0,00 0,05
0,90
ADBC
0,85
K-W
0,80
0,75
0,25 0,30
0,70
0,00 0,05
0,10
de referncia
0,15
0,20
0,25 0,30
de referncia
0,18
1000
6. Concluses
de
Estatstica,
UFPR.
Disponvel
em:
13