Análise Paramétrica X Não Paramétrica

III SAEPRO 2007 - UFV
Comparao de testes paramtricos e no paramtricos aplicados em

delineamentos experimentais
Gustavo Mello Reis (UFV) gustavo_epr@yahoo.com.br
Jos Ivo Ribeiro Jnior (UFV) jivo@dpi.ufv.br
RESUMO: Para comparar mais de dois nveis de um fator de interesse sob os delineamentos
inteiramente (DIC) e em blocos casualizados (DBC), podem ser usados os testes no
paramtricos de Kruskal-Wallis e Friedman, respectivamente, alm do teste F da anlise de
varincia (A.OVA). Com base na simulao de mil amostras com 5, 10 e 25 repeties por
amostra, foram estimados os alarmes falso () e verdadeiro (poder) sob as distribuies
normal, lognormal e binomial, para Ho verdadeira e falsa, respectivamente. As estimativas
desses alarmes se referem s propores dos p-valores menores ou iguais a cada valor de
terico, no intervalo de 0 1 nas duas hipteses. Desse modo, para um DIC, foram
plotados num grfico de disperso, as estimativas de pelos testes F da A.OVA e de
Kruskal-Wallis em funo do terico, sendo o mesmo feito para as estimativas do poder
(Pd) destes testes. Para um DBC, de acordo com os testes F da A.OVA e de Friedman, foram
adotados os mesmos procedimentos. De acordo com os grficos construdos, concluiu-se que
o teste F, tanto para o DIC quanto para o DBC, proporcionou estimativas do Pd maiores que
a dos testes no paramtricos.
Palavras-chave: Testes de hipteses; Comparao; Delineamentos experimentais.
1. Introduo
A formulao de hipteses tem sido muito empregada em pesquisas de diversas reas
do conhecimento. Para decidir se uma determinada hiptese confirmada por um conjunto de
dados, necessrio ter um procedimento objetivo para aceitar ou rejeitar a hiptese (SIEGEL
& CASTELLAN, 2006).
Segundo Shimakura, mtodos estatsticos so utilizados para o planejamento e
conduo de um estudo, descrio dos dados e para tomada de decises, onde pode-se citar os
testes de hipteses que se baseiam nos riscos associados s mesmas.
Quando formulamos uma deciso sobre Ho podem ocorrer dois erros distintos. O
primeiro, designado por erro tipo I, consiste em rejeitar a hiptese nula quando ela
verdadeira. O segundo, designado por erro tipo II, consiste em aceitar Ho quando ela falsa.
A estes erros esto associados uma probabilidade: P(rejeitar Ho | Ho verdadeira) = ;
P(aceitar Ho | Ho falsa) = (CMARA & SILVA, 2001).
Os testes de hipteses se dividem em paramtricos e no paramtricos. Os
paramtricos so aqueles que utilizam os parmetros da distribuio, ou uma estimativa
destes, para o clculo de sua estatstica. Normalmente, estes testes so mais rigorosos e
possuem mais pressuposies para sua validao. J os no paramtricos utilizam, para o
clculo de sua estatstica, postos atribudos aos dados ordenados e so livres da distribuio
de probabilidades dos dados estudados.
Segundo Moore & McCabe (2002), os testes de hipteses esto entre os tipos mais
comuns de inferncia. Percebe-se que os testes de hipteses paramtricos so os mais
utilizados, muitas vezes devido ao no conhecimento dos seus concorrentes no paramtricos.
No entanto, segundo Siegel & Castellan (2006), a validao dos resultados dos testes
paramtricos depende da verificao de suas pressuposies, como por exemplo a
normalidade dos dados, pressuposio bsica para aplicao da maioria dos testes
paramtricos.
Desse modo, interessante verificar at que ponto os resultados dos testes
paramtricos sero prejudicados quando a pressuposio de normalidade no venha a ser
satisfeita.
2. Testes de hipteses aplicveis em delineamentos experimentais
O teste paramtrico, sob normalidade, mais usual em experimentos com um fator, com
mais de dois nveis de interesse, o F da anlise de varincia (ANOVA), que pode ser
realizado segundo os delineamentos inteiramente casualizado (DIC) e em blocos casualizados
(DBC).
O teste no paramtrico de Kruskal-Wallis foi introduzido por estes autores, Kruskal e
Wallis, em 1952, como um competidor ou um substituto do teste F da ANOVA segundo um
IDC (CAMPOS, 1976). Assim como a maioria dos testes no paramtricos, este tambm
dispe as respostas dos tratamentos que sero comparados na forma de postos. Quanto maior
for a diferena entre a soma dos postos, maior ser a evidncia de que exista diferena entre
os mesmos. Mesmo no precisando da exigncia de normalidade ou de outra distribuio
qualquer para as populaes estudadas, o teste exige que a distribuio dos erros a mesma
para todos os nveis. Como alternativa no paramtrica ao teste F da ANOVA, segundo o
DBC, existe o teste de Friedman.
3. Objetivo
O presente trabalho teve como objetivo principal comparar a eficincia entre os
mtodos paramtricos e no paramtricos aplicveis em comparaes mltiplas, para dados
sob a presena de normalidade ou no. A comparao foi feita atravs das estimativas do erro
e do poder do teste (Pd), em que a probabilidade de rejeitar a hiptese Ho quando ela
verdadeira (alarme falso) e Pd a probabilidade de rejeitar a hiptese Ho quando ela falsa
(alarme verdadeiro).
4. Metodologia empregada
4.1. Simulao dos dados
Para estimar o e o Pd, foi analisado o quadrado do parmetro phi (2) que, segundo
Montgomery & Runger (2003), est relacionado ao parmetro delta () de no centralidade.
Foi adotado 2 = 0 (Ho verdadeira) para estudar o estimado e 2 = 4 (Ho falsa) para
estudar o Pd estimado, de acordo com a seguinte frmula:
a
n i2
2 =
i =1
a 2
, em que:
n = n de repeties (DIC) = n de blocos (DBC);

i = efeito do tratamento i;
a = n de mdias a serem testadas;
2 = varincia do erro experimental.
Os parmetros n (n de repeties) e a (n de mdias a serem testadas) foram

especificados em a = 5 (nveis) e n = 5, 10 ou 25. J os parmetros i e 2 foram estabelecidos
de forma a obter 2 = 0 e 2 = 4, para as hipteses Ho falsa e veradeira, respectivamente.
No primeiro caso, para obter 2 = 0, basta adotar i = 0, i, i = {1, 2, 3, 4, 5}. J no
segundo caso, para obter 2 = 4, deve-se combinar os valores dos is com os valores de 2.
a
Logo, pode-se obter o valor do
2
i
atravs da equao de 2, da seguinte forma:
i =1
a
n i2
2 =
i =1
a 2
i2 =
=>
i =1
a 2 2
n
Neste estudo foram simulados dados por meio da imposio de que i 0 para
somente um tratamento. Logo, para a = 5 e 2 = 4, tem-se 1 = 2 = 3 = 4 = 0 , sendo a
equao utilizada para estimar 5 igual a:
(0 2 + 0 2 + 0 2 + 0 2 + 52 ) =
5 2 4
n
=>
5 =
20 2
n
=>
5 =
20
n
No caso do DBC, primeiro foi realizada a simulao da distribuio com os

parmetros de interesse, assim como no DIC, para depois somar a estes, os efeitos dos blocos
e, em seguida, o erro aleatrio relacionado a cada valor. O efeito do bloco foi representado
pela adio de 40 unidades em relao ao bloco anterior.
Os efeitos do erro aleatrio foram simulados de acordo com as seguintes distribuies:
Os parmetros que regem as trs distribuies e tambm o tamanho da amostra (n),
foram analisados em diferentes situaes com o objetivo de verificar qual o efeito que estes
parmetros tm sobre o e o Pd estimados.
Para os dados simulados a partir da distribuio lognormal, foram considerados os
parmetros l = ln() e l = / , de forma aproximada.
A confiabilidade deste estudo se baseia na quantidade de amostras simuladas. Para a
construo de cada grfico ilustrado foram simuladas quinhentas mil amostras e aplicados
duzentos mil testes. Desconsiderando as simulaes em fase de teste e outras que tiveram que
ser refeitas para alguma alterao, para a realizao deste estudo foram simuladas dez milhes
e quinhentas mil amostras e aplicados quatro milhes e duzentos mil testes.
4.2. Realizao dos Testes

Como a probabilidade de rejeitar Ho quando esta verdadeira (2 = 0) e o Pd a
probabilidade de rejeitar Ho quando esta falsa (2 = 4), a estimao destes foi realizada por
meio de 1000 amostras simuladas de cada distribuio estudada. Em seguida foram aplicados
os testes estatsticos paramtricos, F da ANOVA DIC (ADIC) e da ANOVA DBC (ADBC), e
no paramtricos, de Kruskal-Wallis (K-W) e de Friedman (Fr). Os parmetros utilizados na
simulao dos dados foram aqueles utilizados na formulao das hipteses Hos. Para
aplicao do teste binomial, foram realizadas algumas manipulaes nos dados simulados.
Primeiro foi realizada uma subtrao dos valores da amostra simulada pela mdia
populacional (). Em seguida foi atribudo o valor 1 para os valores positivos e 0 para os
valores negativos, sendo os valores nulos descartados. Por fim, o teste binomial foi aplicado
nova amostra de zeros e uns, sendo p = 0,5 a hiptese nula (Ho).
4.3. Programa R
As simulaes dos dados, a aplicao dos testes e as estimativas do e do Pd, foram
realizados utilizando-se o programa gratuito R. No programa, foram programadas funes
para gerar os dados de acordo com os parmetros de interesse e para aplicar os testes sobre os
dados criados, armazenando o p-valor de cada teste, para as 1000 amostras de cada
distribuio.
Com os 1000 p-valores retornados de cada teste e de acordo com o de referncia
variando de 0 a 1 em intervalos de 0,001, foram contabilizados quantas amostras foram
rejeitadas no respectivos valores de que, pela definio, o estimado ( ), para 2 = 0, ou
seja, a probabilidade de rejeitar a hiptese nula quando esta verdadeira (alarme falso) e, o Pd
estimado ( Pd ), para 2 = 4, ou seja, a probabilidade rejeitar a hiptese nula quando esta
falsa (alarme verdadeiro).
Para obter valores mais precisos do e do Pd estimados, a funo foi programada,
tambm, para repetir o processo de simulao dos dados, aplicao dos testes e estimao do
e do Pd, por 100 vezes e, em seguida, calcular a mdia dos 100 valores encontrados para
cada de referncia. Assim, com mais preciso, a mdia encontrada, em cada caso, ser o e
o Pd estimados, que foram salvos em arquivos do tipo csv.
4.4. Grfico de disperso

Para melhor avaliar o e o Pd estimados, foram plotados grficos de disperso da
probabilidade acumulada, onde para 2 = 0 permitiu estudar o estimado (eixo y) em funo
do de referncia (eixo x) e, para 2 = 4, foi estudado o Pd estimado (eixo y) em funo do
de referncia (eixo x), para todos os testes aplicados.
Sendo a distncia no eixo x ( de referncia), entre um par ordenado e outro, de apenas
0,001, estes pares foram ligados por linhas para reproduzir a continuidade destes valores, ou
seja, ao invs de mostrar inmeros pontos consecutivos que distam entre si de apenas 0,001,
foi exibida uma linha contnua que percorre todo o digrama de disperso.
Os grficos de disperso da probabilidade acumulada, foram construdos no programa
comercial Microsoft Excel, contendo uma linha representativa de cada teste em estudo, para
cada uma das trs distribuies.
4.5. Anlise dos grficos

Para a anlise do erro , primeiro foi comparada uma situao com o aumento do
desvio padro (), para as distribuies de probabilidades normal e lognormal. Para a
binomial, fez-se referncia ao coeficiente de variao (CV), ao invs do , porque a mdia
nem sempre era mantida. J para o CV ( / ), esta variao na mdia ser considerada. Neste
caso, tem-se = nb p (1 p) e = nb x p. Note que para indicar o nmero de itens
avaliados na distribuio binomial, foi utilizado o smbolo nb, com objetivo de diferenci-lo
do smbolo n que, neste estudo, representa o tamanho da amostra simulada. Em seguida, foi
avaliado um aumento do tamanho da amostra simulada (n).
Para anlise do Pd , teve uma comparao a mais em relao ao , que a comparao
do desvio para cima da mdia ( positivo) com o desvio para baixo da mdia ( negativo),
sendo as outras iguais s utilizadas para o .
As discusses para , ser feita com base em s de referncia no intervalo de 0 a
0,20, o qual exibido no grfico. J para o Pd, os s de referncia exibidos estaro no
intervalo de 0 a 0,30. Estes intervalos foram escolhidos de forma a obter uma melhor
comparao visual dos testes, e, tambm, por abranger a maior parte dos estudos.
Para facilitar a indicao dos parmetros simulados em cada grfico, considere como
apresentado na Tabela 1, para i variando de 1 a 4.
TABELA 1. Parmetros das distribuies
Distribuio 8ormal
Distribuio Log8ormal
Distribuio Binomial
ni = n5 = n
ni = n5 = n
ni = n5 = n
i = ; 5 = +
li = l = ln(); l5 = ln( + )
nbi = nb5 = nb
i =
li = l /; l5 /(+ )
pi = p; p5 = p + p
Onde: =
p (1 p)
20
20
e, p = p
, sendo p =
.
n
n
nb
Em que p o desvio padro do parmetro p da distribuio binomial.

Note que quando = 0, para o estudo de alfa, tem-se i = 5 (normal), li = l5 e li =
l5 (lognormal) e quando p = 0, pi = p5 (binomial).
5. Resultados e Discusses
5.1. Alfa
Observando os grficos a seguir, pode-se perceber certa semelhana entre os

resultados obtidos para o DIC e DBC, sendo as especificaes dos testes de Kruskal-Wallis
(K-W), e Friedman (Fr), semelhantes para as distribuies normal, lognormal e binomial.
Ao aumentar o ou o CV, observa-se nas Figuras 1 e 2 (normal), 4 e 5 (lognormal) e 7
e 8 (binomial), que no houve grandes alteraes para o estimado em todos os testes.
Percebe-se tambm, que ao aumentar o n de 5 para 25, observa-se nas Figuras 1 e 3
(normal), 4 e 6 (lognormal) e 7 e 9 (binomial), que h um aumento nas estimativas de para
os testes no paramtricos, K-W e Fr, tanto que estes passam a ter s estimados semelhantes
aos observados para a ANOVA (ADIC e ADBC), sendo esta pouco influenciada pelo
aumento de n. De todo modo, todas as estimativas de esto prximas aos valores tericos.
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
5.1.1. Distribuio 8ormal
0,10
ADBC
K-W
0,05
0,00
0,00
K-W
0,05
0,00
0,05
0,10
0,15
0,20
de referncia
0,00
0,05
0,10
0,15
0,20
de referncia
FIGURA 1 - Amostras simuladas com n = 5, = 1000, = 30, = 0
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,00
0,00
0,05
0,05
0,10
0,15
0,00
0,00
0,20
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,05
0,00
0,00
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
5.1.2. Distribuio Log8ormal
0,10
ADBC
K-W
0,05
0,00
0,00
K-W
0,05
0,05
0,10
0,15
0,20
0,00
0,00
de referncia
0,05
0,10
0,15
0,20
de referncia
FIGURA 4 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = 0
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,05
0,00
0,00
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
estimado
estimado
0,10
ADBC
K-W
K-W
0,05
0,05
0,00
0,00
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
K-W
0,05
0,10
ADBC
K-W
0,05
0,00
0,00
estimado
estimado
5.1.3. Distribuio Binomial
0,00
0,05
0,10
0,15
0,20
0,00
de referncia
0,05
0,10
0,15
0,20
de referncia
FIGURA 7 - Amostras simuladas com n = 5, nb = 1000, p = 0,1, p = 0
0,20
0,20
0,15
0,15
0,10
ADIC
K-W
estimado
estimado
0,05
ADBC
K-W
0,05
0,00
0,00
0,10
0,00
0,05
0,10
0,15
0,20
0,00
0,05
de referncia
0,10
0,15
0,20
de referncia
0,20
0,20
0,15
0,15
0,10
ADIC
K-W
0,05
0,10
ADBC
K-W
0,05
0,00
0,00
estimado
estimado
0,00
0,05
0,10
0,15
0,20
0,00
de referncia
0,05
0,10
0,15
0,20
de referncia
5.2. Poder
Para a estimao do PD, a semelhana observada entre o DIC e DBC est relacionada
ao comportamento dos testes, quando se altera as variveis em estudo. De forma geral, as
estimativas do Pd dos testes utilizados no DBC foram menores que aquelas obtidas no DIC,
em todas as situaes estudadas. Entretanto, essa diferena foi maior entre os testes no
paramtrico.
Entre as distribuies, a semelhana observada com relao ao aumento de n, de 5
para 10, em que as estimativas do Pd dos testes aumentaram significativamente, sendo os
aumentos ocorridos nos testes no paramtricos, maiores que nos paramtricos, mas no
suficiente para alcanar o Pd dos ltimos que foram sempre superiores em todos os casos
estudados.
As mudanas no desvio da mdia, para baixo e para cima, provocado em um dos
tratamentos (), no alterou o Pd dos testes sob distribuio normal (Figuras 10 e 11), como j
era de se esperar, j que uma distribuio simtrica. Para a distribuio lognormal
(Figuras14 e 15), observa-se uma pequena queda no Pd dos testes no paramtricos, K-W e
Fr, ao provocar um desvio para baixo da mdia. J para a distribuio binomial (Figuras 18 e
19) percebe-se um maior Pd para ambos os testes ao provocar um desvio para baixo da mdia.
Para um aumento no na distribuio normal (Figuras 10 e 12), no houve mudana
significativa na estimativa do Pd dos testes. J para a distribuio lognormal (Figuras 14 e
16), percebeu-se uma ligeira diminuio no Pd do teste F da ADIC e da ADBC e um ligeiro
aumento no Pd dos testes K-W e Fr. Esta diferena pode ser explicada pelo maior
distanciamento da distribuio normal ao aumentar o l da distribuio lognormal. No
entanto, o teste F continuou tendo maior Pd para < 0,20, que abrange a maior parte dos
estudos. J para a distribuio binomial (Figuras 18 e 20), houve uma diminuio no Pd dos
testes ao aumentar o CV. Novamente, esta alterao se deve ao maior distanciamento da
distribuio normal ao diminuir o nb (aumento de CV) da distribuio binomial. No entanto, a
distncia entre o Pd do teste F (ADIC e ADBC) e os testes no paramtricos, K-W e Fr,
aumentou. Portanto, este distanciamento da normalidade beneficiou o teste paramtrico,
diferentemente do esperado.
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
5.2.1. Distribuio 8ormal
0,90
0,85
ADBC
0,80
K-W
0,75
0,75
0,70
0,00 0,05 0,10 0,15 0,20 0,25 0,30
0,70
0,00
0,05
de referncia
0,10
0,15
0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
0,75
0,70
0,00 0,05
Poder estimado
Poder estimado
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,10
0,15
0,20
0,25 0,30
0,00
de referncia
0,05
0,10
0,15
0,20
0,25
0,30
de referncia
FIGURA 11 - Amostras simuladas com n = 5, = 1000, = 30, = -60
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,70
0,00 0,05
0,10
0,15
0,20
0,25 0,30
0,00
0,05
de referncia
0,10
0,15
0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
FIGURA 12 - Amostras simuladas com n = 5, = 1000, = 150, =300
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,00 0,05
0,70
0,10
0,15
0,20
0,25 0,30
0,00
0,05
de referncia
0,10
0,15
0,20
0,25
0,30
de referncia
FIGURA 13 - Amostras simuladas com n = 10, = 1000, = 30, = 30 2
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,00
Poder estimado
Poder estimado
5.2.2. Distribuio Log8ormal
0,05
0,10
0,15 0,20
0,25
0,30
0,70
0,00 0,05 0,10
de referncia
0,15 0,20
0,25
0,30
de referncia
10
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
0,90
0,85
ADBC
0,80
K-W
0,75
0,75
0,70
0,00 0,05 0,10 0,15 0,20 0,25 0,30
0,70
0,00 0,05 0,10
de referncia
0,15 0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
Poder estimado
Poder estimado
FIGURA 15 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = -60
0,75
0,85
ADBC
0,80
K-W
0,75
0,70
0,00
0,90
0,70
0,05
0,10
0,15 0,20
0,25
0,30
0,00
0,05
de referncia
0,10
0,15 0,20
0,25
0,30
de referncia
1,00
1,00
0,95
0,95
0,90
0,85
ADIC
0,80
K-W
0,75
0,90
0,85
ADBC
0,80
K-W
0,75
0,70
0,00
Poder estimado
Poder estimado
0,70
0,05
0,10
0,15 0,20
de referncia
0,25
0,30
0,00
0,05
0,10
0,15 0,20
0,25
0,30
de referncia
FIGURA 17 - Amostras simuladas com n = 10, l = ln(1000), l = 30/1000, = 30 2
11
1,00
1,00
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
5.2.3. Distribuio Binomial
0,75
ADBC
0,85
K-W
0,80
0,75
0,70
0,00
0,90
0,70
0,05
0,10
0,15
0,20
0,25
0,30
0,00 0,05
de referncia
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
1,00
0,75
0,25 0,30
0,90
ADBC
0,85
K-W
0,80
0,75
0,70
0,10 0,15 0,20
0,25 0,30
0,00 0,05
de referncia
0,10
0,15
0,20
0,25 0,30
de referncia
FIGURA 19 - Amostras simuladas com n = 5, nb=1000, p=0,1, p =
1,00
1,00
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
0,20
0,36
1000
1,00
0,75
0,70
0,00 0,05
0,15
de referncia
0,70
0,00 0,05
0,10
0,36
1000
0,90
ADBC
0,85
K-W
0,80
0,75
0,10 0,15 0,20
0,25 0,30
0,70
0,00 0,05
de referncia
0,10
0,15
0,20
0,25 0,30
de referncia
0,36
100
12
1,00
1,00
0,95
0,95
0,90
ADIC
0,85
K-W
0,80
Poder estimado
Poder estimado
0,75
0,70
0,00 0,05
0,90
ADBC
0,85
K-W
0,80
0,75
0,10 0,15 0,20
0,25 0,30
0,70
0,00 0,05
0,10
de referncia
0,15
0,20
0,25 0,30
de referncia
0,18
1000
6. Concluses
O teste paramtrico F da ANOVA obteve resultados mais satisfatrios que os testes

no paramtricos de Kruskal-Wallis e de Friedman, mesmo para situaes que se distanciam
da normalidade. Pode-se observar um maior Pd para o teste F no intervalo estudado (
0,20), alm de que os valores de estimados por este teste foram muito prximos ao de
referncia, em todos os casos estudados.
Resultado semelhante foi obtido por Feir & Toothaker (1974), onde eles concluram
que o teste de Kruskal-Wallis tem seu Pd afetado pela diminuio do tamanho da amostra e,
tambm, pela diminuio da varincia, para baixos nveis de significncia (), sendo o teste F
da ANOVA capaz de se adaptar melhor s diferentes situaes.
A mudana dos parmetros das distribuies lognormal e binomial provocam maiores
alteraes no comportamento dos testes em relao distribuio normal, principalmente para
os testes no paramtricos.
Em sntese, no h necessidade de substituir o teste paramtrico F pelos seus
respectivos competidores no paramtricos na ausncia de normalidade.
Referncias
CMARA, F. G. & SILVA, O. Estatstica No Paramtrica - Testes de Hipteses e Medidas de Associao.
Departamento de Matemtica - Universidade dos Aores, Ponta Delgada, 2001.
CAMPOS, H. Estatstica experimental no paramtrica. 2 ed. Escola Superior de Agricultura Luiz de Queiroz,
USP. Piracicaba, 1976.
FEIR, BETTY J. & TOOTHAKER, LARRY E. The ANOVA F-Test Versus The Kruskal-Wallis Test: A
Robustness Study. Artigo publicado em: Annual Meeting of the American Educational Research Association.
Chicago, 1974.
MONTGOMERY, D.C. & RUNGER, G.C. Estatstica aplicada e probabilidade para engenheiros. Traduo de
Vernica Calado. 2a ed. Rio de Janeiro: Editora LTC, 2003.
MOORE, D. S. & MCCABE, G. P. Introduo prtica da estatstica. 3 ed. Rio de Janeiro: Editora LTC, 2002.
SIEGEL, S. & CASTELLAN JR., N. J. Estatstica no-paramtrica para cincias do comportamento. Traduo
de Sara Ianda Correa Carmona. 2 ed. Porto Alegre: Editora Artmed, 2006.
SHIMAKURA, S. E. Bioestatstica A. Departamento
http://leg.ufpr.br/~shimakur/CE055/. Acesso em: 29/08/2007.
de
Estatstica,
UFPR.
Disponvel
em:
13

Análise Paramétrica X Não Paramétrica

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análise Paramétrica X Não Paramétrica

Enviado por

Direitos autorais:

Formatos disponíveis

III SAEPRO 2007 - UFV

Comparao de testes paramtricos e no paramtricos aplicados em

III SAEPRO 2007 - UFV

n = n de repeties (DIC) = n de blocos (DBC);

III SAEPRO 2007 - UFV

Os parmetros n (n de repeties) e a (n de mdias a serem testadas) foram

Logo, pode-se obter o valor do

atravs da equao de 2, da seguinte forma:

No caso do DBC, primeiro foi realizada a simulao da distribuio com os

4.2. Realizao dos Testes

III SAEPRO 2007 - UFV

4.4. Grfico de disperso

4.5. Anlise dos grficos

III SAEPRO 2007 - UFV

Em que p o desvio padro do parmetro p da distribuio binomial.

Observando os grficos a seguir, pode-se perceber certa semelhana entre os

5.1.1. Distribuio 8ormal

FIGURA 1 - Amostras simuladas com n = 5, = 1000, = 30, = 0

III SAEPRO 2007 - UFV

FIGURA 2 - Amostras simuladas com n = 5, = 1000, = 150, = 0

FIGURA 3 - Amostras simuladas com n = 25, = 1000, = 30, = 0

5.1.2. Distribuio Log8ormal

FIGURA 4 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = 0

III SAEPRO 2007 - UFV

FIGURA 5 - Amostras simuladas com n = 5, l = ln(1000), l = 150/1000, = 0

FIGURA 6 - Amostras simuladas com n = 25, l = ln(1000), l = 30/1000, = 0

5.1.3. Distribuio Binomial

FIGURA 7 - Amostras simuladas com n = 5, nb = 1000, p = 0,1, p = 0

III SAEPRO 2007 - UFV

FIGURA 8 - Amostras simuladas com n = 5, nb = 100, p = 0,1, p = 0

FIGURA 9 - Amostras simuladas com n = 25, nb = 1000, p = 0,1, p = 0

III SAEPRO 2007 - UFV

5.2.1. Distribuio 8ormal

FIGURA 10 - Amostras simuladas com n = 5, = 1000, = 30, = 60

FIGURA 11 - Amostras simuladas com n = 5, = 1000, = 30, = -60

III SAEPRO 2007 - UFV

FIGURA 12 - Amostras simuladas com n = 5, = 1000, = 150, =300

FIGURA 13 - Amostras simuladas com n = 10, = 1000, = 30, = 30 2

5.2.2. Distribuio Log8ormal

FIGURA 14 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = 60

III SAEPRO 2007 - UFV

FIGURA 15 - Amostras simuladas com n = 5, l = ln(1000), l = 30/1000, = -60

FIGURA 16 - Amostras simuladas com n = 5, l = ln(1000), l = 150/1000, = 300

FIGURA 17 - Amostras simuladas com n = 10, l = ln(1000), l = 30/1000, = 30 2

III SAEPRO 2007 - UFV

5.2.3. Distribuio Binomial

0,10 0,15 0,20

FIGURA 19 - Amostras simuladas com n = 5, nb=1000, p=0,1, p =

FIGURA 18 - Amostras simuladas com n = 5, nb=1000, p=0,1, p =

0,10 0,15 0,20

FIGURA 20 - Amostras simuladas com n = 5, nb=100, p=0,1, p =

III SAEPRO 2007 - UFV

0,10 0,15 0,20

FIGURA 21 - Amostras simuladas com n = 10, nb=1000, p=0,1, p =

O teste paramtrico F da ANOVA obteve resultados mais satisfatrios que os testes

Você também pode gostar