Escolar Documentos
Profissional Documentos
Cultura Documentos
Desvendando a Estatstica
com o R Commander
1 Introduo p. 3
2 Estatstica Descritiva p. 13
2.1 Grficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
Referncias Bibliogrficas p. 43
Anexo A -- Tabela da distribuio Normal p. 44
1 Introduo
Convm resaltar que a utilizao direta de softwares amigveis, sem o prvio conhecimento
dos fundamentos da metodologia, pode constituir um grande risco e levar o usurio a
interpretaes perigosamente equivocadas (RODRIGUES; IEMMA, 2005).
http://cran.r-project.org/
> require(Rcmdr)
Na primeira vez que o R Commander for inicializado ser solicitada a instalao de vrios
pacotes necessrios para o seu correto funcionamento. Aceite a solicitao, escolha o espelho
para download dos pacotes e aguarde a finalizao da instalao e a abertura do R Commander
(Fig. 1.2).
Os dados utilizados pelo R Commander podem ser digitados diretamente nele, seguindo
os seguintes passos: [Dados] [Novo conjunto de dados...], e em seguinda escolhendo um
nome para o conjunto de dados. Contudo, na prtica, os resultados so digitados em planilhas
eletrnicas para posteriormente serem importados para os programas estatsticos.
Uma janela ser aberta para que seja informado o nome do conjunto de dados. Na
sequncia, outra janela ser aberta para que seja selecionado o arquivo do Excel. Aps escolher
o arquivo de origem dos dados ser solicitada a planilha do arquivo que deve ser importada,
caso o arquivo possua mais de uma planilha.
1.2 Dados no R Commander 6
Todas as planilhas de arquivos do Excel e do Calc podem ser salvas com extenso CSV. Para
fazer isto, abra o arquivo no programa Excel ou Calc e execute os seguintes passos: [Arquivo]
[Salvar como...]. Na janela que abrir informe o nome do arquivo e, logo abaixo, escolha a
opo CSV (separado por vrgulas) no Excel ou Texto CSV (.csv) no Calc.
Apesar do Excel informar que o os campos sero separados por vrgula, eles sero separador
por ponto e vrgula. No Calc uma janela ser aberta para escolher o delimitador de campo, que
deve ser alterado para ponto e vrgula (Fig. 1.4), porque, no Brasil, a vrgula utilizada como
separador de decimais.
Na janela que abrir escolha um nome para o conjunto de dados, altere o separador de
campos para Outro - Defina: [;] e o separador de decimais para Vrgula [,] (Fig. 1.6).
Logo aps, ser aberta uma janela para informar o nome do arquivo com formato CSV que
deseja importar.
1.2 Dados no R Commander 7
Figura 1.6: Definio de parmetros para importao de dados de arquivos com extenso CSV.
O nome das variveis de uma determinada coluna deve estar na primeira linha;
No devem ser utilizados caractres especiais (, ascentos, entre outros) nos dados
informados na planilha;
Dicas:
Exclua todas as linhas e colunas da planilha que j haviam sido utilizadas e que no
pertenam ao conjunto de dados do experimento;
A normalidade dos dados uma exigncia comum para a aplicao de testes de hiptese.
Se a suposio de normalidade dos dados no aceitvel, podemos adotar a estratgia de
transformao da varivel. Transformaes so nada mais do que uma forma de reescrever
os dados numa unidade diferente.
Contagens: x - Contribui para tornar as varincias muito menores e desta forma mais
facilmente obter homocedasticidade (varincias iguais).
1 x
Propores: log ou arcsen ( x) - Contribuem para alterar a forma da
2 1x
distribuio dos dados.
1 1+x
Correlaes: Fisher: z(x) = log
2 1x
Concentraes: log(x) ou ln(x) - Contribui para tornar as varincias muito menores e
desta forma mais facilmente obter homocedasticidade.
Tabela 1.1: Dados amostrais referentes ao nmero dirio de peas defeituosas em uma linha de
produo.
4 5 4 3 2 9 5 4 2 4
Para criar uma nova varivel com os dados transformados deve-se seguir os seguintes
passos: [Dados] [Modificao de variveis no conjunto de dados...] [Computar nova
varivel...] (Fig. 1.8).
Uma janela ser aberta para informar o nome da nova varivel e a expresso matemtica
para calcular os valores desta varivel (raiz = sqrt, arcsen = asin, log10 = log10 e ln = log).
1.2 Dados no R Commander 10
Muitas vezes necessita-se converter dados amostrais em formato numrico para um fator,
ou vice-versa. O R Commander possui uma opo para fazer isto de forma automtica. Para
exemplificar o uso desta opo considere o seguinte exemplo:
O primeiro passo informar ou importar estes valores para o R Commander (1a coluna da
Fig. 1.11).
Para converter cada nota em um conceito (fator), siga os seguintes passos: [Dados]
[Modificao de variveis no conjunto de dados...] [Recodificar varivel...] (Fig. 1.12).
Uma janela ser aberta para informar o nome da nova varivel e as definies para
recodificao (Fig. 1.13). O comando : utilizado para indicar sequncia, ou seja, a primeira
linha da definio abaixo diz que o conceito D corresponde as notas entre 0 e 5,9. O resultado
da converso apresentada na segunda coluna da figura 1.11. A converso de fatores para dados
numricos segue a mesma metodologia.
1.2 Dados no R Commander 12
Figura 1.13: Configurao no R Commander do nome da nova varivel e das definies para
recodificao.
13
2 Estatstica Descritiva
A estatstica descritiva um ramo da estatstica que aplica vrias tcnicas para descrever e
sumarizar um conjunto de dados. O tratamento dos dados na estatstica descritiva tem como
objetivo organiz-los e resumi-los, a fim de facilitar a interepretao de uma determinada
varivel atravs de uma amostra.
Uma tabela de nmeros no nada interessante para um engenheiro que deseja analisar
a qualidade das peas produzidas. A questo que a estatstica descritiva deseja responder
de como este conjunto de informaes pode ser apresentado de forma resumida e de fcil
interpretao.
2.1 Grficos
Sem a menor dvida, a melhor maneira de analisar uma srie de dados graficamente.
A tentativa de ver padres e tendncias em uma relao de dados escritos em uma tabela
certamente resultar em fracasso, especialmente quando o nmero de dados grande.
Para criar um grfico (histograma) dos resultados apresentados na tabela 2, o primeiro passo
determinar em quantas classes (k) os valores sero divididos. Este valor comumente dado
pela raiz quadrada do tamanho da amostra (n), ou seja,
k= n = 40 6,3245 (2.1)
Assim, para este exemplo, podemos utilizar 6 ou 7 classes no histograma. Optaremos por 6
classes. O prximo passo calcular a amplitude total (AT ) da amostra, que dada pela diferena
entre o maior e o menor valor observado (xi ), ou seja,
Para definir o intervalo referente a cada classe calcula-se a amplitude de classe (AC ), dada
por:
AT 4,57
AC = = = 0,7617 (2.3)
k 6
O incio da primeira classe pode ser arredondado para baixo para utilizar um valor que
facilite a interpretao do grfico. A amplitude de classe tambm pode ser arredondada, para
cima ou para baixo, com o mesmo objetivo. Tais arredondamentos podem variar um pouco o
nmero de classes pr-definido sem perda da qualidade do resultado.
8
6
4
2
0
Conjunto1$comprimento
Figura 2.2: Opo no R Commander para criao de histograma de uma varivel do conjunto
de dados ativo.
Na janela aberta (Fig. 2.3) deve-se escolher a varivel a ser plotada e o nmero de classes
utilizado no histograma. O R Commander ajusta este valor caso julge necessrio para melhorar
a apresentao do grfico.
Todas as medidas descrivivas apresentadas nesta seo podem ser obtidas no R Commander
seguindo os seguintes passos: [Estatsticas] [Resumos] [Resumos numricos...] (Fig.
2.4). A escolha de quais variveis e medidas sero apresentadas realizada na janela que se
abrir. Os resultados so apresentados na janela de resultados do R Commander com a seguinte
notao: mean, sd e cv, respectivamente para a mdia, o desvio padro e o coeficiente de
variao.
2.2 Medidas Descritivas 17
Figura 2.4: Opo no R Commander para obteno das principais medidas descritivas.
Mdia
A mdia (ou mdia aritmtica) uma das principais medidas descritivas. Ela fornece uma
valor tpico do conjunto de dados. Duas mdias aritmticas diferentes so consideradas ao longo
deste material, a mdia populacional ( ) e a mdia amostral (x). A primeira, em geral, no pode
ser encontrada, pois para isto teriamos que conhecer todos os valores de uma populao.
Mediana
Alm da mdia, uma propriedade de um conjunto de dados pode ser resumido utilizando
a mediana (Md ). Esta medida tem o mesmo objetivo da mdia, mas menos sensvel a
valores discrepantes. Para determinar a mediana devemos colocar os dados amostrais em ordem
crescente. A mediana dada pelo dado amostral que divide tal ordenao ao meio. A posio
(l) do valor da mediana na ordenao dada por:
n+1
l= (2.6)
2
2.2 Medidas Descritivas 18
Se l for fracionrio, toma-se como mediana a mdia dos valores de posies mais prximas
a l.
Para os dados amostrais da tabela 2 temos que a posio da mediana dada por l = (40 +
1)/2 = 20,5. Colocando os dados em ordem crescente observamos que os valores de posio
20 e 21 so respectivamente iguais a 100,17 e 100,24. Logo, a mediana Md = (100,17 +
100,24)/2 = 100,205.
Quartis e Extremos
Os quartis so valores que junto com a mediana dividem a amostra em quatro partes iguais,
cada uma contendo 25% dos dados. Na prtica, podemos utilizar os clculos realizados para
obter uma mediana para a primeira metade dos dados (valores menores do que a mediana) e
outra mediana para a segunda metade (valores maiores que a mediana). Estes dois divisores so
chamados respectivamente de quartil inferior (QI ) e quartil superior (QS ).
Para os dados amostrais da tabela 2 temos que a mediana tem posio l = 20,5.
Arredondando este valor para baixo calculamos a posio do quartil inferior [l = (20 + 1)/2 =
10,5]. Assim, o valor do quartil inferior dado pela mdia dos valores das posies 10 e 11, ou
seja, QI = (99,18 + 99,25)/2 = 99,215.
O valor do quartil superior pode ser calculado utilizando a(s) mesma(s) posio(es) j
determinadas para o quartil inferior, a diferena que para o quartil superior conta-se a posio
do ltimo para o primeiro, como se os dados fossem ordenados decrescentemente. Portanto, o
quartil superior igual a QS = (100,92 + 100,82)/2 = 100,87.
Coeficiente de Variao
Para viabilizar comparaes desse tipo, definiu-se o Coeficiente de Variao (cv), que
presta-se para comparar disperses relativas de distribuies de dados, de mesma unidade ou
de unidades diferentes. Tal medida exprime a variao em relao a mdia e, independe de
unidades de medidas:
s
cv = 100% (2.9)
x
20
De forma geral, os testes de hipteses so elaborados a partir de duas hipteses, nula (H0 )
e alternativa (H1 ). Na hiptese nula (H0 ) as diferenas observadas em relao aos valores
esperados, so consideradas fruto do acaso, devido a aleatoriedade dos dados. Na hiptese
alternativa (H1 ) considera-se que tais diferenas so devidas ao fato da populao ter realmente
tal caracterstica.
A relao existente entre as variveis traduzida pelo valor de p (ou, p-valor). Para
valores de p < rejeita-se a hiptese nula, ou seja, a probabilidade das diferenas registadas
na amostra serem devidas ao acaso muito pequena (existe portanto grande probabilidade de
estas diferenas existirem de fato na populao). No caso de p > , diz-se no existir evidncia
suficiente para rejeitar a hiptese nula (logo, aceita-se H0 ).
(c) Calcular o valor da estatstica do teste, que depende do parmetro que se deseja testar;
Um fato importante a ser ressaltado que a validade dos resultados obtidos atravs
dos testes de hiptese paramtricos (teste t, anlise de varincia, entre outros) fortemente
dependente da normalidade dos dados analisados. Salvo raras excees, resultados de anlises
estatsticas efetuadas atravs de mtodos paramtricos no so confiveis se os dados no
pertencem a amostras extradas de populaes com distribuies normais (RODRIGUES;
IEMMA, 2005).
O primeiro passo para aplicao do teste de Shapiro-Wilk a ordenao crescente dos dados
amostrais. Assim, denotamos x1 o menor e xn o maior valor observado. O prximo passo o
clculo do valor da constante b, determinada da seguinte forma:
n/2
b = ani+1 (xni+1 xi ) (3.1)
i=1
Soluo manual:
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
1,42 1,52 1,69 1,90 1,98 1,99 2,10 2,22 2,31 2,75
Utilizando a equao 3.2 podemos determinar o valor observado da estatstica (Wo ) do teste
de Shapiro-Wilk, dado por:
b2 1,16172
Wo = n = = 0,972 (3.4)
1,422 + 1,522 + . . . + 2,752 10 1,9882
x2i n x2
i=1
Considerando que o valor observado da estatstica (Wo ) maior do que o valor crtico (Wc =
0,842), dado pela tabela do anexo F, aceita-se H0 , ou seja, concluimos que a amostra provm
de uma populao com distribuio normal.
3.1 Teste de Shapiro-Wilk para Normalidade da Populao 23
Para aplicar o teste de Shapiro-Wilk aos dados amostrais da tabela 3.1 com o R Commander,
o primeiro passo carregar tais valores no programa. Os dados devem ser informados em uma
nica coluna. Como visto na seo 1.2, uma das formas de carregar estes dados digit-los
diretamente no R Commander (Fig. 3.1).
Uma janela ser aberta para informar qual varivel do conjunto de dados ativo deve ser
avaliada (Fig. 3.3).
Dados pareados;
H0 : 1 = 2
H1 : 1 6= 2 (bilateral)
A estatstica do teste t para dados pareados baseia-se nos valores observados da varivel
D, definida pela diferena de valores de cada par de dados do experimento. Num estudo
antes-e-depois:
Di = (medida depois)i (medida antes)i (4.1)
Para encontrar a estatstica do teste, precisamos calcular a mdia (D) e o desvio padro (sD )
das diferenas, definidos respectivamente por:
v v
n u n u n
2 2
i D (D D) u D2i n D
u u
u i
i=1
t i=1 t i=1
D= e sD = = (4.2)
n n1 n1
4.1 Teste t para Amostras Pareadas 26
A estatstica do teste conhecida como estatstica t para dados pareados, definida por:
D n
t= (4.3)
sD
gl = n 1 (4.4)
Tabela 4.1: Peso das cobaias antes e depois da aplicao da nova dieta.
Antes: 54 61 50 74 79 58 55 49 63
Depois: 57 66 53 73 82 58 56 53 63
Hipteses:
H0 : D = A ou D A = 0
H1 : D > A ou D A > 0 (unilateral)
Na hiptese nula (H0 ) considera-se a situao onde a dieta no altera o peso das cobaias, ou
seja, o peso mdio das cobaias antes da nova dieta ser o mesmo que o peso mdio depois da
nova dieta. Em contrapartida, a hiptese alternativa (H1 ) considera a situao onde a nova dieta
provoca aumento do peso mdio das cobaias, ou seja, a peso mdio das cobaias depois da nova
dieta ser maior do que o peso mdio antes da nova dieta.
4.1 Teste t para Amostras Pareadas 27
Soluo manual:
O primeiro passo obter as diferenas entre o peso depois e o peso antes da nova dieta,
dadas por:
Tabela 4.2: Diferena entre os pesos antes e depois da aplicao da nova dieta.
Diferena (D): 3 5 3 -1 3 0 1 4 0
3 + 5 + 3 + (1) + 3 + 0 + 1 + 4 + 0
D= =2 (4.5)
9
s
32 + 52 + 32 + (1)2 + 32 + 02 + 12 + 42 + 02 9 22
sD = = 2,0616 (4.6)
91
gl = 9 1 = 8 (4.8)
Considerando que o p-valor menor do que 0,01, portanto, tambm menor do que =
0,05, rejeita-se H0 e conclui-se que h diferena significativa entre as mdias de peso ao nvel
4.1 Teste t para Amostras Pareadas 28
de significncia de 5%. Ou seja, concluimos que a nova dieta provoca aumento de peso nas
cobaias ao nvel de significncia de 5%.
Figura 4.2: Lanamento dos dados para o teste t para dados pareados no R Commander.
Na janela que ser aberta deve-se escolher as variveis a serem comparadas, o nvel de
confina e a hiptese alternativa (Fig. 4.4).
4.2 Teste t para Amostras Independentes 29
Nesta seo o teste t aplicado a casos onde desejamos comparar a mdia de duas amostras
aleatrias. Ao contrrio da seo anterior, trataremos do caso em que os dados no so pareados.
O objetivo deste mtodo verificar se existe, ou no, diferena estatstica significativa entre
as mdias de dois grupos. Logo, as hipteses deste teste realizar a comparao entre a mdia
de um grupo com a mdia de outro grupo.
Para aplicar o teste t para amostras independentes precisamos calcular inicialmente a mdia
e a varincia de cada grupo, utilizando as seguintes frmulas:
n n
x x2 n x2
i=1 i=1
x= e s2 = (4.9)
n n1
O nmero de graus de liberdade (gl) para o teste t para amostras independentes dado por:
gl = n1 + n2 2 (4.10)
Tabela 4.3: Notas da avaliao de matemtica obtidas pela crianas submetidas a dois mtodos
de ensino diferentes.
Mtodo de ensino A Mtodo de ensino B
45 51 50 62 43 45 35 43 59 48
42 53 50 48 55 45 41 43 49 39
Hipteses:
H0 : A = B ou A B = 0
H1 : A 6= B ou A B 6= 0
4.2 Teste t para Amostras Independentes 31
A hiptese nula admite que no existe diferena entre os mtodos de ensino, ou seja, em
mdia os mtodos produzem o mesmo resultado no desempenho dos alunos. Em contrapartida,
a hiptese alternativa diz que existe diferena entre os mtodos de ensino, ou seja, em mdia, os
alunos submetidos ao mtodo de ensino A tero desempenho diferente dos alunos submetidos
ao mtodo de ensino B.
Soluo manual:
O primeiro passo para resolver o problema o clculo da mdia e do desvio padro de cada
um dos dois grupos, utilizando as equaes (4.9) obtemos:
gl = 10 + 10 2 (4.14)
O prximo passo obter o p-valor atravs da tabela da distribuio t (anexo B). Para tanto,
olhamos na distribuio t a linha relacionada ao grau de liberdade (gl) igual a 18 e a coluna cujo
intervalo contenha o valor de t = 1,8632 (Fig. 4.5).
4.2 Teste t para Amostras Independentes 32
Pela tabela da distribuio t de student (anexo B) obtemos um intervalo para o p-valor entre
0,025 e 0,05 para um teste unilateral. Lembrando que o problema dado bilateral (H1 : A 6=
B ), toma-se o dobro de cada um destes valores, obtendo-se ento 0,05 < p < 0,1.
O primeiro passo para resolver o problema com o R Commander a digitao dos resultados
obtidos no experimento. No teste t para amostras independentes os dados devem ser informados
em duas colunas, uma com as notas e a outra com o mtodo de ensino associado a cada nota
(Fig. 4.6). No incio de cada coluna deve ser informado um ttulo para os dados.
Figura 4.6: Digitao dos dados no Excel para aplicao do teste t para amostras independentes.
Os dados digitados em uma planilha do Excel devem ser importados para o R Commander
(conforme seo 1.2.1) informando um nome para o conjunto de dados. Para aplicar o teste
4.2 Teste t para Amostras Independentes 33
t para amostras independentes sobre o conjuto de dados ativo, siga os seguintes passos:
[Estatsticas] [Mdias] [Teste t para amostras independentes...] (Fig. 4.7)
Uma janela ser aberta para configurar as informaes relativas ao teste: variveis que
contm o grupo e a resposta, o tipo de hiptese alternativa e o nvel de confiana (Fig. 4.8).
Figura 4.8: Configuraes para aplicao do teste t para amostras independentes bilateral e com
nvel de confiana de 95%..
Aleatoriedade e independncia;
H0 : 1 = 2 = ... = c
H1 : nem todas as mdias so iguais
Na hiptese nula (H0 ) considera-se que o fator variado entre os grupos no afeta de forma
significativa a mdia dos resultados obtidos. Em contrapartida, a hiptese alternativa (H1 )
admite que ao menos uma das mdias diferente das demais devido ao fator considerado.
nj
xi j
i=1
xj = (5.2)
nj
onde c o nmero de grupos, xi j o i-simo valor do grupo j, n o nmero total de amostras e
n j o nmero de amostras do grupo j.
O prximo passo o clculo da variao total (ST ), da variao entre os grupos (SE ) e
da variao dentro dos grupos (SD ). Estas variaes so tambm conhecidas respectivamente
como: soma dos quadrados total, soma dos quadrados entre os grupos e soma dos quadrados
dentro dos grupos. As expresses para o clculo destes valores so apresentados nas equaes
seguintes:
c nj
2
ST = ij
x x (5.3)
j=1 i=1
c 2
SE = n j x j x (5.4)
j=1
c nj 2
SD = xi j x j (5.5)
j=1 i=1
A variao dentro dos grupos pode ser calculada pela diferena entre a variao total ST e
a variao entre os grupos SE , ou seja
SD = ST SE (5.6)
Na sequncia devemos calcular a mdia total dos quadrados (MQ ), a mdia dos quadrados
entre os grupos (ME ) e a mdia dos quadrados dentro dos grupos (MD ), dadas respectivamente
por:
ST
MQ = (5.7)
n1
SE
ME = (5.8)
c1
SD
MD = (5.9)
nc
Quando conclui-se pela anlise de varincia que existe diferena entre as mdias dos
grupos, no obtem-se quais dos grupos possui mdia diferente dos demais. Para responder
tal questo utiliza-se um teste auxiliar chamado teste de Tukey, apresentado na sequncia.
O teste de Tukey um dos testes de comparao de mdia mais utilizados, por ser bastante
rigoroso e de fcil aplicao. Este teste utilizado para testar toda e qualquer diferena entre
duas mdias de tratamento.
O teste de Tukey faz a comparao entre a mdia de dois em dois grupos. Para cada par
de grupos (denotados por i e j) que sero comparados, o primeiro passo para aplicar o teste de
Tukey calcular o intervalo crtico (Ic ) dado por:
s
MD 1 1
Ic = Qc + (5.11)
2 ni n j
Conhecido o intervalo crtico (Ic ), deve-se calcular o mdulo da diferena entre as mdias
dos grupos i e j, ou seja:
|xi x j | (5.12)
5.1 Anlise de Varincia para Um Fator (ANOVA) 37
Quando esta diferena maior do que o intervalo crtico conclui-se que existe diferena
significativa entre as mdias dos grupos i e j, caso contrrio conclui-se que as mdias dos
grupos i e j so iguais.
Exemplo: Voc supervisiona a produo de uma padaria, cujos pes so fabricados com
farinha oriunda de um dentre quatro diferentes fornecedores. A qualidade dos pes produzidos
uma caracterstica importante que garante o aumento das vendas e consequentemente da
produo. Estabelea se os pes produzidos com as diferentes marcas de farinha so igualmente
saborosos com base nos dados amostrais abaixo.
Tabela 5.1: Notas atribuidas pela anlise sensorial dos pes produzidos com a farinha de quatro
diferentes fornecedores.
Forncedor A Forncedor B Forncedor C Forncedor D
68,5 76,3 70,6 75,4
74,0 75,3 75,2 69,9
67,2 74,0 70,8 72,6
69,9 71,2 74,7 67,5
68,0 74,5 72,9 70,4
n
x 347,6 371,3 364,2 355,8
i=1
xj 69,52 74,26 72,84 71,16
Hipteses:
H0 : A = B = C = D
H1 : ao menos uma das mdias diferente
A hiptese nula (H0 ) considera que as farinhas de todos os quatro diferentes fornecedores
produzem em mdia pes com a mesma qualidade sensorial. Em contrapartida, a hiptese
alternativa (H1 ) considera o fato de que o fator fornecedor afeta a qualidade sensorial dos pes,
dizendo que existe diferena em ao menos uma das mdias comparada as outras.
5.1 Anlise de Varincia para Um Fator (ANOVA) 38
Soluo manual:
x = 71,945 (5.13)
Os valores das mdias de cada grupo so dados na tabela do problema. As variaes total,
entre grupos e dentro dos grupos, dadas respectivamente pelas equaes (5.3), (5.4) e (5.6)
fornecem
ST = 160,7895 (5.14)
SE = 63,2855 (5.15)
Na sequncia so obtidas as mdias entre grupos e dentro dos grupos, utilizando as equaes
(5.8) e (5.9) obtemos
SE 63,2855
ME = = = 21,0952 (5.17)
c1 41
SD 97,5040
MD = = = 6,0940 (5.18)
nc 20 4
Por fim, podemos calcular o valor de F observado (Fo ) atravs da equao (5.10)
ME 21,0952
Fo = = = 3,4616 (5.19)
MD 6,0940
Por fim, calcula-se o mdulo da diferena entre a mdias para cada combinao de
5.1 Anlise de Varincia para Um Fator (ANOVA) 39
Na comparao entre o valor absoluto das diferenas com o valor do intervalo crtico,
observa-se que apenas os fornecedor A com o fornecedor B apresenta diferena significativa
(denotada por ).
Figura 5.2: Digitao dos dados no Excel para aplicao da anlise da varincia pelo R
Commander.
Caso os dados forem digitados em uma planilha do Excel, o prximo passo import-la
para o R Commander. Em seguida, para aplicar a anlise de varincia execute os seguintes
passos: [Estatsticas] [Mdias] [ANOVA para um fator (one way)...] (Fig. 5.3).
5.1 Anlise de Varincia para Um Fator (ANOVA) 40
Uma janela ser aberta para informar o nome da coluna que contm os grupos e a
que contm a varivel resposta. O teste de Tukey pode ser aplicado ativando-se a opo
Comparao de mdias 1 a 1 nesta janela (Fig. 5.4).
Caso o teste de Tukey tenha sido ativado, informaes a respeito da comparao entre
as mdias obtidas pelos diferentes grupos sero apresentado na janela de resultados. Um
resumo do teste apresentado em uma tabela que mostra cada uma das comparaes realizadas,
5.1 Anlise de Varincia para Um Fator (ANOVA) 41
Embora a anlise de varincia de fator nico seja relativamente robusto com respeito ao
pressuposto de varincias iguais nos grupos, grandes diferenas nas varincias dos grupos
podem afetar seriamente o nvel de significncia e a eficcia do teste. Um dos procedimentos
com alta eficcia estatstica o teste de Levene. Para testar a homogeneidade da varincia,
utilize as seguintes hipteses:
H0 : 12 = 22 = ... = c2
H1 : Nem todas as varincias so iguais
5.1 Anlise de Varincia para Um Fator (ANOVA) 42
O primeiro passo para aplicar o teste de Levene obter a mediana de cada grupo. Em
seguida, calcula-se o valor absoluto da diferena entre cada valor amostral e a mediana do
grupo a qual ele pertence. Sobre os resultados obtidos aplica-se a anlise de varincia. Caso o
p-valor deste teste for maior do que o nvel de significncia, aceita-se H0 , ou seja, conclui-se
que as varincias so iguais em todos os grupos.
43
Referncias Bibliogrficas