Você está na página 1de 34

NOTA DE AULA: Análise da

Variância - ANOVA
1

DISCIPLINA: ESTATÍSTICA ECONÔMICA II

PROF. DRA. JANAINA ALVES


Análise de variância
2

 Conhecemos os testes de hipóteses para a


média/proporção de uma população, para a diferença
entre médias/proporções de duas populações e para a
comparação de variâncias de duas populações.

 Agora, o procedimento de teste de hipóteses será


utilizado para comparar as médias de mais de
duas populações.

 A análise de variância ou ANOVA é um teste de


hipóteses para médias de mais de duas populações.
Análise da Variância: ANOVA
3

 Portanto, nesta nota de aula, vocês aprenderão um teste


paramétrico da análise da variância, aplicado para variáveis
intervalares (quantitativas).
 A análise da variância trata-se de um método estatístico,
desenvolvido por Fisher, que, por meio de teste de
igualdade de médias verifica se fatores (variáveis
independentes) produzem mudanças sistemáticas em
alguma variável de interesse (variável dependente).
 Os fatores propostos podem ser variáveis quantitativas ou
qualitativas, enquanto a variável dependente deve ser
quantitativa e observada dentro das classes dos fatores – os
tratamentos.
Aplicações
4

 Comparar a eficiência de diversas marcas de remédios para o


tratamento de uma mesma doença.
 Comparar a eficiência na produtividade de diferentes
empresas.
 Comparar o consumo em km/litro de um modelo de carro
abastecido com combustíveis do mesmo tipo, porém de marcas
diferentes.
 Comparar a eficiência de uma lavoura tratada com diferentes
fertilizantes.
 Comparar a eficiência entre escolas, no que se refere ao
desempenho dos alunos.
 Etc.
Análise da Variância: ANOVA
5

 Por exemplo, pode-se estar interessado em descobrir


variáveis que causam o consumo de combustível dos
automóveis.
 A marca do veículo, idade etc. são potenciais fatores.
 Uma pergunta que pode-se fazer é: será que existe
diferença de média de consumo de combustível entre
diferentes amostras de automóveis?
 Por meio da análise da variância, é possível verificar se a
marca, idade – ou uma combinação desses fatores –
produzem efeitos sobre o consumo, ou concluir que tais
fatores não têm influência sobre o consumo de
combustível.
Exemplo
6
 OBS: O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a
distribuição empírica do dados. O boxplot é formado pelo primeiro e
terceiro quartil e pela mediana. O boxplot pode ser utilizado para uma
comparação visual entre dois ou mais grupos. Por exemplo, duas ou mais caixas
são colocadas lado a lado e se compara a variabilidade entre elas, a mediana e
assim por diante. Outro ponto importante é a diferença entre os quartis que é
uma medida da variabilidade dos dados.
7
ANOVA
8

 Neste exemplo, a diferença entre as médias das


amostras é consequência da variação amostral ou é
uma evidência da diferença entre as médias das
populações?

 Variabilidade associada a "m" fontes de variação


 Propriedade aditiva da variância:
 Variância total = entre amostras + dentre amostras
 total: variação de todas as medidas em relação à média geral
 entre: variação das "n" médias em relação à média geral
 dentro: variação de cada amostra em relação à sua média
Para entender esta propriedade aditiva da variância, segue o
exemplo:
9
ANOVA
10

 Assim, a variabilidade total das amostras pode ser dividida em duas


partes:

 Variabilidade devido ao fato de que as populações são diferentes,


denominada variabilidade entre (entre as populações).
 Quanto maior for a variabilidade entre, mais forte é a evidência de
que as médias das populações são diferentes.

 Variabilidade devido à diferenças dentro de cada amostra,


denominada variabilidade dentro.
 Quanto maior for a variabilidade dentro, maior será a dificuldade
para concluir que as médias das populações são diferentes.
ANOVA
11

- O teste de hipóteses para comparação de k amostras é estabelecida da


seguinte forma:

H1: Nem todas as populações têm a mesma média.

- A distribuição F conduzirá a decisão de aceitar o rejeitar a hipótese


nula, comparando o valor da estatística de teste F:

com o valor F tabelado correspondente ao nível de significância 


adotado.
12

• F “grande” (maior que o valor tabelado) indica que


Variância entre > Variância dentro

• Logo F grande é evidência contra a hipótese nula. Ou


seja, se F > F tabelado rejeitamos a hipótese nula.

• F “pequeno” (menor que o valor tabelado) indica que


Variância entre < Variância dentro.

• Logo F pequeno evidência a favor da hipótese nula. Ou


seja, se F ≤ F tabelado não rejeitamos a hipótese nula.
Para aplicação da ANOVA é necessário que:
13

 As populações tenham a mesma variância.

 As amostras sejam retiradas de populações com


distribuição normal.

 As amostras sejam independentes.


Modelo de classificação única ou experimento com
um fator
14

 Trata-se de um modelo aplicado a projetos experimentais


completamente aleatórios, em que amostras aleatórias
independentes são retiradas de k populações normais
(k>2) com médias μ1 , μ2,..., μk, respectivamente, e
variância igual a σ2.
 As amostras podem ser de tamanhos diferentes, sendo o
número total de observações igual a n= n1 + n2+...+ nk.
 As populações são denominadas tratamentos –
categorias ou níveis do fator.
 Por meio de um teste estatístico, procuramos verificar
se determinado fator é possível causa dos efeitos
observados em certa variável de estudo.
Modelo de classificação única ou experimento com um fator
15

 A hipótese nula do teste é de que as médias dos k


tratamentos são iguais. Isto é:

 E a hipótese alternativa H1 é a de que pelo menos


duas médias sejam diferentes.
 Caso o teste estatístico indique a rejeição de H0,
podemos concluir, com risco α (nível de
significância), que o fator considerado tem influência
sobre a variável de estudo.
Partição da soma total dos quadrados- caso de 2 variáveis
independentes
16

Faz-se uma partição da soma total dos quadrados (variação total)


em tantas parcelas quantas forem as variáveis independentes: os
fatores.
Análise da Variância
17

 Variação total
 Soma total de quadrados (estimativa da variação
total)
Observações
18

 Cada soma dos quadrados dividida por uma


constante apropriada indica um estimador da
variância σ2.
 Cada uma das variâncias das variáveis
independentes (somas de quadrados divididas por
uma constante apropriada) é um estimador justo
(imparcial, não viesado) de σ2, quando essas
variáveis não tem influencias sobre a variável de
estudo.
Observações
19

 Quando uma variável independente tem influencia , ou


causa efeitos sobre a variável de estudo, seu valor será
elevado, isto é, sua estimativa será bem maior do que a
estimativa da variância do erro.
 Essa comparação de variâncias é feita através do teste F
para igualdade entre duas variâncias.
 Se a estimativa da variável independente for
significativamente grande, o teste F rejeitará a hipótese
de nenhum efeito provocado pela variável independente,
e teremos evidência de que o fator correspondente tem
influência sobre a variável de estudo (variável
dependente).
Estimadores da variância comum
20

 No caso de uma variável independente (um fator), a


variância σ2 poderá ser estimada de 3 maneiras:
Variância total
21
Variância total
22
Variância devida aos tratamentos
23
Variância devida aos tratamentos
24
Variância devida aos resíduos (erros)
25
Variância devida aos resíduos (erros)
26
Portanto:

27
Tabela ANOVA
28
Procedimento do teste
29

 1) Dispõem-se os elementos, segundo a tabela a


seguir, obtendo as somas das colunas:
Procedimento do teste

30
31
Exemplo em sala
32
33
Referência
34

 MARTINS, G. de A. Estatística geral e aplicada.


3.ed. São Paulo: Atlas, 2005.