Você está na página 1de 24

Diferenças Significativas entre Médias Amostrais; Lógica da

Análise de Variância (ANOVA); Somas de Quadrados; Médias


Quadráticas; Índice F; Exemplo de Uso da ANOVA;

Tópico – 04A
▪ Homens x mulheres; liberais x conservadores; transgênicos x não transgênicos,
etc. representam tipos de comparações de duas amostras que costumam ser
realizadas.
▪ Entretanto, a realidade nem sempre pode ser dividida convenientemente em
dois grupos; entrevistados e objetos de pesquisa estatística, nem sempre se
dividem de uma maneira tão simples.
▪ Um pesquisador busca fazer comparações entre três, quatro, cinco ou mais
amostras ou grupos.
▪ Poderíamos usar uma série de razões t para fazer comparações entre três ou
mais médias amostrais?
▪ Deveríamos fazer estas comparações duas a duas?
▪ Isto seria possível, mas dependendo do número de amostras as possibilidades
de combinação duas a duas ficariam muito grandes demandando muito
trabalho.
▪ Este procedimento teria uma limitação estatística significativa também. Isso
ocorre porque ele aumenta a probabilidade de se cometer um erro tipo I - o
erro de rejeitar a hipótese nula quando ela deveria ser mantida, por ser
verdadeira.
▪ Quando realizamos um grande número de testes dessa natureza , a
interpretação de nosso resultado se torna problemática.
▪ Tomando um exemplo extremo: como interpretaríamos uma razão t
significativa de 1.000 comparações como essas feitas em um estudo em
particular?
▪ Sabemos que podemos esperar pelo menos algumas grandes diferenças de
médias simplesmente com base no erro amostral.
▪ Exemplo genérico: Suponha que um pesquisador quisesse pesquisar e
comparar eleitores em oito regiões dos EUA (Nova Inglaterra, Atlântica Média,
Atlântico Sul, Meio Oeste, Sul, Sudoeste, Montanhosa e Pacífico) sobre suas
opiniões a respeito do presidente .
▪ Comparar as amostras regionais exigiria 28 razões t separadas.

▪ De 28 testes de diferenças entre médias amostrais feitos separadamente, cada


um com um nível de significância de 0,05, seria esperado que 5% - um ou dois
(1,4 para ser exato) - fossem significativos, devido somente ao acaso ou a erros
amostrais.
▪ Suponha que, das 28 razões t diferentes , o pesquisador obtenha duas razões t
que sejam significativos. Como o pesquisador deve interpretar essas duas
diferenças significativas?
▪ Ele deveria se arriscar e tratar ambas como indicativas de diferenças
populacionais reais?
▪ Ele deveria seguir pelo caminho mais seguro, sustentando que ambas
poderiam ser resultado de erros amostrais e voltar para coletar mais dados?
▪ Ele deveria, baseado na expectativa de que uma razão t poderia ser
significativa por acaso, decidir que apenas uma das duas razões t significativas
seria válida? Sendo assim, em qual das duas razões t significativas ele deve ter
fé?
▪ Na maior? A que parece mais plausível?

▪ Infelizmente, nenhuma dessas soluções é particularmente segura.

▪ O problema é que, à medida que o número de testes separados aumenta, a


probabilidade de rejeição de uma hipótese nula verdadeira (erro tipo I)
também cresce. Desse modo, enquanto a probabilidade de um erro tipo I
ocorrer para cada razão t ser de 0,05, no todo a probabilidade de rejeição de
qualquer hipótese nula verdadeira é muito maior que 0,05.
▪ Para superar esse problema e esclarecer a interpretação de nossos resultados,
precisamos de um teste estatístico que mantenha o erro tipo I em um nível
constante (por exemplo, 0,05), tomando uma única decisão global sobre a
existência de uma diferença significativa entre três, quatro, oito ou qualquer
que seja o número de médias amostrais que buscamos comparar.

▪ Esse teste é conhecido como Análise de Variância – ANOVA


▪ Para conduzir uma análise de variância, tratamos a variação total em um
conjunto de escores como sendo divisível em dois componentes: a distância
ou desvio de escores brutos de sua média de grupo, conhecida como variação
dentro dos grupos, e a distância ou desvio de médias de grupos umas das
outras, referida como variação entre grupos.
▪ Para examinar a variação entre grupos, os escores de motivação de
desempenho de membros de quatro classes sociais - (1) baixa, (2)
trabalhadora, (3) média e (4) alta - são graficamente representados abaixo
onde:
▪ 𝑋1 , 𝑋2 , 𝑋3 , 𝑋4 são quaisquer
escores brutos em seus
respectivos grupos;
ത1 , 𝑋ത2 , 𝑋ത3 , 𝑋ത4 são as médias
▪ 𝑋
dos grupos.
▪ Em termos simbólicos,
vemos que a variação
dentro dos grupos se refere
aos desvios 𝑋1 − 𝑋ത1 , 𝑋2 − 𝑋ത2 ,
𝑋3 − 𝑋ത3 , 𝑋4 − 𝑋ത4
▪ Na Figura abaixo, vemos que o grau de motivação para o desempenho varia
conforme a classe social.
▪ Determinamos a média global para a amostra total de todos os grupos
combinados, denotados aqui como 𝑋ത𝑇 , e então comparamos cada uma das
quatro médias de grupos com a média total.

▪ Em termos simbólicos, vemos que a variação entre os grupos se concentra


sobre os desvios 𝑋ത1 − 𝑋ത𝑇 , 𝑋ത2 − 𝑋ത𝑇 , 𝑋ത3 − 𝑋ത𝑇 , 𝑋ത4 − 𝑋ത𝑇
▪ No âmago da análise de variância está o conceito da soma de quadrados, que
representa o passo inicial para se medir a variação total, assim como a variação
entre os grupos e dentro deles.
▪ Esse procedimento é semelhante ao utilizado para a obtenção da variância.

▪ Quando aplicada à situação em que grupos são comparados, há mais de um


tipo de soma de quadrados, apesar de cada tipo representar a soma dos
desvios ao quadrado de uma média.
▪ Correspondendo à distinção entre variação total e seus dois componentes,
temos:
▪ a soma total de quadrados (SQtotal);
▪ soma de quadrados entre grupos (SQentre) e;
▪ a soma de quadrados dentro dos grupos (SQdentro).
2
𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = ෍ 𝑋𝑡𝑜𝑡𝑎𝑙 2
− 𝑁𝑡𝑜𝑡𝑎𝑙 . 𝑋ത𝑡𝑜𝑡𝑎𝑙 2
𝑆𝑄𝑑𝑒𝑛𝑡𝑟𝑜 = ෍ 𝑋ത𝑡𝑜𝑡𝑎𝑙 2
− ෍ 𝑁𝑔𝑟𝑢𝑝𝑜 . 𝑋ത𝑡𝑜𝑡𝑎𝑙

𝑆𝑄𝑒𝑛𝑡𝑟𝑒 = ෍ 𝑁𝑔𝑟𝑢𝑝𝑜 . 𝑋ത𝑡𝑜𝑡𝑎𝑙


2
− 𝑁𝑡𝑜𝑡𝑎𝑙 . 𝑋ത𝑡𝑜𝑡𝑎𝑙
2

▪ onde:
2
σ 𝑋𝑡𝑜𝑡𝑎𝑙 = 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑒𝑠𝑐𝑜𝑟𝑒𝑠 𝑒𝑙𝑒𝑣𝑎𝑑𝑜𝑠 𝑎𝑜 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑒 𝑑𝑒𝑝𝑜𝑖𝑠 𝑠𝑜𝑚𝑎𝑑𝑜𝑠
𝑋ത𝑡𝑜𝑡𝑎𝑙 = 𝑚é𝑑𝑒𝑖𝑎 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑑𝑜𝑠
𝑁𝑡𝑜𝑡𝑎𝑙 = 𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑠𝑐𝑜𝑟𝑒𝑠 𝑒𝑚 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑑𝑜𝑠
𝑋ത𝑔𝑟𝑢𝑝𝑜 = 𝑚é𝑑𝑖𝑎 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜 𝑎𝑟𝑏𝑖𝑡𝑟á𝑟𝑖𝑜
𝑁𝑔𝑟𝑢𝑝𝑜 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑠𝑐𝑜𝑟𝑒𝑠 𝑒𝑚 𝑔𝑟𝑢𝑝𝑜 𝑎𝑟𝑏𝑖𝑡𝑟á𝑟𝑖𝑜
▪ Como era de se esperar de uma medida de variação, o valor das somas de
quadrados tende a se tornar maior à medida que a variação aumenta.
▪ A soma de quadrados também fica maior com um aumento no tamanho da
amostra.
▪ Como consequência, a soma dos quadrados não pode ser considerada urna
medida "pura" inteiramente satisfatória de variação, a não ser, é claro, que
possamos encontrar uma maneira de controlar o número de escores
envolvidos.
▪ Tal método existe em uma medida de variação conhecida como média
quadrática (ou variância ), que obtemos dividindo SQentre ou SQdentro pelos
graus de liberdade apropriados.
𝑆𝑄𝑒𝑛𝑡𝑟𝑒 𝑆𝑄𝑑𝑒𝑛𝑡𝑟𝑜
𝑀𝑄𝑒𝑛𝑡𝑟𝑒 = 𝑀𝑄𝑑𝑒𝑛𝑡𝑟𝑜 =
𝑔𝑙𝑒𝑛𝑡𝑟𝑒 𝑔𝑙𝑑𝑒𝑛𝑡𝑟𝑜
▪ onde: ▪ onde:
𝑀𝑄𝑒𝑛𝑡𝑟𝑒 = 𝑚é𝑑𝑖𝑎 𝑞𝑢𝑎𝑑𝑟á𝑡𝑖𝑐𝑎 𝑒𝑛𝑡𝑟𝑒 𝑔𝑟𝑢𝑝𝑜𝑠 𝑀𝑄𝑑𝑒𝑛𝑡𝑟𝑜 = 𝑚é𝑑𝑖𝑎 𝑞𝑢𝑎𝑑𝑟á𝑡𝑖𝑐𝑎 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠
𝑆𝑄𝑒𝑛𝑡𝑟𝑒 = 𝑠𝑜𝑚𝑎 𝑑𝑒 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑒𝑛𝑡𝑟𝑒 𝑔𝑟𝑢𝑝𝑜𝑠 𝑆𝑄𝑑𝑒𝑛𝑡𝑟𝑜 = 𝑠𝑜𝑚𝑎 𝑑𝑒 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠
𝑔𝑙𝑒𝑛𝑡𝑟𝑒 = 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 𝑒𝑛𝑡𝑟𝑒 𝑔𝑟𝑢𝑝𝑜𝑠 𝑔𝑙𝑑𝑒𝑛𝑡𝑟𝑜 = 𝑔𝑟𝑎𝑢𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠

𝑔𝑙𝑒𝑛𝑡𝑟𝑒 = 𝑘 − 1 𝑔𝑙𝑑𝑒𝑛𝑡𝑟𝑜 = 𝑁𝑡𝑜𝑡𝑎𝑙 − 𝑘

𝑜𝑛𝑑𝑒:
𝑜𝑛𝑑𝑒:
𝑘 = 𝑛º 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠
𝑘 = 𝑛º 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠
𝑁𝑡𝑜𝑡𝑎𝑙 = 𝑛º 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑠𝑐𝑜𝑟𝑒𝑠 𝑒𝑚 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠
𝑔𝑟𝑢𝑝𝑜𝑠 𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑑𝑜𝑠
▪ A análise da variância produz uma razão F na qual a variação entre grupos e a
variação dentro dos grupos são comparadas.
▪ A razão F pode ser considerada o indicador do tamanho da média quadrática
entre grupos, em relação ao tamanho da média quadrática dentro dos grupos.

𝑀𝑄𝑒𝑛𝑡𝑟𝑒
𝐹=
𝑀𝑄𝑑𝑒𝑛𝑡𝑟𝑜

▪ Tendo obtido uma razão F, temos agora de determinar se ela é grande o


suficiente para rejeitar a hipótese nula e aceitar a hipótese de pesquisa.
▪ Similarmente ao casos dos testes de hipóteses para a média, variância e
proporção, onde utilizávamos as tabelas normal, t de “Student” e Qui-quadrado,
também utilizamos a tabela com a distribuição F-Snedecor (valores críticos de
F).
▪ Suponha que uma pesquisadora social interessada em questões de
discriminação no emprego conduza um experimento simples para avaliar se
estudantes do sexo masculino formados em Direito são favorecidos em relação
a estudantes do sexo feminino formadas em Direito por escritórios de
advocacia grandes e de renome no mercado. Ela pede aos sócios contratantes
de 15 escritórios importantes que classifiquem uma série de currículos em
termos de formação e potencial em uma escala de 0 a 10, com os escores mais
altos indicando um interesse mais forte no candidato. Os currículos dados aos
15 entrevistados são idênticos, com uma exceção. Em um dos currículos, o
nome é modificado para refletir um candidato do sexo masculino (o nome do
candidato é "Jeremy Miller"), um candidato com um nome ambíguo em termos
de gênero (o nome do candidato é " Jordan Miller"), ou uma candidata do sexo
feminino (o nome da candidata é "Janice Miller"); todo o resto no currículo é o
mesmo em todas as condições.
▪ Os 15 entrevistados recebem aleatoriamente um desses três currículos dentro
de seus pacotes de currículos. Os outros currículos nos pacotes são os mesmos
para todos os sócios contratantes. Esses outros currículos são incluídos para
fornecer um contexto melhor para o experimento, entretanto, apenas as
classificações dos currículos Jeremy/Jordan/Janice Miller são de interesse.
▪ A pesquisadora estabelece as seguintes hipóteses:

▪ Hipótese nula: (𝜇1 = 𝜇2 = 𝜇3 ) - Classificações dos candidatos não diferem com


base no gênero.
▪ Hipótese de pesquisa: alguns (𝜇𝑖 ≠ 𝜇𝑗 ) Classificações dos candidatos diferem
com base no gênero.
▪ Os escores de classificação dados pelos 15 sócios contratantes que receberam
aleatoriamente os três grupos baseados no gênero aparente do currículo-
chave são os seguintes:
▪ Os escores de classificação dados pelos 15 sócios contratantes que receberam
aleatoriamente os três grupos baseados no gênero aparente do currículo-
chave são os seguintes:

Sexo masculino Gênero neutro Sexo feminino


(N1 = 5) (N2 = 5) (N3 = 5)
X1 X21 X2 X22 X3 X23
6 36 2 4 3 9
7 49 5 25 2 4
8 64 4 16 4 16
6 36 3 9 4 16
4 16 5 25 3 9
∑X1=31 ∑X12=201 ∑X2=19 ∑X22=79 ∑X3=16 ∑X32=54
▪ Passo 1: Calcular a média para cada amostra.

σ 𝑋1 31 σ 𝑋2 19 σ 𝑋3 16
𝑋ത1 = = = 6,52 𝑋ത2 = = = 3,8 𝑋ത3 = = = 3,2
𝑁1 5 𝑁2 5 𝑁3 5

▪ Observar que diferenças realmente existem, sendo que há uma tendência de o


candidato que "aparentemente" pertence ao sexo masculino ter uma
classificação mais alta do que o candidato de gênero neutro e do que o
candidato que pertence "aparentemente" ao sexo feminino.
▪ Passo 2: Calcular a soma de escores, a soma dos quadrados dos escores, o
número de indivíduos e a média para todos os grupos combinados.

෍ 𝑋𝑡𝑜𝑡𝑎𝑙 = ෍ 𝑋1 + ෍ 𝑋2 + ෍ 𝑋3 = 31 + 19 + 16 = 66

2
෍ 𝑋𝑡𝑜𝑡𝑎𝑙 = ෍ 𝑋12 + ෍ 𝑋22 + ෍ 𝑋32 = 201 + 79 + 54 = 334

𝑁𝑡𝑜𝑡𝑎𝑙 = 𝑁1 + 𝑁2 + 𝑁3 = 5 + 5 + 5 = 15

σ 𝑋𝑡𝑜𝑡𝑎𝑙 66
𝑋ത𝑡𝑜𝑡𝑎𝑙 = = = 4,4
𝑁𝑡𝑜𝑡𝑎𝑙 15
▪ Passo 3: Calcular a soma total dos quadrados.
2
𝑆𝑄𝑡𝑜𝑡𝑎𝑙 = ෍ 𝑋𝑡𝑜𝑡𝑎𝑙 − 𝑁𝑡𝑜𝑡𝑎𝑙 . 𝑋ത𝑡𝑜𝑡𝑎𝑙
2
= 334 − 15 . 4,4 2
= 43,6

▪ Passo 4: Calcular a soma dos quadrados dentro dos grupos.

2
𝑆𝑄𝑑𝑒𝑛𝑡𝑟𝑜 = ෍ 𝑋𝑡𝑜𝑡𝑎𝑙 − 𝑁𝑔𝑟𝑢𝑝𝑜 . 𝑋ത𝑔𝑟𝑢𝑝𝑜
2
= 334 − [ 5 . 6,2 2
+ 5 . 3,8 2
+ 5 . 3,2 2 ] = 18,4

▪ Passo 5: Calcular a soma dos quadrados entre grupos.


𝑆𝑄𝑒𝑛𝑡𝑟𝑒 = σ 𝑁𝑔𝑟𝑢𝑝𝑜 . 𝑋ത𝑔𝑟𝑢𝑝𝑜
2
− 𝑁𝑡𝑜𝑡𝑎𝑙 . 𝑋ത𝑡𝑜𝑡𝑎𝑙
2
= 5 . 6,2 2
+ 5 . 3,8 2
+ 5 . 3,2 2
− 15 . 4,4 2
= 25,2
▪ Passo 6: Calcular os graus de liberdade entre grupos.
𝑔𝑙𝑒𝑛𝑡𝑟𝑒 = 𝑘 − 1 = 3 − 1 = 2

▪ Passo 7: Calcular os graus de liberdade dentro dos grupos.


𝑔𝑙𝑑𝑒𝑛𝑡𝑟𝑜 = 𝑁𝑡𝑜𝑡𝑎𝑙 − 𝑘 = 15 − 3 = 12

▪ Passo 8: Calcular a média quadrática dentro dos grupos.


𝑆𝑄𝑑𝑒𝑛𝑡𝑟𝑜 18,4
𝑀𝑄𝑑𝑒𝑛𝑡𝑟𝑜 = = = 1,53
𝑔𝑙𝑑𝑒𝑛𝑡𝑟𝑜 12

▪ Passo 9: Calcular a média quadrática entre grupos.


𝑆𝑄𝑒𝑛𝑡𝑟𝑒 25,2
𝑀𝑄𝑒𝑛𝑡𝑟𝑒 = = = 12,6
𝑔𝑙𝑒𝑛𝑡𝑟𝑒 2

▪ Passo 10: Obter a razão F.


𝑀𝑄𝑒𝑛𝑡𝑟𝑒 12,6
𝐹= = = 8,24
𝑀𝑄𝑑𝑒𝑛𝑡𝑟𝑜 1,53
▪ Passo 11: Comparar a razão F obtida com o valor apropriado encontrado na
Tabela F-Snedecor.
▪ Razão F obtida = 8,24.

▪ Razão F da Tabela = 3,89, com glentre = 2 (lê-se na coluna “m”) e gldentro = 12


(lê-se na linha “n”) e α = 0,05.
▪ Para rejeitar a hipótese nula ao nível de significância de 0,05 com 2 e 12 graus de
liberdade, a razão F calculada tem de exceder 3,89.
▪ Como obtivemos uma razão F de 8,24, podemos rejeitar a hipótese nula e aceitar
a hipótese de pesquisa.
▪ Especificamente, concluímos que as classificações dadas aos candidatos a
empregos em escritórios de advocacia tendem a diferir com base em seu gênero
aparente.
1) Nas amostras aleatórias de classes sociais a seguir, teste a hipótese nula de que a amabilidade
entre vizinhos não varia segundo a classe social. (Observação: escores mais altos indicam
maior amabilidade).
Baixa Trabalhadora Média Alta
8 7 6 5
4 3 5 2
7 2 5 1
8 8 4 3

2) Psicólogos testaram a eficácia relativa de três programas de tratamento diferentes - A, B e C -


contra o abuso de drogas ilícitas. Os dados a seguir representam o número de dias de
abstinência de drogas acumulados por 15 pacientes (5 em cada programa de tratamento) nos 3
meses após o término do programa de tratamento . Desse modo, um número maior de dias
indica um período mais longo livre do uso de drogas. Teste a hipótese nula de que esses
programas de tratamento contra drogas não diferem em relação à sua eficácia.

Tratamento A Tratamento B Tratamento C


90 81 14
74 90 20
90 90 33
86 90 5
75 85 12
3) Estudos descobriram que as pessoas acham rostos simétricos mais atraentes do que rostos que
não são simétricos. Para testar essa teoria, uma psiquiatra selecionou uma amostra aleatória de
pessoas e mostrou a elas fotos de três rostos diferentes: um rosto que é perfeitamente
simétrico, um rosto que é ligeiramente assimétrico e um rosto que é altamente assimétrico.
Pediu a elas que classificassem os três rostos em termos de atratividade em uma escala de 1 a
7, com 7 sendo o mais atraente. Teste a hipótese nula de que a atratividade não difere com a
simetria facial.
Simétrico Ligeiramente Altamente
Assimétrico Assimétrico
7 5 2
6 4 3
7 5 1
5 2 1
6 4 2
6 5 2
4) Um fornecedor alimenta a linha de produção de uma determinada indústria com peças em
que a sua espessura é medida em milímetros e produzidas pelas máquinas MA, MB e MC,
verifique se existe diferença significativa na espessura média destes itens ao nível de 5%.
MA MB MC
3,2 4,9 3,0
4,1 4,5 2,9
3,5 4,5 3,7
3,0 4,0 3,5
3,1 4,2 4,2

5) A Hiperfértil desenvolveu 3 tipos de fertilizantes específicos para a cultura do milho. Para


testá-los, aplicou-os às mesmas áreas em pequenos sítios do interior paulista, obtendo-se a
produção mostrada na tabela abaixo. Com esses dados podemos dizer que há significativas
diferenças entre os fertilizantes utilizados? Teste essa hipótese ao nível de 5%.

Produção em sacas de 60 Kg
Fertilizantes
Região 1 2 3
Bragança 30 32 26
Sorocaba 35 31 29
Itu 24 42 26

Você também pode gostar