Você está na página 1de 24

TESTES DE HIPÓTESES APLICÁVEIS A DUAS

AMOSTRAS - DADOS INDEPENDENTES

Curso: Estatı́stica (Bacharelado)


Disciplina: Métodos não paramétricos
Profa.: Tatiane

IME - UFG

Aula 12: 20/09/2017


Teste Qui-quadrado

Uma importante aplicação do teste Qui-Quadrado ocorre quando


queremos estudar a associação, ou dependência, entre duas
variáveis.
O cálculo das frequências esperadas fundamenta-se na definição de
independência estatı́stica entre dois eventos.
Isto é, diz-se que X e Y são independentes se a distribuição
conjunta de probabilidades de (Y , X ) é igual ao produto das
distribuições marginais de probabilidades de X e Y , ou seja:

p(xi , yi ) = p(xi )p(yi ), para todo i e j.


Teste Qui-quadrado

Tabela de contingência: Se refere as tabelas usadas para testar a


existência de relações entre duas variáveis.
Teste Qui-quadrado

Dentro deste teste qui-quadrado devemos distinguir dois tipos de testes:


Independência: o objetivo é verificar se existe independência entre
duas variáveis.
Heterogeneidade: o objetivo é verificar se uma variável se comporta
de modo similar, ou heterogêneo, em várias subpopulações.
Teste Qui-quadrado

Vejamos quando estamos tratando de um teste de independência e


quando estamos tratando com um teste de homogeneidade, através de
exemplos.
Teste Qui-quadrado - Teste de independência e de
homogeneidade

Suponha que uma educadora quer analisar se existe relação entre a


participação ativa dos pais dos alunos nos deveres extra-escolares e
o desempenho dos alunos em Matemática.
Suponha que ela categoriza o desempenho dos alunos em três
grupos: baixo, médio, alto e, do mesmo modo categoriza a
participaçãoo dos pais em dois grupos: participação ativa,
participação fraca.
Suponha que ela deseja trabalhar com 300 crianças.

Neste caso a educadora pode delinear sua pesquisa de duas formas:


Teste Qui-quadrado - Teste de independência e de
homogeneidade

Caso 1. Selecionar uma amostra de crianças aleatoriamente e examinar em que célula


cada uma está alocada, logo o único valor fixo será o total geral que será de 300. Mas
os totais de colunas e de linhas serão frutos da pesquisa, portanto, aleatórios, neste
caso estamos frente a um teste de independência de variáveis ou de associação. Logo
a tabela de contingência será:

Table: Teste de Independência


Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Ativa Aleatório
fraca Aleatório
Total Aleatório Aleatório Aleatório 300

H0 : Não existe associação entre Participação dos pais e Desempenho do aluno em


Matemática;
H1 : Existe associação entre Participação dos pais e Desempenho do aluno em
Matemática;
Teste Qui-quadrado - Teste de independência e de
homogeneidade

Caso 2. Pegar uma amostra aleatória de tamanho 100 de cada grupo de alunos, logo
os totais das colunas serão fixos, mas os totais das linhas serão aleatórios e assim
estaremos frente a um teste de homogeneidade. Logo a tabela de contingência será:

Table: Teste de Heterogeneidade


Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Ativa Aleatório
fraca Aleatório
Total 100 (fixo) 100 (fixo) 100 (fixo) 300

H0 : A proporção de alunos para os diferentes nı́veis de desempenho (baixo, médio e


alto) é a mesma quando seus pais participam ativamente das atividades
extra-escolares.
H1 : A proporção de alunos em pelo menos um nı́vel de desempenho é diferente.
Teste Qui-quadrado - Teste de independência e de
homogeneidade

Os valores totais, das colunas e das linhas, são chamados de totais


marginais.
Quando os totais marginais variam livremente, o teste de associação
é chamado de independência (ou de associação), e quando um dos
conjuntos, linha ou coluna é fixado pelo pesquisador então é
chamado de teste de homogeneidade (ou heterogeneidade).
Isso vai depender do pesquisador.
No exemplo da educadora, observemos que para ela é muito mais
fácil fixar o número de alunos segundo seu desempenho, do que
fixar pela participação dos pais, que, a priori será quase impossı́vel.
Teste Qui-quadrado - Construção do teste - Independência

1 Enunciar as hipóteses H0 e H1 :
H0 : As variáveis são independentes, ou as variáveis não estão associadas.
H1 : As variáveis são dependentes, ou as variáveis estão associadas.
2 Fixar α e considerar a variável de teste:

Q=
XX
L C
(Foij − Feij )2
∼ χ2(L−1)(C −1) ,
i=1 j=1
Feij

onde L é o número de linhas da tabela e C o número de colunas. Além disso,


temos
(soma da linha i)(soma da coluna j)
Feij =
total de observações

3 Escrever a região crı́tica: RC = {q ∈ <+ |q ≥ qtabelado }.


4 Calcular:

q=
XX
L C
(Foij − Feij )2

i=1 j=1
Feij

5 Se q ∈ RC então rejeitamos H0 .
Teste Qui-quadrado - Independência

Observações:

O valor esperado de células não deve ser menor ou igual a 5. Nesse


caso, usamos a correção de Yates:
L X
C
X (|Foij − Feij | − 21 )2
Q= .
Feij
i=1 j=1

Se muitos valores (> 20%) esperados (Feij ≤ 5) são menores ou


iguais a 5 ou se pelo menos Feij < 1, então utilizamos o teste exato
de Fisher.
Exemplo 1 - Teste de independência

Uma droga nova foi testada em 56 pacientes, outros 51 receberam


placebo. Temos que 48 dos que receberam a droga melhoraram e 38 dos
que receberam placebo melhoraram.

Efeito
Estı́mulo Positivo Negativo
Droga 48 8
Placebo 38 13
Exemplo 1 - Teste de independência

H0 : Não há diferença entre os grupos que receberam a droga e placebo


em relação à melhora dos pacientes.
Solução:

Efeito
Estı́mulo Positivo Negativo Total
Droga Fo11 Fo12 Fo1∗
Placebo Fo21 Fo22 Fo2∗
Total Fo∗1 Fo∗2 N

Determina-se as frequências esperadas, Feij ,

total da linha i × total da coluna j Fo × Fo∗j


Feij = = i∗
soma total N
Exemplo 1 - Teste de independência

No exemplo, do efeito de uma droga comparada com placebo temos


Fo1∗ × Fo∗1 56 × 86
Fe11 = = = 45, 01
N 107
Fo1∗ × Fo∗2 56 × 21
Fe12 = = = 10, 99
N 107
Fo2∗ × Fo∗1 51 × 86
Fe21 = = = 40, 99
N 107
Fo2∗ × Fo∗2 51 × 21
Fe22 = = = 10, 01
N 107
Exemplo 1 - Teste de independência
Daı́,

Efeito
Estı́mulo Positivo Negativo Total
Droga 48 8 56
45, 01 10, 99
Placebo 38 13 51
40, 99 10, 01
Total 86 21 107

Logo,
(48 − 45, 01)2 (38 − 40, 99)2 (8 − 10, 99)2 (13 − 10, 01)2
χ2cal = + + + = 2, 123.
45, 01 40, 99 10, 99 10, 01

Temos que
χ2tab = 3, 84.
Como o valor obtido é menor que o valor crı́tico não podemos rejeitar a
hipótese nula para erro α = 5%. Logo, não podemos dizer que os efeitos
da droga e do placebo sejam diferentes.
Exemplo 2 - Teste de independência

Associação entre Gênero e Tipo de comercial de TV. Suponha que 125


crianças foram expostas a três tipos de comerciais de TV, sobre cereais
para café da manhã. Após a exposição foi solicitado a cada criança para
indicar qual dos comerciais ela gostou mais. O que se deseja saber é se a
escolha do comercial está relacionado ao gênero da criança: pois
suspeita-se de que o gênero pode estar influenciando na escolha do
comercial.

Gênero Tipo do comercial Total


A B C
Meninos 30 29 16 75
Meninas 12 33 5 50
Total 42 62 21 125
Exemplo 3 - Teste de independência

Testar, ao nı́vel de 5%, se há dependência entre a preferência por sabor


da pasta de dentes e o bairro onde foram feitas 500 entrevistas com
pessoas adultas. Os dados estão na tabela a seguir:

Bairros
Sabor da pasta A B C Total
Limão 70 44 86 200
Chocolate 50 30 45 125
Hortelã 10 6 34 50
Outros 20 20 85 125
Total 150 100 250 500

EXERCÍCIO
Teste Qui-quadrado - Construção do teste -
Heterogeneidade
1 Enunciar as hipóteses H0 e H1 :
H0 : O comportamento da variável é homogêneo nas subpopulações.
H1 : O comportamento da variável não é homogêneo nas subpopulações.

XX
2 Fixar α e considerar a variável de teste:
L C
(Foij − Feij )2
Q= ∼ χ2(L−1)(C −1) ,
i=1 j=1
Feij

onde L é o número de linhas da tabela e C o número de colunas. Além disso,


temos
(total da linha i)(total da coluna j)
Feij = ,
total de observações
caso haja homogeneidade de comportamento da variável, esperamos que essa
proporção seja a mesma em todas as subpopulações.
3 Escrever a região crı́tica: RC = {q ∈ <+ |q ≥ qtabelado }.
4 Calcular:

q=
XX
L C
(Foij − Feij )2

i=1 j=1
Feij

5 Se q ∈ RC então rejeitamos H0 .
Exemplo 4 - Teste de heterogeneidade

No exemplo do desempenho do aluno em Matemática, suponha que os


pesquisadores selecionaram aleatoriamente 125 crianças, das quais 75
eram meninos e 50 meninas.

Table: Teste de Heterogeneidade


Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Ativa 5 25 70 100
fraca 95 75 30 200
Total 100 100 100 300

H0 : p11 = p12 = p13


H1 : p1i =
6 p1j para algum i 6= j
Exemplo 4 - Teste de heterogeneidade

H0 : p11 = p12 = p13


H0 está testando que a proporção de alunos com baixo desempenho
é igual a proporção de alunos médio e igual a proporção de alunos
com desempenho alto quando seus pais participam ativamente das
atividades extra-classe.
Exemplo 5 - Teste de heterogeneidade

A reação ao tratamento por quimioterapia está sendo estudada em


quatro grupos de pacientes com câncer. Deseja-se investigar se todos
reagem da mesma maneira. Uma amostra de pacientes de cada grupo foi
escolhida ao acaso e classificou-se a reação em três categorias.

Câncer Reação Total


Pouca Média Alta
Tipo I 51 33 16 100
Tipo II 58 29 13 100
Tipo III 48 42 30 120
Tipo IV 26 38 16 80
Total 183 142 75 400

H0 : Os pacientes reagem da mesma maneira


Teste Qui-Quadrado para Tabelas (2 × 2)

H0 : Não há diferença significativa entre os grupos.


H1 : Há diferença significativa entre os grupos.
As frequências são dispostas em uma tabela (2 × 2) do tipo:

Classificação 1 Classificação 2 Total


Grupo 1 Fo11 Fo12 Fo1∗
Grupo 2 Fo21 Fo22 Fo2∗
Total Fo∗1 Fo∗2 N

A estatı́stica de teste é do tipo:

(Fo11 × Fo22 − Fo12 × Fo21 )2 × N


χ2cal = ∼ χ21
Fo∗1 × Fo∗2 × Fo1∗ × Fo2∗
Teste Qui-Quadrado para Tabelas (2 × 2) - Voltando no
Exemplo 1

Temos,

Efeito
Estı́mulo Positivo Negativo Total
Droga 48 8 56
Placebo 38 13 51
Total 86 21 107

Logo,
(Fo11 × Fo22 − Fo12 × Fo21 )2 × N (48 × 13 − 38 × 8)2 107
χ2cal = = ≈ 2, 124 < 3, 84.
Fo∗1 × Fo∗2 × Fo1∗ × Fo2∗ 86 × 21 × 56 × 51

Então não rejeitamos a hipótese nula. Ao nı́vel de 5%, não há diferença
significativa entre os grupos (placebo e droga). Ou seja, não podemos
dizer que os efeitos da droga e do placebo sejam diferentes.
Exemplo 6

Para verificar se há relação entre o hábito de fumar e o gênero das


pessoas, um entrevistador montou a seguinte tabela:

Fumam Não Fumam


Homens 15 25
Mulheres 10 20

Adotar α = 5%.