Você está na página 1de 36

UNIVERSIDADE FEDERAL DE SANTA CATARINA

CMIP- Centro de Metrologia e Inovação em Processos

Teste do 2 (Qui-quadrado)

Profª Andréa Cristina Konrath


TESTES NÃO PARAMÉTRICO PARA VARIÁVEIS CATEGÓRICAS

Um dos objetivos mais comuns em pesquisas com dados


categorizados é verificar se duas ou mais variáveis
apresentam-se associadas.

A associação entre duas ou mais variáveis implica que o


conhecimento de uma altera a probabilidade de algum
resultado da outra.
Teste do 2 (qui-quadrado)

A estatística de teste permite medir o grau de discordância entre as frequências


efetivamente observadas e as frequências que deveríamos esperar teoricamente no
caso de as variáveis serem independentes

É uma tabela em que as frequências correspondem a duas variáveis: uma variável


categoriza as linhas e a outra categoriza as colunas.

Aqui, testa-se a hipótese nula de que a variável linha e a variável coluna não estão
relacionadas, isto é, são independentes. Para realizar esse teste não é necessário
supor que a população original tenha distribuição normal nem qualquer outro tipo
de distribuição.
Teste do 2 (qui-quadrado)

A estatística é a mesma utilizada no teste de aderência, onde os graus de liberdade e


a frequência esperada são calculados da seguinte forma:

E ij 
total da linha "i"total da coluna " j"
total geral

O teste é unilateral à direita com  = (l - 1) (c - 1) .


Teste do 2 (qui-quadrado)

  
2
l c O ij  Eij 
2

i 1 j 1 Eij
onde:
l - número de linhas;
c - número de colunas;
Eij - frequência esperada na linha “i” e coluna “j”;
Oij – frequência observada na linha “i” e coluna “j”.

Obs.1: Os testes de independência com tabelas de contingência envolvem, apenas,


regiões críticas unilaterais à direita.
Obs.2: Para cada célula na tabela de contingência, a frequência esperada "E" deve
ser, no mínimo, igual a 5. Não há tal exigência para as frequências observadas.
Exemplo 1

Deseja-se verificar se existe associação entre as funções


exercidas e o sexo.

O quadro a seguir mostra as funções exercidas e o sexo de


474 funcionários de uma organização. Supondo que os
resultados são provenientes de uma amostra aleatória,
verificar se as variáveis são independentes a 1% de
significância.

6
Exemplo 1

Função
Sexo Escritório Serviços Gerência Total
gerais
Masculino 157 27 74 258
Feminino 206 0 10 216
Total 363 27 84 474

7
Exemplo 1

H0: variáveis sexo e função são independentes.


H1: variáveis sexo e função são dependentes.

8
Exemplo 1

• Masc. - Escritório E = (258  363)/ 474 =


197,58
• Masc. - Serviços Gerais E = (258  27)/ 474
= 14,70
• Masc. - GerênciaE = (258  84)/ 474 = 45,72
• Fem. - Escritório E = (216  363)/ 474 = 165,42
• Fem - Serviços Gerais E = (216  27)/ 474 =
12,30
• Fem. - Gerência E = (216  84)/ 474 = 38,28

9
Exemplo 1

O-E Função
Sexo Escritório Serviços Gerência
gerais

Masculino 157 - 197,58 27 - 14,70 74 - 45,72

Feminino 206 - 165,42 0 - 12,30 10 - 38,28

10
Exemplo 1

(O-E)2 Função

Sexo Escritório Serviços Gerência


gerais
Masculino 1646,921 151,383 799,672

Feminino 1646,921 151,383 799,672

11
Exemplo 1

2=(O-E)2/E Função

Sexo Escritório Serviços Gerência


gerais
Masculino 8,336 10,301 17,490

Feminino 9,956 12,304 20,891

12
Exemplo 1

2 = 8,336 + 10,301 + 17,490 + 9,956 + 12,304 + 20,891 =


79,227
Os graus de liberdade: (número de linhas -1)x(número
de colunas - 1) = (2 -1)(3-1)= 2
Então 2 = 79,227
2 ,crítico = 9,21 (tabela)

Rejeitar H0, pois 2 > 2 ,crítico.


Há associação entre as variáveis.

13
Teste do 2 (qui-quadrado)
Teste do 2 (qui-quadrado- YATES)

Ex.: Verifique se existe associação entre as variáveis Tabagismo e


Ansiedade, ao nível de significância de 10%.

Fumante Ansioso Total


Sim Não
Sim 15 / 12,16 7 / 9,84 22
Não 6 / 8,84 10 / 7,16 16

Total 21 17 38

H0: o Tabagismo é independe de Ansiedade;


H1: o Tabagismo depende de Ansiedade.

15
Teste do 2 (qui-quadrado)

  
2
l c O
ij  Eij  0,5 
2

i 1 j 1 Eij

2 (| 15  12,16 | 0,5) 2 (| 7  9,84 | 0,5) 2 (| 6  8,84 | 0,5) 2


    
12,16 9,84 8,84
(| 10  7,16 | 0,5) 2
  2,39
7,16
2 tabelado = 2,39

Não rejeito H0, o tabagismo independe de Ansiedade, ao nível de 5% de


significância.

16
Exemplo 3

• Há dúvidas sobre o desempenho dos alunos, na


disciplina de Estatística, de alguns cursos de
engenharia. Alguns argumentam que, dependendo do
curso, o percentual de aprovação pode ser diferente,
mesmo que a disciplina tenha o mesmo programa. Um
estudo foi realizado, selecionando aleatoriamente alunos
de três cursos, registrando os aprovados e reprovados
na disciplina. Os resultados estão na tabela a seguir:
Exemplo 3

Situação Curso
Eng. Civil Eng. Eng. Total
Química Mecânica
Aprovados 44 26 35 105
Reprovados 11 26 15 52
Total 55 52 50 157

Considerando o nível de significância de 5%, os percentuais de aprovação


podem ser considerados iguais?
Exemplo 3 - Solução

H0: a aprovação independem do curso


H1: há associação entre a aprovação e o curso

Situação Curso
Eng. Civil Eng. Eng. Total
Química Mecânica
Aprovados 36,78 34,78 33,44 105
Reprovados 18,22 17,22 16,56 52
Total 55 52 50 157

• Valores esperados?
Eij = (Total da linha i)*(Total da coluna j)
(Total geral)
(105) * (55) (52) * (55)
E11   36,78 E21   18,22...
157 157
Exemplo 3 - Solução

H 0 : Oi  Ei
H i : Oi  Ei
2 2 2 2
K
(O  E ) ( 44  36, 78) (11  18, 22) (15  16,56)
2   i i
   ...   11,18
i 1 Ei 36,78 18,22 16,54
 2 (  5%, gl  (c  1)( L  1)  (3  1)(2  1)  5,99
 2   c2
11,18  5,99

Conclusão: Como cai na região de rejeição, o teste rejeita H0. Os


percentuais de aprovação não podem ser considerados iguais.
Estatística Qui-Quadrado Utilizando o

Software R
Associação/Independência
Associação/Independência

 Converter variável numérica para fator


 Fazer o teste Qui-Quadrado
Associação/Independência

 Forma alternativa para realizar a mesma análise

Digite as variáveis

Digite o no. de linhas

e colunas

Digite o nome das categorias

e os valores na tabela
PASSOS NO R COMMANDER

Lembrando: A hipótese nula é de que as variáveis não estão


associadas, em outras palavras, eles são independentes. A hipótese
alternativa é de que as variáveis estão associadas, ou dependentes.

Conclusão: Aceito H0 logo as variáveis são independentes.

25
Teste Qui-quadrado de independência

Exemplo
Qui-Cancer.xls. Analise mediante o emprego do
teste do Qui-Quadrado a eventual associação
existente entre as variáveis ter câncer versus
fumo. O que você pode concluir?

26
Teste Qui-quadrado de independência

Exemplo
Qui-Cancer.xls.
Primeiro passo elaborar as hipóteses
H0: as variáveis tabagismo e a doença câncer são independentes
H1: as variáveis tabagismo e a doença câncer não são independentes

27
PASSOS NO R COMMANDER

Importar os dados

28
PASSOS NO R COMMANDER

Converter variável numérica para fator

Seleção das Variáveis

Seleção dos percentuais

29
Associação/Independência

Em uma tabela 2x2 deve-se utilizar a correção de continuidade,


para isso é necessário alterar a sintaxe que o R irá mostrar ou
seja: APENAS TROCAR FALSE POR TRUE, conforme abaixo.

local({
.Table <- xtabs(~fumantes+cancer, data=Exemplo2)
cat("\nFrequency table:\n")
print(.Table)
cat("\nRow percentages:\n")
print(rowPercents(.Table))
.Test <- chisq.test(.Table, correct=TRUE)
print(.Test)
})
PASSOS NO R COMMANDER

Lembrando: A hipótese nula é de que as variáveis não estão


associadas, em outras palavras, eles são independentes. A hipótese
alternativa é de que as variáveis estão associadas, ou dependentes.

Conclusão: rejeito H0 logo as variáveis estão associadas, ou seja são


dependentes.

31
Exemplo

Usando o arquivo “Aproveitamento.xlsx”, faça a análise


correta para testar a associação entre trabalho (0: não; 1:
sim) e reprovação (0: não; 1: sim).
Exemplo
Converter variável numérica para fator

 25% ou mais dos valores esperados das células da


tabela é menor do que 5.
Exemplo
 25% ou mais dos valores esperados das células da
tabela é menor do que 5.
PASSOS NO R COMMANDER

Lembrando: A hipótese nula é de que as variáveis não estão


associadas, em outras palavras, eles são independentes. A hipótese
alternativa é de que as variáveis estão associadas, ou dependentes.

Conclusão: Aceito H0 logo as variáveis são independentes

35
EXERCÍCIOS – LISTA 15

36

Você também pode gostar