Você está na página 1de 30

Universidade Federal de Minas Gerais

Instituto de Ciências Exatas


Departamento de Estatística

Inferência Estatística:
Princípios de Bioestatística
decidindo na presença de incerteza

Aula 12:

Teste Qui-Quadrado:
Comparação de Várias Proporções
Associação entre duas Variáveis Qualitativas
Exemplo Inicial: Igualdade de Proporções
A administração de um hospital deseja verificar se luvas de três
marcas (A, B e C) são homogêneas quanto à permeabilidade a
vírus.
Para isto, realizou um experimento, no qual 240 luvas da marca A,
240 luvas da marca B e 300 luvas da marca C foram submetidas à
tensão.
Durante os testes, 151 luvas da marca A (62.9%), 134 luvas da
marca B (55.8%) e 177 luvas da marca C (59.0%) deixaram passar
vírus.
Os dados do experimento apresentam evidências estatísticas
suficientes contra a hipótese de que as três marcas possuem a
mesma permeabilidade?

H0: PA = PB = PC = P
H1: ao menos uma das permeabilidades é diferente das outras
Teste de Igualdade de Proporções
(mais de uma população)

Tabela de valores observados

Deixou passar vírus quando


Marca da submetida à tensão? Total
luva Sim Não
A 151 89 240
B 134 106 240
C 177 123 300
Total 462 318 780

Tabela de Classificação Cruzada


H0: PA = PB = PC = P
H1: ao menos uma das permeabilidades é diferente das outras

Deixou passar vírus quando submetida


Marca da à tensão? Total
luva Sim Não
A 151 89 240
B 134 106 240
C 177 123 300
Total 462 318 780

4 6 2 estimativa da permeabilidade comum sob H


P =
ˆ 0
780
Se H0 (PA = PB = PC = P) é verdadeira:

quantas luvas que deixam passar o vírus deveríamos esperar


dentre as luvas da marca A ?
E dentre as luvas da marca B ?
E da marca C ?

Marca da Deixou passar vírus quando submetida à tensão? Total


luva Sim Não
A 151 (240 x462/780=142.15)
.................................... (240-142.15=97.85)
89............................. 240
B (240x462/780=142.15)
134..................................... (240-142.15=97.85)
106............................... 240
C (300x462/780=177.70)
177..................................... 123...............................
(300-177.70=122.30) 300
Total 462 318 780

462 Valores esperados sob H0


Pˆ = = 0.593
780
Note que os valores esperados sob H0 são calculados como uma
função simples dos totais de linha, coluna e do total geral:

(total de linha) × (total de coluna)


Valor Esperado da casela =
(total geral)

Marca da Deixou passar vírus quando submetida à tensão? Total


luva Sim Não
A 151 (240 x462/780=142.15)
.................................... 89.............................
(240x318/780=97.85) 240
B (240x462/780=142.15)
134..................................... 106...............................
(240x318/780=97.85) 240
C 177.....................................
(300x462/780=177.70) 123...............................
(300x318/780=122.30) 300
Total 462 318 780
Tabela de Valores Observados
(esperados sob H0 entre parênteses)

Marca da Deixou passar vírus quando submetida à Total


luva tensão?
Sim Não
A 151 (142.15) 89 (97.85) 240
B 134 (142.15) 106 (97.85) 240
C 177 (177.70) 123 (122.30) 300
Total 462 318 780

Estatística de Teste = “Observado – Esperado sob H0”


Tabela de Valores Observados (esperados sob H0 entre parênteses)

Marca da Deixou passar vírus quando submetida à Total


luva tensão?
Sim Não
A 151 (142.15) 89 (97.85) 240
B 134 (142.15) 106 (97.85) 240
C 177 (177.70) 123 (122.30) 300
Total 462 318 780

Estatística de Teste = (151-142.15)2 (89-97.85)2


(134-142.15)2 (106-97.85)2
(177-177.70)2 (123-122.30)2
Tabela de Valores Observados (esperados sob H0 entre parênteses)

Marca da Deixou passar vírus quando submetida à Total


luva tensão?
Sim Não
A 151 (142.15) 89 (97.85) 240
B 134 (142.15) 106 (97.85) 240
C 177 (177.70) 123 (122.30) 300
Total 462 318 780

(151-142.15) 2 (89-97.85) 2 (134-142.15) 2


Estatística de Teste = + + +
142.15 97.85 142.15
(106-97.85) 2 (177-177.70) 2 (123-122.30) 2
+ +
97.85 177.70 122.30
X = 2.50
2
Valores críticos para X2

O valor de X2 está perto ou longe do zero?

Valores de Referência para X2  Distribuição de Probabilidade de X2

5 g.l.

Distribuição
Qui-quadrado

χ 2
gl 10 g.l.

0
Graus de Liberdade para o Teste Qui-Quadrado

No caso do teste Qui-quadrado, os graus de liberdade da


distribuição de referência equivalem ao
número de caselas livres na tabela

Exemplo: Tabela 2 x 2
Marca da Deixou passar vírus quando Total
luva submetida à tensão?
Sim Não
A 151 89 240
B 134 106 240
Total 285 195 480

G.L. = (número de linhas -1) x (número de colunas -1)


Voltando ao exemplo inicial ….

Tabela 3 x 2  G.l. = (3-1) x (2-1) = 2 x 1 = 2

O valor da estatística X2 deve ser comparado aos valores de


distribuição Qui-quadrado com 2 graus de liberdade.

Se α = 0.05,

RR : X2 > χ20.05 ;2

gl

Percentil que deixa uma área de α=0.05 acima dele na distribuição


Qui-quadrado com 2 graus de liberdade (linha 2 , coluna do 0.05)
Voltando ao exemplo inicial ….

RR(5%) : X2 > 5.991

O valor da estatística observado de X2 foi 2.50.


Como esse valor não pertence à região de valores críticos do teste
qui-quadrado, a distância entre os valores observados e os valores
esperados sob H0 foi considerada pequena.
Assim, o experimento não mostrou evidências estatísticas suficientes
para a rejeição da hipótese de que as permeabilidades das luvas das
três marcas sejam iguais, a 5% de significância.
Se rejeitarmos a hipótese da homogeneidade das
permeabilidades usando os dados deste
experimento ….

Qual será o risco de estarmos cometendo o erro tipo I ?

Valor P = P[ obter um valor de X2 ainda “mais extremo” do que o


valor observado ]

Valor P = P[χ2gl> X2obs] Valor P

X2obs
Voltando ao exemplo inicial ….

Valor P = P[χ22> 2.50]

Na linha 2 da Tabela Qui-quadrado, não existe o valor 2.50.

2.50

Valor P = P[χ22> 2.50] > 0.10

Conclusão: Os dados do experimento não mostraram evidências


estatísticas suficientes para a rejeição da hipótese de que as
permeabilidades das luvas das três marcas sejam iguais (valor P > 0.10).
Teste Qui-Quadrado para Homogeneidade de Proporções

H0: As proporções de sucesso são homogêneas para todas as populações


Ha: Ao menos uma população tem proporção de sucesso diferente das demais

Onde :

Nc é o número total de caselas da tabela


Nc
(Oi − Ei ) 2 Oi é o valor observado na casela i, i=1,2,…, Nc
X 2
obs =∑
i =1 Ei Ei é o valor esperado na casela i.
(total de linha) × (total de coluna)
Ei =
(total geral)

Valor P = P[χ2gl> X2obs], onde g.l. = (l-1) x (c-1)


Teste Qui-Quadrado de Independência
Os n indivíduos de uma amostra são classificados segundo duas
variáveis qualitativas (variável A e variável B):

Variável B
Variável A B1 B2 .... Bc Total
A1
A2
A3

AL
Total n
Exemplo: Distribuição de 592 estudantes de uma universidade
segundo as variáveis cor dos cabelos e cor de olhos.

Cor dos Cor dos olhos


Total
cabelos Verde Acinzentado Azul Castanho
Preto 5 15 20 68 108
Castanho 29 54 84 119 286
Ruivo 14 14 17 26 71
Loiro 16 10 94 7 127
Total 64 93 215 220 592

Pergunta: Existe associação entre a cor de olhos e a cor dos


cabelos de uma pessoa?

A distribuição percentual das cores de olhos é igual em cada


cor de cabelo (e vice-versa)?
H0: não existe associação cor de olhos e a cor dos cabelos.

Valores observados na amostra (valores esperados sob H0):

Cor dos Cor dos olhos


Total
cabelos Verde Acinzentado Azul Castanho
Preto 5 15 20 68 108
Castanho 29 54 84 119 286
Ruivo 14 14 17 26 71
Loiro 16 10 94 7 127
Total 64 93 215 220 592

(total de linha) × (total de coluna)


Valor Esperado da casela =
(total geral)
Verde Cinza Azul Castanho All
Preto 5 15 20 68 108
11.68 16.97 39.22 40.14

Castanho 29 54 84 119 286


30.92 44.93 103.87 106.28

Ruivo 14 14 17 26 71
7.68 11.15 25.79 26.39

Loiro 16 10 94 7 127
13.73 19.95 46.12 47.20

All 64 93 215 220 592

Chi-Square = 138.290; DF = 9; P-Value = 0.000

(Oi − Ei ) 2
Nc
X 2obs =∑
i =1 Ei
Exemplo: associação entre grupo sanguíneo e
presença de uma característica de interesse

Tabela de Classificação Cruzada


Grupo Característica
Total
Sangüíneo Presente Ausente
A 32 47 79
B 8 19 27
AB 7 14 21
O 9 64 73
Total 56 144 200
H0: Variável A não está associada à Variável B
(A e B são independentes)
HA: Variável A está associada à Variável B
(A e B não são independentes)

Onde :

Nc é o número total de caselas da tabela


Nc
(Oi − Ei ) 2
Oi é o valor observado na casela i, i=1,2,…, Nc
X 2
obs =∑
i =1 Ei Ei é o valor esperado na casela i.
(total de linha) × (total de coluna)
Ei =
(total geral)

Valor P = P[χ2gl> X2obs], onde g.l. = (l-1) x (c-1)


“Associação entre toxoplasmose e acidente de trânsito
em pessoas com sangue Rh negativo”

“Increased incidence of traffic accidents in Toxoplasma-infected military drivers and


protective effect RhD molecule revealed by a large-scale prospective cohort study”
H0: acidente automobilístico NÃO está associado à
presença de toxoplasmose em pessoas com Rh negativo
HA: acidente automobilístico está associado à
presença de toxoplasmose em pessoas com Rh negativo

Toxoplasma Acidente ? Total


Não Sim
Não 526 14 540
Sim 170 11 181
Total 696 25 721

X2 = 4.92

Valor P = P[χ21> 4.92]


4.92

(0.025 < Valor P < 0.05)

Ao nível de 5% de significância, há evidências estatísticas


suficientes a favor da hipótese de associação entre acidente
automobilístico e presença de toxoplasmose em pessoas com
sangue Rh negativo (0.025 < Valor P < 0.05).
“Associação entre toxoplasmose e acidente de trânsito
em pessoas com sangue Rh positivo”

“Increased incidence of traffic accidents in Toxoplasma-infected military drivers and


protective effect RhD molecule revealed by a large-scale prospective cohort study”
H0: acidente automobilístico NÃO está associado à
presença de toxoplasmose em pessoas com Rh positivo
HA: acidente automobilístico está associado à
presença de toxoplasmose em pessoas com Rh positivo

Toxoplasma Acidente ? Total


Não Sim
Não 2391 69 2460
Sim 692 17 709
Total 3083 86 3169

X2 = 0.21

Valor P = P[χ21> 0.21]


0.21

(0.10 < Valor P < 0.90)

Para pessoas com sangue Rh positivo, os dados amostrais não


fornecem evidências estatísticas suficientes contra a hipótese
de independência entre acidente automobilístico e presença de
toxoplasmose (Valor P > 0.10).

Você também pode gostar