Escolar Documentos
Profissional Documentos
Cultura Documentos
net/publication/338294452
CITATIONS READS
0 172
2 authors:
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by André Moreno Morcillo on 01 January 2020.
Entre diferentes técnicas2 que podem ser usadas para avaliar a associação entre duas
1900.
“Os dados foram coletados de setembro de 2013 a setembro de 2016 nas fichas
de notificação e nos prontuários médicos de internamento e de seguimento
ambulatorial. Foram consideradas adequadamente seguidas as crianças que
compareceram à unidade de atenção primária ou ao ambulatório de referência no
período recomendado pelo Ministério da Saúde e realizaram os exames
preconizados.
Foram notificadas 460 crianças com sífilis congênita, das quais 332 (72,2%)
retornaram para pelo menos uma consulta e fizeram parte do estudo. Houve não
adesão às consultas subsequentes por parte de 272 (81,9%) indivíduos. As
seguintes variáveis apresentaram associação estatisticamente significativa com o
seguimento não adequado das crianças: estado civil das genitoras, número de
consultas no pré-natal, número de gestações, hemograma e radiografia de ossos
longos. Os autores concluíram que a maioria das crianças notificadas com sífilis
1
X e Y independentes ⇔ p(x,y) = p(x).p(y), ∀(x,y). Se existe pelo menos um par (𝑥0 , 𝑦0 ) tal que 𝑝(𝑥0 , 𝑦0 ) ≠
𝑝(𝑥0 ). 𝑝(𝑦0 ) então X e Y são variáveis associadas (dependentes) (Magalhães e Lima, 2002, pg. 137)
2
Por exemplo, podemos citar o Risco Relativo, a Razão de chances, a correlação de Spearman.
3
Cavalcante ANM, Araújo MAL, Nobre MA, Almeida RLF. Fatores associados ao seguimento não adequado de
crianças com sífilis congênita. Rev. Saúde Pública, 2019; 53:95. DOI: http://dx.doi.org/10.11606/s1518-
8787.2019053001284
1
congênita comparecem à atenção primária para seguimento, porém os serviços
não atendem às recomendações do Ministério da Saúde para o seguimento
adequado”
(𝑂𝑖 − 𝐸𝑖 )2
𝜒 2 𝑐é𝑙𝑢𝑙𝑎 =
𝐸𝑖
𝑘 𝑘
2 2
(𝑂𝑖 − 𝐸𝑖 )2
𝜒 𝑡𝑎𝑏𝑒𝑙𝑎 = ∑ 𝜒 𝑐é𝑙𝑢𝑙𝑎 = ∑
𝐸𝑖
𝑖=1 𝑖=1
𝑘
2
𝑂𝑖2
𝜒 𝑡𝑎𝑏𝑒𝑙𝑎 = ∑ ( )−𝑁
𝐸𝑖
𝑖=1
2
As frequências esperadas4,5 (teóricas) são calculadas a partir dos dados da tabela,
em que a frequência esperada (E) em uma determinada célula é o resultado do
produto do total de sua coluna (TC) pelo total de sua linha (TL) e dividido pelo total
geral da tabela (N).
𝑇𝐶 . 𝑇𝐿
𝐸=
𝑁
Vejamos a tabela abaixo:
Linha 1 a b TL 1
Linha 2 c d TL 2
Total TC 1 TC 2 N
TOMADA DE DECISÃO
4
As frequências esperadas são calculadas considerando que H0 é verdadeira, ou seja, não há associação entre as
duas variáveis.
5
Ver leitura suplementar.
3
eixo das abscissas, representa o qui-quadrado crítico, que divide a distribuição em
duas áreas: rejeição e não rejeição de H0.
Seguimento Adequado
Não Sim Total
O E O E N
< 20 78 a 17 b 95
Idade
≥ 20 194 c 43 d 237
Total 272 60 332
4
Agora podemos completar a tabela
Seguimento Adequado
Não Sim Total
O E O E N
< 20 78 77,83 17 17,17 95
Idade
≥ 20 194 194,17 43 42,83 237
Total 272 60 332
𝑘 𝑘
2 2
(𝑂𝑖 − 𝐸𝑖 )2
𝜒 𝑡𝑎𝑏𝑒𝑙𝑎 = ∑ 𝜒 𝑐é𝑙𝑢𝑙𝑎 = ∑
𝐸𝑖
𝑖=1 𝑖=1
𝑘
2
𝑂𝑖2
𝜒 𝑡𝑎𝑏𝑒𝑙𝑎 = ∑ ( ) − 𝑁
𝐸𝑖
𝑖=1
Graus de liberdade:
Como estamos analisando uma tabela com duas linhas e duas colunas temos:
gl = (2 – 1).(2 – 1) = 1
Qui-quadrado crítico:
5
Como 𝜒 2 calculado < 𝜒 2 crítico não podemos rejeitar H0, concluindo que não há
associação entre idade da mãe e a inadequação de seguimento da doença.
Seguimento Adequado
Não Sim Total
O E O E
Estado Casada 147 a 41 b 188
Civil Solteira 122 c 18 d 140
Total 269 59 328
Seguimento Adequado
Não Sim Total
O E O E
Estado Casada 147 154,18 41 33,82 188
Civil Solteira 122 114,82 18 25,18 140
Total 269 59 328
Graus de liberdade:
Como estamos trabalhando com uma tabela com duas linhas e duas colunas temos
somente 1 grau de liberdade.
6
Qui-quadrado crítico:
Como 𝜒 2 calculado > 𝜒 2 crítico podemos rejeitar H0, concluindo que há associação entre
o estado civil da mãe e a inadequação de seguimento da doença. A prevalência de
seguimento inadequado foi maior entre as solteiras (87,1%) do que nas casadas
(78,2%) e esta diferença é estatisticamente significante.
Seguimento Adequado
Não Sim Total
O E O E N
Nº de <6 134 a 21 b 155
consultas ≥6 137 c 39 d 176
Total 271 60 331
7
A frequência esperada da célula “a” será: E = (271 x 155) / 331 = 126,9
A frequência esperada da célula “b” será: E = (60 x 155) / 331 = 28,1
A frequência esperada da célula “c” será: E = (271 x 176) / 331 = 144,1
A frequência esperada da célula “d” será: E = (60 x 176) / 331 = 31,9
Seguimento Adequado
Não Sim Total
O E O E N
Nº de <6 134 126,9 21 28,1 155
consultas ≥6 137 144,1 39 31,9 176
Total 271 60 331
Graus de liberdade:
Como estamos trabalhando com uma tabela com duas linhas e duas colunas temos
somente 1 grau de liberdade.
Qui-quadrado crítico:
8
Como 𝜒 2 calculado > 𝜒 2 crítico podemos rejeitar H0, concluindo que há associação entre
o número de consultas no pré-natal e a inadequação de seguimento da doença. A
prevalência de seguimento inadequado foi maior entre as mães que fizeram menos
de seis consultas no pré-natal (86,5% vs 77,8%).
Calculando o qui-quadrado:
5362 2602 802 122 1642 1652 882 292 292 482 662 532
𝜒2 = + + + + + + + + + + +
407,2 268 142,6 70,2 204,5 134,6 71,6 35,3 89,9 59,1 31,5 15,5
22 82 222 322
+ + + + − 1594 = 495,56
29,4 19,3 10,3 5,1
𝑂2
Neste caso usamos a fórmula (𝜒 2 = ∑𝑘 ( 𝐸 ) − 𝑁) que requer menor número de cálculos,
Graus de liberdade:
9
Qui-quadrado crítico:
Como 𝜒 2 calculado > 𝜒 2 crítico podemos rejeitar H0, concluindo que há associação entre
a escolaridade do pai e a renda familiar. Observe que entre os pais com menos de 4
anos de escolaridade 796/888 (89,6%) tem renda inferior a 1 salário mínimo,
enquanto entre aqueles com nível superior somente 10/64 (15,6%) tem a mesma
renda.
O cálculo do em tabelas com duas linhas e duas colunas (tabelas 2x2) pode ser
2
Linha 1 a b TL 1
Linha 2 c d TL 2
Total TC 1 TC 2 N
2
(𝑎. 𝑑 − 𝑏. 𝑐)2 . 𝑁
𝜒 =
(TL1 . TL2 . TC1 . TC2)
10
2. Quando o número de casos estudados (N) é maior que 20 e menor que 40
temos que usar a correção de Yates:
𝑁 2
(|𝑎. 𝑑 − 𝑏. 𝑐| − 2 ) . 𝑁
𝜒2 =
(TL1 . TL2 . TC1 . TC2)
Adequação ao seguimento
2
(134 × 39 − 137 × 21)2 . 331
𝜒 = = 4,12
(271 × 60 × 155 × 176)
Não se deve usar o teste do qui-quadrado para avaliar a associação entre duas
ou mais variáveis qualitativas se houver uma ou mais células com frequência
esperada (E) menor que 1. No caso de ocorrerem células com frequência
esperada (E) maior que 1 e menor que 5, estas não podem ocorrer em mais de
20% das células da tabela.
11
que indicará quais linhas ou colunas podem ser agrupadas, evitando assim
prejuízo na interpretação futura dos dados.
Não se deve usar o teste do qui-quadrado em tabelas com duas linhas e duas
colunas (2x2) se o número de casos for menor ou igual a 20. Nestes casos
recomenda-se o teste Exato de Fisher.
LEITURA SUPLEMENTAR
Variável B
Total
1 0
1 a b Tl1
Variável A
0 c d Tl2
P(A=1) = Tl1/N
P(A=0) = Tl2/N
P(B=1) = Tc1/N
P(B=0) = Tc2/N
12
P(a) = P(A=1 e B=1) = P(A=1 Ո B=1) = P(A=1) . P(B=1)= Tl1/N . Tc1/N
𝐸(𝑋) = ∑(𝑓(𝑥𝑖 ). 𝑛𝑖 )
A frequência esperada de A = 1 e B = 0 é:
A frequência esperada de A = 0 e B = 1 é:
A frequência esperada de A = 0 e B = 0 é:
𝑇 𝑙𝑖𝑛ℎ𝑎𝑖 × 𝑇 𝑐𝑜𝑙𝑢𝑛𝑎𝑗
𝐸𝑖,𝑗 =
𝑁
O QUI-QUADRADO ...
13
𝑘
𝑠𝑑 = ∑(𝑂𝑖 − 𝐸𝑖 ) = 0
𝑖=1
𝑠𝑑 = ∑(𝑂𝑖 − 𝐸𝑖 )2 ≥ 0
𝑖=1
Ultrapassada a primeira dificuldade, ainda resta uma dúvida. Como saber se uma
determinada diferença (𝑂𝑖 − 𝐸𝑖 )2 é grande ou pequena?
𝑘
(𝑂𝑖 − 𝐸𝑖 )2
𝜒2 = ∑ ≥0
𝐸𝑖
𝑖=1
𝑘 𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2 (0)2
𝜒 = lim (∑ ) =∑ =0
(𝑂𝑖 −𝐸𝑖 )→0 𝐸𝑖 𝐸𝑖
𝑖=1 𝑖=1
𝑘 𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2 (∞)2
𝜒 = lim (∑ ) =∑ =∞
(𝑂𝑖 −𝐸𝑖 )→∞ 𝐸𝑖 𝐸𝑖
𝑖=1 𝑖=1
Neste caso temos uma variável é dicotômica em termos de resposta que será
avaliada em diferentes estratos de outra variável. Como exemplo podemos citar tipo
de parto em relação à escolaridade da mãe ou à renda familiar.
6
Esta foi a maneira que Pearson resolveu o problema quando desenvolveu o conceito da variância
14
Scossiroli (1962)7 e Snedecor e Cochran (1980) 8 apresentam um método simplificado
que permite avaliar não somente a associação entre as duas variáveis, mas também
a homogeneidade9 das proporções das categorias. Observe na tabela abaixo que a
variável B tem duas categorias e a variável A tem “r” categorias.
Variável B
Total
B1 B2
A1 a1 b1 n1
A2 a2 b2 n2
A3 a3 b3 n3
Variável A
... ... ... ...
Ar ar br nr
Total TB1 TB2 N
Sob H0 podemos inferir que cada categoria da variável A (A1, A2, A3, ... Ar) tem a
mesma proporção de sujeitos B1 que a proporção observada para o total da tabela
(𝑝̅) que pode ser considerada a média esperada. Assim:
𝑇𝐵1 𝑇𝐵2
𝑝̅ = 𝑞̅ = = 1 − 𝑝̅
𝑁 𝑁
𝑎1 𝑎2 𝑎3 𝑎𝑟
𝑝(𝐴1 = 𝑎1) = 𝑛1 𝑝(𝐴 = 𝑎2) = 𝑛2 𝑝(𝐴3 = 𝑎3) = 𝑛3 𝑝(𝐴𝑟 = 𝑎𝑟) = 𝑛𝑟
Como temos r linhas e somente duas colunas, estamos trabalhando com r – 1 graus
de liberdade.
7
Scossiroli (1962) atribui a Brand e Snedecor o método.
8
Snedecor e Cochran (1980) atribuem a Snedecor e Irwin (1933) o desenvolvimento do método.
9
Zar (1999) afirma que é necessário o adequado planejamento da amostra para se avaliar a homogeneidade. Nos
casos em que selecionamos uma única amostra e, durante a análise dos dados, geramos uma tabela cruzando duas
variáveis, só poderemos falar em associação.
15
Na tabela apresentada a seguir temos a distribuição do excesso de peso em relação
à renda familiar per capita (salário-mínimo). Desejamos avaliar a associação e
homogeneidade dos dados. Para tal, vamos usar a fórmula de Brandt-Snedecor.
Graus de liberdade = 4 – 1 = 3
2
𝜒𝑐𝑟í𝑡𝑖𝑐𝑜 = 7,81
58
𝑝(< 0,5) = 770 = 0,07532
56
𝑝(0,5 ⟼ 1,0) = = 0,11313
495
35
𝑝(1,0 ⟼ 2,0) = = 0,13672
256
28
𝑝(≥ 0,2) = = 0,21705
129
177
𝑝̅ = = 0,10727
1650
Observe que nas três primeiras categorias de renda as proporções são próximas à
média esperada, enquanto na última categoria temos o dobro da esperada. Com este
método podemos ir um pouco além de avaliar a simples associação entre duas
variáveis.
16
Renda Familiar per Baixa Estatura
Total
capita (SM) Sim Não
< 0,5 33 737 770
0,5 |--- 1,0 S 10 485 495
1,0 |--- 2,0 5 251 256
≥ 2,0 1 128 129
Total 49 1.601 1.650
2
𝜒𝑐𝑟í𝑡𝑖𝑐𝑜 = 7,81
Como o qui-quadrado calculado é maior que o qui-quadrado crítico rejeitamos H0,
concluindo que há associação entre a Baixa estatura e a Renda familiar e há
heterogeneidade entre as categorias de renda. Vejamos as proporções:
33
𝑝(< 0,5) = = 0,04286
770
10
𝑝(0,5 ⟼ 1,0) = = 0,0202
495
5
𝑝(1,0 ⟼ 2,0) = = 0,01953
256
1
𝑝(≥ 0,2) = = 0,00775
129
49
𝑝̅ = = 0,0297
1650
Neste caso a primeira categoria de renda tem proporção 1,44 vezes maior que a
média esperada (𝑝̅ = 0,0297) e a última categoria tem proporção 73,8% menor que
a esperada.
Calcular o qui-quadrado de uma tabela maior que duas linhas e duas colunas é
trabalhoso, pois temos que calcular muitas frequências esperadas e, posteriormente,
calcular o qui-quadrado de cada célula e somá-los.
Scossiroli (1962) descreve uma maneira bastante prática de executar a análise sem
utilizar as frequências esperadas. Considere a tabela abaixo que apresenta “r” linhas
(categorias da variável A) e “c” colunas (categorias da variável B). Em uma
determinada linha “i” vamos ter “c” colunas, sendo que podemos representar um
elemento qualquer da linha “i” e coluna “j” por “ai.j”.
17
Variável B
B1 B2 ... Bj ... Bc Total
A1 a1.1 a1.1 ... a1.j ... a1.c n1
A2 a2.1 a2.2 ... a2.j ... a2.c n2
A3 a3.1 a3.2 ... a3.j ... a3.c n3
... ... ... ... ... ... ...
Variável A
Ai ai.1 ai.2 ... ai.j ... ai.c ni
... ... ... ... ... ... ...
Ar ar.1 br.2 ... ar.j ... ar.c nr
Total TB1 TB2 ... TBJ ... TBc N
r : nº de linhas; c : nº de colunas
Que é igual a:
𝑟 𝑟 𝑟
2
𝑎𝑖.1 2 𝑁 𝑎𝑖.2 2 𝑁 𝑎𝑖.𝑐 2 𝑁
𝜒 = (∑ . +∑ . + ⋯+ ∑ . )−𝑁
𝑛𝑖 𝑇𝐵1 𝑛𝑖 𝑇𝐵2 𝑛𝑖 𝑇𝐵𝑐
𝑖=1 𝑖=1 𝑖=1
𝑟 𝑟
2
𝑎𝑖.1 2 𝑁 𝑎𝑖.2 2 𝑁
𝜒 = (∑ . +∑ . )−𝑁
𝑛𝑖 𝑇𝐵1 𝑛𝑖 𝑇𝐵2
𝑖=1 𝑖=1
18
Primeira coluna:
Segunda coluna:
BIBLIOGRAFIA
Bussab WO, Morettin PA. Estatística básica. 7ªed. São Paulo: Saraiva, 2012.
Conover MJ. Practical nonparametric statistics. 3th ed. New York: John Wiley & Sons
Inc., 1999.
Pearson K. On a criterion that a given system of deviations from the probable in the
case of a correlated system of variables is such that it can reasonably be supposed
to have arisen in randon sampling. Philosophical Magazine, 1900; 50:157-175.
19
Scossiroli RE. Manuale di statistica per ricercatori. Pavia: Ing. C. Olivetti & C. S.p.A,
1962.
Snedecor GW, Cochran WG. Statistical methods. Ames, Iowa: Iowa Universiy Press,
1980.
Zar JH – Biostatistical analysis. 2nd ed. Englewood Cliffs: Prentice-Hall Inc., 1999.
20
Valores de qui-quadrado crítico para =0,05
gl 2 crítico gl 2 crítico
1 3,84 16 26,30
2 5,99 17 27,59
3 7,82 18 28,87
4 9,49 19 30,14
5 11,07 20 31,41
6 12,59 21 32,67
7 14,07 22 33,92
8 15,51 23 35,17
9 16,92 24 36,42
10 18,31 25 37,65
11 19,68 26 38,88
12 21,03 27 40,11
13 22,36 28 41,34
14 23,68 29 42,56
15 25,00 30 43,77
21