Escolar Documentos
Profissional Documentos
Cultura Documentos
Bioqui PDF
Bioqui PDF
Biometria
Qui Quadrado
(Leitura complementar ao captulo 3)
Sumrio:
Como calcular
Como usar a tabela
Correo de Yates (continuidade)
Definio
Em tabelas de contingncia
Heterogeneidade de amostras
Modelos "simplificados"
Teste exato de Fisher
Definio
Qui Quadrado, simbolizado por 2 um teste de hipteses que se destina a encontrar um valor
da disperso para duas variveis nominais, avaliando a associao existente entre variveis
qualitativas.
um teste no paramtrico, ou seja, no depende dos parmetros populacionais, como mdia
e varincia.
O princpio bsico deste mtodo comparar propores, isto , as possveis divergncias entre
as frequncias observadas e esperadas para um certo evento.
Evidentemente, pode-se dizer que dois grupos se comportam de forma semelhante se as
diferenas entre as frequncias observadas e as esperadas em cada categoria forem muito
pequenas, prximas a zero.
Portanto, o teste utilizado para:
Verificar se a frequncia com que um determinado acontecimento observado em uma
amostra se desvia significativamente ou no da frequncia com que ele esperado.
Comparar a distribuio de diversos acontecimentos em diferentes amostras, a fim de
avaliar se as propores observadas destes eventos mostram ou no diferenas
significativas ou se as amostras diferem significativamente quanto s propores desses
acontecimentos.
Condies necessrias
Para aplicar o teste as seguintes proposies precisam ser satisfeitas:
Os grupos so independentes,
Os itens de cada grupo so selecionados aleatoriamente,
As observaes devem ser frequncias ou contagens,
Como calcular
Karl Pearson props a seguinte frmula para medir as possveis discrepncias entre
propores observadas e esperadas:
2 = [(o - e)2 /e]
em que
o = frequncia observada para cada classe,
e = frequncia esperada para aquela classe.
Note-se que (o - e) = desvio (d), portanto a frmula tambm pode ser escrita como
2 = (d 2 /e)
Percebe-se que as frequncias observadas so obtidas diretamente dos dados das amostras,
enquanto que as frequncias esperadas so calculadas a partir destas
importante notar que (o - e) a diferena entre a frequncia observada e a esperada em uma
classe. Quando as frequncias observadas so muito prximas s esperadas, o valor de 2
pequeno. Mas, quando as divergncias so grandes (o - e) passa a ser tambm grande e,
consequentemente, 2 assume valores altos.
Assim, os valores esperados so: cara: 50 e coroa: 50 e os observados so: cara: 60 e coroa:
40.
2 = [(60 50)2 / 50] + [(40 50)2 / 50]
a. Valor de 2 = 2 + 2 = 4
O que significa esse nmero? Ou seja, como se analisa um teste de 2 ?
Supondo que em vez de lanarmos 100 moedas uma nica vez, tivssemos feito inmeros
lanamentos de 100 moedas. Se calcularmos o 2.a cada 100 lanamentos, e, depois, colocarmos
todos os resultados em um grfico, teria sido obtida a figura ao lado.
Nota-se que os valores pequenos de 2 ocorrem mais frequentemente que os grandes, pois se
um experimento puder ser representado pelo modelo terico proposto, pequenos desvios casuais
entre propores esperadas e observadas ocorrero em maior nmero do que grandes desvios.
Tomando a rea total sob a curva como 100%, sabe-se que o valor 3,841 delimita 5% dela.
Este o valor crtico de qui quadrado conhecido como 2c. Portanto, espera-se em experimentos
semelhantes, que valores de 2.e menores que 3,841 tenham 95% de probabilidade de
ocorrncia.
Sempre que o valor de 2 for menor que 3,841 aceita-se a hiptese de igualdade estatstica
entre os nmeros de observados e de esperados (H0). Ou seja, admite-se que os desvios no so
significativos.
2c
GL \ P 0,99 0,95 0,90 0,80 ... 0,05 0,02 0,01 0,001
1 0,0002 0,004 0,016 0,064 ... 3,841 5,412 6,635 10,827
2 0,020 0,103 0,211 0,446 ... 5,991 7,824 9,210 13,815
3 0,115 0,352 0,584 1,005 ... 7,815 9,837 11,345 16,266
4 0,297 0,711 1,064 1,649 ... 9,488 11,668 13,277 18,467
5 0,554 1,145 1,610 2,343 ... 11,070 13,388 15,080 20,515
...
Aceita-se a hiptese de igualdade estatstica entre Rejeita-se H0 e aceita-se H1.
os nmeros de observados e de esperados (H0). Os nmeros de obs e esp so
. estatisticamente diferentes.
Os desvios no so significativos. Os desvios so significativos.
Exemplo 2:
Se um dado no viciado for jogado 6 vezes, espera-se obter 1 vez cada face (1, 2, 3, 4, 5 e 6)
j que a probabilidade de cair qualquer face 1/6.
Supondo que um dado foi jogado 186 vezes e se obteve:
observado 34 29 30 32 28 33
esperado 31 31 31 31 31 31
2 parcial 0,2903 0,1290 0,0322 0,0322 0,2903 0,1290
http://www.cultura.ufpa.br/dicas/biome/biozip/quipropo.zip
Em tabelas de contingncia
At aqui foram analisadas situaes em que havia uma hiptese baseada em alguma teoria,
gerando propores esperadas. Por exemplo, efetuar um experimento semelhante ao de Mendel
e verificar se a distribuio de uma certa varivel obedece a proporo 3 :1.
Entretanto, o teste de 2 pode ser aplicado em casos em que no se dispe de uma teoria que
permita efetuar o clculo de classes esperadas.
Por exemplo, supondo que se deseja verificar se uma caracterstica se distribui igualmente
entre os sexos, ou em classes sociais, ou em diferentes grupos raciais, ou em grupos etrios, ou
Jovens 15 25 40
Esp 13,3333 26,6667
(o-e)2 /e 0,2083 0,1042
Adultos 10 30 40
Esp 13,3333 26,6667
(o-e)2 /e 0,8333 0,4167
http://www.cultura.ufpa.br/dicas/biome/biozip/qui55.zip
a frequncia esperada em uma das classes pequena (tipicamente, quando for menor que 5) a
frmula de obteno de 2 poder produzir um valor maior que o real.
Alguns autores, entre eles Ronald Fisher, recomendam que se observe a seguinte restrio:
O teste de 2 pode ser usado se o nmero de observaes em cada casela da tabela for maior
ou igual a 5 e a menor frequncia esperada for maior ou igual a 5.
Em caso contrrio, em cada classe deve ser utilizada a correo de Yates:
2 = [( | o -e | - 0,5)2/ e ]
Evidentemente, no preciso usar a correo de Yates se o valor de 2 obtido for menor que
2, pois o novo valor ser menor que o primeiro, continuando a no ser significativo.
Apesar do assunto ser controverso, de modo geral, usa-se a correo de Yates quando:
o valor de Qui Quadrado obtido maior que o crtico e
o valor de N menor que 40 ou
h pelo menos uma classe com nmero de esperados menor que 5.
Exemplo
Supondo uma coleo de irmandades, com N = 16, filhos de casais com um cnjuge afetado
por uma anomalia endgena. 4 dentre os filhos tambm apresentam a doena. A caracterstica
obedece o padro de transmisso autossmico, dominante e monognico?
A genealogia seria:
http://www.cultura.ufpa.br/dicas/biome/biozip/qui22y.zip
A probabilidade calculada ser igual ao produto dos fatoriais dos totais marginais pelo fatorial
do total geral multiplicado pelo inverso do produto dos fatorais dos valores observados em cada
classe.
Para facilitar, identifiquemos as clulas por letras.
A probabilidade de dependncia das duas amostras ser definida por:
P = [( G! H! E! F! ) / I! ] x [1 / ( a! c! b! d! )]
Total
5 3 8 P = (8! 7! 7! 8! / 15!) (1 / 5! 3! 2! 5!)
2 5 7 P = 0,1828
Total 7 8 15
0 7 7 P = 0,0012
Total 7 8 15
P = 0,1828 + 0,0305 + 0,0012 = 0,2145 = 21,45 %
Nesse caso, como o valor encontrado de P maior que 5%, a hiptese das caractersticas
serem independentes aceita, dizendo-se que a sua associao casual.
Observao: Em tabelas com mais de 2 colunas ou 2 linhas, ou seja, quando G.L. > 1, pode-se
utilizar o teste de 2 se o nmero de caselas com frequncia esperada inferior a 5 menor que
20% do total de caselas e nenhuma frequncia esperada for zero.
Para facilitar os clculos utilize uma planilha especial:
http://www.cultura.ufpa.br/dicas/biome/biozip/fisher1zip
Para obter a 2 basta somar os valores de 2 obtidos em cada classe e os seus G.L.:
0,600 + 1,700 + 0,950 = 2 = 3,250 e GL = 2 + 2 + 2 = 6.
E, ento, subtrair 2T. de 2
3 18 20,1 0,219
4 10 8,9 0,136
>5 6 4,3 0,672
Total 128 128,0 2 = 2,152
____
Este "site", destinado prioritariamente aos alunos de Ftima Conti, pretende auxiliar quem
esteja comeando a se interessar por Bioestatstica, computadores e programas, estando em
permanente construo. Sugestes e comentrios so bem vindos. Agradeo antecipadamente.
____
Endereo dessa pgina:
HTML: http://www.cultura.ufpa.br/dicas/biome/bioqui.htm
PDF: http://www.cultura.ufpa.br/dicas/pdf/bioqui.pdf
ltima alterao: 11 out 2009 (Solicito conferir datas. Pode haver atualizao s em HTML)