Escolar Documentos
Profissional Documentos
Cultura Documentos
EXEMPLO:
A linhagem produzida pelo cruzamento de entre dois tipos de planta pode ter
qualquer um de três genótipos designados por A, B e C. Um modelo teórico de
herança genética sugere que a linhagem dos tipos A, B e C deve estar na razão
Tabelas Bidimensionais de 1 : 2 : 1. Para verificação experimental, 90 plantas foram geradas pelo
cruzamento dos dois tipo de plantas. Sua classificações genéticas estão registradas
na tabela a seguir.
Genótipo No de Plantas
A 18
Unidade I B 44
Parte 3 C 28
Total 90
UnB – IE
UnB – IE Departamento de Estatística Análise de Dados Categorizados
Departamento de Estatística Análise de Dados Categorizados Maria Teresa Leão Costa 2
Maria Teresa Leão Costa
A hipótese nula do modelo genético corresponde a π 1 = 0 ,25 ,π 2 = 0 ,5 e π 3 = 0 ,25 Deseja-se testar a hipótese nula ( H0 ) que as probabilidades das células de uma tabela
onde π i é a probabilidade de ocorrência de cada genótipo. de contingência são iguais a certos valores fixados π ij . { }
Para uma amostra de tamanho n com freqüências das células nij { } , os valores
Assim,
H 0 ) π 1 = 0 ,25 ,π 2 = 0 ,5 ,π 3 = 0 ,25 {µ ij = nπ ij }
são chamados freqüências esperadas e representam os valores das expectâncias
{ }
E ( n ij ) quando H0 é verdadeira.
Se H0 é verdadeira , se espera observar cerca de 1 4 de plantas do genétipo A, ou
seja, a freqüência esperada do genótipo A é dada por: A idéia é comparar as freqüências amostrais das células com as esperadas para
µ1 = nπ 1 = 90 × 0 ,25 = 22 ,5
{
decidir se os dados contradizem H0 . Quanto maior as diferenças nij − µ ij , mais forte a}
evidência contra H0.
Analogamente pode-se calcular as freqüências esperadas do genótipo B e do genótipo C. A estatística Qui-quadrado de Pearson para testar H0 é:
(nij − µ ij ) 2
A idéia é comparar as freqüências amostrais das células com as esperadas para decidir χ2 = ∑
se os dados contradizem H0 . Quanto maior as diferenças , mais forte a evidência contra µ ij
H0. tem distribuição qui-quadrado para amostras “grandes” µ ij ≥ 5 . { }
UnB – IE UnB – IE
Departamento de Estatística Análise de Dados Categorizados Departamento de Estatística Análise de Dados Categorizados
Maria Teresa Leão Costa 3 Maria Teresa Leão Costa 4
Estatística da Razão de Verossimilhança Testes Qui-quadrado
Uma estatística alternativa para testar H0 resulta do método da razão de Teste de Comparação de Proporções
verossimilhança para testes de significância.
→ Teste Qui-quadrado de Homogeneidade
O teste se baseia na razão das funções de verossimilhança maximizadas, Em tabelas 2x2:
H 0 )π 11 = π 21 e π 12 = π 22 ⇔ H 0 )π 11 = π 21
máximo da finção de verossimilhança quando parâmetros satisfazem H o
Λ= Se H0 é verdadeira :
máximo da finção de verossimilhança quando parâmetros são irrestrito s
n+ j ni + ⋅ n+ j
A estatística do teste para o Teste da Razão de Verossimilhança é igual a µˆ ij = ni + ⋅ p+ j = ni + ⋅ =
N N
− 2 log( Λ )
tem distribuição aproximadamente qui-quadrado. Teste Qui-quadrado de Independência
Para tabelas de contingência bidimensionais, esta estatística pode ser simplificada H 0 ) π ij = π i + π + j
para a fórmula:
Se H0 é verdadeira :
nij
G 2 = 2∑ nij log ni + n+ j ni + ⋅ n+ j
µ µˆ ij = N ⋅ pij = N ⋅ pi + p+ j = N =
ij N N N
UnB – IE UnB – IE
Departamento de Estatística Análise de Dados Categorizados Departamento de Estatística Análise de Dados Categorizados
Maria Teresa Leão Costa 5 Maria Teresa Leão Costa 6
UnB – IE UnB – IE
Departamento de Estatística Análise de Dados Categorizados Departamento de Estatística Análise de Dados Categorizados
Maria Teresa Leão Costa 7 Maria Teresa Leão Costa 8
Resíduos
A estatística do teste e seu p-value simplesmente descrevem a evidência contra a hipótese
nula H0 .
A comparação, célula por célula, da freqüência observada com a esperada ajuda a entender
melhor a natureza desta evidência. Entretanto a diferença absoluta (bruta) é insuficiente.
Os resíduos úteis têm a forma n − µˆ ij ij
µˆ ij (1 − p i + )(1 − p + j )
e são denominados resíduos ajustados.
Quando H0 , cada resíduo ajustado tem para grandes amostras, distribuição N(0,1). Um
resíduo ajustado que seja maior que 2 ou 3 em valor absoluto indica falta de ajustamento de H0
nesta célula.
UnB – IE
Departamento de Estatística Análise de Dados Categorizados
Maria Teresa Leão Costa 9