Você está na página 1de 176

Fundação Universidade Estadual de Maringá - UEM

Centro de Ciências Exatas - CCE


Departamento de Estatı́stica - DES
Programa de Pós-Graduação em Bioestatı́stica - PBE

Bioestatı́stica

Prof. Dr. Robson Marcelo Rossi


Sumário

1 Definições e Conceitos 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 BioEstatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Os Conceitos da Bioestatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 Experimentação Biométrica 7
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 O Raciocı́nio Indutivo da Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Delineamentos Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.1 Etapa de um levantamento estatı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.1 Estudo de Caso-Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Estudo de Coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.3 Ensaios Clı́nicos Aleatorizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.4 Estudos Descritivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Estatı́stica Descritiva 20
3.1 Organização de Dados Estatı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Normas para a Apresentação Tabular de Dados . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Medidas de Tendência Central ou de Posição . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.2 Medida de Variabilidade ou de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4.3 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4 Noções de Probabilidade 43
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Espaço Amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3 Definição Axiomática de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Propriedades Fundamentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.6 Independência Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7 Variável Aleatória Discreta e Contı́nua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.1 Esperança Matemática de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . 49
4.7.2 Variabilidade de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . 50

5 Distribuições de Probabilidade 51
5.1 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.3 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.4 Distribuição Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

ii
6 Inferência Estatı́stica 55
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Noções de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.2.1 Plano de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.2.2 Amostragem Aleatória Simples (AAS) . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.2.3 Amostragem Aleatória Simples Sistemática (AASist) . . . . . . . . . . . . . . . . . . . 58
6.2.4 Amostragem Aleatória por Conglomerados (AAC) . . . . . . . . . . . . . . . . . . . . 58
6.2.5 Amostragem Aleatória Estratificada (AAE) . . . . . . . . . . . . . . . . . . . . . . . . 59
6.3 Distribuição Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3.1 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3.2 Distribuição Amostral da Diferença de Médias . . . . . . . . . . . . . . . . . . . . . . 64
6.3.3 Distribuição Amostral da Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.4 Intervalo de Confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4.1 Intervalo de Confiança para Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4.2 Intervalo de Confiança para Diferença de Médias . . . . . . . . . . . . . . . . . . . . . 67
6.4.3 Intervalo de Confiança para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.5 Tamanho da Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5.1 Método Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5.2 Método Inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.6 Testes de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.6.1 Construção de um Teste de Hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.6.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.6.3 Teste de Hipótese para Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.6.4 Teste de Hipótese para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

7 Análise em Tabelas 2x2 e LxC 80


7.1 Tabelas de Contingência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.2 Teste de Independência e de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.3 Análise de Resı́duos em Tabelas 2×L . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.4 Medidas do Efeito em Tabelas 2×2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.4.1 Risco Relativo (RR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.4.2 Odds-Ratio (OR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

8 Comparações Entre Grupos 92


8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.2 Normalidade dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.2.1 Faixas de Referência (Método de Gauss) . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.3 Resposta Dicotômica: Amostras Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.3.1 Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.3.2 Teste Exato de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.3.3 Teste z para Comparação de Proporções . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.4 Resposta Dicotômica: Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.4.1 Teste McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.5 Resposta Contı́nua - Teste de Médias para Amostras Independentes . . . . . . . . . . . . . . 100
8.5.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
8.5.2 Teste z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas . . . . . . . . . . . . . . . . . 102
8.6.1 Teste t-pareado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.7 Testes Não-Paramétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
8.7.1 Teste Mann-Whitney para Amostras Independentes . . . . . . . . . . . . . . . . . . . 104
8.7.2 Teste Kruskal-Wallis para k Amostras Independentes . . . . . . . . . . . . . . . . . . . 105
8.7.3 Teste de Wilcoxon para Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . 107
8.7.4 Teste Friedman para k Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . 109
8.7.5 Outros Testes Não-Paramétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
9 Análise de Variância 113
9.1 ANOVA para Experimentos ao Acaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
9.2 Teste de Comparações Múltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9.2.1 Número Igual de Repetições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9.2.2 Número Diferente de Repetições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

10 Testes Diagnósticos 122


10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
10.2 Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
10.3 Valor das Predições: VPP e VPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
10.4 Decisões Incorretas: PFP e PFN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
10.5 Combinação de Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
10.5.1 Combinação em Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
10.5.2 Combinação em Série . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
10.6 Escolha entre Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
10.7 Relação entre Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
10.8 Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

11 Análise de Regressão 140


11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
11.2 Ajustamento da reta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
11.3 O Modelo de Regressão Linear Simples - MRLS . . . . . . . . . . . . . . . . . . . . . . . . . . 140
11.3.1 Intervalos de confiança para os parâmetros . . . . . . . . . . . . . . . . . . . . . . . . 141
11.3.2 Intervalos de predição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

12 Regressão Logı́stica 148


12.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
12.2 O modelo de Regressão Logı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
12.3 Várias Variáveis Explicativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12.4 Método da Máxima Verossimilhança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12.5 Significância dos Efeitos das Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
12.6 Qualidade e Diagnóstico do Modelo Ajustado . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
12.7 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
12.7.1 Associação entre Tempo de experiência e Realização de uma tarefa . . . . . . . . . . . 156
12.7.2 Diagnóstico de Displasia Bronco Pulmonar (BPD) . . . . . . . . . . . . . . . . . . . . 157
12.7.3 Doença na artéria coronariana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
12.7.4 Estudo de fatores associados a vaso-constrição . . . . . . . . . . . . . . . . . . . . . . 160

Referências Bibliográficas 167

Formulários 169
Capı́tulo 1

Definições e Conceitos

1.1 Introdução
O objetivo deste capı́tulo é ilustrar o papel que conceitos e técnicas estatı́sticas têm na formação do
especialista na área biométrica, na sua prática profissional e de modo especial no avanço do conhecimento
nesta área especı́fica.
Este objetivo será alcançado principalmente através da apresentação e discussão dos resultados de es-
tudos relevantes. Através destes exemplos, argumenta-se que conceitos estatı́sticos têm importante papel a
desempenhar, tanto no estudo da saúde de populações, como nos tratamentos individuais.

1.2 BioEstatı́stica
A má utilização de dados nas áreas das ciências, com interpretações errôneas ou mal intencionadas, tem
produzido um grande ceticismo em relação à estatı́stica. Podemos encontrar muitos professores, clı́nicos ou
mesmo profissionais de ciências básicas, que acham que “bom senso” é suficiente para tratar desses dados,
que qualquer coisa que exija prova estatı́stica não pode ter valor prático ou que procurarão um matemático
se tiverem algum problema estatı́stico em seu trabalho.
É importante compreender, no entanto, que cada vez que se toma a média de duas leituras de pipeta,
por exemplo, ou o número médio de dias de internação no hospital de pacientes com determinada doença,
se está usando um método estatı́stico. Do mesmo modo, usamos métodos estatı́sticos para concluir que a
pressão arterial do paciente está normal ou que um tratamento cirúrgico é melhor que outro.
Convencionou-ser chamar de Bioestatı́stica o conjunto de conceitos e métodos cientı́ficos usados no trata-
mento da variabilidade nas ciências da saúde, biológicas e farmacêuticas. A Bioestatı́stica fornece métodos
para se tomar decisões ótimas na presença de incerteza, estabelecendo faixas de confiança para a eficácia dos
tratamentos e verificando a influência de fatores de risco no aparecimento de doenças.
A ênfase crescente do papel dos métodos quantitativos torna imperativo que o profissional tenha algum
conhecimento de estatı́stica.
O estudante aprende na escola o melhor método de diagnose e terapêutica; depois de formado dependerá
necessariamente de trabalhos apresentados em reuniões, jornais e revistas médicas, para aprender novos
métodos de terapia, assim como os progressos em diagnose e técnica cirúrgica. Portanto, deverá estar apto
a avaliar por si próprio os resultados de outros pesquisadores, deverá decidir quando uma nova técnica
ou método pode substituir os antigos. Deverá estar apto a responder à pergunta da mãe que o consulta
sobre a vacina mais recente e, com a mesma segurança, aconselhá-la em relação à vacina antipólio ou anti-
sarampo. Deverá estar apto a dar à famı́lia do paciente segurança quanto ao diagnóstico, o que pode depender
de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais, como também de seu
conhecimento sobre a relação da idade, sexo e outras condições do paciente a uma determinada doença. Os
novos conhecimentos virão através do trabalho de pesquisa realizado por ele próprio ou por outros. Deve,
portanto, ser capaz de selecionar, da massa de informações, aquelas que forem válidas e que resistirem a
testes cientı́ficos rı́gidos. Deve desenvolver um ceticismo sadio em relação a tudo que lê.
Uma noção básica em planejamentos experimentais referentes à pesquisa médica, é o reconhecimento de
que os indivı́duos diferem não apenas uns dos outros, mas também em relação a si próprios, de dia para

1
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 2

dia ou mesmo de hora para hora. Uma certa quantidade de variação é normal, mas a questão que desafia o
médico é determinar quando uma variação especı́fica se torna patológica (referente à doença). Para isso, o
estudante deve aprender como medir a variação em indivı́duos normais e definir qual é o limite de variação
normal. Deve aprender que há algum erro aleatório presente em cada medida ou contagem feita. É altamente
improvável que duas contagens sucessivas de glóbulos, feitas na mesma amostra de sangue, sejam idênticas.
Quando, porém, uma diferença se torna maior que o erro de mensuração? Para tratar seu paciente
do melhor modo possı́vel, o médico deve saber responder à questões como essa. Para cada medida ou
determinação fornecida pelo laboratório, o médico deve conhecer a variação que é parte do próprio método,
para saber quando uma dada variação representa uma mudança real no paciente.
Sempre que novos métodos de terapia são introduzidos, é necessário saber se são realmente superiores,
isto é, mais eficientes aos velhos métodos. Será necessário fazer-se a avaliação crı́tica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o fator
em prova foi o único fator de diferença entre o grupo experimental e o grupo controle, se a diferença entre os
resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribuı́da ao acaso. Apenas depois
da avaliação, através de técnicas estatı́sticas adequadas, da fidedignidade dos resultados, comparabilidade
dos grupos experiência e controle e, significância da diferença encontrada é que podemos tirar as conclusões
relativas ao novo método.
O número de falhas encontradas em publicações médicas enfatiza a necessidade de uma avaliação crı́tica
da literatura. Para ajudar o estudante a desenvolver tal atitude são necessários certos conceitos estatı́sticos
básicos e uma certa familiaridade com a terminologia mais usada.
Métodos estatı́sticos são essenciais no estudo de situações em que as variáveis de interesse estão sujeitas,
inerentemente, a flutuações aleatórias. Este é o caso da área da saúde. Mesmo tomando-se um grupo
de pacientes homogêneos, observa-se grande variabilidade, por exemplo, no tempo de sobrevida após um
tratamento adequado. Dosagens de caracterı́sticas hematológicas flutuam não só entre indivı́duos, como
também no mesmo indivı́duo em ocasiões diferentes. Na realidade, há variações entre diferentes pacientes
para qualquer variável de interesse clı́nico. Portanto, para se estudar problemas clı́nicos, é necessária uma
metodologia capaz de tratar a variabilidade de forma adequada.
Deve-se notar, entretanto, que ao tratar um paciente, o médico se vale da experiência de eventos ante-
riores, vivenciada pessoalmente ou transmitida por outros através de livros e artigos. Assim, a Estatı́stica
pode ser vista como ferramenta de organização e validação do conhecimento médico.
Nas áreas da saúde e biológica coletam-se dados de pessoas, de animais experimentais e de fenômenos
fı́sicos e quı́micos. Interessam aos pesquisadores dessas áreas dados sobre mortalidade infantil, eficiência de
medicamentos, incidência de doenças, causas de morte etc. Os dados referem-se a variáveis, classificadas
como qualitativas, ordinais e quantitativas.
O dado qualitativo está fortemente presente nas ciências da saúde. Caracterı́sticas de pessoas, raça,
doenças, etc, são frequentemente medidas como variáveis categóricas. No entanto, mercê de sua tradição
escolástica, as ciências da saúde ainda mostram preferência pelas medidas contı́nuas de alta precisão: medir
em miligramas, milı́metros etc. Engajado no conhecimento do biólogo, o cientista da saúde tende a isentar-se
de reflexão sobre a importância das estratégias de mensuração e análise providas por outras ciências, como
a estatı́stica.

1.3 Os Conceitos da Bioestatı́stica


Para que serve a Estatı́stica?
Imagine um médico e um farmacêutico querendo saber se um remédio em desenvolvimento é bom ou
ruim. Para testar o remédio, é preciso PLANEJAR muito bem o experimento, COLETAR corretamente
os dados, ANALISAR com muito cuidado e rigor os resultados para poder DIVULGAR de forma honesta
e com confiança no que está dizendo. Imagine o perigo de uma pesquisa mal feita num assunto tão importante!
Bom, para não colocar a vida de ninguém em risco, é preciso tomar muitos cuidados. Dentro do planejamento
saber claramente a respeito de algumas questões:
O remédio será testado em quem? Homens? Jovens? Mulheres? Obesos? Idosos? Crianças?...
Quantas pessoas serão necessárias para testar? Basta testar em uma ou duas pessoas? ou será melhor
testar em 10 pessoas? 30? 50? 2.000? como saber?
Há dinheiro para testar em tantas pessoas?
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 3

E se houver dois grupos de pessoas? Para o grupo de voluntário dá-se o remédio a ser testado; para
o outro grupo, dá-se um remédio ”de mentirinha”, chamado placebo, mas não se conta a verdade para
ninguém. Será que há diferença nos resultados de um grupo para outro? Mas se o remédio foi testado só
com um grupo de pessoas, em geral voluntários, como é que depois pode-se afirmar que este remédio vai ser
bom para todo mundo? É certeza absoluta?
A estatı́stica pode ser utilizada simplesmente para descrever conjuntos de dados, mostrando sua distri-
buição, média, dispersões, etc. Mas, pode ir além, pode estar presente nas diversas etapas de uma pesquisa,
desde o seu planejamento, até na interpretação de seus resultados, podendo ainda, influenciar na condução
do processo da pesquisa.
Definição: Estatı́stica é um conjunto de conceitos e métodos cientı́ficos para a coleta, a organização, a
descrição, a análise e a interpretação de dados experimentais, que permitem conclusões válidas e tomadas
de decisões razoáveis.
Classificação: Usualmente, a estatı́stica é dividida em três grandes áreas que atuam em conjunto:
Planejamentos de Experimentos e Amostragem, Estatı́stica Descritiva e, Estatı́stica Inferencial.
Amostragem e Planejamento de Experimentos: É a parte que tem por objetivo planejar a pesquisa e se
preocupa com o mecanismo da coleta de dados.
Estatı́stica Descritiva: É a parte que tem por objetivo organizar, apresentar e sintetizar dados observados
de determinada população, sem pretenções de tirar conclusões de caráter extensivo.
Estatı́stica Inferencial ou Indutiva: É a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi
retirada. A estatı́stica inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades.
É, também definida como um conjunto de métodos para a tomada de decisões.

Figura 1.1: Processo Cientı́fico na Análise Estatı́stica.


1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 4

A Estatı́stica está presente em diversas áreas e em diversas abordagens. Podemos citar alguns exemplos
de suas aplicações:
1. Eleições: Anúncio prévio, em termos percentuais, de que o candidato A é o provável vencedor. (A
previsão pode ser feita após a contagem de 2% dos votos);
2. Marketing: Ajudar a decidir que tipo de modelo de carro deve ser lançado no mercado; ou perfume,
bolacha, sorvete, roupas, etc. Onde deve ser lançado; Avaliação de campanhas publicitárias, etc;
3. Indústria: Teste de lâmpadas ”flash” para máquinas fotográficas. O fabricante deve saber com ante-
cedência se o lote fabricado pode ser colocado no mercado ou não (Ele pode estar sujeito a riscos !
O Recall é um exemplo, onde ocorre a retirada ou troca de produtos devido a uma falha em algum
estágio de fabricação não detectado pelo controle de qualidade);
4. Meteorologia: Informa que a “chance” de chuva para hoje é de 30% (utilização de métodos estatı́sticos
de previsão);
5. Economia: Decisão na compra ou venda de ações – “Risco”; Desenvolver um produto bancário que dê
mais lucro para o banco; Prever a arrecadação de impostos municipais, etc;
6. Instituições bancárias/crédito: Análise de crédito; Desenvolvimento de modelos matemáticos para
seguro de Vida e/ou de automóveis; Mineração de dados e busca de potenciais clientes, etc;
7. IBGE/ı́ndices: Censo; Taxa de desemprego; Inflação; Custo de vida; Valor do salário mı́nimo, cesta
básica, ı́ndices de preços-INPC; Taxa de mortalidade/Natalidade; Índices de analfabetismo, desenvol-
vimento de modelos matemáticos para prever se uma população vai aumentar ou diminuir; fornecer
informações que ajudam no planejamento urbano;
8. Farmácia/Medicina/saúde pública: Analisar a entrada de um novo medicamento, verificando a sua
eficácia; Ajudando a estabelecer nı́veis e padrões para testes clı́nicos; planejar e realizar experimentos
com grupos de controle, para avaliação de tratamentos; desenvolvimento de estudos sobre a distribuição
e incidência de doenças; Analisar o comportamento de epidemias, doenças, cáries, seus tratamentos
e controles, desnutrição; Estabelecer padrões/curvas que servirão como parâmetros de comparação
(idade vs altura, por exemplo);
9. Pesquisas biológicas: Estudo sobre hábitos migratórios de certo animal; Estimação do tamanho popu-
lacional de certas espécies;
10. Experimentação agrı́cola: Estudos de uma nova variedade de semente (modificação genética) ou de
fertilizantes;
11. Telecomunicações: A utilização da Internet gera informações preciosas de clientes; Controle de tráfego
telefônico, chamadas e consumo, forçam a utilização de modelos estatı́sticos complexos; Analisar de-
sempenho de diversos programas de televisão, rádio, jornais, revistas, etc;
12. Esportes: Comparar o aproveitamento dos atletas, acompanhar o desempenho progressivo, etc;
13. Artes: Analisar estilos literários, de pintura, escultura; Atribuição de obra ao autor; Lexologia, etc;
14. Experimentação zootécnica: Estudo do desenvolvimento de um animal e análise de fatores que in-
fluenciam neste desenvolvimento tais como, alimentação, cativeiro e outros; Melhoramento genético;
Pesquisas com vacinas animais entre outros;
15. Universidades e Instituições de Pesquisas: O docente/pesquisador desenvolve novas metodologias de
análise estatı́stica para mais variados problemas práticos e teóricos; Assessoria em pesquisas de outras
áreas, dando suporte tecnocientı́fico para tomada de decisões dentro da variabilidade instrı́nseca de
cada problema auxiliando desde o planejamento até a publicação de resultados.
A revista SUPER INTERESSANTE, da Editora Abril, trouxe na edição 271 de novembro de 2009
(pg. 84) a reportagem 6 razões para Acreditar que Estatı́stica é a Profissão do Futuro,
classificando-a como a ”profissão dos sonhos”, com base na declaração do economista Chefe da
Google, Dr. Hal Varian, de que a estatı́stica será a profissão de destaque dos próximos 10
anos.
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 5

A amostragem é naturalmente usada na vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, pode-se provar (observar) uma pequena porção deste alimento. Desta forma, está
se fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito
de avaliar (inferir) sobre a qualidade de tempero de todo o alimento.
Nas pesquisas cientı́ficas em que se quer conhecer algumas caracterı́sticas de uma população, também é
muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra,
obter valores aproximados, ou estimativas, para as caracterı́sticas populacionais de interesse. Este tipo de
pesquisa é usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob
uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar
caracterı́sticas de toda a população.
A população pode ser formada por pessoas da famı́lia, indivı́duos de uma certa espécie, estabelecimentos
industriais, ou qualquer outro tipo de elementos, cujas variáveis que se pretende estudar sejam passı́veis de
serem mensuradas.
Os elementos de uma população diferem entre si com respeito a fatores tais como: sexo, idade, medidas
fı́sicas, cor, susceptibilidade a doença, agressividade, etc. Desta forma o padrão de comportamento no qual
o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por estas
razões, muitos trabalhos nas ciências em geral tendem a ser de natureza comparativa, procurando lidar com
as variações inerentes.
População
É qualquer conjunto de elementos, tendo pelo menos uma variável em comum (Pode ser finita ou infinita).
Censo
Pesquisas utilizando todos os elementos da população.
Obs. Desvantagem quando a população é muito grande Ex.: A população brasileira estimada em 2011:
196.655.014 (Fonte: IBGE - http://www.ibge.gov.br/paisesat).
Amostra
É qualquer subconjunto da população. Pesquisas utilizando amostras da população denominam-se pes-
quisas por amostragem.
Parâmetros
São certas caracterı́sticas populacionais especı́ficas que se deseja descrever.
Estimativas dos Parâmetros ou Estatı́stica
São os valores calculados a partir dos dados da amostra, com o objetivo de avaliar parâmetros desconhe-
cidos, por exemplo, média amostral.
Unidade de Amostragem
É a unidade a ser selecionada para se chegar aos elementos da população. Pode ser os próprios elementos
da população, ou, outras unidades fáceis de serem selecionadas e que, de alguma forma, estejam associadas
aos elementos da população.
Variáveis
São as caracterı́sticas medidas. As variáveis apresentam variabilidade dentro da população. Podem ser
qualitativas ou quantitativas.
Variáveis Qualitativas
Quando seus valores forem expressos por atributos (não-numéricos).

• Nominal quando tem nome (ex.: Cor dos olhos, sexo, raça, consumo de álcool (sim, não), gostar de
estudar ... etc).
• Ordinal quando tem ordem (ex.: classe social, grau de instrução, consumo de álcool (pouco, médio,
muito) ... etc).

Variáveis Quantitativas
Quando seus valores podem ser descritos numericamente.

• Discreta quando seus valores resultam de contagem (ex.: número de filhos, número de reprovações,
número de copos de álcool consumidos... etc).
• Contı́nua quando seus valores resultam de medições e podem assumir qualquer valor em um intervalo
da reta (ex.: estatura, nota na prova, imc, quantidade de álcool consumido ... etc)
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 6

Exemplo 1.1. Com o objetivo de levantar conhecimento sobre algumas caracterı́sticas de homens com
doenças cardı́acas de uma clı́nica especializada de Maringá, no Paraná, decidiu-se pesquisar os pacientes
com idade entre 40 e 70 anos. As caracterı́sticas de interesse eram:

1 – Nı́vel de instrução;
2 – Peso;
3 – Altura;
4 – Idade;
5 – Tabagismo;
6 – Atividade fı́sica;
7 – Taxa de glicose;
8 – Taxa de colesterol sérico;
9 – Pressão sanguı́nea diastólica/sistólica;
10 – Uso de medicamentos de controle.
Capı́tulo 2

Experimentação Biométrica

2.1 Introdução
Na medicina como em outros campos da ciência aplicada, o efeito geral da estatı́stica é tornar um
observador mais crı́tico e mais consciente quando, por falta de informação segura, ele tem de agir com base
em impressões ou opinião. Esta é a atitude cientı́fica, e o melhor modo de começar a adquirı́-la é procurar
evidências, e “provar”. Alguns princı́pios dessa procura de evidências serão estudadas neste capı́tulo.

2.2 O Raciocı́nio Indutivo da Biometria


Quando realizamos um experimento, a observação resultante é vista não como um resultado a êsmo e
irreprodutı́vel, mas como um resultado que poderia vir a ser obtido outras vezes, sempre que o experimento
fosse repetido nas mesmas condições. De fato, a generalização é feita sob a hipótese de que o resultado
obtido é tı́pico de uma classe de experimentos similares e, se conseguı́ssemos repetir, exatemente, um experi-
mento, uma única observação constitui-se-ia em base suficiente para fazermos afirmações gerais. Na prática,
obviamente, nunca podemos garantir que dois experimentos sejam exatamente iguais em cada minúcia de
suas circunstâncias, de tal sorte que nunca podemos garantir resultados identicamente reprodutı́veis. As
observações vão, de fato, variar em maior ou menor grau - aquilo que chamamos de erro experimental estará
presente - e, em lugar de um único resultado que se repete exatamente, teremos numerosos resultados que
variam entre si, de acordo com o tamanho do erro experimental. As nossas generalizações não podem ser
absolutamente precisas: devem levar em consideração o erro experimental e conter, em si, um elemento
de incerteza. Essa incerteza é caracterı́stica do raciocı́nio indutivo, e o grande problema no raciocı́nio do
particular ao geral é levar em devida conta essa incerteza.
Em Biologia, o problema da incerteza é muito sério, pois organismos vivos e suas partes são coisas
altamente variáveis. Eles estão influenciados por uma riqueza de fatores - genéticos, ambientais e de de-
senvolvimento - de tal modo que nenhuma situação do sistema pode ser reproduzida exatamente; em geral
elas não podem ser reproduzidas nem com muita aproximação. Poucas (se é que algumas) circunstâncias
de um experimento podem ser supostas triviais em seus efeitos sobre os resultados e raramente consegui-
mos identificar um ou dois fatores cujos controles reduziriam o erro experimental a proporções desprezı́veis.
Efetivamente, com muita freqüência o nosso problema é tentar distinguir um efeito que seja pouco maior
do que o de outros fatores que provocam a variação do sistema; devemos então enfrentar o problema: Qual
deve ser a fidedignidade da mensuração? Ou mesmo: Será o efeito observado atribuı́vel ao fator em que
estamos interessados, ou será conseqüência de alguma outra causa de variação que não pudemos reconhecer
e certamente não pudemos controlar?

2.3 Delineamentos Experimentais


Muitos trabalhos em pesquisas médicas são acometidos de vários erros devido ao procedimento na coleta
e no tratamento de dados. Um dos fenômenos mais comuns é a ocorrência de diferenças entre homens e
mulheres, entre crianças e adultos, entre as estaturas, pesos, cor dos olhos e comportamento de pessoas

7
2.3 Delineamentos Experimentais ROSSI, R. M. 8

da mesma raça, sexo e idade, entre diferentes amostras da mesma substância quı́mica “pura”. Todas essa
diferenças são coletivamente chamadas variação e a estatı́stica pode ser descrita como ciência de tratar a
variação.
Os seres humanos são tão infinitamente variáveis interna quanto o são externamente, mas algumas
matérias básicas do curso médico, como a Anatomia, parecem não reconhecer tal fato, deixando de des-
tacar esse profundo sentido da variação humana. A pseudoprecisão anatômica, criando um conceito artificial
do corpo humano no inı́cio da carreira do estudante, parece que largamente partilham essa responsabilidade;
e mesmo se todos os professores enfatizassem a importância da variação, não iria ajudar muito, a não ser
que o estudante adquirisse prática em enfrentar problemas que surgem da variação - especialmente, prática
na procura de evidências e uma atitude crı́tica em face dos assuntos que lê, ouve ou discute.

2.3.1 Etapa de um levantamento estatı́stico


A. Planejamento experimental. Consiste no planejamento da pesquisa que será realizada:

Mainland, D. (1952) em Elementary medical statistics - The principles of quantitative medicine, sugere
nove questões que constituem um roteiro valioso para desenvolvimento dessa atitude:

1. Quem?...(relativa ao pesquisador)
2. Para quê?...(relativa ao objetivo da pesquisa)

3. O quê?...(refere-se a pessoas, coisas ou fatos estudados)

4. Onde?...(refere-se ao local e ambiente)


5. Quando?...(refere-se ao tempo)

6. Como?...(relativa aos métodos)


7. Quanto?...(relativa às medidas)

8. Quantos?...(relativa à enumeração)
9. Por quê?...(referente à interpretação causal)

Tomadas as devidas precauções, alguns aspectos estatı́sticos deverão ser analisados e o tipo de estudo
adequado deverá ser abordado.

Exemplo 2.1. Considere a seguinte hipótese: ”Associação entre incidência de luz solar e câncer de
mama”. Comparações regionais, na antiga União soviética, mostraram correlação negativa entre incidência
de luz solar e de câncer do seio: em locais de baixa luminosidade solar, foi encontrada alta incidência deste
tipo de neoplasia, e vice-versa. Em muitos paı́ses, semelhante associação também foi detectada. A evidência
sugere, segundo os autores, que a vitamina D possa ter papel de relevo na redução do risco de câncer de
mama, e estudos adicionais devem ser feitos para esclarecer a matéria. (GOHAM et al, 1990).
Os principais delineamentos experimentais para a realização destas pesquisas serão:

1. Quem? GOHAM et al.


2. Para quê? Verificar a associação entre a taxa de incidência de luz solar sobre indivı́duos em diferentes
lugares com luminosidades desiguais e a incidência de câncer de mama.
3. O quê? Número de mulheres com câncer de mama e incidência de luminosidade no local destas onde
habitam estas mulheres. Pelo fato de quanto maior a luminosidade maior a sı́ntese de vitamina D pela
pele, há evidências que a vitamina D possa ter elevo na redução do risco de câncer de mama.

4. Onde? Regiões diferentes que apresentam também diferentes incidências de luminosidade na antiga
União Soviética.
5. Quando? 1990.
2.3 Delineamentos Experimentais ROSSI, R. M. 9

6. Como? (Metodologia): considerando que o câncer de mama é o que mais mata nas mulheres, porém
em relação à população de mulheres é uma doença pouco prevalente, como, por exemplo, Transtorno
Pré-Menstrual. Assim, um estudo de caso-controle em mulheres com câncer de mama já diagnosticado
exposto à luminosidade solar por um perı́odo de tempo predeterminado devendo ser razoavelmente
grande, mas não saberia dizer quanto sem revisão bibliográfica. Na entrevista retrospectiva perguntaria
as mulheres há quanto tempo residiam naquela região, e se tivessem dentro do tempo predeterminado
entrariam no estudo. Faria também um grupo controle de mulheres daquela região para comparação dos
dados. Repetindo este mesmo estudo em mulheres de diferentes regiões com diferentes luminosidades, e
comparando-se as taxas de fatores de riscos, poder-se-ia chegar a conclusão de associação e em seguida
calcular o Odds Ratio, isto é, a razão de chances.
7. Quanto? As medidas seriam o número de mulheres diagnosticadas com câncer de mama comparadas
a um número semelhantes de mulheres sem o câncer (controles) separadas após serem examinadas por
médicos. Já a luminosidade colheria as informações com as centrais de meteriológicas locais ou algum
centro de referência deste assunto para o estudo.
8. Quantos? A amostra tentaria ser a maior possı́vel para melhorar a confiabilidade dos resultados, já que
a doença é pouco prevalente. Procuraria os centros de saúdes locais (hospitais, clı́nicas especializadas,
etc) das respectivas regiões a serem estudadas. Se o número de centros for muito grande e for muito
difı́cil abordá-los, sortearia os centros para amostragem.
9. Por quê? Alguns cuidados têm que serem relevados como o vı́cio da seleção, de informação e con-
fundimento. Por exemplo, a ingestão de alimentos ricos em precursores e da própria vitamina D bem
como uso de suplementos alimentares com vitamina D (pı́lulas), poderia influenciar os resultados dos
estudos.

Observação: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa.
Avaliação de informações existentes. Inicialmente, deve-se realizar um levantamento bibliográfico sobre
o assunto para obter subsı́dios que podem representar valiosa colaboração para o estudo e, também, serem
aproveitados nas discussões posteriores.

B. Formulação de hipóteses. Com exceção das pesquisas meramente descritivas, todas as pesquisas
estatı́sticas comportam a formulação de hipóteses. Com base nos dados observados, a hipótese será
rejeitada ou não.
C. Verificação das hipóteses. A verificação das hipóteses será realizada no decorrer da pesquisa.
D. Delineamento da pesquisa. Compreende o estudo (planejamento) detalhado da coleta de dados, da
realização do trabalho e da análise dos dados.

Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por
outros indivı́duos.
Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observação direta, o
questionário ou interrogatório e a entrevista.
Observação: é a observação direta dos fenômenos em laboratórios ou na natureza.
Questionário: é uma seqüência de perguntas previamente preparadas. O questionário é aplicado por
meio de entrevista ou remetido pelo correio. Os valores observados podem ser complementados por ob-
servação.
Execução da pesquisa. Coleta dos dados e realização da análise estatı́stica.
Análise e apresentação dos resultados. Os dados coletados devem ser apresentados na forma de:
gráficos e/ou de tabelas. A análise dos dados deve ser realizada pelo pesquisador, com a ajuda de um
estatı́stico, aplicando os recursos estatı́sticos necessários para refutar ou não as hipóteses previamente for-
muladas.
Exemplo 2.2. Objetivo geral: conhecer o perfil dos homens portadores de doenças cardı́acas em Honolulu,
Havaı́. Para dar seqüência a esta pesquisa, é preciso especificar melhor o que se quer conhecer da população
de portadores de doenças cardı́acas, ou seja, os objetivos especı́ficos. Exemplos de alguns desses objetivos.

(a) conhecer a distribuição do grau de instrução dos portadores de doenças cardı́acas.


2.3 Delineamentos Experimentais ROSSI, R. M. 10

(b) Conhecer a idade e o peso médio dos portadores de doenças cardı́acas.

(c) Conhecer os hábitos dos portadores de doenças cardı́acas.


(d) Avaliar a condição de saúde dos portadores de doenças cardı́acas.

Exemplo 2.3. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das in-
formações contidas em uma amostra dos prontuários dos pacientes. Dados observados: resultados de diversos
atributos e medidas relativas aos pacientes selecionados para participarem da amostra. Esquematicamente:

População: Todos os
portadores de
doenças cardíacas de
Honolulu.

Levantamento Plano de
de dados. amostragem.

Amostra:
Parte dos
portadores
de doenças
cardíacas de
Honolulu.

Dados
observados.

Figura 2.1: Esquema 1.

Exemplo 2.4. Objetivo geral: Comparar a eficiência de dois métodos para detectar o bacilo causador de
tuberculose. Em outras palavras, quer-se avaliar se os meios utilizados são equivalentes ou se um é mais
eficiente que o outro. Delineamento da pesquisa: são formados dois grupos de pacientes com tuberculose e
amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). Dados observados: a detecção
ou não do bacilo foi registrada para cada amostra, resultando em dois conjuntos, relativos a cada método.
Esquematicamente:

Meio A. Meio B.

Grupo 1 de Grupo 1 de
pacientes. pacientes.

Amostra 1 de Amostra 2 de
respostas respostas
Sim ou Não. Sim ou Não.

Figura 2.2: Esquema 2.

Este é um delineamento de pesquisa experimental, onde o pesquisador exerce controle sobre o método
utilizado.
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 11

2.4 Aspectos Estatı́sticos dos Estudos Etiológicos


O objetivo central da pesquisa etiológica (parte da medicina que trata das causas das doenças) é deter-
minar se o fato de uma pessoa contrair uma dada doença está associado com um dado fator, o qual pode ser,
por exemplo uma caracterı́stica pessoal, alguma especificidade do ambiente onde viveu ou uma experiência
pela qual passou. Discutiremos maneiras de se organizar um estudo etiológico, métodos estatı́sticos para se
determinar quais fatores estão associados com o contrair da doença e meios de se quantificar esta associação.
A pesquisa etiológica é baseada em dados coletados em pacientes convenientemente escolhidos. O pesqui-
sador não controla quem será exposto ou não ao fator em questão, mas tem liberdade de determinar quem
entrará ou não no estudo. Para que os resultados tenham validade, a pesquisa tem de ser planejada segundo
modelos bem definidos. Os principais tipos de planejamento para estudos etiológicos receberam os nomes
de estudos tipo Caso-Controle, estudos tipo Coorte, Ensaios Clı́nicos Aleatorizados, Estudos Descritivos e
Seccionais ou Tranversais.

2.4.1 Estudo de Caso-Controle


Um estudo tipo caso-controle pode ser definido como um estudo no qual a determinação da associação da
doença com um fator é baseada na observação de freqüências muito altas ou muito pequenas do fator entre
as pessoas doentes. Para isto um grupo de indivı́duos afetados pela doença em questão é comparado com
um grupo controle de indivı́duos não afetados. Como as informações são obtidas de maneira retrospectiva,
freqüentemente, este tipo de planejamento recebe o nome de Estudo Retrospectivo.
Um estudo retrospectivo começa com um grupo de indivı́duos, a serem chamados de ”casos”, que tenham
contraı́dos a doença em questão. O pesquisador escolhe como padrão de comparação, um grupo ”controle”
constituı́do de pacientes que não estão sofrendo da doença. A seguir obtém a história clı́nica de todos os
pacientes selecionados a fim de averiguar a presença ou ausência do fator de risco que está sendo estudado. A
questão é saber se o fator de risco está presente mais freqüentemente ou em nı́vel mais elevados entre os casos
do que entre os controles. Se a evidência for suficiente o pesquisador concluirá que existe uma associação
entre o fator de risco e a doença.
Idealmente, os casos devem ser todos os que ocorreram durante um perı́odo de tempo em uma população
finita. Os controles devem ser pessoas comparáveis aos casos, mas sem a doença, ou seja, pessoas que, se
desenvolvessem a doença, seriam escolhidas como casos.
Os grupos de casos e de controles podem ser formados de forma emparelhada ou de forma independente.
No primeiro esquema, para cada caso ou mais controles semelhantes são escolhidos. Já na formação de grupos
de forma independente, os controles não escolhidos de forma associada a um caso especı́fico. Preocupa-se
apenas em garantir que o grupo de casos seja, na sua totalidade, parecido com o grupo de controles.
O caso particular do emparelhamento em que há apenas um controle para cada caso é denominado
pareamento.
Os estudos de caso-controle são uma forma de pesquisa simples e eficiente, por isso muito utilizada.
Através dela, já se verificaram ou se confirmaram associações entre fatores de risco e vários tipos de câncer.
Não há dificuldades éticas para sua implementação e, portanto, os dados usados são os de seres humanos. Isto
livra o pesquisador de difı́ceis generalizações inerentes aos estudos desenvolvidos em animais. O tempo gasto
e os custos associados são relativamente pequenos, já que, normalmente, são utilizados dados preexistentes.
São particularmente adequados ao estudo de doenças raras, porque o pesquisador começa com um grupo de
pessoas que comprovadamente têm a doença.
Sua grande limitação é a suscetibilidade aos vı́cios de informação e de seleção. Outra é que obtemos
apenas informação sobre associação entre fatores e doença e não sobre causas da doença. O resultado de
tais estudos deve ser considerado um elo a mais em uma cadeia de evidências que levará ao veredito de
causalidade.
Descreveremos abaixo alguns tipos de tendenciosidade aos quais os estudos caso-controle estão sujeitos. O
leitor deve, antes de se envolver no planejamento de um tal estudo, conhecer mais profundamente a literatura
médica da área. Esta experiência é fundamental pois lhe dará conhecimento das formas especı́ficas pelas
quais estas tendenciosidades aparecem.
Embora não existindo associação entre o fator e a doença em questão, existem várias maneiras pelas quais
uma associação pode aparecer em um estudo caso-controle. Uma delas é chamada Vı́cio da Seleção. Ocorre
quando os casos ou os controles são incluı́dos no estudo por causa de alguma caracterı́stica que possuam e
que está relacionada com o fator de risco sendo considerado. Chamamos de Vı́cio de Informação àquele
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 12

introduzido pelos pesquisadores que, já desconfiando da associação a ser constatada, são mais cuidadosos ao
levantar a história clı́nica dos casos que dos controles. Dizemos que houve Vı́cio de Confundimento se a
associação observada é produto não do fator considerado mas de outros fatores não controlados no estudo.
O grupo controle é usualmente constituı́do de pacientes de hospitais, onde estão sendo tratados os pa-
cientes do grupo de casos. Deve-se escolher para o grupo controle pacientes de uma grande variedade de
doenças. Isto protege os resultados de uma forma de vı́cio da seleção; o estudo não detecta uma associação
porque a doença dos pacientes-controle e a doença sendo estudada estão ambas associadas com o fator de
risco. Quando existe facilidade na coleta de dados o número de pacientes do grupo controle pode ser até 4
vezes maior que o número de pacientes do grupo de casos. O método de seleção dos indivı́duos do grupo
controle é quase que inteiramente dependente das circunstâncias especı́ficas do estudo. Aqui também é fun-
damental o conhecimento da literatura médica da área, já que é usual apresentar-se uma descrição detalhada
dos controles utilizados.

Exemplo 2.5. Fatores de risco em câncer de mama.


Gomes (1992), em tese de doutorado na Faculdade de Medicina da UFMG, realizou estudo caso-controle
com o objetivo de avaliar a influência de fatores de risco no câncer de mama, utilizando dados de nosso meio.
Como “casos” foram escolhidas pacientes portadoras de câncer de mama registradas no Hospital das Clı́nicas
da UFMG, que satisfizeram os seguintes critérios de inclusão: idade na época do diagnóstico entre 25 e 75
anos, diagnóstico feito entre 1978-1987 e confirmado por exame anátomo-patológico, tumor originário do
tecido epitelial e ter sido submetida a algum tipo de cirurgia na mama.
Como “controles” foram escolhidas pacientes com idade igual à do “caso” (mais ou menos dois anos),
data de admissão ao hospital igual à data de confirmação do diagnóstico do caso (mais ou menos seis
meses) e exame clı́nico da mama sem indicação de patologias mamárias. De acordo com esses critérios,
foram selecionados, através de emparelhamento, dois controles para cada caso. O primeiro foi selecionado
no ambulatório de ginecologia e o segundo no registro geral do hospital. A análise estatı́stica, entre várias
outras conclusões, mostrou que a presença na paciente de história familiar (retrospectivamente) de câncer
de mama aumenta o risco desta patologia em 8,84 vezes.

a
EXPOSTOS

DOENTES
(GRUPOS
DE
b CASOS)
NÃO-EXPOSTOS
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx

AMOSTRA
ANÁLISE DE
DE CASOS
DADOS POPULAÇÃO
DE CASOS
E DE AMOSTRA
CONTROLES DE
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx

c CONTROLES
EXPOSTOS

NÃO-DOENTES
(GRUPO
DE
CONTROLES)
d NÃO-EXPOSTOS

MENSURAÇÃO FORMAÇÃO DOS GRUPOS


a, b, c, d : os quatro possíveis resultados DA EXPOSIÇÃO POR OBSERVAÇÃO
(note o caráter retrospectivo) DA EXPOSIÇÃO

Figura 2.3: Esquema de Estudo Caso-Controle.


2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 13

Vantagens do Estudo de Caso-Controle

• Baixo custo relativo;

• Alto potencial analı́tico;


• Adequado para estudar doenças raras.

Desvantagens do Estudo de Caso-Controle

• Incapaz de estimar risco (reduzido poder descritivo);


• Vulnerável a inúmeros biases (seleção, etc.)

• Complexidade analı́tica.

2.4.2 Estudo de Coorte


Em contraste com um estudo retrospectivo, um estudo prospectivo avança no tempo e coloca ênfase no
fator de risco. O Estudo de Coorte é uma forma de pesquisa que visa verificar se indivı́duos, selecionados
porque foram expostos ao fator de risco, desenvolvem a doença em questão, em maior ou menor proporção
do que um grupo de indivı́duos, comparáveis, mas não expostos ao fator de risco.
Identificam-se um grupo exposto ao fator e o grupo controle, constituı́do de pessoas que não foram
expostas a ele. Os dois grupos são acompanhados por um perı́odo de tempo e as taxas de incidência da
doença calculadas. Se essas taxas são significativamente diferentes nos dois grupos, o pesquisador conclui
que há associação significativa entre a doença e o fator.
Os epidemiologistas preferem o termo “Estudo Tipo Coorte” para este tipo de estudo, entretanto “Estudo
Prospectivo” é a nomenclatura mais utilizada.
Os Estudos de Coorte possuem várias vantagens. O pesquisador tem a possibilidade de usar critérios
uniformes, tanto na identificação da presença ou não do fator de risco ao inı́cio do estudo, quanto na veri-
ficação da ocorrência da doença nos vários exames de acompanhamento. Nos dois grupos a comparabilidade
pode ser verificada no inı́cio do estudo e identificadas as variáveis para as quais são necessários ajustamentos
na análise dos dados.
Em um estudo prospectivo, o pesquisador tem muito mais liberdade sobre o que medir e como medir, já
que não se restringirá ao uso de dados já coletados. Uma outra vantagem, que só poderá ser completamente
apreciada ao se estudar a metodologia de análise de dados, é que os estudos de coorte nos permitem obter
diretamente uma estimativa da magnitude do risco relativo. Isto significa que é possı́vel quantificar o risco
de desenvolver a doença comparando-se o grupo de expostos ao fator de risco com o grupo de não expostos.
Estudos de Coorte são grandes, longos e normalmente caros. Quanto mais rara a doença em questão,
maior o número de pacientes que precisam ser examinados, portanto não indicado para doenças raras.
Embora, do ponto de vista teórico, os Estudos de Coorte sejam melhores que os Estudos Caso-Controle,
estes últimos são mais comuns.
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 14

Seleção das Coortes


Grupos de pessoas são selecionadas para o Estudo de Coorte por uma variedade de razões. Apresentamos
a seguir dois exemplos:
Exemplo 2.6. Fumo e câncer de pulmão.

O clássico estudo de Doll & Hill (1964) sobre associação entre câncer no pulmão e fumo ilustra a escolha
da coorte pelo fato de o grupo possuir caracterı́sticas que facilitam a obtenção dos dados sobre a exposição
ao fator e o seguimento dos pacientes. Foram acompanhados médicos da Inglaterra desde o fim dos anos
20, um grupo fácil de contactar e no qual todas as mortes são rotineiramente bem documentadas. Estas
pesquisas iniciaram-se devido ao grande aumento da mortalidade causada por este câncer.
No primeiro estudo, publicado em 1950, compararam-se dois grupos de pacientes. O primeiro, constituı́do
de todos os casos de câncer de pulmão de um conjunto de hospitais londrinos. Assistentes sociais, especi-
almente treinadas para o estudo, entrevistaram todos os pacientes internados com diagnóstico de câncer de
pulmão, levantando sua história clı́nica e seus hábitos tabagistas. O segundo grupo, chamado de controle,
foi constituı́do por pacientes dos mesmos hospitais, sem diagnóstico de câncer, na mesma faixa etária, do
mesmo sexo e da mesma região de residência que os casos anteriores. A Tabela 2.1 mostra os resultados
obtidos. A associação é clara e forte.

Tabela 2.1: Número de fumantes e não fumantes entre pacientes do sexo masculino com diagnóstico de
câncer pulmonar e controles.
Grupo Fumantes Não-Fumantes Total
Câncer pulmonar 647 2 650
Controle 622 27 649
Total 1269 29 1299

A forma de organização deste estudo é chamada de Estudo Caso-Controle. À época, esta metodologia
era muito criticada, pois, com facilidade, podia produzir associações espúrias. Por isso, a evidência, embora
clara e forte, não foi convincente o suficiente.
Assim, os mesmos autores iniciaram um segundo estudo, cuja caracterı́stica básica é o fato de que o
acompanhamento dos pacientes foi prospectivo. Este tipo de planejamento é chamado de Estudo de Coorte.
Em outubro de 1951, os pesquisadores enviaram um questionário simples a todos os médicos da Inglaterra,
aproximadamente 60.000 indivı́duos. O questionário perguntava se o respondente já havia fumado ou não.
Em caso afirmativo, pedia informações sobre o que e quanto. Mais de dois terços dos médicos responderam
com detalhe suficiente para que seus dados pudessem ser incluı́dos no estudo.
As respostas possibilitaram aos pesquisadores classificar cada respondente como fumante ou não fumante.
A definição de não-fumante usada foi: um não fumante é uma pessoa que fumou até no máximo um cigarro
diário, em média, por um perı́odo inferior a um ano.
Através de complexo sistema de acompanhamento, observaram-se nos primeiros 10 anos, 136 mortes
associadas ao câncer pulmonar entre os médicos incluı́dos no estudo. Destas, apenas 3 eram de não-fumantes.
Para equalizar os perı́odos de acompanhamento nos vários grupos, trabalhou-se com a taxa de incidência
por 1.000 pessoas-ano de exposição. Os valores desta taxa estão na Tabela 2.2. O risco de morte por câncer
pulmonar das pessoas que fumam mais de 25 cigarros diários é quase 32 vezes maior do que o mesmo risco
para quem não fuma.

Tabela 2.2: Taxa de mortalidade por 1.000 pessoas-ano devida a câncer pulmonar (número de mortes entre
parênteses) para não fumantes e fumantes.
Não-Fumantes Cigarros diários (Fumantes)
1-14 5-24 25+
0,07(3)
0,57(22) 1,39(54) 2,27(57)

Estes dois planejamentos, estudo Caso-Controle e Estudo de Coorte, são as formas usuais de organização
da pesquisa etiológica. Muitos outros estudos como os descritos anteriormente foram feitos em populações
variadas para se verificar o possı́vel papel do fumo. Em todos, a evidência foi clara. Hoje, o papel de agente
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 15

causador do câncer de pulmão é amplamente reconhecido e justifica a militância cada vez mais organizada
contra o fumo.
Em muitos Estudos de Coorte os grupos de comparação são obtidos após o inı́cio do estudo, de acordo
com o nı́vel de exposição ao fator. As coortes do estudo de Framingham sobre doenças coranárias (Kannel
et al., 1972), foram construı́das dividindo-se o grupo acompanhado de acordo com hábitos de fumo, nı́veis
de colesterol, etc. Nestes casos não há necessidade de um grupo externo de comparação.

Exemplo 2.7. Personalidade e desenvolvimento de doença coronariana.


Um Estudo de Coorte com o objetivo de avaliar o possı́vel efeito da personalidade no risco de desenvol-
vimento de doença coronariana foi conduzido entre 3.154 trabalhadores do sexo masculino com idade de 30
a 59 anos (Brand et al., 1976). Os indivı́duos entraram no estudo entre 1960-61 e foram acompanhados por
um perı́odo médio de 8 anos e meio. Através de entrevista no inı́cio do estudo, foram classificados em dois
tipos de personalidade, A e B, sendo os primeiros mais agressivos, competitivos e ansiosos.
Os resultados da Tabela 2.3 indicam que nas duas faixas etárias consideradas os percentuais de indivı́duos
do tipo A que desenvolveram doença coronariana são aproximadamente o dobro dos encontrados no outro
grupo.
Em outras situações, particularmente quando um grupo submetido a uma exposição pouco comum é
estudado, é importante comparar o resultado observado com aquele esperado, caso os indivı́duos não tivessem
sido submetidos ao fator de risco. Usa-se a experiência da população em geral, ao tempo em que a coorte é
formada, como padrão de comparação.

Tabela 2.3: Percentual de indivı́duos que desenvolveram doença coronariana segundo faixa etária e tipo de
personalidade.
Faixa etária Personalidade
A B
39-49 8,9 4,2
50-59 15,9 7,6

Finalmente, usa-se também como base de comparações outra coorte formada por pessoas não expostas,
parecidas nas caracterı́sticas demográficas com o grupo exposto. Por exemplo, considerando uma coorte
de radiologistas, Seltser e Sartwell (1965) usaram como padrão de comparação dados de oftalmologistas e
otorrinolaringologistas.

a
DOENTES

POPULAÇÃO
EXPOSTOS

ou
b
grupo-experimental NÃO-DOENTES
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx

AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS

c
DOENTES

NÃO-EXPOSTOS

ou
grupo-controle d
NÃO-DOENTES
FORMAÇÃO DOS GRUPOS
POR OBSERVAÇÃO MEDIÇÃO
DA EXPOSIÇÃO DOS EFEITOS

a, b, c, d : os quatro possíveis resultados

Figura 2.4: Esquema de Estudo Coorte.


2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 16

Vantagens do Estudo de Coorte

• Produz medidas diretas de risco;

• Alto poder analı́tico;


• Facilidade de análise.

Desvantagens do Estudo de Coorte

• Estudos de Coorte são grandes, longos e normalmente caros. Quanto mais rara a doença em questão,
maior o número de pacientes que precisam ser examinados. Portanto este estudo é inadequado para
doenças de baixa frequência;
• Vulnerável a perdas (biases).

2.4.3 Ensaios Clı́nicos Aleatorizados


O Ensaio Clı́nico Aleatorizado é um experimento médico, realizado com o objetivo de verificar, entre dois
ou mais tratamentos, qual é o mais efetivo.
São usados quando é incerto o valor de uma nova terapia ou os méritos da terapia existente estão em
disputa. É a metodologia apropriada para a comparação de tratamentos.
Após um critério de admissão ter sido definido, os pacientes são, à medida que entram no experimento,
alocados de maneira aleatória ao grupo controle, que recebe a terapêutica padrão, ou ao grupo tratamento,
que recebe a terapêutica sendo testada. Todo esforço deve ser feito para oferecer os mesmos cuidados aos
dois grupos. Terminado o experimento, técnicas estatı́sticas são usadas para se decidir se há ou não diferença
na eficácia das terapias envolvidas.
Esta é uma forma experimental de pesquisa, isto é, o pesquisador interfere deliberadamente no curso
natural dos acontecimentos, em contraposição aos estudos observacionais, em que o pesquisador se restringe
à coleta de dados, sem alterar a dinâmica do processo em consideração. Por isto está sujeita a costrangimentos
éticos, disciplinados pela convenção de Helsinque.
O conhecimento pelo paciente ou pelo médico do tratamento a ser administrado pode influir na evolução
da doença, não através de fatores extrı́nsecos, mas diretamente pelo processo de auto-sugestão. É o efeito
placebo, que traz vı́cios ao estudo clı́nico.
A única maneira de eliminar o efeito placebo nos grupos comparados é realizar, sempre que possı́vel,
experimentos cegos, nos quais o paciente ou o médico não conhece o tratamento, ou duplo-cego, no qual
ambas as parte desconhecem o tratamento. Este ideal, entretanto, nem sempre é factı́vel.

Exemplo 2.8. Tamoxifeno e câncer de mama.

Muitos avanços no tratamento do câncer de mama têm sido estabelecidos através de estudos realizados
pelo National Surgical Adjuvant Breast and Bowel Project (NSABP). Em 1985, discutia-se a necessidade de
se submeter à quimioterapia ou hormonioterapia, pacientes de bom prognóstico, logo após a cirurgia. Em
particular, havia evidências de várias origens de que o tamoxifeno poderia melhorar ainda mais o prognóstico
dessas pacientes. Naquela época, o tamoxifeno já era usado largamente no tratamento de pacientes com
câncer de mama. Diante disto, o NSABP iniciou o protocolo B-14 para determinar a eficácia do tamoxifeno
em pacientes consideradas de bom prognóstico, isto é, aquelas com tumores com receptor de estrógeno
positivo (>10 fmol ), idade inferior a 70 anos, com câncer de mama operável e linfonodos axilares negativos
ao exame histológico. Foram criados dois grupos de pacientes através de aleatorização feita dentro de estratos
definidos por idade e tamanho do tumor na análise clı́nica, tipo de cirurgia e concentração de receptor de
estrógeno. Um grupo recebeu tamoxifeno (10 mg por dia, via oral, duas vezes ao dia) e o outro, placebo,
indistinguı́vel do tamoxifeno na aparência e gosto. Além disto, o ensaio foi organizado na forma duplo-cego.
Após acompanhamento das pacientes por um perı́odo de até 4 anos, constatou-se uma diferença signifi-
cativa em termos de tempo livre de doença em favor das pacientes que receberam o tamoxifeno. No grupo
tratamento, 83% estavam livres da doença aos quatro anos após a cirurgia, enquanto que no grupo placebo
esta porcentagem era de 73%. Este estudo, publicado por Fisher et al. (1989), contribuiu decisivamente para
a adoção do tamoxifeno como quimioterapia adjuvante logo após a cirurgia em pacientes de bom prognóstico.
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 17

a
EFEITO: PRESENTE

POPULAÇÃO
EXPOSTOS
À INTERVENÇÃO

ou b
grupo-experimental EFEITO: AUSENTE

xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS

c
EFEITO: PRESENTE

NÃO-EXPOSTOS
À INTERVENÇÃO
ou
grupo-controle d
EFEITO: AUSENTE
FORMAÇÃO DOS GRUPOS
POR ALEATORIZAÇÃO E MEDIÇÃO
APLICAÇÃO DOS TRATAMENTOS DOS EFEITOS
a, b, c, d : os quatro possíveis resultados

Figura 2.5: Esquema de um Ensaio Clı́nico Aleatorizado.

2.4.4 Estudos Descritivos


As investigações de cunho descritivo, têm o objetivo de informar sobre a distribuição de um evento, na
população, em termos quantitativos.
Elas podem ser de incidência ou de prevalência. Nelas, não há formação de grupo-controle para a
comparação dos resultados, ao menos na forma como é feita nos estudos analı́ticos - daı́ serem considerados
estudos não-controlados.

Exemplos de temas de estudos descritivos

• A incidência de infecção chagásica em habitantes rurais;

• A prevalência da hepatite B entre os voluntários à doação de sangue;

• As caracterı́sticas demográficas e socioeconômicas dos pacientes que sofrem de artrite reumatóide ou


das pessoas que fumam;

• As principais causas de óbito da população residente em um dado municı́pio;


• O estado imunitário de pré-escolares, de um municı́pio, frente à poliomielite;

• Os padrões de crescimento e desenvolvimento de crianças normais ou daquelas acometidas por uma


determinada doença;

• A variação regional na utilização de serviços de saúde.


• A tendência do coeficiente de mortalidade por tuberculose, de uma cidade, nos últimos anos.

Estudo de Caso
Trata-se de observar um ou poucos indivı́duos com uma mesma doença ou evento e, a partir de descrição
dos respectivos casos, traçar um perfil das suas principais caracterı́sticas.
Muitas revistas cientı́ficas apresentam uma seção de ”relato” ou ”apresentação de casos”, para difundir
os resultados destes estudos.
O estudo de casos é empregado para enfocar grupos especı́ficos da população ou um particular aspecto
de interesse, não devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de
suplementação de informações, com maior riqueza de detalhes.

Vantagens do Estudo de Casos

• Em geral, o estudo de caso é relativamente fácil de ser realizado e de baixo custo.


2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 18

• O relato pode restringir-se a uma simples descrição ou ir mais além, de modo a sugerir explicações
sobre elementos pouco conhecidos, tais como os fatores implicados na etiologia ou no curso de uma
doença, sob vigência ou não de terapêutica.

• Em clı́nica, é possı́vel acompanhar pacientes durante anos, e mesmo décadas, chegando-se a um quadro
repleto de detalhes sobre aspectos evolutivos de uma dada condição.

• O estudo de casos constitui-se em um verdadeiro inventário do que acontece genericamente, à luz da


observação de poucos indivı́duos.
• É um enfoque qualitativo e exploratório, embora muitas facetas possam ser quantificadas. Um aspecto
positivo, convém realçar, é a possibilidade de observação intensiva de cada caso.

Desvantagens do Estudo de Casos

• Os indivı́duos observados costumam ser altamente selecionados. Às vezes, a observação restringe-se a
situações incomuns de enfermos graves, outras vezes, aos casos de evolução atı́pica, de reação inusitada
ou de resultado terapêutico inesperado; muito raramente, abrange pacientes em todas as faces de
manifestação da doença.
• A falta de indivı́duos-controle, para comparar resultados, pode fazer com que simples coincidências
sejam difı́ceis de interpretar: por exemplo, em investigação de um surto de diarréia, se os casos beberam
água de um certo poço a evidência é ainda frágil para incriminar a água do poço na etiologia da doença.
Seria conveniente saber se os sadios também beberam ou não água do mesmo poço.

Em sı́ntese, apesar das vantagens referentes à facilidade de realização e baixo custo, duas limitações
principais estão presentes no estudo de casos:

• a falta de controle - eles serviriam para contornar problemas de aferição e comparação acima mencio-
nados;

• o número pequeno de indivı́duos incluı́dos para observação - o que aponta para a prudência na in-
terpretação dos resultados de estudos de casos, especialmente, na generalização, como ele tem sido
atualmente empregado na área clı́nica, é útil para levantar problemas, muitos dos quais são comple-
mentarmente investigados com o auxı́lio de outros métodos.

Seccionais ou Transversais
Investigações que produzem ”instantâneos” da situação de saúde de uma população ou comunidade,
com base na avaliação individual do estado de saúde de cada um dos membros do grupo, e daı́ produzindo
indicadores globais de saúde para o grupo investigado, são chamadas de estudos seccionais ou de corte-
transversal-seccional.
O Estudo Seccional também é conhecido como Estudo Transversal ou da Prevalência.

Vantagens do Estudo Seccional

• Simplicidade e baixo custo;


• Rapidez;

• Não há necessidade de seguimento das pessoas;


• Alto potencial descritivo (subsı́dio ao planejamento);

• Boa opção para descrever as caracterı́sticas dos eventos na população, para identificar casos na comu-
nidade e para detectar grupos de alto risco, aos quais pode ser oferecida atenção especial.

Desvantagens do Estudo Seccional

• Vulnerabilidade a biases ou vı́cios (especialmente de seleção);


2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 19

POPULAÇÃO

AMOSTRA PARA
ESTUDO FORMAÇÃO DOS GRUPOS POR
OBSERVAÇÃO SIMULTÂNEA DE

xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
EXPOSIÇÃO E DOENÇA

EXPOSTOS EXPOSTOS NÃO-EXPOSTOS NÃO-EXPOSTOS


E E E E
DOENTES NÃO-DOENTES DOENTES NÃO-DOENTES

a b c d

ANÁLISE DOS DADOS

Figura 2.6: Esquema de um Estudo Seccional.

• Baixo poder analı́tico (inadequado para testar hipóteses causais);


• Condições de baixa prevalência exigem amostra de grande
tamanho, logo têm dificuldades operacionais;

• Não determina risco absoluto (ou seja, a incidência);


• A associação entre exposição e doença, se detectada, refere-se à época de realização do estudo e pode
não ser a mesma da época de aparecimento da doença.
Capı́tulo 3

Estatı́stica Descritiva

3.1 Organização de Dados Estatı́sticos


3.1.1 Normas para a Apresentação Tabular de Dados
A representação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas
e colunas, distribuı́das de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas
estatı́sticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de Estatı́stica.
Uma tabela estatı́stica compõe-se de elementos essenciais e elementos complementares.

1. Elementos essenciais

a. Tı́tulo:
É a indicação da natureza do fato estatı́stico observado, fazendo referência ao local e ao tempo
em que foi observado.
b. Cabeçalho:
São as indicações que especificam o conteúdo das colunas.
c. Coluna indicadora:
São as indicações que especificam o conteúdo das linhas.

2. Elementos complementares

a. Fonte
É a entidade responsável pelos dados contidos na tabela.
b. Nota
São informações que esclarecem critérios usados na confecção da tabela.
c. Chamada
É a informação de natureza especı́fica, que serve para complementar determinado dado usado na
confecção da tabela.

20
3.2 Distribuição de Frequências ROSSI, R. M. 21

Tabela 3.1: População brasileira por faixa etária.


Idades (Anos) 1980 (%) 1991 (%)
0 à 9 27, 9 23, 6
10 à 19 20, 6 18, 3
20 à 59 45, 0 50, 9
≥ 60 6, 5 7, 2
Fonte: IBGE

3.2 Distribuição de Frequências


Geralmente após a coleta de dados, estes são apresentados de forma desorganizada e de difı́cil mani-
pulação, logo faz-se necessário organizá-los. Para organizar os dados provenientes de uma variável qualitativa,
é usual fazer uma Tabela de frequências.

Tabela 3.2: Total de alunos matriculados na UEM em 2002.


Sexo Frequência
Feminino 7.545
Masculino 5.905
Total 13.450
Fonte: UEM/2002.

Quando a variável em estudo é do tipo contı́nua e assume muitos valores distintos, o agrupamento dos
dados em classes será sempre necessário na construção das tabelas de frequências.
Em publicações mais antigas sobre construção de tabelas de frequências, há fórmulas para determinação
do número de classes de acordo com o número de dados. Essas fórmulas eram úteis, pois a construção
dos gráficos era muito custosa sem o auxı́lio do computador. Esse procedimento é aconselhável como uma
primeira visualização da distribuição de frequências de uma variável. A seguir é apresentado um roteiro para
construção de distribuições de frequência.

Exemplo 3.1. Considere uma amostra de 25 criança, das quais foram obtidas medidas de intoxicação
alimentar por uma substância desconhecida ( g).

Dados brutos
0, 77 0, 75 0, 80 0, 78 0, 75 0, 65 1, 05 1, 10 0, 75 0, 75
0, 85 0, 61 0, 78 0, 58 0, 52 0, 78 1, 02 0, 99 0, 65 0, 55
0, 85 0, 90 0, 96 0, 79 0, 55
Fonte: Dados hipotéticos

Os dados, como apresentados acima, são chamados brutos, pois não foram ainda submetidos a nenhum
tipo de tratamento. Inicialmente, os dados devem ser colocados em ordem crescente:

Dados em ordem crescente


0, 52 0, 55 0, 55 0, 58 0, 61 0, 65 0, 65 0, 75 0, 75 0, 75
0, 75 0, 77 0, 78 0, 78 0, 78 0, 79 0, 80 0, 85 0, 85 0, 90
0, 96 0, 99 1, 02 1, 05 1, 10
Fonte: Dados hipotéticos

Pode-se observar, agora, que das 25 observações o menor valor é xmı́n = 0, 55 e o maior é xmáx = 1, 10.

Amplitude (AT): é a diferença entre o maior e o menor valor do conjunto de dados observados.

AT = xmáx − xmı́n
3.2 Distribuição de Frequências ROSSI, R. M. 22

Para os dados acima: AT = 1, 10 − 0, 52 = 0, 58


Observe que esse exemplo contém um número pequeno de observações (n = 25), quando há um grande
número de dados observados o processo de ordenação é trabalhoso e a listagem final pouco representará.
Nesses casos, pode-se simplificar o processo agrupando os dados em certo número de classes, cujos limites
serão denominados limite inferior e limite superior. A quantidade de classes e a amplitude destas devem
ser obtidas observando as seguintes normas:

i) as classes devem cobrir a amplitude total;


ii) o extremo superior de uma classe é o extremo inferior da classe seguinte;
iii) cada valor observado deve enquadrar-se em apenas uma classe;
iv) o número total de classes não deve ser inferior a 5 e nem superior a 25;

O número de classes (k), pode ser obtido de uma das fórmulas seguintes:

i) k = n ;

ii) k = 1 + 3, 22 log n , (fórmula de Sturges).



Para o exemplo 2.1: k = 25 = 5 ou k = 1 + 3, 22log(25) ≃ 5, 50. Dividindo a amplitude total (AT ) por
k = 5 chega-se ao tamanho ou amplitude de cada uma das classes:

AT 0, 58 ∼
h= = = 0, 12
k 5

Obs.: quando os valores observados são números inteiros, os limites das classes também devem ser
AT
números inteiros. Para isso, aconselha-se escolher o número mais próximo de AT que resulte h = em
k
um número inteiro.
Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:

i) o limite inferior da primeira classe pode ser o menor valor da série, neste caso : 0,52.
ii) os demais limites serão obtidos somando aos limites inferiores o valor de h. Isto é,
0, 52 ⊢ (0, 52 + h = 0, 52 + 0, 12) = 0, 64
0, 64 ⊢ (0, 64 + h) = 0, 76
0, 76 ⊢ (0, 76 + h) = 0, 88
0, 88 ⊢ (0, 88 + h) = 1, 00
1, 00 ⊢ (1, 00 + h) = 1, 12.

Lembrando que a notação (⊢) significa que se esta incluindo os valores iguais ao limite inferior e excluindo
os valores iguais ou superiores ao limite superior. A partir da listagem ordenada das classes, pode-se construir
os chamados quadros (ou tabelas) de frequência ou distribuições de frequência, que permitem uma melhor
visualização dos dados.

Frequência: é o número de valores que aparecem no domı́nio de uma classe.

Um quadro de frequências completo deve conter as seguintes informações:

i) xi é o ponto médio da i-ésima classe; representa a média dos pontos limites da classe;

li + Li
xi = ; li : limite inferior e Li : limite superior da classe i.
2

ii) n é o tamanho da amostra;


iv) Fi é a frequência absoluta da i-ésima classe;
3.3 Gráficos ROSSI, R. M. 23

Fi
v) fi é a frequência relativa da i-ésima classe, fi = ;
n
vi) Faci é a frequência acumulada da i-ésima classe;

Faci
vii) faci é a frequência relativa acumulada da i-ésima classe, faci = .
n

Assim, no caso da amostra de 25 criança intoxicadas, a distribuição de frequência pode ser da seguinte
forma:

Tabela 3.3: Distribuição do nı́vel de intoxicação.


Classes xi Fi fi Fac fac
0, 52 ⊢ 0, 64 0, 58 5 0, 20 5 0, 20
0, 64 ⊢ 0, 76 0, 70 6 0, 24 11 0, 44
0, 76 ⊢ 0, 88 0, 82 8 0, 32 19 0, 76
0, 88 ⊢ 1, 00 0, 94 3 0, 12 22 0, 88
1, 00 ⊢ 1, 12 1, 06 3 0, 12 25 1, 00
Total - 25 1 - -
Fonte: Dados hipotéticos

Outras informações:
Nenhuma cela ( casa ) deve ficar em branco;
Hı́fen ( - ), indica que o valor numérico é nulo;
Reticência ( ... ), indica que não se dispõe do dado;
Interrogação ( ? ), indica dúvida quanto a exatidão do valor numérico;
Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em relação a unidade utilizada.

3.3 Gráficos
Os gráficos são representações pictóricas, de grande valia na compreensão e visualização dos dados.
Os principais gráficos utilizados na representação estatı́stica são:

1. Diagramas;

(a) Por Pontos;


(b) Por Linhas;
i. Poligonais;
ii. Curvas;
(c) Por Superfı́cies;
i. em Colunas;
ii. em Barras;
iii. em Histogramas;
iv. em Box;
v. em Setores;

2. Cartogramas;
3. Estereogramas.
3.3 Gráficos ROSSI, R. M. 24

3.3.1 Diagramas
São representações gráficas de séries estatı́sticas por intermédio de linhas e superfı́cies. As linhas utilizadas
são as poligonais e as curvas, e as superfı́cies são retângulos, cı́rculos e quadrados. Para suas construções
pode-se utilizar a proporcionalidade entre série de números ou do sistema retilı́nio ortogonal. Este sistema
estabelece uma correspondência biunı́voca entre os pares de números reais e os pontos de um plano. Assim,
de modo geral, num sistema retilı́neo ortogonal, um ponto P do plano está determinado pelos números reais
X e Y, tomados sobre dois eixos divididos em segmentos unitários.

Diagramas por Pontos (Diagramas de Dispersão):


É a representação gráfica dos dados de forma bruta e geral, o que pode fornecer uma idéia da variabilidade
dos dados, pontos extremos etc.

Figura 3.1: Diagrama de dispersão e de relação entre X e Y.

Diagramas por Linha Poligonal:


É a representação gráfica de uma série estatı́stica por meio de uma linha poligonal. É um dos mais impor-
tantes gráficos; representa observações feitas ao longo do tempo, em intervalos iguais ou não. Tais conjuntos
de dados constituem as chamadas séries históricas ou séries temporais. Traduzem o comportamento de um
fenômeno em certo intervalo de tempo.

Figura 3.2: Gráfico para séries temporais.


3.3 Gráficos ROSSI, R. M. 25

O polı́gono de frequência é um gráfico que se obtém unindo por uma poligonal os pontos correspondentes
às frequências das diversas classes, centradas nos respectivos pontos médios. Para obter as intersecções do
polı́gono com o eixo, cria-se em cada extremo do histograma uma classe com frequência nula.
Obs.: Suavizando a linha poligonal que define o polı́gono obtém-se uma curva que visualiza a tendência
de variação dos dados.

0.3
Probabilidade

0.2
0.1
0.0

−4 −3 −2 −1 0 1 2 3

Amostra

Figura 3.3: Suavização do polı́gono de frequência.

Ogiva
A Ogiva ou Polı́gono de Frequência Acumulada, consiste de uma linha poligonal das Fac ou das fac .

Figura 3.4: Gráfico da Ogiva.


3.3 Gráficos ROSSI, R. M. 26

Diagramas por Linha Curva:


É a representação de uma série estatı́stica por meio de uma linha curva. Pode ser utilizada para repre-
sentar uma tendência do tipo linear ou não-linear.

Figura 3.5: Gráfico para modelos lineares não-lineares.

Diagrama por Superfı́cie em Barras ou Colunas:


É a representação de uma série estatı́stica por intermédio de retângulos em posições verticais. Este tipo
de gráfico proporciona comparar grandezas.
Os valores da variável dependente, dados pela série estatı́stica ou suas diferenças, devem ser proporcionais
às áreas dos retângulos a serem traçados. Para tanto pode-se utilizar o sistema retilı́nio ortogonal marcando-
se os pontos de forma já indicada, e a partir do eixo dos x, construir retângulos de bases iguais e que tenham
respectivamente, por meio de cada base, os valores da variável independente e os pontos marcados.

Figura 3.6: Gráfico Gráfico em Barras ou Colunas.


3.3 Gráficos ROSSI, R. M. 27

Diagrama por Superfı́cie em Histogramas:


O Histograma é um conjunto de retângulos com bases sobre um eixo dividido de acordo com os tamanhos
de classe, centrados nos pontos médios das classes e áreas proporcionais às frequências.

Figura 3.7: Gráfico do Histograma.


3.3 Gráficos ROSSI, R. M. 28

Diagrama por Superfı́cie em Caixas (BoxPlot):


O BoxPlot é uma representação da forma de distribuição dos dados que visa apresentar a massa de
dados assim como identificar valores extremos e/ou outliers.

Figura 3.8: Gráfico BoxPlot.

Diagrama por Superfı́cie em Setores (Pizza):


É a representação gráfica de uma série estatı́stica por intermédio de superfı́cies setoriais.
É utilizado quando se pretende comparar os valores de uma série com a sua soma total. A representação é
feita tomando como figura básica um cı́rculo que é dividido em setores. O quociente entre a soma dos valores
da série e a área do cı́rculo deve ser o mesmo que entre cada valor da variável dependente e a respectiva área
do setor representativo. Porém em virtude da proporcionalidade das áreas dos setores de um cı́rculo com
seus ângulos centrais, podem-se dividir os valores considerados na série proporcionalmente a estes ângulos.

Figura 3.9: Diagrama por Superfı́cie em Setores (Pizza).


3.3 Gráficos ROSSI, R. M. 29

Outros:
Há muitos outros tipos de gráficos em diferentes áreas do conhecimento.

Figura 3.10: Diagrama da prevalência por área.

Figura 3.11: Diagrama de curva de crescimento.


3.3 Gráficos ROSSI, R. M. 30

Figura 3.12: Diagrama de pirâmide etária.

Figura 3.13: Diagrama epidemiológico.

Figura 3.14: Curva de superfı́cie.


3.4 Medidas Descritivas ROSSI, R. M. 31

3.4 Medidas Descritivas


3.4.1 Medidas de Tendência Central ou de Posição
São medidas que objetivam representar o ponto central de equilı́brio de uma distribuição de dados. Essas
medidas representam quantitativamente os dados, sendo as mais utilizadas em análise:

Média
Representa o ponto de equilı́brio de um conjunto de dados. Seja (x1 , . . . , xn ) um conjunto de dados. A
média será dada por:

N
xi
µ = i=1 ( dados populacionais ), para dados não-agrupados em tabelas de frequências.
N

n
xi
i=1
x= ( dados amostrais ), para dados não-agrupados em tabelas de frequências.
n

k
xi Fi
i=1
x= ( dados amostrais ), quando os dados agrupados em tabelas de frequências, com k classes.
n
Quando os dados são agrupados em intervalos de classes, xi corresponde ao ponto médio do intervalo.

Exemplo 3.2. Considere do Exemplo anterior, o conjunto de dados da amostra retirada da variável nı́vel
de intoxicação, dado no inı́cio desta parte. A média será dada por:


25
xi
i=1 19, 53
xA = = = 0, 7812, para os dados brutos, ou
n 25


5
xi Fi
i=1 19, 66
xB = = = 0, 7864, para os dados agrupados (Tabela 3.3).
n 25
Observe que x̄A ≃ x̄B .
3.4 Medidas Descritivas ROSSI, R. M. 32

Propriedades da Média:

1 - A soma algébrica dos desvios tomados em relação a média é nula. Isto é,
∑k ∑k
i=1 di = i=1 (xi − x) = 0 , i = 1, 2, . . . , n

X = {2, 3, 7} → x = 4,
∑k
pela propriedade: i=1 di = (2 − 4) + (3 − 4) + (7 − 4) = 0.

2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a média do conjunto
fica aumentada ou diminuı́da dessa constante.

yi = xi ± k ⇒ y =x±k

Para k = +2, tem-se: Y = {4, 5, 9} → y = 6,


pela propriedade: y = x + 2 = 4 + 2 = 6.

3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante k, a média do
conjunto fica multiplicada ou dividida por essa constante.

xi x
yi = k · xi ⇒ y =k·x e yi = ⇒ y= ; .k ̸= 0.
k k

Para k = +5, tem-se Y = {10, 15, 35} → y = 20,


pela propriedade: y = 5.x = 5.4 = 20.

Vantagens e desvantagens da Média:

1 - É uma medida que, pôr uniformizar os dados, não representa bem os conjuntos que revelam tendências
extremas, uma vez que a mesma será grandemente influenciada pelos valores discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno tenha as seguintes notas em uma disciplina:
30, 35, 25, 30, 25 35, 35, 95, 90, 100.
500
Um cálculo rápido nos mostra que sua média final foi x = = 50. Como a média deve traduzir o
10
aproveitamento do aluno durante o ano e a média 50 só foi conseguida à custa das três últimas notas,
concluı́mos que 50 é um valor falho para medir o aproveitamento do aluno.
2 - A média nem sempre tem existência real, isto é, ela nem sempre faz parte do conjunto de dados
(x ∈
/ X).
3 - É a medida de posição mais conhecida e de maior emprego.
4 - É facilmente calculada.
5 - Serve para compararmos conjuntos semelhantes.
6 - Depende de todos os valores do conjunto de dados.
7 - em geral não ocupa a posição central do conjunto (ocupa a posição do centro de equilı́brio).

Moda
A Moda (Mo ) é o valor que ocorre com maior frequência em uma série de dados. Existem séries de dados
em que nenhum valor aparece mais vezes que outros. Neste caso não apresenta moda. São séries amodais.
Em outros casos, pode aparecer dois ou mais valores de concentração. Diz-se então, que a série tem duas ou
mais modas (bimodal, trimodal ou multimodal).

X : {2, 2, 2, 2, 5, 5, 5, 6, 6, 7, 8} → Mo = 2 (unimodal).
3.4 Medidas Descritivas ROSSI, R. M. 33

Quando os dados se apresentam agrupados em tabelas de frequências é necessário utilizar a expressão de


“Czuber” (a mais precisa), dada a seguir, para calcular o valor que representa a moda: ( onde i é a ordem
da classe de maior frequência).

h(Fi − Fi−1 )
“Czuber”: Mo = li + .
(Fi − Fi−1 ) + (Fi − Fi+1 )

Outras modas:
“Pearson”: Mo = 3.Md − 2.x
e
h.Fi+1
“King”: Mo = li + .
Fi−1 + Fi+1
Graficamente, A equeção de Czuber de dá quando, em um conjunto de dados qualquer, identifica-se a
classe modal como aquela que apresenta o retângulo de maior altura (frequência). A intersecção das retas
que unem os pontos AD e os pontos BC, determina o ponto P que, projetado perpendicularmente no eixo
da variável, corresponderá ao valor da moda M o.

Figura 3.15: Projeção de Czuber para Moda.

Exemplo 3.3. Calcular a moda de Czuber, para os dados agrupados da amostra dada na Tabela 3.3.
i = 3 (Classe de maior frequência)
h = 0, 12
l3 = 0, 76
Fi = F3 = 8
Fi−1 = F2 = 6
Fi+1 = F4 = 3

0, 12(8 − 6)
Mo = 0, 76 + ≃ 0, 794
(8 − 6) + (8 − 3)
Isto significa que o nı́vel de toxicidade mais frequente é de 0,794 g.
3.4 Medidas Descritivas ROSSI, R. M. 34

Mediana
A mediana (Md ) de um conjunto de valores ordenados segundo uma ordem de grandeza, é o valor situado
de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos (é o valor
que está no meio !).
Quando o conjunto de observações tem um número ı́mpar de valores, não-agrupados em classes, então
n+1
a mediana é dada pela expressão: Md = xp , onde p = .
2
x1 x2 x3 x4 x5
→ Md = 5.
3 5 5 6 7

Quando o conjunto de observações tem um número par de valores, não-agrupados em classes, então a
xp + xp+1
mediana será, a média aritmética dos dois números que ocuparem o meio da série: Md = , onde
2
n
p= .
2
x1 x2 x3 x4 x5 x6 5+6
→ Md = = 5, 5.
3 5 5 6 7 7 2

Quando o conjunto de observações se apresenta agrupados em classes em uma tabela de frequências,


então a mediana é dada pela expressão abaixo, onde onde i representa a classe mediana, isto é, a classe onde
n
estará presente o valor de p = .
2
h(p − Fac−1 )
Md = li +
Fi

Exemplo 3.4. Calcular a mediana para os dados agrupados da amostra da Tabela 3.3.

n = 25( )
n
i = 3 p = = 12, 5 está na terceira linha −→ olhar em Fac
2
h = 0, 12
Fi = 8
Fac−1 = 11 (frequência acumulada da classe anterior)
l3 = 0, 76
0, 12(12, 5 − 11)
Md = 0, 76 + ≃ 0, 783
8
Isto significa que o 50% das crianças apresenta nı́vel de toxicidade acima de 0,783 g.

3.4.2 Medida de Variabilidade ou de Dispersão


São medidas estatı́sticas que indicam o grau de dispersão, ou variabilidade do conjunto de observações
pesquisados, em relação a uma medida de tendência central, por exemplo, x̄.
Uma única medida não é suficiente para descrever de modo satisfatório um conjunto de observações. Por
exemplo, dois conjuntos de dados podem ter a mesma média aritmética e, no entanto, a dispersão de um
pode ser muito maior que a dispersão do outro.
As principais medidas de dispersão são: amplitude total (AT), variância (σ 2 ou s2 ), desvio-padrão (σ
ou s) e coeficiente de variação (CV).

Amplitude total
Amplitude total ou AT é a diferença entre o maior e o menor valor observado

AT = xmáx − xmı́n
3.4 Medidas Descritivas ROSSI, R. M. 35

Desvio absoluto médio


Desvio absoluto médio ou Dm é a média aritmética dos valores absolutos dos desvios tomados em
relação a uma das seguintes medidas de tendência central: média ou mediana.
Desvio médio em relação à média para dados não tabulados:

n
|xi − x̄|
i=1
Dm =
n
Desvio médio em relação à média para dados tabulados:

n
|xi − x̄| Fi
i=1
Dm =
n

Variância
Variância ou Var(X) é a medida que fornece o grau de dispersão, ou variabilidade dos valores do
conjunto de observações em torno da média. Ela é calculada somando os quadrados dos desvios em relação
à média:
Amostral Populacional
∑n
2
(xi − x̄) ∑
N
(xi −µ)2
D. Brutos s2 = i=1 2
σ = i=1

n−1  ( )2 
N

∑k ∑
k
2
(xi − x̄) Fi ( ) k xi Fi  ∑
k

i=1 1 ∑ 2 i=1  (xi −µ)2 Fi


D. Agrupados s2 = ou s2 =  xi Fi −  σ2 = i=1

n−1 n−1 i=1 n  N

Desvio-padrão
Desvio-padrão ou DP(X) - Como a variância calculada a partir do quadrados dos desvios, sua unidade
é quadrada em relação à variável estudada, o que, sob o ponto de vista prático é um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão,
definida como a raiz quadrada da variância e representada por:

Amostral
√ Populacional

s = s2 σ = σ2

Propriedades da Variância e do Desvio-Padrão

1 - V ar(X) ≥ 0 =⇒ DP (X) ≥ 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a variância e o
desvio-padrão do novo conjunto permanecem inalterados:

Y =X ±k ⇒ V ar(Y ) = V ar(X) + 0

Y =X ±k ⇒ DP (Y ) = DP (X) + 0

X: Variável Aleatória e k: constante real.


3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante, k, a variância e
o desvio-padrão do novo conjunto são alterados da seguinte forma:

Y = kX ⇒ V ar(Y ) = k 2 V ar(X)

Y = kX ⇒ DP (Y ) = |k|DP (X)
3.4 Medidas Descritivas ROSSI, R. M. 36

e para k ̸= 0,

X V ar(X)
Y = ⇒ V ar(Y ) =
k k2
X DP (X)
Y = ⇒ DP (Y ) =
k |k|

4 - Sejam X e W variáveis aleatórias independentes, a e b constantes reais, tal que Y = aX ± bW, tem-se:

Y = aX ± bW ⇒ V ar(Y ) = V ar(aX ± bW ) = a2 V ar(X) + b2 V ar(W ).

Variância Relativa
A variância relativa de uma série X é indicada por VR(X) e definida por:

s2
V R(X) = 2 (amostral)
(x̄)

Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro.
Portanto, pode ser expresso em percentual.

Coeficiente de variação
Coeficiente de variação ou CV é uma medida relativa da dispersão ou variabilidade dos dados:

s σ
CV(x) = (amostral) ou CV(x) = (populacional).
x̄ µ

Critérios para interpretação: Quanto menor for o coeficiente de variação (CV ≤ 25%), mais representa-
tiva dos dados será a média.

Exemplo 3.5. Calcular a variância, o desvio-padrão e o coeficiente de variação para o conjunto de dados
da amostra X: {2, 3, 5, 7}.

Sabemos que x = 4, 25 ≃ 4, 3, então:


∑n
2
(xi − x̄) 2 2 2 2
(2 − 4, 3) + (3 − 4, 3) + (5 − 4, 3) + (7 − 4, 3)
s2 = i=1 = ≃ 4, 92
√ n−1 3
s = 4, 92 ≃ 2, 12, assim:
2, 12
CV = ≃ 0, 522 (sendo CV = 52,2% > 25%, há indicativo de que a média não é representativa).
4, 25
Exemplo 3.6. Calcular a variância, o desvio-padrão e o coeficiente de variação para o conjunto de dados
amostrais apresentados na tabela abaixo.

Tabela 3.4: Exemplo de Tabela de Frequência.


xi Fi
1 2
3 4
5 2
Total 8


3
xi Fi
i=1 1 × 2 + 3 × 4 + 5 × .2
sendo x = = = 3, temos
n 8
3.4 Medidas Descritivas ROSSI, R. M. 37


k
2
(xi − x̄) Fi 2 2 2
i=1 (1 − 3) 2 + (3 − 3) 4 + (5 − 3) 2
s2 = = ≃ 2, 29, ou
n − 1 7
( k )2 

( ) k xi Fi 
1 ∑ 2 i=1 
s2 =  x F i −  = s2
n − 1 i=1 i n 

( )[ 2
]
1 (24) 16
= 88 − = ≃ 2, 29
8−1 8 7

logo, s = 2, 29 ≃ 1, 51, assim:
1, 51
cv = ≃ 0, 50 (há indicativo de que a média não é representativa).
3

3.4.3 Medidas Separatrizes


Quartis, Decis e Percentis
As medidas de posição denominadas “Separatrizes” para valores agrupados são calculadas através da
expressão:

h(p − Fac−1 )
Sk = li +
Fi
onde
SK : é a medida de posição separatriz desejada (Md : M ediana, Qk : Quartil, Dk : Decil ou Pk :
P ercentil de ordem k);
k : é a ordem da medida;
w : é o divisor;

Sk k w
Md 1 2
Q 1, 2, 3 4
D 1, 2, ...,9 10
P 1, 2, ...,99 100
p : é a posição da observação, dado por:
n.k
p=
w
Exemplo 3.7. Calcule o Q1 , Q2 , Q3 , D7 , P10 e P90 para os dados da Tabela 3.3.

Tabela 3.5: Distribuição do nı́vel de intoxicação (g) em 25 crianças.


Classes xi Fi fi Fac fac
0,52 ⊢ 0,64 0,58 5 0,20 5 0,20
0,64 ⊢ 0,76 0,70 6 0,24 11 0,44
0,76 ⊢ 0,88 0,82 8 0,32 19 0,76
0,88 ⊢ 1,00 0,94 3 0,12 22 0,88
1,00 ⊢ 1,12 1,06 3 0,12 25 1,00
Total - 25 1 - -
Fonte: Dados hipotéticos
3.4 Medidas Descritivas ROSSI, R. M. 38

Solução:
Cálculo de Q1 : {k = 1; w = 4; }
25 × 1
p= = 6, 25 (i = 2 : olhar em Fac )
4
h = 0, 12
Fi = F2 = 6
li = 0, 64
Fac−1 = 5
0, 12(6, 25 − 5)
Q1 = 0, 64 + = 0, 64 + 0, 025 = 0, 665
6
Obs.: O valor Q1 = 0, 665 representa o nı́vel de intoxicação que deixa 25% dos demais valores abaixo dele.
Cálculo de Q2 : {k = 2; w = 4; }
25 × 2
p= = 12, 5 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(12, 5 − 11)
Q2 = 0, 76 + ≃ 0, 783 = Md
8
Obs.: O valor Q2 ≃ 0, 783 representa o o nı́vel de intoxicação que deixa 50% dos demais valores abaixo dele,
isto é, é o valor mediano.
Cálculo de Q3 : {k = 3; w = 4; }
25 × 3
p= = 18, 75 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(18, 75 − 11)
Q3 = 0, 76 + ≃ 0, 876
8
Obs.: O valor Q3 ≃ 0, 876 representa o nı́vel de intoxicação que deixa 75% dos demais valores abaixo dele.
Cálculo de D7 : {k = 7; w = 10; }
25 × 7
p= = 17, 5 (i = 3)
10
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(17, 5 − 11)
D7 = 0, 76 + ≃ 0, 858
8
Obs.: O valor D7 ≃ 0, 858 representa o o nı́vel de intoxicação que deixa 70% dos demais valores abaixo dele.
Cálculo de P10 : {k = 10; w = 100; }
25 × 10
p= = 2, 5 (i = 1)
100
h = 0, 12
Fi = 5
li = 0, 52
Fac−1 = 0
0, 12(2, 5 − 0)
P10 = 0, 52 + = 0, 58
5
Obs.: O valor P10 = 0, 58 representa o o nı́vel de intoxicação que deixa 10% dos demais valores abaixo dele.
Cálculo de P90 : {k = 90; w = 100; }
25 × 90
p= = 22, 5 (i = 1)
100
h = 0, 12
Fi = 3
3.4 Medidas Descritivas ROSSI, R. M. 39

li = 1, 00
Fac−1 = 22
0, 12(22, 5 − 22)
P90 = 1 + = 1, 02
3
Obs.: O valor P90 = 1, 02 representa o o nı́vel de intoxicação que deixa 90% dos demais valores abaixo dele
ou 10% acima dele.

Medidas de Assimetria
Tem por objetivo básico medir o quanto a distribuição de frequências do conjunto de valores observados
se afasta da condição de simetria.

(A) Distribuição Assimétrica negativa. Quando a média é menor que a mediana que é menor que a
moda.

(B) Distribuição Simétrica. Quando a média, moda e mediana são iguais, ou muito próximas.
(C) Distribuição Assimétrica positiva. Quando a média é maior que a mediana que é maior que a
moda.
3.4 Medidas Descritivas ROSSI, R. M. 40

Gráfico das distribuições quanto à assimetria

Figura 3.16: (A) Assimétrica Negativa (x̄ < Md < Mo )

Figura 3.17: (B) Simétrica (x̄ = Md = Mo )

Figura 3.18: (C) Assimétrica Positiva (Mo < Md < x̄)

Uma das medidas para quantificar a assimetria de uma distribuição pode ser dada pelo primeiro coe-
ficiente de assimetria de Pearson (Ap ) :

x̄ − Mo 3 (x̄ − Md )
Ap = ou Ap =
s s

Outra é através do coeficiente quartilı́tico de Bowley (Ab ) :

Q3 + Q1 − 2Md
Ab =
Q3 − Q1

Em ambos temos:
Se A < 0 a distribuição é assimétrica negativa.
Se A = 0 a distribuição é distribuição simétrica.
Se A > 0 a distribuição é assimétrica positiva.
Obs.: 0, 15 < |A| < 1 a assimetria é considerada moderada e se |A| > 1, forte.

Exemplo 3.8. Considerando o conjunto de dados da Tabela 3.3, obter Ap .


sabemos que: x = 0, 7864; s = 0, 153 e Mo ≃ 0, 794, assim:
x̄ − Mo 0, 786 − 0, 794
Ap = = ≃ −0, 04967 (Ap < 0 : assimétrica negativa).
s 0, 153
3.4 Medidas Descritivas ROSSI, R. M. 41

Medidas de Curtose
A curtose ou achatamento mede a concentração ou dispersão dos valores de um conjunto de valores
em relação às medidas de tendência central em uma distribuição de frequências conhecida (a distribuição
Normal).

(A) Distribuição Leptocúrtica. Quando a distribuição apresenta uma curva de frequência mais “fe-
chada” que a da distribuição Normal.
(B) Distribuição Mesocúrtica. Quando a distribuição apresenta uma curva de frequência “parecida”
a da distribuição Normal.
(C) Distribuição Platicúrtica. Quando a distribuição apresenta uma curva de frequência mais “aberta”
que a da distribuição Normal.

Gráfico das distribuições quanto à curtose

Figura 3.19: Leptocúrtica

Figura 3.20: Mesocúrtica

Figura 3.21: Platicúrtica

As medidas de curtose podem ser calculadas através da expressão:

(Q3 − Q1 )
k=
2(P90 − P10 )
3.4 Medidas Descritivas ROSSI, R. M. 42

Obs.1 : k : coeficiente de curtose


Obs.2 : DQ: Q3 − Q1 é denominado Desvio interquartilı́tico.
Relativamente à curva da distribuição Normal, temos:
Se k < 0, 263 ( leptocúrtica );
Se k = 0, 263 ( mesocúrtica );
Se k > 0, 263 ( platicúrtica ).
Podemos utilizar também, o coeficiente de curtose baseado nos momentos centrados (k4 ), para dados
tabelados:

(xi − x̄)4 Fi

Fi
k4 = 4
−3
σ
Lembrando que
(∑ )2
( )2 (xi − x̄)2 Fi
σ = σ2 =
4
(populacional).
N
e (∑ )2
( )2 (xi − x̄)2 Fi
s = s2 =
4
(amostral).
n−1
Analogamente, temos:
Se k4 > 0 a distribuição é leptocúrtica;
Se k4 = 0 a distribuição é mesocúrtica;
Se k4 < 0 a distribuição é platicúrtica.
Exemplo 3.9. Considerando o conjunto de dados da Tabela 3.3, obter k, o coeficiente de curtose interquar-
tilı́tico.
Sabemos que Q1 = 0, 665, Q3 = 0, 876, P10 = 0, 58 e P90 = 1, 02 , então:
(Q3 − Q1 ) (0, 876 − 0, 665)
k= = = 0, 2398 (k < 0, 263 : leptocúrtica).
2(P90 − P10 ) 2(1, 02 − 0, 58)
Do exemplo ??, tem-se a Figura 3.22:

Figura 3.22: Histograma do nı́vel de intoxicação (g).


Capı́tulo 4

Noções de Probabilidade

4.1 Introdução
Uma das ferramentas fundamentais da Inferência Estatı́stica é a Probabilidade, a qual teve seu inı́cio
formal com jogos de azar no século XVII.
Muitas decisões precisam ser tomadas na presença da incerteza. Os preços e modelos de novos carros
devem ser selecionados com base na previsão instável do consumidor, na tendência da economia nacional
e nas ações competitivas. A locação e o quadro de funcionários de um hospital devem ser decididos com
informação limitada na quantidade de pacientes. O estoque de um produto deve ser feito em face da incerteza
sobre a demanda. Probabilidade é a linguagem da incerteza. Assim sendo, probabilidade será estudada como
o mecanismo de fazer inferências.
Independente de qual seja a aplicação em particular, a utilização da teoria de probabilidade indica que
existe um elemento de acaso, ou de incerteza, quanto a ocorrência ou não de um acontecimento futuro.
Assim é que, em muitos casos, pode ser virtualmente impossı́vel afirmar por antecipação o que ocorrerá;
mas é possı́vel dizer o que pode ocorrer. Por exemplo, se uma moeda for jogada para o ar, de modo
geral não se pode afirmar se vai dar cara ou coroa. Entretanto, é reconhecido que embora o resultado
seja incerto, existe um resultado previsı́vel a longo prazo. É sabido que se a moeda é ideal (balanceada,
simétrica) cerca de metade das provas resultarão em caras. Além disso, mediante determinada combinação
de julgamento, experiência passada e dados históricos, em geral é possı́vel dizer quão provável é a ocorrência
de determinado acontecimento futuro. Neste longo prazo, a regularidade previsı́vel possibilitam que as casas
de jogos se empenhem no negócio.

4.2 Espaço Amostral e Eventos


Suponha que um experimento seja realizado sob certas condições fixas. Seja Ω o conjunto de resultados
possı́veis, onde por “resultado possı́vel” entende-se resultado elementar e indivisı́vel do experimento. Ω será
chamado espaço amostral do experimento.
Exemplo 4.1. Lançar um dado equilibrado e observar o número da face superior. É claro que Ω = {1, 2,
3, 4, 5, 6}, pois esses 6 resultados são os únicos possı́veis.
Às vezes, o conjunto de resultados possı́veis não é tão fácil de ser definido, veja o exemplo:

Exemplo 4.2. Selecionar ao acaso um habitante de Maringá e medir sua altura em metros. Quais os resul-
tados possı́veis deste experimento? Números reais entre 0 e ? Supondo que não exista uma altura máxima,
talvez seja razoável fazer Ω = (0, ∞). Mas é evidente que esse conjunto contém resultados impossı́veis.
Outros candidatos para Ω seriam, por exemplo, os intervalos limitados (0, 3) e [1/10, 3]. Os dois interva-
los contém, aparentemente, todos os resultados possı́veis do experimento. Esta propriedade já é suficiente
para os propósitos aqui estudados, e qualquer desses intervalos (incluindo (0, ∞)) pode ser escolhido para
ser espaço amostral. De fato, a própria reta R, embora contenha muitı́ssimos resultados impossı́veis, pode
representar uma escolha muito conveniente para Ω.

43
4.3 Definição Axiomática de Probabilidade ROSSI, R. M. 44

O importante, então, é que Ω contenha todo resultado possı́vel; por isso suponha que a todo resultado
possı́vel corresponda um, e somente um, ponto ω ∈ Ω; e resultados distintos correspondem a pontos distintos
em Ω, i. e., não pode representar mais de um resultado.
Para uma terminologia uniforme os resultados dos experimentos serão denominados eventos.
Quando se realiza um experimento há certos eventos que ocorrem ou não. Por exemplo, no primeiro
exemplo alguns eventos são:
A = “observa-se um número par”
B = “observa-se o número 2”
C = observa-se um número > 3”.
Note que cada um desses eventos pode ser identificado a um subconjunto de Ω, a saber: A = {2, 4, 6},
B = {2} e C = {4, 5, 6}. Esta identificação costuma ser realizável no caso de um experimento qualquer.

Definição: Seja Ω o espaço amostral do experimento. Todo subconjunto A ⊂ Ω será chamado evento.
Ω é o evento certo, ϕ o evento impossı́vel. Se ω ∈ Ω, o evento {ω} é dito evento elementar (ou
simples).
Notações de conjuntos e eventos:
A ∪ B é o evento “A ou B”;
A ∩ B é o evento “A e B”;
Ac é o evento “não A” ou Ω − A (isto é, ocorre o evento Ac se, e só se, não ocorre A);
A ⊂ B significa: a ocorrência do evento A implica a ocorrência do evento B;
A ∩ B = ϕ significa: A e B são eventos mutuamente exclusivos ou incompatı́veis.

Definição de Probabilidade
A esta altura pode-se perguntar: a que será atribuı́do probabilidade?
Seja A um evento, i. e., A ⊂ Ω. Desta forma pode-se atribuir probabilidade a A:
#A
P (A) =
#Ω
#A : número de resultados favoráveis a A;
#Ω : número de resultados possı́veis.
Outro método de definir probabilidade é o da frequência relativa: pode-se definir P (A) como o limite da
frequência relativa da ocorrência de A em n repetições independentes do experimento, com n tendendo ao
infinito, isto é:
#A
P (A) = lim
n→∞ n
em que #A é o número de ocorrências de A em n “ensaios” independentes do experimento.
Essa é a definição “frequentista” de probabilidade. Baseia-se na experiência, comum a todos, da estabili-
dade da frequência relativa de ocorrência de eventos, quando é realizado muitas repetições do experimento.
Essa definição foi utilizada por Von Mises na construção de uma teoria de probabilidade.
Observação: Embora nenhuma destas definições - clássica e frequêncial - seja completamente rigorosa,
sendo, portanto, ambas insatisfatórias do ponto de vista teórico, elas servem para que se avance bastante no
conhecimento das principais idéias da Teoria das Probabilidades.

4.3 Definição Axiomática de Probabilidade


Suponha agora que existam as probabilidades em uma certa famı́lia A de eventos, chamados eventos
aleatórios. Suponha também que a todo A seja associado um número real P (A), chamado probabilidade de
A, de modo que os itens a seguir sejam satisfeitos:
1. 0 ≤ P (A) ≤ 1;
2. P (Ω) = 1.
4.4 Propriedades Fundamentais ROSSI, R. M. 45

4.4 Propriedades Fundamentais


Seja P uma probabilidade em uma famı́lia de eventos A. Então e as propriedades a seguir são con-
sequências dos axiomas:

• Se ϕ é o conjunto vazio, então P (ϕ) = 0;


• Se Ac for o evento complementar de A, então P (A) = 1 − P (Ac ) já que P (Ω) = P (A) + P (Ac );

• Se A e B são dois eventos quaisquer e A − B é o complemento de A em relação a B, então


P (A − B) = P (A) − P (A ∩ B).

Prova. Pelo diagrama de Venn podemos notar que A = (A − B) ∪ (A ∩ B) e que A − B e A ∩ B são


disjuntos, logo:
P (A) = P ((A − B) ∪ (A ∩ B)) → P (A) = P (A − B) + P (A ∩ B) → P (A − B) = P (A) − P (A ∩ B);

• Se A e B forem dois eventos quaisquer, então, P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

Prova. Pelo diagrama de Venn podemos notar que A ∪ B = B ∪ (A − B). Uma vez que, B e A − B são
mutuamente exclusivos, segue que:
P (A ∪ B) = P (B ∪ (A − B)) → P (A ∪ B) = P (B) + P (A − B) → P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

• Se A, B e C forem três eventos quaisquer, então:

P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B − P (A ∩ C) − P (B ∩ C) − P (A ∩ B ∩ C).

Exemplo 4.3. Se A e B são eventos de A mutuamente exclusivos, e é conhecido que P(A)=0,20 enquanto
P(B)=0,30, pode-se avaliar varias probabilidades:

a. P (Ac ) = 1 − P (A) = 0, 80

b. P (B c ) = 1 − P (B) = 0, 70
c. P (A ∪ B) = P (A) + P (B) = 0, 2 + 0, 3 = 0, 5

d. P (B ∩ A) = 0
e. P (Ac ∩ B c ) = P ((A ∪ B)c ), pela Lei de Morgan = 1 − P (A ∪ B) = 1 − (P (A) + P (B)) = 0, 5

Exercı́cio 4.1. Suponha que os eventos A e B não sejam mutuamente exclusivos e que P (A) = 0, 20,
P (B) = 0, 30 e P (B ∩ A) = 0, 10. Então, calcule as mesmas probabilidades do exemplo anterior.
Exercı́cio 4.2. Entre os 1.820 indivı́duos em um estudo, 30 sofriam de tuberculose e 1.790 não. Raios X
do tórax foram administrados para todos; 73 tiveram raio X positivo – o que implica evidência significante
de doença inflamatória – enquanto os resultados dos outros 1.747 foram negativos. Os dados pra esse estudo
são apresentados a seguir:
Raio X Tuberculose Total
Não Sim
Negativo 1.739 8 1.747
Positivo 51 22 73
Total 1.790 30 1.820
Escolhido um individuo ao acaso, qual a probabilidade:
a) de ter raio X negativo? b) de ter tuberculose e o raio X positivo?
4.5 Probabilidade Condicional ROSSI, R. M. 46

4.5 Probabilidade Condicional


Definição: Se A e B são eventos tal que P (B) > 0, a probabilidade condicional de A dado B é definida
por:

P (A ∩ B)
P (A|B) = .
P (B)
Do diagrama de Venn se A e B são desenhados de modo que áreas de A, B e A ∩ B sejam proporcionais
às suas probabilidades, então P (A|B) é a proporção do evento B ocupada pelo evento A.

Note que P (A|B), é realmente uma probabilidade. Consequentemente as propriedade de probabilidade


são mantidas, por exemplo: P (Ac |B) = 1 − P (A|B).
Decorre da definição que:
P (A ∩ B) = P (B)P (A|B) ou P (A ∩ B) = P (A)P (B|A).
Esta igualdade se generaliza: sendo A, B e C eventos aleatórios, tem-se
P (A ∩ B ∩ C) = P (A)P (B|A)P (C|A ∩ B).
Isto pode ser visto pelo diagrama, pensando nas probabilidades de todos os eventos como proporcionais
às suas áreas:
P (A ∩ B ∩ C) = P (A ∩ B)P (C|A ∩ B) = P (A)P (B|A)P (C|A ∩ B).

Exercı́cio 4.3. Para os dados do exercı́cio anterior, escolhido um indivı́duo ao acaso, qual a probabilidade:
a) de ter raio X negativo e ser tubérculo?
b) de ter tuberculose, dado que o resultado do raio X foi negativo?
c) de ter raio X positivo, dado que não é tuberculoso?
Teorema da Probabilidade Total: Se a sequência (finita ou enumerável) de eventos aleatórios B e A1 ,
A2 , ... formar uma partição de Ω, i.é., se são eventos aleatórios mutuamente exclusivos e exaustivos,
os Ai são disjuntos (2 a 2) então ∪Ai = Ω, então:

P (B) = P (Ai )P (B|Ai ).
i
4.5 Probabilidade Condicional ROSSI, R. M. 47

Teorema de Bayes:

Considerando o Teorema da Probabilidade Total, segue que:


P (B|Ai )P (Ai )
P (Ai |B) = ∑
n .
P (B|Ai )P (Ai )
i=1

Exemplo 4.4. Uma caixa contém 5 bolas brancas e 3 bolas pretas. Duas bolas são retiradas simultaneamente
ao acaso e substituı́das por 3 bolas azuis. Em seguida, duas novas bolas são retiradas ao acaso da caixa.
a) calcular a probabilidade de que essas duas últimas bolas sejam da mesma cor;
b) se as duas ultimas bolas retiradas forem uma branca e uma preta, calcular a probabilidade de que, na
primeira extração, tenham sido duas bolas brancas.
Solução:

a) Uso do teorema da probabilidade total .

Para a primeira retirada de duas bolas, os eventos


E1 : saı́rem duas bolas brancas
E2 : sair uma bola branca e uma preta
E3 : saı́rem duas bolas pretas
formam uma participação de Ω, isto é, são mutuamente exclusivos e exaustivos tal que:
5 4 10
P (E1 ) = × =
8 7 28
5 3 15
P (E2 ) = P (BP ) + P (P B) = 2 × × =
8 7 28
3 2 3
P (E3 ) = × =
8 7 28
Observe que P (E1 ) + P (E2 ) + P (E3 ) = 1
Agora sendo F : duas últimas bolas da mesma cor, podemos calcular as P (F |Ei ), cada uma sendo
calculada, em cada caso, pela soma das probabilidades de saı́rem duas brancas, duas pretas ou duas azuis.
Para isso basta analisar a nova composição da caixa condicionada à ocorrência de cada um dos eventos
da famı́lia Ei . Teremos:
3 2 3 2 3 2 9
P (F |E1 ) = P (BB|E1 ) + P (P P |E1 ) + P (AA|E1 ) = × + × + × =
9 8 9 8 9 8 36
4 3 2 1 3 2 10
P (F |E2 ) = P (BB|E2 ) + P (P P |E2 ) + P (AA|E2 ) = × + × + × =
9 8 9 8 9 8 36
5 4 1 0 3 2 13
P (F |E3 ) = P (BB|E3 ) + P (P P |E3 ) + P (AA|E3 ) = × + × + × =
9 8 9 8 9 8 36
Finalmente, utilizando a equação da probabilidade total, temos que:
10 9 15 10 3 13 579
P (F ) = P (E1 )P (F |E1 ) + P (E2)P (F |E2 ) + P (E3 )P (F |E3 ) = × + × + × = ≃
28 36 28 36 28 36 1008
0, 5744.

b) A solução desta parte é dada pelo teorema de Bayes. Seja G : as duas últimas bolas retiradas serem
uma preta e uma branca, temos que:
4.6 Independência Estatı́stica ROSSI, R. M. 48

3 3 3 3 9
P (G|E1 ) = P (P B|E1 ) + P (BP |E1 ) = × + × =
9 8 9 8 36
4 2 4 2 8
P (G|E2 ) = P (P B|E2 ) + P (BP |E2 ) = × + × =
9 8 9 8 36
5 1 5 1 5
P (G|E3 ) = P (BP |E3 ) + P (P B|E3 ) = × + × =
9 8 9 8 36
O denominador da formula de Bayes é a probabilidade do evento que ocorreu dado pelo teorema da
probabilidade total. No caso
∑3 10 9 15 8 3 5 225
P (G) = P (Ei )P (G|Ei ) = × + × + × =
i=1 28 36 28 36 28 36 1008
Logo pela formula de Bayes
10 9
P (E ∩ G) P (Ei )P (G|Ei ) × 90
P (E1 |G) = = = 2822536 = = 0, 4.
P (G) P (G) 225
1008
∑3
Exercı́cio 4.4. Encontrar P (E2 |G), P (E3 |G) e somas P (Ei |G).
i=1

Exemplo 4.5. Experimento de duas etapas (experimento composto). Supor que uma caixa contenha três
moedas: duas honestas e uma de duas caras. Retirar uma moeda ao acaso e jogá-la. Pergunta: qual a
probabilidade condicional da moeda ter sido a de duas caras, dado que o resultado final foi cara?
Solução: Nesse experimento, deseja-se calcular a probabilidade de um evento determinado pela primeira
etapa dado um evento determinado pela segunda etapa. Sejam, então A1 = “moeda retirada é honesta”,
A2 = “moeda retirada é a de duas caras” e B = “resultado final é cara”.
Aplicando a fórmula de Bayes, tem-se:
1
P (B|A2 )P (A2 ) 1× 1
P (A2 |B) = = 3 = .
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) 1 1 2 2
1× + ×
3 3 3
Esse resultado pode ser interpretado em termos de freqüência relativa: se o experimento fosse repetido
independentemente um grande número de vezes, então a moeda de duas caras seria a escolhida na primeira
etapa de aproximadamente metade dos experimentos em que o resultado final fosse cara.

4.6 Independência Estatı́stica


Definição: Os eventos aleatórios A e B são independentes se P (A ∩ B) = P (A)P (B).
Obs.: Eventos de probabilidade 0 (zero) ou 1 são independentes de qualquer outro:
se P (A) = 0, então P (A ∩ B) = 0 e A e B são independentes;
se P (B) = 1, então P (A ∩ B) = P (A) − P (A ∩ B c ) e, como A ∩ B c ⊂ B c implica P (A ∩ B c ) ≤ P (B c ) = 0,
tem-se que P (A ∩ B c ) = 0 e P (A ∩ B) = P (A) = P (A)P (B). Logo A e B são independentes.
Exemplo 4.6. No experimento em que os eventos A: ”observa-se um número par” e Ac : “observa-se um
número ı́mpar” em que Ω : {1, 2, 3, 4} não são independentes. Intuitivamente, porque não são compatı́veis,
1
e formalmente, porque P (A ∩ Ac ) = P (ϕ) = 0 ̸= = P (A)P (Ac ).
4

4.7 Variável Aleatória Discreta e Contı́nua


São provenientes de Experimentos Aleatórios (todos as possibilidades são equiprováveis, isto é, tem
a mesma chance de ocorrência). As v.as. geralmente são representadas por letras maiúsculas A, X, Y ou W,
que podem assumir qualquer um dos conjuntos de valores que lhe são atribuı́dos.
Exemplo 4.7. Em um experimento de lançar uma moeda e observar a sua face, existem duas possibili-
dades:“Cara ou Coroa“. Considerando uma v.a. discreta X: “número de caras em dois lançamentos“,
temos: {
Cara: c
possibilidades {cc,ck,kc,kk}: → X : {0, 1, 2}.Muitos experimentos produzem resultados não-
Coroa: k
numéricos. Antes de analisá-los, é conveniente transformar seus resultados em números, o que é feito através
4.7 Variável Aleatória Discreta e Contı́nua ROSSI, R. M. 49

da variável aleatória (v.a.), que é uma regra de associação de um valor numérico a cada ponto do espaço
amostral.
As variáveis aleatórias podem ser discretas, contı́nuas ou mistas. No caso discreto, a distribuição de pro-
babilidade pode ser caracterizada por uma função de probabilidade, que indica diretamente as probabilidades
associadas a cada valor.
O passo fundamental para se entender uma v.a. é associar a cada valor a sua probabilidade, obtendo
o que se chama uma distribuição de probabilidades, que fica caracterizada pelos valores da v.a. X e pela
função que associa a cada valor uma probabilidade. Esta função é chamada função de probabilidade.
No caso discreto, a função p(xi ) que associa a cada valor xi (de uma variável aleatória discreta X) sua
probabilidade de ocorrência, isto é:
p(xi) = P (Xi = xi ) = p.
Para que uma função p(x) seja uma distribuição de probabilidade, é necessário que:

1. p(x) ≥ 0;

2. p(x) = 1 (somatório para todos os valores de x do domı́nio de X);
3. P (X = x) = p(x).

No caso contı́nuo, a distribuição de probabilidade é caracterizada pela função de densidade de probabi-


lidade, que é uma função contı́nua gozando das seguintes propriedades:

1. f (x) ≥ 0;
∫b
2. f (x)dx = P (a ≤ x ≤ b) (área sobre a curva f (x) entre os pontos a e b é a probabilidade entre a e b);
a



3. f (x)dx = 1.
−∞

Para melhor entender a abrangência do conceito de v.a., é necessário proceder a algumas etapas assim
como estudar caracterı́sticas gerais das distribuições das v.a. para as distribuições mais importantes, que
descrevem um grande número de fenômenos aleatórios. Neste texto será apresentado apenas conceitos
básicos.

4.7.1 Esperança Matemática de uma Variável Aleatória


A Média ou Esperança matemática de uma variável aleatória é definida como:

• Para variáveis aleatórias discretas:



E(X) = µ(X) = xi P (xi ).
i

• Para variáveis aleatórias contı́nuas, por:


∫∞
E(X) = xf (x)dx.
−∞

Propriedades da Média:

1. E(k) = k, k é uma constante;


2. E(kX) = kE(X);
3. E(X ± Y ) = E(X) ± E(Y );
4. E(X ± k) = E(X) ± k.
4.7 Variável Aleatória Discreta e Contı́nua ROSSI, R. M. 50

4.7.2 Variabilidade de uma Variável Aleatória


A Variância, o Desvio-padrão e o Coeficiente de Variação são parâmetros que caracterizam a
variabilidade das variáveis aleatórias, sendo de grande importância.
A Variância de uma Variável Aleatória é definida por:

σ 2 = σ 2 (X) = E[(X − µx )2 ] = E(X2) − [E(X)]2 ,

em que, de acordo com a definição da média, tem-se:



E(X 2 ) = x2i P (xi ),
i

para variáveis aleatórias discretas, e


∫∞
E(X 2 ) = x2 f (x)dx,
−∞

e para variáveis aleatórias contı́nuas.


Propriedades da Variância:

1. σ 2 (k) = 0, k é uma constante;


2. σ 2 (kX) = k 2 σ 2 (X);

3. se X e Y são variáveis aleatórias independentes, σ 2 (X ± Y ) = σ 2 (X) + σ 2 (Y );


4. σ 2 (X ± k) = σ 2 (X).

O Desvio-padrão de uma Variável Aleatória é a raiz quadrada positiva da variância. Tem a vantagem
de ser expresso na mesma unidade da variável. Suas propriedades decorrem da variância. É denotado por σ
ou σ(X).
σ
O Coeficiente de Variação de uma Variável Aleatória é definido como: CV = .
µ(X)
É uma medida adimensional da dispersão. É utilizado para comparar conjuntos de dados quanto a
dispersão.
Capı́tulo 5

Distribuições de Probabilidade

O objetivo da Inferência Estatı́stica é obter afirmações sobre uma dada caracterı́stica da população, na
qual se tem interesse, a partir de informações colhidas de uma amostra.
Essa caracterı́stica de interesse pode ser representada por uma variável aleatória.
Se informações completa sobre a distribuição de probabilidade da variável em estudo, fosse conhecida
não haveria necessidade de colher uma amostra. Então, toda afirmação desejada seria obtida através desta
distribuição.
Mas isso raramente acontece. A informação que se tem a respeito da variável é parcial ou nada se conhece.
Exemplos:
• a altura dos brasileiros adultos, apresenta uma distribuição Normal?
• a prevalência (proporção) de uma determinada doença infecciosa segue uma distribuição Binomial?
• o número de filhos de um casal humano segue uma distribuição de Poisson ?
• o tempo de vida de pacientes soropositivos segue uma distribuição Exponencial?
Se não há informações nem sobre os parâmetros, nem sobre a forma da curva, então, o uso de uma
amostra nos dá uma idéia sobre o comportamento da variável na população. Através de suas carac-
terı́sticas e através de testes de aderência, podemos verificar qual o modelo probabilı́stico (conhecido)
será mais adequado aos dados.
Muitas vezes isto não acontece. Nestes casos um novo modelo deverá ser produzido, ou a distribuição
é produzida através de simulação computacional.

5.1 Distribuição Binomial


Considere n ensaios independentes e todos com a mesma probabilidade de sucesso p.
A variável aleatória discreta que conta o número total de sucessos é denominada Binomial com parâmetros
n e p, isto é
X ∼ Bin(n; p)
onde sua função de probabilidade é dada por:
( )
n x n−x
P (X = x) = p q , q = 1 − p; x = 0, 1, 2, ..., n.
x
Exemplo 5.1. Uma certa doença pode ser curada através de procedimentos cirúrgicos em 80% dos casos.
Dentre os que têm essa doença, sorteamos 15 pacientes que serão submetidos à cirurgia.
Fazendo alguma suposição adicional que julgar necessária. Qual a probabilidade de todos serem curados?
X ∼ Bin(15; 0, 8)
( )
15
P (X = 15) = 0, 815 0, 215−15
15
≃ 0, 0352 ou 3, 52%.

51
5.2 Distribuição de Poisson ROSSI, R. M. 52

Obs.: Se X tem uma distribuição Binomial então:

Média : E(X) = np

e
Variância : V ar(X) = npq.

5.2 Distribuição de Poisson


Uma variável X tem distribuição de Poisson com parâmetro λ > 0 se sua função de probabilidades é dada
por
λe−λ
P (X = x) = , x = 0, 1, 2, ...
x!
com parâmetro λ sendo usualmente referido como a taxa de ocorrência. A notação utilizada será

X ∼ P o(λ).

O modelo Poisson é um modelo discreto muito utilizado em experimentos biológicos e, nesses casos, λ é
a frequência média ou esperada de ocorrências num determinado intervalo de tempo.
Exemplo 5.2. Chegada de pacientes em um pronto socorro. Suponha que o número de pacientes que chegam
a um pronto socorro de uma pequena cidade durante a madrugada tenha distribuição de Poisson com média
3 (λ = 3). Calcular as probabilidades de chegadas desses pacientes:
3e−3
Solução: Para X valendo 0 temos P (X = 0) = = 0, 05. Para os demais (x = 1, 2, ...) o cálculo é
0!
análogo e os resultados estão na Tabela 5.1.

Tabela 5.1: Distribuição de Poisson com parâmetro λ = 3.


x P(X = x) x P(X = x)
0 0,050 7 0,022
1 0,149 8 0,008
2 0,224 9 0,003
3 0,224 10 0,001
4 0,168 11 0,000
5 0,101 12 0,000
6 0,050 ≥ 13 ≈0

5.3 Distribuição Normal


Esta distribuição é muito importante na teoria e na aplicação de estatı́stica.
A distribuição Normal foi inicialmente estudada no século XVIII quando foi observado que os erros de
mensurações seguem uma distribuição em forma de sino. Ela foi apresentada na forma matemática em
1733 por DeMoivre, que derivou-a como uma forma limitante da distribuição binomial. Esta distribuição
foi também descoberta por Laplace por volta de 1775. Devido aos erros históricos, seu descobrimento tem
sido atribuı́do a Gauss, porém suas primeiras publicações com referência a ela apareceu em 1809. Várias
tentativas foram feitas durante os séculos dezoito e dezenove para estabelecer sua distribuição como a lei
básica de probabilidade para todas as variáveis aleatórias; assim o nome normal foi aplicado.
A maioria dos fenômenos da natureza, em especial os biológicos, apresenta variações dentro de um
intervalo definido.
Se coletássemos os dados quanto ao peso de mil indivı́duos, encontrarı́amos diversos valores, dos quais
haveria pequena quantidade de baixos e altos, e grande quantidade em torno dos valores centrais.
Numa representação gráfica dos dados obtidos, encontrarı́amos uma distribuição normal, conforme Figura
5.1.
5.3 Distribuição Normal ROSSI, R. M. 53

Figura 5.1: Distribuição Normal.

A Distribuição de Probabilidade Normal, ou Distribuição Gaussiana (curva de Gauss), se caracteriza por


reunir um grande número de valores em torno da média, que diminuem gradualmente de frequência à medida
que se afastam dela.
A distribuição de probabilidade é dada por:
( )2
1 x−µ
1 −
P (X = x) = √ e 2 σ , − ∞ < x < +∞
σ 2π

X ∼ N (µ, σ)
Lê-se: O conjunto de dados X, têm distribuição Normal com média : µ e desvio-padrão : σ.
Devido a complexidade da função de probabilidade, fazemos uso da Tabela Normal-Padrão ou Normal-
Reduzida, construı́da através da transformação na variável X:
X −µ
Z= ∼ N (0, 1)
σ
Caracterı́sticas:
1. é contı́nua;
2. a curva em forma de sino, que engloba o total de frequências ou 100%;
3. é simétrica: a média (µ) = a moda (Mo ) = a mediana (Md );
4. é unimodal;
5. o desvio-padrão é σ;
6. a curva de inflexão ocorre nos pontos x = µ ± σ;
Como já dissemos, a área subordinada à curva normal representa 100% das frequências. Em torno da
média determinamos intervalos com utilização do desvio-padrão, conforme abaixo:
µ±σ = 68, 26%
µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%
Exemplo 5.3. Pressão sistólica em jovens saudáveis.
Suponha que a pressão arterial sistólica em pessoas jovens gozando de boa saúde tenha distribuição
N (120, 10) mmHg.
Qual é a probabilidade de se encontrar uma pessoa com pressão sistólica acima de 140 mmHg ?
Solução:
X −µ 140 − 120
Z= = =2
σ 10
P (X ≥ 140) = P (Z ≥ 2) = P (Z ≤ −2) = 0, 0228 ou 2, 28%.
Isto é, 2, 28% das pessoas jovens e sadias têm pressão sistólica acima de 140 mmHg.
5.4 Distribuição Exponencial ROSSI, R. M. 54

Exemplo 5.4. O peso ( mg) de um determinado medicamento é denotada por X e é distribuı́da como N(800,
12). Um técnico em farmácia ao testá-lo requer que ele tenha peso de pelo menos 772 mg. Uma amostra do
medicamento é selecionada aleatoriamente e testada.

Solução: Para encontrar P (X ≥ 772), primeiro calculamos:

P (X ≥ 772) = 1 − P (Z < −2, 33) = 1 − 0, 001 = 0, 99.

Figura 5.2: P(X < 772) onde X ˜N(800, 12).

5.4 Distribuição Exponencial


Uma variável aleatória X, que toma todos os valores não negativos, terá uma distribuição exponencial
com parâmetro λ > 0, se sua função de densidade for dada por:
{
λe−λx ; x ≥ 0
f (x) =
0; c.c.

onde o parâmetro λ é uma constante real positiva.


1 1
Sua média é dada por E(X) = e sua variância por V (X) = 2 .
λ λ
Obs.: Uma informação útil é que P (T ≤ x) = 1 − e−λx , x ≥ 0.
Exemplo 5.5. A vida útil de um componente eletrônico pode ser representada por uma função densidade
exponencial com razão de falha 0, 5 falhas por hora (isto é, λ = 0, 5). O tampo médio de falhas, E(X), é
de 2 horas. Suponha que se deseje determinar a fração dos tais componentes que irão falhar antes do tempo
médio ou tempo de vida esperado.
Solução: Como P (T ≤ 2) = 1 − e−0,5×2 = 0, 6321. Neste caso, 63,212% dos ı́tens irão falhar antes de
2 horas.

Figura 5.3: A média de uma distribuição exponencial.


Capı́tulo 6

Inferência Estatı́stica

6.1 Introdução
Inferência Estatı́stica ou Estatı́stica indutiva é a parte da estatı́stica que utiliza métodos cientı́ficos para
fazer afirmações e tirar conclusões sobre caracterı́sticas ou parâmetros de uma população, baseando-se em
resultados de uma amostra. O próprio termo “indutiva” decorre da existência de um processo de indução, isto
é, um processo de raciocı́nio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões
sobre a realidade no todo. O uso de informações da amostra para concluir sobre o todo faz parte da atividade
diária da maioria das pessoas. Basta observar como uma cozinheira verifica se o prato que ela está preparando
tem ou não a quantidade adequada de sal. Ou ainda, quando uma dona de casa, após experimentar um
pedaço de uma laranja numa banca de feira, decide se as compra ou não. Essas são decisões baseadas em
procedimentos amostrais.
O objetivo é procurar a conceituação formal desses princı́pios intuitivos do dia-a-dia para que possam ser
utilizados cientificamente em situações mais complexas.
É fácil perceber que um processo de inferência ou indução ( em estatı́stica) não pode ser exato. A
Inferência Estatı́stica, entretanto, irá dizer até que ponto pode-se estar errando nas inferências, e com que
probabilidade. Esse fato é fundamental para que uma inferência possa ser considerada estatı́stica, e faz parte
dos objetivos da Inferência Estatı́stica.
Em suma, a Inferência Estatı́stica busca obter resultados sobre as populações a partir das amostras,
dizendo também, qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões
obtidas. Evidentemente, a forma como as inferências serão realizadas irá depender de cada tipo de problema,
conforme será estudado posteriormente.
Segue-se que a teoria da Inferência Estatı́stica recorre intensamente a conceitos e resultados do Cálculo
de Probabilidades.
O objetivo da Inferência Estatı́stica é obter afirmações sobre uma dada caracterı́stica da população, na
qual se tem interesse, a partir de informações colhidas de uma amostra.
Essa caracterı́stica de interesse pode ser representada por uma variável aleatória. Se informações completa
sobre a distribuição de probabilidade da variável em estudo, fosse conhecida não haveria necessidade de
colher uma amostra. Toda afirmação desejada seria obtida através da distribuição da variável, usando-se as
propriedades estudadas anteriormente. Mas isso raramente acontece. A informação que se tem a respeito
da variável é parcial ou nada se conhece. Por exemplo, a altura dos brasileiros adultos, apresenta uma
distribuição normal, mas os parâmetros que a caracterizam (média e variância) são desconhecidos. Em
outros casos, pode-se ter uma idéia da média e variância, mas se desconhece a forma da curva. Ou ainda,
não há informações nem sobre os parâmetros, nem sobre a forma da curva. Então, o uso de uma amostra
permite ter uma idéia sobre o comportamento da variável na população.

55
6.2 Noções de Amostragem ROSSI, R. M. 56

6.2 Noções de Amostragem


Uma questão das mais comuns em planejamentos de pesquisas cientı́ficas é: Por que amostragem?
São quatro as principais razões para o uso de amostragem em levantamento de grandes populações:
Economia. Em geral, torna-se bem mais econômico o levantamento de somente uma parte da população.
Tempo. Em geral a pesquisa por amostragem é bem mais rápida que o censo. Numa pesquisa eleitoral,
a três dias de uma eleição presidencial não haveria tempo suficiente para pesquisar a população de eleitores
do paı́s, mesmo que houvesse recurso financeiros em abundância.
Confiabilidade dos dados. Quando se pesquisa uma número reduzido de elementos, pode-se dar mais
atenção aos casos individuais, evitando erros nas respostas.
Operacionalidade. É mais fácil realizar operações de pequena escala. Um dos problemas tı́picos nos
grandes censos é o controle dos entrevistados.

Situações em que o uso da amostragem NÃO é interessante

População pequena. Sob o enfoque de amostragem aleatórias que será estudado no próximo item,
se a população for pequena (digamos de 50 elementos ou menos) para se ter uma amostra capaz de gerar
resultados precisos para os parâmetros da população, será necessário uma amostra relativamente grande (em
torno de 80% da população).
Caracterı́stica de fácil mensuração. Mesmo que a população não seja tão pequena, mas a variável
que se quer observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por
exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de
trabalho, pode-se entrevistar toda a população no próprio local de trabalho.
Necessidade de alta precisão. A cada dez anos o IBGE realiza um censo demográfico para estudar
diversas caracterı́sticas da população brasileira. Dentre estas caracterı́sticas têm-se o parâmetro número de
habitantes residentes no paı́s, que é fundamental para o planejamento do paı́s. Desta forma este parâmetro
precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.

6.2.1 Plano de Amostragem


Para se fazer um plano de amostragem é necessário ter bem definidos os objetivos da pesquisa, a população
a ser amostrada, bem como os parâmetros que precisam ser estimados para atingir os objetivos da pesquisa.
Num plano de amostragem deve constar a definição da unidade de amostragem, a forma de seleção dos
elementos da população e o tamanho da amostra.
Amostras Probabilı́sticas e Não Probabilı́sticas
A seleção dos elementos que farão parte da amostra pode ser feita sob alguma forma de sorteio ou
por escolha deliberada. As amostras obtidas através de algum tipo de sorteio são chamadas amostras
probabilı́sticas ou aleatórias.
Estes tipos de amostragens são particularmente interessante por permitir a utilização das técnicas clássicas
inferência estatı́sticas, facilitando a análise dos dados e fornecendo maior segurança ao generalizar resultados
da amostra para a população.
As amostras não aleatórias ou não probabilı́sticas podem levar a resultados úteis, não se prestam, entre-
tanto, à utilização de processos estatı́sticos inferências.
Exemplo 6.1. Exemplos de casos de amostragens não probabilı́sticas:

• Amostragem sem critério (escolha desordenada);

• Amostragem intencional ou por conveniência (o pesquisador escolhe certos elementos para a amostra);
• Amostragem com desigualdade de acesso aos elementos da população (há elementos com mais facilidade
de figurarem na amostra);
• Outras.
6.2 Noções de Amostragem ROSSI, R. M. 57

Alguns Tipos de Amostragens Probabilı́sticas

6.2.2 Amostragem Aleatória Simples (AAS)


Para a seleção de uma amostra aleatória simples é necessário ter uma lista completa dos elementos da
população (ou de unidades de amostragens apropriadas). Este tipo de amostragem consiste em selecionar a
amostra através de um sorteio, sem restrição
Seja uma única população com N elementos. Uma forma de extrair uma amostra aleatória simples de
tamanho n, sendo n < N , é identificar os elementos da população em pequenos pedaços de papel e retirar,
ao acaso, n pedaços. Será considerado sorteio realizado sem reposição.
A amostragem aleatória simples tem a seguinte propriedade: qualquer subconjunto da população, com
o mesmo número de elementos, tem a mesma chance de fazer parte da amostra. Em particular tem-se que
cada elemento da população tem a mesma probabilidade de pertencer à amostra.
O uso de tabelas de números aleatórios
As tabelas de números aleatórios facilitam o processo de seleção de uma amostra aleatória simples. Tais
tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, 3, ..., 9}, com reposição. Uma
parte destas tabelas é apresentada a seguir.

Figura 6.1: Esquema de uma Amostragem Aleatória Simples e uma Tabela de Números Aleatórios.

Procedimento:

1. Numere todos os elementos da população;

2. Sorteie uma linha ou coluna da tabela de números aleatórios;


3. Leia os números na tabela de números aleatórios de modo que o número de algarismos em cada um
seja igual ao número de algarismos do último da sua listagem. Assim, se o último número é 56, devem
ser lidos números com dois algarismos;

4. Despreze quaisquer números que não correspondam a números da lista. No caso de amostragem sem
reposição, despreze também os números que sejam repetições de números lidos anteriormente. Continue
o processo até obter o número desejado de observações;
5. Use os números assim escolhidos para identificar os ı́tens da lista a serem incluı́dos na amostra.
6.2 Noções de Amostragem ROSSI, R. M. 58

6.2.3 Amostragem Aleatória Simples Sistemática (AASist)


Muitas vezes é possı́vel obter uma amostra de caracterı́sticas parecidas com a amostra aleatória simples,
por um processo bem mais rápido. Por exemplo, tirar uma amostra de 1.000 fichas, dentre uma população
de 5.000 fichas, pode-se tirar, sistematicamente, uma ficha a cada cinco (5.000/1.000 = 5). Para garantir
que cada ficha da população tenha a mesma probabilidade de pertencer á amostra, a primeira ficha deve ser
sorteada, dentre as cinco primeiras.
Numa amostragem sistemática a relação N/n é chamada intervalo de seleção. No exemplo das fichas o
intervalo de seleção é 5.000/1.000 = 5.

Figura 6.2: Esquema de uma Amostragem Aleatória Sistemática.

6.2.4 Amostragem Aleatória por Conglomerados (AAC)


A população é dividida em diferentes conglomerados (grupos), extraindo-se uma amostra apenas dos
conglomerados selecionados, e não de toda a população. O ideal seria que cada conglomerado representasse
tanto quanto possı́vel o total da população. Na prática, selecionam-se os conglomerados geograficamente.
Escolhem-se aleatoriamente algumas regiões, em seguida algumas sub-regiões e finalmente, alguns lares.
Esse processo possibilita ao pesquisador entrevistar apenas poucas pessoas.
Suponha que desejamos selecionar uma amostra de domicı́lios na cidade de Maringá. Para se proceder,
a seleção precisamos de uma lista atualizada dos endereços dos domicı́lios.
A elaboração dessa lista é uma tarefa que requer um considerável esforço fı́sico e financeiro. É muito mais
conveniente identificarmos no mapa da cidade alguns conglomerados naturais ou seja, as ruas ou quarteirões.
Algumas vezes é possı́vel a construção de conglomerados, nesse caso a melhor técnica consiste em se
colocar num mesmo conglomerado unidades elementares com caracterı́sticas ou valores bem diferentes. Isto
é justamente o princı́pio oposto da estratificação onde os estratos eram formados com unidades elementares
com caracterı́sticas ou valores bem próximos. Se cada conglomerado é uma miniatura da população, nó
podemos fazer boas estimativas pela seleção de poucos conglomerados.
No entanto rara são às vezes que temos oportunidade de construir conglomerados, pois na maioria dos
casos somos obrigados a nos valer de conglomerados naturais, como ruas, quarteirões ou municı́pios. Isso
devido ao fato de que é necessário se ter os limites dos conglomerados plenamente identificados no campo.
Normalmente os conglomerados naturais não são tão eficientes, por exemplo as pessoas que moram numa
mesma rua tem aproximadamente as mesmas caracterı́sticas (renda). Esse fato faz com que o conglomerado
seja internamente bem homogêneo.
6.2 Noções de Amostragem ROSSI, R. M. 59

Figura 6.3: Congromerados da cidade de Maringá e Região.

6.2.5 Amostragem Aleatória Estratificada (AAE)


A técnica de amostragem estratificada consiste em dividir a população em subgrupos, que são denomi-
nados de estratos. Estes estratos devem ser internamente mais homogêneos do que a população toda, com
respeito às variáveis em estudo. Por exemplo, para estudar alguns parâmetros, de um conjunto de hotéis,
pode-se estratificar esta população por quantidade de estrelas, pelo tipo de acomodações (quarto, aparta-
mento, chalé etc), ou pela distância até o cento da cidade. Deve-se escolher um critério de estratificação
que forneça estratos bem homogêneos, com respeito ao que se está estudando. Neste contexto, um prévio
conhecimento sobre a população em estudo é fundamental. Sobre os diversos estratos da população, são
realizadas seleções aleatórias, de forma independente. A amostra completa é obtida através da agregação
das amostras de cada estrato

Amostragem Aleatória Estratificada Proporcional (AAEp)


Neste caso particular de amostragem estratificada, a proporcionalidade do tamanho de cada estrato da
população é mantida na amostra.
Por exemplo: se um estrato corresponde a 20% do tamanho da população ele também deve corresponder
a 20% da amostra.
A amostragem estratificada proporcional garante que cada elemento da população tem a mesma probabi-
lidade de pertencer a amostra e a soma dos tamanhos dos subgrupos na amostra deve ser igual ou maior ao
tamanho da amostra. Desde que no problema em estudo, os estratos formam subgrupos mais homogêneos
do que a população como um todo, uma amostra estratificada proporcional tende a gerar resultados mais
precisos, quando comparada com uma amostra aleatória simples.

Figura 6.4: Ilustração de uma amostragem estratificada proporcional.


6.2 Noções de Amostragem ROSSI, R. M. 60

Exemplo 6.2. A população de N=1.200 indivı́duos de uma escola é composta por 20% de professores, 20%
de servidores e 60% de alunos. Separam-se os grupos e sorteia-se uma amostra de tamanho 10% de N, com
24 professores, 24 servidores e 72 alunos.

Figura 6.5: Ilustração de uma amostragem estratificada proporcional dos indivı́duos de uma escola.

FONTES DE ERROS

O erro amostral, definido como a diferença entre uma estatı́stica (calculada a partir de uma amostra de
n elementos) e o verdadeiro valor do parâmetro (caracterı́stica de uma população de N elementos), parte do
princı́pio de que as n observações que compõem a amostra são obtidas sem erro. Na prática, isso geralmente
não acontece.
Havendo erros ou desvios nos dados da própria amostra, a diferença entre a estatı́stica e o parâmetro
pode ser maior que o limite tolerável, que será usado para o cálculo do tamanho da amostra. Por isso, o
planejamento e a execução da pesquisa devem ser feitos com muita cautela, para evitar ou reduzir, os erros
nos próprios dados da amostra, conhecidos como erros não amostrais. Alguns dos erros são:

• População acessı́vel diferente da população alvo;


Exemplo: Em uma pesquisa sobre febre amarela no Amazonas, a investigação se dá no centro da cidade
ao invés de ser a beira dos rios e/ou mata.

• Falta de resposta;
Exemplo: Geralmente em questionários em que não há orientação ao indivı́duo selecionado, ou então
quando a pergunta cria dúvida ou constrangimento em sua resposta.

• Erros de mensuração;
Exemplo: Aparelhos desajustados e/ou cansaço do experimentador (ou inexperiência).
• Efeito placebo;
Exemplo: O indivı́duo ”acredita” realmente que tomou o medicamento com o princı́pio ativo, certo
que obteve melhoras significativas (efeito psicológico).
• Efeito experimentador;
Exemplo: Quando o pesquisador (dono de uma empresa, por exemplo) influencia involuntariamente
nas respostas ao questionar se o seu funcionário está satisfeito com salário.
6.3 Distribuição Amostral ROSSI, R. M. 61

6.3 Distribuição Amostral


Já foi visto, que o problema da Inferência Estatı́stica é fazer uma afirmação sobre parâmetros da população
através da amostra. Suponha que uma afirmação deva ser feita sobre um parâmetro populacional (média,
variância ou qualquer outra medida). Será utilizado uma amostra aleatória simples, com reposição, de n
elementos sorteados dessa população. A decisão será baseada em uma estatı́stica calculada em função da
amostra, (X1 , X2 , ..., Xn ).
A validade da resposta seria melhor compreendida se fosse conhecido o que acontece com a estatı́stica,
quando todas as amostras de uma população conhecida são retiradas, segundo o plano amostral adotado.
Isto é, qual a distribuição da estatı́stica quando (X1 , X2 , ..., Xn ) assume todos os valores possı́veis. Esta
distribuição é chamada de distribuição amostral da estatı́stica e desempenha papel fundamental na teoria
de Inferência Estatı́stica. Didaticamente, tem-se o seguinte esquema:

1. Uma população X, com um certo parâmetro de interesse;


2. Todas as amostras retiradas da população, de acordo com um certo procedimento;

3. Para cada amostra, calcula-se o valor da estatı́stica;

4. Os valores da estatı́stica formam uma nova população, cuja distribuição recebe o nome de distribuição
amostral da estatı́stica.

Para a obtenção das distribuições amostrais em sua forma matemática, precisamos entender o Teorema
do Limite Central.

6.3.1 Distribuição Amostral da Média


Considere uma população identificada pela variável X, cujos parâmetros média populacional (µ ) e
variância (σ 2 ), são supostamente conhecidos. Todas as possı́veis amostras aleatórias simples de tamanho n
dessa população, devem ser retirada e para cada uma deve-se calcular x, a média da amostra. Em seguida,
será construı́do a distribuição amostral de e estudadas as suas propriedade.

Teorema do Limite Central

Teorema. Para amostras aleatórias simples (X1 , X2 , ..., Xn ), retiradas de uma população com média
µ e variância σ 2 , a distribuição amostral da média aproxima-se de uma distribuição Normal com média µ e
σ2
variância , quando n → ∞, isto é
n ( )
σ2
X̄ ∼ N µ; .
n

n x1 + x2 + ... + xn σ2
Prova: X̄ = 1
n xi = → E(X̄) = µ e V ar(X̄) = .
i=1 n ( ) n
( ) σ2
Portanto se X ∼ N µ; σ 2 , então X̄ ∼ N µ; ou
n

X̄ − µ
Z= σ ˜N (0; 1) .

n
6.3 Distribuição Amostral ROSSI, R. M. 62

Figura 6.6: Distribuição Amostral.

Verificação da Adequação do Modelo


Na prática não podemos fazer suposições arbitrárias a respeito da distribuição de probabilidade dos
dados, logo usamos de técnicas para fazer uma verificação da adequação do modelo suposto.
A verificação pode ser baseada nas caracterı́sticas do modelo, em gráficos especiais e em testes de
aderência.
Para a distribuição Normal, em especial, sabemos que:

µ±σ = 68, 26%


µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%

Figura 6.7: Faixa de Referência.

Grandes discrepâncias entre as frequências relativas observadas e as probabilidades teóricas acima citadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.
Outros critérios:

• Técnicas Gráficas: Normal-plot, Q-Q-plot e P-P-plot;

• Testes de aderência: Kolmogorov-Smirnov (K-S) [µ e σ conhecidos], Shapiro Wilks (W) e/ou Lilliefors
(L) [µ e σ desconhecidos e estimados pelos dados através de x̄ e s, respectivamente].

Faixas de Referência
Toda medida laboratorial é analisada confrontando-se seu valor com uma faixa padrão.
Isto é tão comum que, na própria apresentação do resultado, muitos laboratórios já indicam os limites
inferiores e superiores para o valor da medida que devem servir de base ao raciocı́nio clı́nico.

• Devemos fixar, inicialmente, o nı́vel de confiança (1 − α)% ou cobertura;

• Calculamos através da amostra de pessoas supostamente saudáveis: x̄ e s.


6.3 Distribuição Amostral ROSSI, R. M. 63

Tabela 6.1: Faixas de Referência.


Cobertura (1 − α)% Faixa
90% x̄ ± 1, 64.s
95% x̄ ± 1, 96.s
99% x̄ ± 2, 58.s
.. ..
. .
(1 − α)% x̄ ± Z α2 .s

Exemplo 6.3. Faixa de referência para identificar o Pseudomonas sp.


Um pesquisador deseja criar um padrão para identificar presença de infecção bacteriana (Pseudomonas
sp) no trato respiratório através de cultura de escarro. Para isto, coletaram-se dados de pessoas sabidamente
sadias e determinou-se o número de colônias encontradas em cada cultura. Foram encontrados os seguintes
resultados, em duas etapas amostrais distintas.
Amostra 1:
20 21 23 24 25 25 25 25 25 25
26 26 27 28 29 29 29 29 29 30
30 30 30 30 30 31 31 31 32 32
32 32 32 33 33 33 34 34 34 35
35 35 36 36 37 37 38 38 41 42
Amostra 2:
17 22 23 23 23 23 24 24 24
24 24 23 25 25 25 25 25 25
25 26 28 28 29 30 30 31 31
35 35 35 36 40 41 41 41 42
51 54 56 56 56 58 60 68 79
0.10

Q-QPlot
40
0.08

35
Freqüências
0.06

amostra
30
0.04

25
0.02
0.0

20

20 25 30 35 40 -2 -1 0 +1 +2

Figura 6.8: Histograma e Q-Q Plot da Amostra 1

Observe através da Figura 6.8 o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição Normal.
Para a Amostra 1, foram realizados alguns testes de normalidade com uso de um software estatı́stico e
indicaram ajuste dos dados já (mais detalhes serão apresentados no capı́tulo referente a Testes de Hipóteses).
Observe através da Figura 6.9 uma assimetria do histograma comparado à normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
normal. Testes confirmam isto para a Amostra 2.
Neste caso duas metodologias distintas deverão ser utilizadas para construir faixas de referência:
6.3 Distribuição Amostral ROSSI, R. M. 64

0.05
Q-=Q Plot

70
0.04

60
0.03
Freqüências

amostra2
50
0.02

40
30
0.01

20
0.00

20 40 60 80 -2 -1 0 1 2

Figura 6.9: Histograma e Q-Q Plot da Amostra 2

• Método de Gauss para a Amostra 1:

[x̄ ± 1, 96s] : [30, 7 ± 1, 96(4, 9)]


[21; 40] colônias - “Adequado”

Observe que devido a normalidade temos praticamente a mesma faixa, utilizando o método dos per-
centis:
[21; 41] colônias - “Adequado”
Sendo assim, considerando esse método, um indivı́duo será considerado ”doente” se tiver com o número
de colônias acima de 41 unidades.
• e Método dos Percentis para a Amostra 2, isto é, obter uma faixa de inclua, por exemplo, 95% dos
elementos, excluindo os 2,5% valores menores e os 2,5 % maiores valores

[22; 68] colônias - “Adequado”

Considerando esse método, um indivı́duo na amostra 2 será considerado ”doente” se tiver com o número
de colônias acima de 68 unidades.
Observe que, se optássemos pelo método de gauss para a amostra 2 terı́amos:

[7; 63] colônias - “Inadequado”

Um teste estatı́stico a ser usado depende do tipo de variável e do tipo de planejamento.

6.3.2 Distribuição Amostral da Diferença de Médias


Analogamente ao caso da média, consideremos o caso em que temos duas populações de modo que o
caráter que estudamos em ambas (X1 e X2 ) são v.a. distribuı́das conforme as leis gaussianas:
( )
X1 ∼ N µ1 ; σ 21
( )
X2 ∼ N µ2 ; σ 22

De cada uma dessas populações, extraem-se, mediante amostragem aleatória simples, amostras que não
têm por que serem necessariamente do mesmo tamanho (respectivamente, n1 e n2 ): X̄1 e X̄2 , então: consi-
derando que σ 21 = σ 22 = σ 2 , tem-se que:
( )
X̄1 − X̄2 − (µ1 − µ2 )
Z= √ ∼ N (0; 1) .
σ n11 + n2
1
6.3 Distribuição Amostral ROSSI, R. M. 65

Quando as variâncias das populações são desconhecidas, mas podemos assumir que, pelo menos, são
iguais, a seguinte estatı́stica distribui-se como uma t de Student com n1 + n2 − 2 graus de liberdade, isto é:
( )
X̄1 − X̄2 − (µ1 − µ2 )
T = √ ∼ tn1 +n2 −2
Ŝ n11 + n2
1

em que Ŝ 2 é a quase-variância amostral ponderada de Ŝ12 e Ŝ22 :

(n1 − 1)Ŝ12 + (n2 − 1)Ŝ22


Ŝ 2 = .
n1 + n2 − 2

6.3.3 Distribuição Amostral da Proporção


Seja uma população em que a proporção de elementos portadores de uma certa caracterı́stica é p. Assim,
a população pode ser considerada como a variável aleatória X, tal que:
{
1, se o indivı́duo possui a caracterı́stica;
X:
0, se o indivı́duo não possui a caracterı́stica.

assim, para n suficientemente grande, pelo Teorema Limite Central, a variável aleatória X que conta o
número de sucessos na amostra terá a distribuição Normal com média np e variância np(1 − p), ou seja,
ˆ
X ∼ N (np; np(1 − p)). Assim, para n → ∞, pode-se considerar a distribuição amostral de p como:
( )
ˆ p(1 − p)
p ∼ N p; .
n

X
em que a proporção de indivı́duos portadores da caracterı́stica na amostra é dada por: p̂ = .
n
6.4 Intervalo de Confiança ROSSI, R. M. 66

6.4 Intervalo de Confiança


Utilizando-se deste teorema, podemos construir um Intervalo de Confiança de (1 − α)% para o parâmetro
de interesse, para um nı́vel de significância, α, fixo.

6.4.1 Intervalo de Confiança para Média


Se a população original é próxima da normal, sua convergência é rápida; já, se a distribuição da população
tem outra distribuição, essa convergência é mais demorada. Como regra prática, aceita-se que para amostras
com mais de 30 elementos a aproximação já pode ser considerada muito boa.
σ
IC(µ) : X̄ ± Z α2 √
n

já que
X̄ − µ
Z= σ ∼ N (0; 1) .

n

Figura 6.10: Intervalo de Confiança.

Exemplo 6.4. Sabe-se que o peso dos recém-nascidos segue uma distribuição normal com um desvio padrão
de 0,75 kg. Se em uma amostra aleatória simples de 100 deles, se obtém uma média amostral de 3 kg e um
desvio padrão de 0,5 kg, o IC(µ) com uma confiança de 95% é dado por:
σ 0, 75
IC(µ) : X̄ ± Z α2 √ = 3 ± 1, 96 √ = 3 ± 0, 147 : [2, 853; 3, 147]kg.
n 100
No caso de amostras pequenas ou no desconhecimento da dispersão populacional, usa-se uma aproximação
através da distribuição t de Student, substituindo σ por s, desvio-padrão amostral.
s
IC(µ) : X̄ ± t(n−1; α2 ) √ .
n

Exemplo 6.5. Suponha o exemplo anterior em que não se conheça a dispersão populacional, assim o IC(µ)
com uma confiança de 95% é dado por:
s 0, 5
IC(µ) : X̄ ± t(n−1; α2 ) √ = 3 ± t(99;2,5%) √ = 3 ± 1, 98(0, 05) : [2, 901; 3, 099]kg.
n 100
6.4 Intervalo de Confiança ROSSI, R. M. 67

6.4.2 Intervalo de Confiança para Diferença de Médias


Se (1 − α)% é o nı́vel de significância com que desejamos estabelecer o intervalo para a diferença das
duas médias, calculamos o valor tn1 +n2 −2 que deixa além de si α/2 da massa da probabilidade de Tn1 +n2 −2 ,
o intervalo de confiança para variâncias desconhecidas será:

( ) 1 1
IC(µ1 − µ2 ) : X̄1 − X̄2 ± tn1 +n2 −2; 2 Ŝ
α +
n1 n2

(n1 − 1)Ŝ12 + (n2 − 1)Ŝ22


sendo Ŝ 2 = .
n1 + n2 − 2
Exemplo 6.6. Deseja-se estudar a influência que pode exercer o tabaco no peso de crianças ao nascer. Para
isso, consideram-se dois grupos de mulheres grávidas (um de fumante e outro de não-fumante) e obtém-se
os seguintes dados sobre o peso (X) de seus filhos:
Mães fumantes → n1 = 35, X̄1 = 3, 6 kg, Ŝ1 = 0, 5 kg
Mães não-fumantes → n2 = 27, X̄2 = 3, 2 kg, Ŝ2 = 0, 8 kg
Em ambos os grupos, os pesos dos recém-nascidos provém de distribuições normais de médias desconhe-
cidas e com variâncias que, embora sejam desconhecidas, podemos supor que sejam as mesmas. É possı́vel
determinar quanto a mãe fumante influi no peso de seu filho !
(n1 − 1)Ŝ12 + (n2 − 1)Ŝ22 (35 − 1)0, 52 + (27 − 1)0, 82
Solução: Ŝ 2 = = = 0, 419 → Ŝ = 0, 6473.
n1 + n2 − 2 35 + 27 − 2
Considerando um nı́vel de confiança de 5%, √ o IC(µ1 − µ2 ) será dado por:
IC(µ1 − µ2 ) : (3, 6 − 3, 2) ± t60;2,5% 0, 6473 351 1
+ 27 = 0, 4 ± 2(0, 6473)(0, 256)
IC(µ1 − µ2 ) : 0, 4 ± 0, 3316 : [0, 068; 0, 731] kg, com o qual pode-se dizer que em um filho de mãe não-
fumante supera o de mãe fumante, está compreendido, com um nı́vel de confiança de 95%, entre 0,068 kg e
0,731 kg.

6.4.3 Intervalo de Confiança para Proporção


Analogamente ao processo de obtenção do IC para a média, podemos obter um IC com uma confiança
de (1 − α)%, para a proporção populacional, considerando um nı́vel de significância, α, fixo:

p̂(1 − p̂)
IC(p) : p̂ ± Z α2 .
n
Exemplo 6.7. Deseja-se estimar o resultado de um referendo mediante uma sondagem. Para isso, realiza-
se uma amostragem aleatória simples com n=100 pessoas e obtêm-se 35% que votarão a favor e 65% que
votarão contra (supomos que não haja indecisos para simplificar o problema a uma variável dicotômica).
Com um nı́vel de significância de 5%, o Intervalo de Confiança para a proporção de favoráveis é dado por:

35 0, 35(1 − 0, 35)
IC(p) : ± 1, 96 = 0, 35 ± 0, 093 : [25, 7; 44, 3]%.
100 100
Portanto, estima-se com 95% de confiança que a proporção de favoráveis ao referendo é de no mı́nimo 25,7%
e no máximo 44,3% ou de 35% com uma margem de erro de 9,3% para mais ou para menos.
6.5 Tamanho da Amostra ROSSI, R. M. 68

6.5 Tamanho da Amostra


O assunto pertence à Teoria da Amostragem. Pode-se, entretanto, calcular, para algumas situações
especiais, o tamanho da amostra necessário para se fazer inferências.

6.5.1 Método Simples


Tamanho de uma amostra aleatória simples. Será abordado cálculo do tamanho da amostra para
amostragem aleatória simples.
A diferença entre a estatı́stica descritiva dos elementos da amostra e o verdadeiro valor do parâmetro
que se deseja estimar como o erro amostral. Para determinar o tamanho da amostra o pesquisador deve
especificar o erro amostral tolerável, ou seja, quanto ele admite errar na avaliação dos parâmetros de
interesse.
A especificação do erro amostral tolerável deve ser feita sob um enfoque probabilı́stico, pois por maior
que seja a amostra, existe sempre o risco do sorteio gerar uma amostra com caracterı́sticas bem diferentes
da população de onde ela foi extraı́da.
O calcular do tamanho mı́nimo de uma amostra aleatória simples é dado por:
Sejam:
N: tamanho (número de elementos) da população;
n: tamanho (número de elementos) da amostra;
n0 : uma primeira aproximação do tamanho da amostra, e
E0 : erro amostral tolerável.
onde
1
n0 = .
E0
Conhecendo N o tamanho da população, pode-se corrigir o cálculo:
N n0
n= .
N + (n0 − 1)

Exemplo 6.8. Com objetivo de conhecer algumas caracterı́sticas dos pacientes de uma clı́nica com 35
pacientes. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas
caracterı́sticas da população de pacientes. Qual deve ser o tamanho mı́nimo da amostra aleatória simples,
tal que se possa admitir, com alta confiança, que os erros amostrais não ultrapassem 4% (E0 = 0,04)?

Solução: Uma primeira aproximação é dada por:


1
n0 = = 625 pacientes.
0, 042
Corrigindo, em função do tamanho N da população, tem-se:

35(625)
n= ≃ 34.
35 + 624
Exemplo 6.9. Suponha que na clinica do Exemplo anterior a população fosse de N = 200 pacientes. Qual
deve ser o tamanho mı́nimo da amostra aleatória simples, tal que se possa admitir, com alta confiança, que
os erros amostrais não ultrapassem 4% (E0 = 0, 04)?

Solução: O valor de n0 continua sendo o mesmo do exemplo anterior, pois não depende de N . Fazendo
a correção em termos do novo valor de N , tem-se:

200(625)
n= ≃ 152.
200 + 624
Exemplo 6.10. Suponha agora que a população fosse de N = 200.000 pacientes.
6.5 Tamanho da Amostra ROSSI, R. M. 69

Solução: Da mesma forma, o valor de n0 continua sendo o mesmo dos exemplos anteriores. E a correção
em termos do novo valor de N , é:
200.000(625)
n= ≃ 623 pacientes.
200.000 + 624

Observe que para manter o mesmo erro amostral, no Exemplo ?? foi necessária uma amostra abrangendo
quase 100% da população; enquanto no Exemplo 6.9 a amostra abrange 76%; e no Exemplo 6.10 abrange
0,3% da população. É, portanto, errônea a idéia de que para uma amostra ser representativa
deva abranger uma percentagem fixa da população.
Tamanho da amostra em subgrupos da população
É muito comum termos interesse em estudar separadamente certos subgrupos da população. Nesta
situação, é preciso calcular o tamanho da amostra para cada uma destas partes. O tamanho total da
amostra vai corresponder à soma dos tamanhos das amostras de cada parte.
O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos
subgrupos da população, por isso, é comum o pesquisador não ser muito exigente na precisão das estimativas
nos subgrupos, tolerando erros amostrais maiores.

6.5.2 Método Inferencial


Erro Tipo I e Tipo II
Muitas vezes temos necessidade de saber:

• Que estatı́sticas serão utilizadas e retiradas dessa amostra?


• Qual o comportamento desta estatı́stica? é razoável?

Dois tipos de erros podem ser cometidos em um TH:

H0
Decisão Verdadeira Falsa
Correto
Não Rejeitar Erro tipo II: β
Probabilidade: (1 − α)
Correto
Rejeitar Erro tipo I: α
Probabilidade: (1 − β)

Figura 6.11: Erro tipo I e Erro tipo II.


6.5 Tamanho da Amostra ROSSI, R. M. 70

Tamanho da Amostra para estimar a Média e a Proporção


Se o objetivo é estimar a média, ou uma proporção, pode-se usar os intervalos de confiança anteriormente
estabelecidos para obter n, o tamanho da amostra. Para isto, é preciso fixar o maior erro aceitável e o nı́vel
de confiança com que se quer trabalhar.
Sendo o tamanho máximo do erro aceitável : e (fixo), com probabilidade (1 − α) (fixo), o intervalo de
confiança de nı́vel 100(1 − α)% serão, respectivamente, para a média e para a proporção, considerando a
população infinita, tem-se:
[ ]
Z α2 so 2 so
Média: n= onde e = Z α2 √
e n
[ ] [ ]
Z α2 2 Z α2 2
Proporção: n= p̂0 (1 − p̂0 ) ou n≤ se p̂ é desconhecido.
e 2e

onde p̂0 e so são estimativas da proporção e da dispersão, respectivamente, obtidos através de uma amostra
piloto, ou de informações populacionais.

Exemplo 6.11. Numa amostra de classificação de veteranos de um colégio com. x̄ = 2, 6 e so = 0, 3, qual


deve ser o tamanho da amostra para que tenhamos 95% de confiança em que erro da estimativa de µ não
supere 0,05?
Solução:
[ ]2
Z α2 so
n =
e
[ ]2
1, 96(0, 3)
=
0, 05
≃ 139.

Exemplo 6.12. Suponha que, em uma amostra de 500 famı́lias que possuem aparelho de televisão em certa
cidade, haja 340 com televisor em cores. Se o objetivo é estimar o número de famı́lias que possuem televisor
em cores, qual o tamanho da amostra necessário para que tenhamos 95% de confiança em que o erro da
estimativa não seja superior a 0,02 ?
Solução: Trate as 500 famı́lias como uma mostra preliminar que fornece a estimativa p̂0 = 0, 68. Então:
[ ]2
Z α2
n = p̂0 (1 − p̂0 )
e
[ ]2
1, 96
= 0, 68(0, 32)
0, 02
≃ 2.090.

Para o caso em que a população é finita (N conhecido), onde a amostragem é sem reposição, temos as
fórmulas para o cálculo do tamanho amostral, respectivamente, para a média e para a proporção:
( )2
N Z α2 so
Média: n= ( )2 ;
(N − 1)e2 + Z α2 so
( )2 ( )2
N p̂0 q̂0 Z α2 N Z α2
Proporção: n= ( )2 ou n ≤ ( )2 se p̂0 for desconhecido.
p̂0 q̂0 Z α2 + (N − 1)e2 Z α2 + 4(N − 1)e2

Alternativamente, temos tanto para o caso em que estudamos variáveis quantitativas discretas, quanto
contı́nuas, utilizamos as fórmula descritas anteriormente, e tomamos n = n0 , e conhecendo N , o cálculo de
n, tamanho amostral poderá ser obtido através de:
N n0
n= .
N + (n0 − 1)
6.5 Tamanho da Amostra ROSSI, R. M. 71

Exemplo 6.13. Determinado trabalho, realizado para investigar a prevalência de hansenı́ase em trabalha-
dores rurais, apresentou um valor igual a 22%. Para estimar o tamanho da amostra para novo projeto sobre
hansenı́ase, desejamos um nı́vel de confiança de 95% e erro de amostragem de 5%. Determine n, o tamanho
da amostra necessária para uma população de tamanho N = 100.000.
Solução:
[ ]2
Z α2
n0 = p̂0 (1 − p̂0 )
e
[ ]2
1, 96
n0 = 0, 22(0, 78)
0, 05
n0 ≃ 264,

logo, o tamanho da amostra corresponderá a:

100.000(264)
n =
1 + 263
n ≃ 253.

Por definição o Poder do teste é: 1 − β e na prática, utilizam-se valores entre 80% a 90% no cálculo
dos tamanhos amostrais para a Média e para a Proporção, agora podem ser dados, respectivamente por:
[( ) ]2
Z α2 + Zβ s0
Média: n0 = ;
e
[ √ √ ]2
Z α2 p0 (1 − p0 ) + Zβ p1 (1 − p1 )
Proporção: n0 =
e

e = p1 − p0 ;
p0 : proporção presumida da população (referente a H0 );
p1 : é a alternativa ou proporção esperada na população.

Exemplo 6.14. Suponha que desejemos testar a hipótese nula H0 : µ = 180 mg/100 ml ao nı́vel de
significância α = 1%. Neste contexto µ é o nı́vel médio sérico de colesterol da população de homens de 20 a
74 anos. O desvio-padrão é σ = 46 mg/100 ml. Se uma amostra piloto indica que o nı́vel médio sérico de
colesterol é de 201 mg/100 ml (e = 201 − 180 = 21), queremos adotar um poder do teste de 95%. Qual o
tamanho da amostra para inferir em uma população de 1.500 indivı́duos?
[( ) ]2 [ ]2
Z α2 + Zβ s0 (2, 58 + 1, 65) 46
n0 = = n0 = ≃ 85,
e 201 − 180

e corrigindo para N, temos:


1.500(85)
n= ≃ 81.
1 + 84
6.5 Tamanho da Amostra ROSSI, R. M. 72

Exemplo 6.15. A proporção de pacientes com câncer nos pulmões abaixo dos 40 anos no diagnóstico, que
sobrevivem pelo menos 5 anos é conhecida e igual a p0 = 8, 2%. Deseja-se testar essa hipótese baseado em
dados de uma amostra que acusou uma proporção de p1 = 20%. Qual o tamanho desta amostra, considerando
um nı́vel de confiança de 99% e um poder do teste com 95%?
[ √ √ ]2
Z α2 p0 (1 − p0 ) + Zβ p1 (1 − p1 )
n0 =
e
[ √ √ ]2
2, 57 0, 082(0, 918) + 1, 65 0, 2(0, 8)
n0 = ≃ 134.
0, 2 − 0, 082

Tamanho da Amostra Ensaios Clı́nicos


Aqui devem ser considerados outros fatores.
n0 : tamanho amostral;
n2
r : razão entre grupos controles (n2 ) e os casos (n1 ), ou seja: r = ;
n1
p0 : proporção de indivı́duos não-expostos (ou controles);
p1 : proporção de indivı́duos expostos (ou tratados);
p1 + rp0
p̄ = ;
1+r
s0 : desvio-padrão obtida através de uma amostra piloto;
α : nı́vel de significância ou erro tipo I (1%, 5%, 10%, ...);
β : erro tipo II (10%, 15%, 20%, ...);
e : erro máximo de estimação.
Tamanho de amostra para duas médias:
( )2
Z α2 + Zβ s20 (r + 1)
n0 = ;
e2 r

Tamanho de amostra para duas proporções:


( )2
Z α2 + Zβ (r + 1)
n0 = p̄(1 − p̄).
e2 r
Exemplo 6.16. Com objetivo de comparar médias de teor de hemoglobina devido a dois tratamentos dis-
tintos, um experimento será realizado com duas amostras independentes.Sabe-se que α = 0, 05, e portanto
n2
Z α2 = 1, 96; β = 0, 20, ou seja, um poder de 80%, portanto Zβ = 0, 84; r = = 3, ou seja, 3 controles
n1
para cada caso; s0 = 1, 5 mg variação observada em estudos anteriores; e = 0, 5 mg erro máximo desejado,
assim, tem-se que:
2 2
(1, 96 + 0, 84) (1, 5) (3 + 1)
n= ≃ 94.
(0, 5)2 3
Portanto, o grupo tratado deverá ter 94 indivı́duos, enquanto o grupo controle, o triplo : 282.

Exemplo 6.17. Um ensaio clı́nico aleatório será realizado e para a determinação do tamanho das amostras,
n2
as seguintes informações foram utilizadas: α = 0, 05; β = 0, 10, ou seja, Zβ = 1, 28; r= = 2; p0 = 0, 40 e
n1
p1 = 0, 60; e = 0, 20, assim tem-se:
2
(1, 96 + 1, 28) (2 + 1)
n= ≃ 98.
(0, 2)2 2

Portanto, o grupo tratado deverá ter 98 indivı́duos, enquanto o grupo controle, o dobro : 196.
6.6 Testes de Hipóteses ROSSI, R. M. 73

6.6 Testes de Hipóteses


Frequentemente é necessário tomar decisões sobre parâmetros ou distribuições populacionais com base
em informações amostrais, as quais são denominadas decisões estatı́sticas. Na tomada de decisões, são
formuladas hipóteses que serão rejeitadas ou não rejeitadas. Tais hipóteses, que podem ser verdadeiras ou
não, chamam-se hipóteses estatı́sticas e, em geral, consistem de afirmações sobre os parâmetros populacionais
ou sobre as distribuições de probabilidade das populações, como, por exemplo:
1. a média populacional da altura dos brasileiros é 1,65 m;
2. a proporção de brasileiros com a doença X é 40% (p = 0, 40);
3. a distribuição dos pesos dos pacientes adultos do hospital X é normal.
Os processos que nos permitem decidir por rejeitar ou não rejeitar uma hipótese, ou determinar se amos-
tras observadas diferem significativamente dos resultados esperados são chamados Testes de Hipóteses.
O objetivo é fornecer ferramentas que nos permitam validar ou refutar uma hipótese, através de resultados
da amostra. Os Testes de Hipóteses podem ser de dois tipos:
(a) Não Paramétricos: quando formulamos hipóteses com respeito à natureza da distribuição da população.
Estes testes não dependem dos parâmetros populacionais, nem de suas respectivas estimativas. Veja o
ı́tem (3.);
(b) Paramétricos: quando formulamos hipóteses com respeito ao valor de um parâmetro populacional.
Veja ı́tens (1.) e (2.).

6.6.1 Construção de um Teste de Hipótese


Inicialmente, para a construção de um teste, deve-se formular duas hipóteses a cerca da afirmação:
(a) Hipótese Nula (H0 ): é uma afirmação que diz que o parâmetro populacional é tal como especificado.
(b) Hipótese alternativa (Ha ): é uma afirmação que oferece uma alegação alternativa (isto é, o parâmetro
é diferente do valor alegado).
As hipóteses estatı́sticas para um parâmetro θ, podem ser formuladas como segue:
1. Teste Bilateral: quando utilizamos ambas as “caudas” da distribuição.
H0 : θ = θ0
Ha : θ ̸= θ0

2. Teste Unilateral à Direita: quando utilizamos a “cauda” direita da distribuição.


H0 : θ = θ0
Ha : θ > θ0

3. Teste Unilateral à Esquerda: quando utilizamos a “cauda” esquerda da distribuição.


H0 : θ = θ0
Ha : θ < θ0

Ao se testar uma hipótese, o que se deseja verificar é, através de uma estatı́stica obtida de uma amostra,
se a hipótese pode ou não rejeitada com o nı́vel de significância pré-fixado, α. Esta conclusão é tomada com
base na Região Crı́tica (RC: cuja área corresponde a α) que é construı́da de modo que:

P (θ̂ ∈ RC|H0 verdadeira) = α.


RA é denominada Região de não rejeição cuja área corresponde a 1 − α.
O procedimento que será utilizado para a construção de um teste de hipótese é o que consiste em
apresentar o nı́vel descritivo ou p-valor.
A sequência abaixo pode ser usada sistematicamente para qualquer teste de hipótese:
6.6 Testes de Hipóteses ROSSI, R. M. 74

1-alfa

alfa/2 alfa/2

xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
-Zalfa/2 +Zalfa/2

Figura 6.12: Teste de Hipótese Bilateral.

1. Passo 1: Definir as hipóteses H0 e Ha ;

2. Passo 2: Use a teoria estatı́stica e as informações para decidir qual a distribuição da estatı́stica
(estimador) que será utilizada no julgamento de H0 ;
Exemplos:
• para µ (n ≥ 30) • para µ (n < 30 ou σ desconhecido)
x̄ − µ x̄ − µ
Zc = √ ∼ N (0, 1) Tc = √ ∼ tn−1
σ/ n s/ n
• para p (supondo normalidade)
p̂ − p0
Zc = √ ∼ N (0, 1)
p0 (1 − p0 )
n
3. Passo 3: Escolher o nı́vel de significância α (erro tipo I) e utilizando as informações fornecidas pela
amostra para encontrar o valor do estimador do parâmetro (estatı́stica) que está sendo testado;
Dois tipos de erros podem ser cometidos em um TH:

H0
Decisão Verdadeira Falsa
Correto
Não Rejeitar Erro tipo II: β
Probabilidade: (1 − α)
Correto
Rejeitar Erro tipo I: α
Probabilidade: (1 − β)

4. Passo 4: Com o valor da estatı́stica observada na amostra encontrar a probabilidade (probabilidade


de significância p-valor) de ocorrer amostras com valores mais extremos do que o valor obtido.

5. Passo 5: Conclusão. Compare a probabilidade obtida, p-valor, com o valor de α:

“Rejeitamos H0 quando p-valor < α”.

6.6.2 O p-valor
O procedimento de teste de hipótese descrito acima fornece informação sobre a força da evidência contra
H0 obtida a partir dos dados. Isto é, é informado se o valor observado para a estatı́stica de teste que levou
à rejeição de H0 está próxima da fronteira da RC-região crı́tica ou RR-região de rejeição (baixa evidência
contra H0 ) ou se está muito afastada da fronteira (alta evidência contra H0 ).
O p-valor é a probabilidade de ocorrência do valor particular observado para a estatı́stica de teste ou de
valores mais extremos, na direção da região crı́tica, quando a hipótese nula H0 é verdadeira. Quanto maior
for a força da evidência contra H0 , menor será o p-valor.
6.6 Testes de Hipóteses ROSSI, R. M. 75

6.6.3 Teste de Hipótese para Média


Existem diferentes estatı́sticas para se testar uma média:

Desvio-padrão conhecido
• Caso 1. σ conhecido (σ!). Nessa situação a estatı́stica teste é a Z, isto é:

x̄ − µ
Zc = √ ∼ N (0, 1).
σ/ n

Exemplo 6.18. Deseja-se investigar se uma certa moléstia que ataca o rim altera o consumo de oxigênio
desse órgão. Para indivı́duos sadios, admite-se que esse consumo tem distribuição Normal com média 12
cm3 /min. Os valores medidos em cinco pacientes com a moléstia foram:

14, 4 12, 9 15, 0 13, 7 13, 5

Qual seria a conclusão, ao nı́vel de 5% de significância?

Solução: O teste de interesse é:

H0 : A moléstia não altera a média de consumo renal de oxigênio;


Ha : Indivı́duos portadores da moléstia têm média alterada.

Em termos da média populacional, estamos testando as hipóteses:

H0 : µ = 12
Ha : µ ̸= 12,

e a região crı́tica, considerando um teste bilateral, é da forma:

RR = {z ∈ R|z < z1 ou z > z2 }.

Sendo σ conhecido e igual a 0,5, temos como valor calculado:


x̄ − µ
Zc = √ ∼ N (0, 1)
σ/ n
13, 9 − 12
= √
1, 5/ 5
( )
p-valor
= +2, 83 = 0, 002327 → p-valor = 0, 0047 .
2

Os valores tabelados para α = 5%, são: Z0,025 = ±1, 96.


Portanto, como Zc ∈ RR, decidimos pela rejeição da hipótese nula, ou seja, a média de consumo de
oxigênio difere de 12 cm3 /min ao nı́vel de 5% (p-valor = 0, 0047 < 0, 05 = α).
6.6 Testes de Hipóteses ROSSI, R. M. 76

Figura 6.13: Teste de hipótese - Desvio-padrão conhecido.

Desvio-padrão desconhecido e n ≥ 30
• Caso 2. σ desconhecido (σ?, n ≥ 30). Nessa situação a estatı́stica teste continua sendo a Z, porém
σ = s, isto é:
x̄ − µ
Zc = √ ∼ N (0, 1).
s/ n

Exemplo 6.19. Considere o Exemplo 6.18, e que não há conhecimento de σ, além disso o tamanho amostral
tivesse sido 50, refaça o teste ao nı́vel de 5%.
Solução: Sendo σ desconhecido e n = 50, usaremos s como seu estimador e a estatı́stica teste será:

x̄ − µ
Zc = √ ∼ N (0, 1)
s/ n
13, 9 − 12
= √
0, 82/ 50
( )
p-valor
= +16, 4 =0 .
2

Os valores tabelados para α = 5%, são: Z0,025 = ±1, 96.


Portanto, como Zc ∈ RR, decidimos pela rejeição da hipótese nula, ou seja, o nı́vel médio de consumo
de oxigênio difere de 12 cm3 /min ao nı́vel de 5% (p-valor = 0 < 0, 05 = α).
6.6 Testes de Hipóteses ROSSI, R. M. 77

Figura 6.14: Teste de hipótese - Desvio-padrão desconhecido e n >= 30.

Desvio-padrão desconhecido e n < 30


• Caso 3. σ desconhecido (σ?, n < 30). Nessa situação a estatı́stica teste é a t-Student, porém σ = s,
isto é:
x̄ − µ
Tc = √ ∼ t(n−1) .
s/ n

Exemplo 6.20. Considere o Exemplo 6.18, e que não há conhecimento de σ, refaça o teste ao nı́vel de 5%.
Solução: Sendo σ desconhecido e n = 5, usaremos s como seu estimador e a estatı́stica teste será:

x̄ − µ
Tc = √ ∼ t(4)
s/ n
13, 9 − 12
= √
0, 82/ 5
= +5, 21 (p-valor = 0, 0066).

Os valores tabelados para α = 5%, são: t(4;0,025) = ±2, 78.


Portanto, como Tc ∈ RR, decidimos pela rejeição da hipótese nula, ou seja, o nı́vel médio de consumo de
oxigênio difere de 12 cm3 /min ao nı́vel de 5%.
6.6 Testes de Hipóteses ROSSI, R. M. 78

Figura 6.15: Teste de hipótese - Desvio-padrão desconhecido e n < 30.

6.6.4 Teste de Hipótese para Proporção


Exemplo 6.21. Suponha que um laboratório alegue que uma determinada droga que ele comercializa é
eficiente em pelo menos 85% dos casos em que é utilizada. Suponha que, para comprovar a alegação do
laboratório, um organismo de controle testou 180 pacientes, verificando a ação da droga em 146 casos.
Solução: O teste da eficiência alegada pelo laboratório, aos nı́veis clássicos de significância, seria feito
da seguinte forma:
Y 146
p̂ = = ≃ 0, 811 (proporção de eficiência na amostra)
n 180
H0 : θ ≥ 0, 85
Ha : θ < 0, 85
A Estatı́stica teste é
p̂ − p0
Zc = √
p0 (1 − p0 )
n
0, 811 − 0, 85
= √
0, 85(1 − 0, 85)
180
−0, 0389
=
0, 0266
Zc = −1, 46 (p = 0, 072145 ou 7, 2%)

Os valores tabelados para os nı́veis de significância de interesse são:

α 10% 5% 1%
Zα −1, 28 −1, 65 −2, 33

Observe que Rejeitamos H0 para α : 10%, mas não para α : 1% e 5%.


Conclusão: Ao nı́vel de significância α = 10%, há evidências estatı́sticas de que a droga é menos eficaz
do que o alegado.
6.6 Testes de Hipóteses ROSSI, R. M. 79

Figura 6.16: Teste de Hipótese para Proporção.


Capı́tulo 7

Análise em Tabelas 2x2 e LxC

Neste tópico estudaremos a relação entre duas variáveis categóricas (ou qualitativas), onde as observações
podem ser classificadas em uma das várias categorias (nı́veis ou células) mutuamente exclusivas.
O problema de mensuração do grau de associação entre dois conjuntos de escores é de caráter bem
diferente do teste da simples existência de uma associação em determinada população. Naturalmente, há
interesse em avaliar o grau de associação entre dois conjuntos de escores referentes a um grupo de indivı́duos.
Mas é talvez de muito maior interesse podermos afirmar que determinada associação observada em uma
amostra de escores indica, ou não, probabilidade de associação entre as variáveis na população da qual se
extraiu a amostra (Siegel, 1956).

7.1 Tabelas de Contingência


Segundo o dicionário Webster o termo “contingency” significa the quality or state of having a close
connection or relationship. O termo “contingency table” se refere ao fato de que as tabelas construı́das são
usadas para testar a existência de relações entre duas variáveis. Observamos que infelizmente este termo
em português não tem o mesmo significado. Segundo o Aurélio, “contingência” significa qualidade do que é
contingente, incerteza se uma coisa vai acontecer ou não e “contingente” significa que pode ou não suceder,
eventual, incerto. Logo, em estatı́stica, quando nos referimos a palavra “contingência” estamos tomando o
mesmo significado da lı́ngua inglesa.
O teste chi-quadrado (χ2 ) pode ser usado para avaliar a relação entre duas variáveis qualitativas. Este
teste é um teste não-paramétrico, que é muito útil, pois não precisa da suposição de normalidade das variáveis
para analisar o grau de associação entre as duas variáveis, porém este teste é menos poderoso que o teste
paramétrico.
Dentro deste teste devemos distinguir dois tipos de testes: o de independência e o de homogeneidade.
Vejamos quando estamos tratando de um teste de independência e quando estamos tratando com um teste
de homogeneidade, através de exemplos.

7.2 Teste de Independência e de Homogeneidade


Suponha que uma educadora quer analisar se existe relação entre a participação ativa dos pais dos
alunos nos deveres extra-escolares e o desempenho dos alunos em Matemática. Suponha que ela categoriza
o desempenho dos alunos em três grupos: baixo, médio, alto e, do mesmo modo, categoriza a participação
dos pais em dois grupos: participação ativa, participação fraca. Suponha que ela deseja trabalhar com 300
crianças.
Neste caso a educadora pode delinear sua pesquisa de duas formas:

80
7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 81

Caso 1. Selecionar uma amostra de crianças aleatoriamente e examinar em que célula cada uma está
alocada, logo o único valor fixo será o total geral que será de 300. Mas os totais de colunas e de linhas
serão frutos da pesquisa, portanto, aleatórios, neste caso estamos frente a um teste de independência
de variáveis.

Logo a tabela de contingência será:

Tabela 7.1: Exemplo de tabela de contingência.


Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Teste de
Ativa Aleatório =⇒ Independência
Fraca Aleatório
Total Aleatório Aleatório Aleatório 300

Porém ela pode fixar o número de alunos de acordo com seu desempenho.

Caso 2. Pegar uma amostra aleatória de tamanho 100 de cada grupo de alunos, logo os totais das
colunas serão fixos, mas os totais das linhas serão aleatórios e assim estaremos frente a um teste de
homogeneidade:

Logo a tabela de contingência será:

Tabela 7.2: Exemplo de tabela de contingência.


Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Teste de
Ativa Aleatório =⇒ Homogeneidade
Fraca Aleatório
Total 100 (fixo) 100 (fixo) 100 (fixo) 300

Os valores totais, das colunas e das linhas, são chamados de “totais marginais”. Quando os totais
marginais variam livremente, o teste de associação é chamado de independência, e quando
um dos conjuntos, linha ou coluna é fixado pelo pesquisador então é chamado de teste de
homogeneidade. Isso vai depender do pesquisador. No exemplo da educadora, observemos que para ela é
muito mais fácil fixar o número de alunos segundo seu desempenho, do que fixar pela participação dos pais,
que, apriori será quase impossı́vel.

Teste de Independência
Apresentaremos a lógica do teste com um exemplo bastante simples.
Exemplo 7.1. Suponha que 125 crianças foram expostas a três tipos de comerciais de TV, sobre cereais
para café da manhã. Após a exposição foi solicitado a cada criança para indicar qual dos comerciais ela
gostou mais. O que se deseja saber é se a escolha do comercial está relacionado ao gênero da criança: pois
suspeita-se de que o gênero pode estar influenciando na escolha do comercial. Os dados podem ser apreciados
na Tabela 7.3.

Tabela 7.3: Número de crianças segundo tipo de comercial escolhido e gênero.


Tipo de comercial
Gênero A B C Total
Meninos 30 29 16 75
Meninas 12 33 5 50
Total 42 62 21 125

Analisando atentamente a Tabela 7.3, composta por valores absolutos, percebemos:


7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 82

• a amostra está composta por mais meninos do que meninas,


• nos comerciais A e C o número de meninos é maior do que meninas, e
• no comercial B essa relação se inverte.

Contudo, essa análise fica prejudicada pela composição da amostra, que tem mais meninos do que me-
ninas. Portanto, a primeira coisa a fazer é analisar as estruturas percentuais, mostradas na Tabela 4.3, ou
seja retirar a influência da amostragem.

Tabela 7.4: Porcentagem para os valores absolutos de crianças por tipo de comercial escolhido e gênero
apresentados na tabela anterior.
Tipo de comercial
Gênero A B C Total
Meninos 71% 47% 76% 60%
Meninas 29% 53% 24% 40%
Total 100% 100% 100% -

Observe cuidadosamente a Tabela 7.4, onde 60% da amostra é composta por meninos. Se a preferência das
crianças pelos comerciais independe do gênero, esperarı́amos que a estrutura percentual para cada comercial
ficasse em torno de 60% para os meninos e 40% para as meninas, desvios grandes destes percentuais estariam
mostrando evidências de que existe alguma relação entre essas variáveis. Essa inspeção intuitiva, também,
pode ser feita analisando a estrutura dentro de cada gênero como mostra a Tabela 7.5.

Tabela 7.5: Porcentagem de crianças por gênero e tipo de comercial escolhido.


Tipo de comercial
Gênero A B C Total
Meninos 40% 39% 21% 100%
Meninas 24% 66% 10% 100%
Total 33% 50% 17% -

Analisando a Tabela 7.5 observamos que as meninas tem uma forte preferência pelo comercial B, enquanto
que os meninos se dividem entre o comercial A e B.
Assim, intuitivamente percebemos que existe interferência do gênero na preferência, agora precisamos
saber até que ponto essas diferenças se devem ao acaso, ou a existência de associação entre as duas variáveis:

X: preferência pelo comercial ( A, B e C) → qualitativa;


Y: gênero (meninos, meninas) → qualitativa.

Hipótese nula (H0 ): A preferência pelo comercial independe do gênero da criança;


Hipótese alternativa (Ha ): A preferência pelo comercial depende do gênero da criança (ou, o gênero
interfere na preferência pelo comercial);
Analogamente, temos:

Ho : independência de variáveis
H1 : dependência de variáveis

Como deveriam ser os valores a serem observados se as variáveis fossem independentes?, ou dito de outra
forma, sob a hipótese de nulidade, de independência de variáveis, como deveriam ser os valores a serem
observados? A lógica nos diz que esses valores devem estar muito próximos da estrutura percentual global.
Esses valores são chamados de valores esperados.
Cada valor esperado será calculado supondo que a estrutura percentual global se mantenha em cada
coluna:

Calculando os valores esperados, sobre a suposição de independência:


7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 83

Tabela 7.6:
Valores percentuais Valores absolutos
Tipo de comercial Valores esperados
Gênero A B C Total Gênero A B C Total
e
Meninos 60% 60% 60% 60% Meninos 25 37 13 75
Meninas 40% 40% 40% 40% Meninas 17 25 8 50
Total 42 62 21 125 Total 42 62 21 125

Valor esperado menino, comercial A: 60% de 42 = 25,2


Valor esperado menino, comercial B: 60% de 62 = 37,2
...

O mesmo teria acontecido se fixarmos primeiro o comercial:

Valor esperado comercial A, menino: 33,7% de 75 = 25,2


Valor esperado comercial A, menina: 33,7% de 50 = 16,8
...
Tanto faz fixar a linha ou a coluna pois:
Tl × Tc Tc Tl
Ei = = Tl × = Tc ×
T T T
Por exemplo, calculemos o valor esperado da primeira linha e primeira coluna:
75 × 42 42 75
Ei = = 75 × = 42 × = 25, 2
125 125 125
Assim calculando os valores esperados para todas as células temos:

Tabela 7.7:
Tipo de comercial
Gênero A B C Total
Oi = 30 Ei = 25,2 29 37,2 16 12,6
Meninos 75
di = +4,8 -8,2 +3,4
12 16,8 33 24,8 5 8,4
Meninas 50
-4,8 +8,2 -3,4
Total 42 62 21 125

Dentro de cada célula, no canto superior esquerdo colocamos o valor observado, no canto superior direito
o valor esperado (sob a hipótese de independência) e, na parte inferior, a distância entre o observado e o
esperado. Logo, se as variáveis fossem independentes, as distâncias entre os valores observados e esperados
deveriam ser muito pequenas, caso contrário haverá indı́cios de dependência. A pergunta agora é: quando a
distância é pequena ou grande? Para isto devemos calcular o valor (χ2 ) qui-quadrado da amostra:

∑k (observado − esperado)2 ∑k (O − E )2
i i
χ2amostra = =
i=1 esperado i=1 Ei

que terá uma distribuição chi-quadrado com graus de liberdade igual ao produto do número de linhas menos
um vezes o número de colunas menos um, isto é:

ν : graus de liberdade
χ2amostra ∼ χ2ν ⇒
ν : (no colunas - 1)×(no linhas - 1)

Para testar as hipóteses, temos a estatı́stica teste qui-quadrado com correção de continuidade de Yates:
( )2

k |O − E | − 1
i i
2
χcY = 2
∼ χ2[L−1×C−1;(1−α)%] (Tabelas L × C)
i=1 Ei
7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 84

No nosso exemplo sem a correção de Yates, temos:


(+4, 8)2 (−8, 2)2 (+3, 4)2 (−4, 8)2 (+8, 2)2 (−3, 4)2
χ2amostra = + + + + +
25, 2 37, 2 12, 6 16, 8 24, 8 8, 4
= 0, 914 + 1, 808 + 0, 917 + 1, 371 + 2, 711 + 1, 376
= 9, 09818 (p-valor : 0,0106)

onde v = (2 − 1) × (3 − 1) = 1 × 2 = 2
Para aceitar ou rejeitar a hipótese devemos conhecero valor de χ2calculado na tabela qui-quadrado, com
dois graus de liberdade. Para α = 5%, o valor crı́tico é 5, 991, como o valor da amostra é maior que o valor
crı́tico, logo rejeitamos a hipótese nula, concluindo que o gênero interfere na preferência pelos comerciais.
No caso de dispormos de um pacote estatı́stico, este, via de regra, calcula o p-valor, nesse caso é só
comparar esse valor com o nı́vel de significância desejado. No nosso caso o p − valor = 0, 01058, ou seja,
rejeitamos ao nı́vel de 5% mas não ao nı́vel de 1%.
Obs.: Quando as variáveis são independentes (H0 ), as freqüências observadas tendem a ficar perto das
esperadas. Neste caso, o valor de χ2 deve ser pequeno.
Limitações do teste χ2 :
1. Infelizmente, o teste qui-quadrado não permite concluir como se dá a relação, uma vêz que ele testa
apenas a hipótese geral de que as duas variáveis são independentes. Examinando a distância entre
valor observado e esperado, por exemplo, observamos que as meninas tem uma maior preferência pelo
comercial B, porém não podemos concluir nada.
2. Uma outra limitação do teste qui-quadrado é que o valor esperado das células não deve ser menor ou
igual a 5 e devido a isso torna vulnerável a estatı́stica. Nesse caso usamos outra estratégia: o teste
exato de Fisher.

Teste de Homogeneidade
Quando testamos independência de variáveis, o pesquisador só controla o tamanho total da amostra, mas
os totais para cada coluna e linha são aleatórios.
Exemplo 7.2. No caso do exemplo anterior, os pesquisadores selecionaram aleatoriamente 125 crianças,
das quais 75 eram meninos e 50 meninas. Ele não fixou o numero de meninos e o número de meninas.
Vejamos um exemplo de teste de homogeneidade. Retomemos o exemplo inicial e suponhamos que a
professora fixou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes:

Tabela 7.8: Número de alunos segundo seu desempenho em Matemática e participação dos pais nas atividades
extra-escolares.
Desempenho em Matem.
Participação
Baixo Médio Alto Total
dos pais
Ativa 5 25 70 100
Fraca 95 75 30 200
Total 100 100 100 300

H0 : p11 = p12 = p13 → igualdade de proporções


H1 : p1i ̸= p1j ; para algum i ̸= j → existe pelo menos uma proporção diferente
A hipótese nula esta testando que a proporção de alunos com baixo desempenho é igual a proporção de
alunos médio e igual a proporção de alunos com desempenho alto quando seus pais participam ativamente
das atividades extra-escolares, contra a hipótese alternativa que indica que existe pelo menos uma proporção
diferente.
O teste é idêntico ao teste de independência.
7.3 Análise de Resı́duos em Tabelas 2×L ROSSI, R. M. 85

O Coeficiente de Contingência.
O coeficiente de contingência é uma medida do alcance da associação ou relação entre dois conjuntos de
atributos. Ele é calculado em função do valor calculado na tabela de contingência e independe de ordenação
das categorias das variáveis:

χ2
C= 2
, onde n é o tamanho da amostra.
χ +n

Exemplo 7.3. No exemplo dos comerciais de TV, o coeficiente de contingência será:



9, 09818
C= = 0, 26047.
9, 09818 + 125
Para testar a significância deste coeficiente terı́amos que recorrer a tabela própria.

H0 : C=0
H1 : C ̸= 0

Se o p-valor associado for menor que alfa rejeitamos H0 e concluı́mos de que existe associação entre as
variáveis, caso contrário não.
Para facilitar a interpretação, usaremos uma modificação deste coeficiente. Chamaremos de k o menor
entre l (no de linhas da tabela) e c (no de colunas da tabela), isto é:

k = min{l; c}.

O chamado coeficiente de contingência modificado (C ∗ ) é dado por:



∗ k.χ2
C = .
(k − 1)(χ2 + n)

O valor C ∗ sempre estará no intervalo de 0 a 1. Será 0, somente quando houver completa independência e
será 1 quando houver associação perfeita. Valores de C ∗ próximos de 1 descrevem associação forte, enquanto
que valores de C ∗ próximos de 0 indicam associação fraca. Os valores de C ∗ em torno de 50% podem ser
interpretados como associação moderada.
Exemplo 7.4. Cálculo do coeficiente de contingência para os dados do exemplo anterior.

k = min{2; 3} = 2

k.χ2
C∗ =
(k − 1)(χ2 + n)

2.(9, 09818)
=
(2 − 1)(9, 09818 + 125)
= 0, 3684 ou 36, 84%.

Este resultado indica uma fraca associação entre X: preferência pelo comercial e Y: gênero.

7.3 Análise de Resı́duos em Tabelas 2×L


Exemplo 7.5. Vieira e Prolla (1979) estudaram uma amostra de 384 pacientes com problemas pulmonares,
classificando-os segundo a presença ou não de eosinófilos no escarro e o tipo de pneumopatia diagnosticada.
Grupo 1: asmas; Grupo 2: bronquite crônica com broncoespasmo; Grupo 3: bronquite crônica
ou enfisema sem broncoespasmo; Grupo 4: outras doenças pulmonares.
7.3 Análise de Resı́duos em Tabelas 2×L ROSSI, R. M. 86

Tabela 7.9: Presença de eosinófilos no escarro e tipo de doença pulmonar em 384 pacientes porto-alegrenses.
Grupo quanto a pneumopatia
Eosinófilos no escarro Grupo 1 Grupo 2 Grupo 3 Grupo 4 Total
Sim 142 26 32 28 228
Não 55 19 41 41 156
Total 197 45 73 69 384

{
H0 : Não existe associação entre Eosinófilos no escarro e pneumopatia;
Hipóteses :
Ha : Existe associação entre Eosinófilos no escarro e pneumopatia.
O teste χ2 de associação indica haver associação entre o tipo de pneumopotia e a ocorrência de eosinófilos
no escarro (χ2c = 30, 6465; p < 0, 001) ao nı́vel de 1%.
Uma conclusão simples de existência de associação é em geral insatisfatória para os pesquisadores, que
gostariam de entender melhor o tipo de associação observada. Para responder a esta indagação, existem
várias técnicas estatı́sticas; a análise de resı́duos é uma das mais interessantes.
A análise de resı́duos é usada como auxiliar na interpretação de dados organizados em tabelas L x C.
Por seu intermédio, é possı́vel avaliar como as diferentes caselas contribuem para o valor do χ2c .
Calcula-se inicialmente o resı́duo padronizado (R p ) para cada casela:

O−E
Rp = √ .
E
A seguir, cada resı́duo deve sofrer uma correção, passando a denominar-se resı́duo ajustado (Raj ) :

Rp
Raj = √( )( ).
1− TC
TG 1− TL
TG

Finalmente, os valores de Raj são comparados com valores crı́ticos da distribuição normal, por exemplo,
zα = 1,96, para um nı́vel de 5% de significância. Se Raj for maior do que zα , conclui-se que o valor
observado na casela (O) desvia-se significativamente (para mais ou para menos, conforme o sinal de Raj ) do
valor esperado (E).
Os resı́duos ajustados obtidos para os dados da Tabela 7.9, estão apresentados na Tabela 7.10. Na
primeira casela, o resı́duo ajustado foi obtido do seguinte modo:
O−E 142 − 117
Rp (Sim; G1) = √ = √ = +2, 311
E 117
Rp +2, 311
Raj (Sim; G1) = √( )( ) = √( )( ) = +5, 20.
1− TC
TG 1 − TT G
L
1− 197
384 1− 228
384

Como Raj = |+5, 20| > Z5% = 1, 96, conclui-se que o número de asmáticos que apresentam eosinófilos
no escarro foi significantemente maior (pois Raj é positivo) do que o esperado se as variáveis fossem inde-
pendentes. Portanto, existe associação positiva entre asma e presença de eosinófilos no escarro.
A interpretação dos demais resı́duos ajustados é feita do mesmo modo, após compará-los com Zα . Por
exemplo, no Grupo 3 a freqüência de indivı́duos com eosinófilos no escarro é significantemente menor do que
o esperado ao acaso (Raj = |+3, 00| > 1, 96).
Na Tabela 7.10 há seis resı́duos significativos. Cambinando este resultado com as percentagens observadas
na Tabela 7.9, a conclusão geral é a de que indivı́duos com eosinófilos no escarro são mais freqüentes entre os
asmáticos (142/197 = 72%) e menos comuns em pacientes dos Grupos 3 (44%) e 4 (41%). Em pacientes do
Grupo 2, a percentagem de pessoas com eosinófilos no escarro (58%) não diferem significativamente daquela
observada para o total da amostra (59%).
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 87

Tabela 7.10: Resı́duos ajustados (Raj) obtidos para os dados da tabela anterior. Os valores com (*) são
significativos ao nı́vel de 5%.
Grupo quanto a pneumopatia
Eosinófilos no escarro Grupo 1* Grupo 2 Grupo 3* Grupo 4*
Sim 5,20 -0,23 -3,00 -3,51
Não -5,20 0,23 3,00 3,51

7.4 Medidas do Efeito em Tabelas 2×2


7.4.1 Risco Relativo (RR)
Os pesquisadores em saúde investigam a todo momento a ocorrência de doenças, sua forma de apre-
sentação, sua freqüência, localização, enfim, reúnem uma série de informações que são apresentadas de
forma expositiva, dando ciência de tudo o que encontraram a respeito.
Porém, existe uma preocupação maior, que é a de se estudar o vardadeiro sistema no qual está inserido
o fato, a fim de pesquisarem-se os fatores que a ele estariam associados.
Com o objetivo de analisar os fatores responsáveis e quantificar em sua grandeza a participação desses
fatores, vale a pena ressaltar que um dos estudos mais importantes que visa a responder a essas indagações
seria a análise dos fatores de risco, que podem ser um agente quı́mico, um tipo de acidente ou mesmo um
hábito de vida.
Em determinados tipos de estudo, através de um procedimento metodológico estatı́stico, é possı́vel realizar
estimativas como indicadores relevantes de causa e efeito.
O risco relativo é uma forma de expressarmos a força de associação entre exposição ao fator e a doença.
Os estudos longitudinais prospectivos e retrospectivos proporcionam ao investigador a oportunidade de
identificar, dentro do sitema composto das variáveis que são selecionadas e estudadas, os fatores de risco e
de proteção, considerando as variáveis independentes e dependentes contidas no modelo de estudo.
Um dos primeiros procedimentos no estudo é identificar a variável dependente e as variáveis indepen-
dentes. Tanto seja variável discreta ou contı́nua, podemos realizar a análise dos dados, com o intuito de
verificar o risco de ocorrência de um fato, pela presença de um ou mais fatores, considerando inclusive a sua
intensidade.
Exemplificando, poderı́amos verificar a hipótese de que o consumo de cigarros tenha associação com câncer
de pulmão, determinando-se o risco para tabagistas, baseando-se em indivı́duos não fumantes, tendo-se em
conta que os não tabagistas também podem contrair a doença.
Conceituar o que seja risco é fundamental para nossa apresentação. Portanto, considera-se como risco a
probabilidade de que pessoas que estão sem a doença, mas expostas a certos fatores, possam adquirı́-la.
Na verificação da ocorrência de doentes na população, variável chave da investigação epidemiológica, as
medidas de incidência, prevalência e outros coeficientes servem como indicadores de risco.
Incidência (I): número de casos novos registrados em determinado perı́odo de tempo (dia, mês ou ano).
Prevalência: número de casos (novos+antigos) registrados no perı́odo de tempo determinado.
Coeficiente de incidência: número de casos novos em relação ao total de indivı́duos expostos na unidade
de tempo.
Coeficiente de prevalência: número de casos novos + antigos, em relação ao total de indivı́duos expostos
na unidade de tempo.
Risco Relativo (RR): relação existente entre o coeficiente de incidência de casos expostos (IE ) e o coefi-
ciente de incidência de casos não-expostos (IN E )
IE P (doente|exposto)
RR = =
IN E P (doente|não-exposto)
Risco Atribuı́vel (RA): diferença entre coeficiente de incidência no grupo exposto ao fator e o coeficiente
de incidência do grupo não exposto ao fator

RA = IE − IN E

Risco Atribuı́vel na População (RAP%): expresso em porcentagem, é uma medida de associação que
depende da ocorrência do fator de risco na população (é o excesso de risco na população devido ao fator de
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 88

risco)
IN − IN E (RR − 1)p
RAP % = =
IN (RR − 1)p + 1
onde IN : é a incidência global nos expostos e não expostos e p: prevalência do fator de risco.
No estudo de coorte é bastante natural pensar na razão entre a proporção dos que desenvolveram a
doença dentre os pacientes expostos e a proporção análoga entre os pacientes não-expostos. Observando a
disposição dos grupos na Tabela 7.11 a seguir,

Tabela 7.11: Distribuição quanto à ocorrência de um evento


Doença Fator Total
(Exposto) (Não-exposto)
Presente Ausente
Presente a b n1 = a + b
Ausente c d n2 = c + d
Total m1 = a + c m2 = b + d n = n1 + n2

de modo geral, podemos encarar o RR como


a
IE a + c.
RR = =
IN E b
b+d
Ensaios clı́nicos podem ser vistos como um estudo de coortes, em que os grupos foram criados através
de alocação aleatória de pacientes aos grupos. Portanto, o risco relativo também pode ser calculado para
ensaios clı́nicos.
Exemplo 7.6. Quando estamos interessados em estimar probabilidades condicionais, por exemplo, de um
nascituro ter aberração cromossômica, dado que a gestante está na faixa etária de 35 até 40 anos, e a
probabilidade (condicional) de um nascituro ter aberração cromossômica, dado que a gestante tem 40 anos
ou mais, é comum na área da saúde usar a palavra risco para identificar esta probabilidade.

Tabela 7.12: Resultados de casos de diagnóstico pré-natal segundo a idade da gestante e a presença ou
ausência de aberração cromossômica.
Doença Fator (Idade em anos) Total
(Exposto) (Não-exposto)
(Aberração)
≥ 40 35 − 40
Presente 18 10 28
Ausente 510 447 957
Total 528 457 985

Então, com base nas dados da Tabela 7.12, podemos calcular:

1. o risco de um nascituro ter aberração cromossômica, dado que a gestante tem 40 anos ou mais (IE ):
18
IE = = 0, 0341 ou 3, 41%.
528
2. o risco de um nascituro ter aberração cromossômica, dado que a gestante está na faixa etária de 35
até 40 anos (IN E ):
10
IN E = = 0, 0219 ou 2, 19%.
457
3. a incidência global (I N ) :
10 + 18
IN = = 0, 0284 ou 2, 84%.
985
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 89

4. o risco atribuı́vel (RA):


RA = IE − IN E = 3, 41% − 2, 19% = 1, 22%.
5. o risco atribuı́vel na população (RAP%):
IN − IN E 2, 84% − 2, 19%
RAP % = = = 0, 2289 ou 22, 89%.
IN 2, 84%

6. o Risco Relativo (RR) é a razão entre duas probabilidades condicionais (ou dois riscos condicionais).
Com base na Tabela 7.12, tem-se o risco relativo
3, 41
RR = = 1, 56.
2, 19
Este resultado mostra que o risco de um nascituro apresentar aberração cromossômica é 1,56 maior se a
gestante tiver 40 anos ou mais do que se a gestante estiver na faixa etária de 35 até 40 anos.

Intervalo de Confiança para RR


Nos estudos longitudinais de coorte, em que procedemos à verificação e à identificação dos fatores con-
siderados de risco ou de proteção, determinamos os valores referentes ao risco relativo. Entretanto, para
que possamos concluir sobre os verdadeiros fatores de risco ou proteção, utilizamos IC(RR) o intervalo de
confiança para o RR, o IC(RR):

1± √
IC(RR) = RR χ2c

onde χ2c é o valor da estatı́stica teste calculada através dos dados na tabela de contingência formada.
Exemplo 7.7. Dos dados da Tabela 7.12, para RR = 1,56, podemos obter seu respectivo IC(RR), já que
χ2c = 1, 32 e para um nı́vel de significância de 5%, o valor de Z5% = 1, 96 :
1, 96
1± √
IC(RR) = 1, 56 1, 32
= 1, 561±1,71
IC(RR) : [0, 73; 3, 34]
Observação: Este intervalo não incluindo a unidade, isto é, (o no 1) possibilita-nos rejeitar H0 : ”Não
existe associação entre as variáveis”.
Para o exemplo portanto, concluimos que existe associação entre idade e aberração cromossômica, isto
é, a idade é realmente um fator de risco para a doença em estudo.

7.4.2 Odds-Ratio (OR)


O risco relativo, embora seja uma medida de efeito com muitas qualidades, tem uma grande limitação: não
pode ser estimado em estudo de caso-controle, forma mais freqüente de estudo comparativo. Isto porque,
neste tipo de estudo, as incidências observadas são meras conseqüências do número escolhido
de casos e controles e não caracterı́sticas dos grupos em estudo. Por isto, buscaram-se maneiras
alternativas para se definir o efeito da exposição de forma adequada a todos os estudos epidemiológicos. A
solução encontrada foi o uso de uma medida denominada razão das chances ou Odds-Ratio (OR).
Define-se chance de se desenvolver a doença entre os expostos e os não expostos como a seguinte estima-
tiva:
a/(a + c)
c/(a + c) a/c ad
OR = ψ̂ = = =
b/(b + d) b/d bc
c/(b + d)
P (doente|exposto)
1−P (doente|exposto)
OR = P (doente|não-exposto)
.
1−P (doente|exposto)
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 90

Também pode ser definida como a chance de exposição entre indivı́duos doentes dividia pela chance de
exposição entre os não-doentes, isto é:
P (exposto|doente)
1−P (exposto|doentes)
OR = P (exposto|não-doente)
.
1−P (exposto|não-doentes)

Intervalo de Confiança para o OR


Método A: O intervalo de confiança para a razão de chances, IC(OR), pode ser obtido analogamente
ao processo do IC(RR):

1± √
IC(OR) = OR χ2c

Método B: Alternativamente podemos por razões teóricas obter o IC(OR), já que muitas vezes a variação
de ψ é mais facilmente calculada na escala logarı́tmica. Vale o seguinte resultado:
1 1 1 1
V ar(ln ψ̂) = + + + .
a b c d
Como lnψ tem aproximadamente distribuição gaussiana, construı́mos intervalos de confiança para lnψ̂:
[ √ ]
ln[IC(OR)] = [Li ; Ls ] = ln ψ̂ ± Zα V ar(ln ψ̂) .

Obs.: Se este intervalo contém o número 0 (zero) (correspondente ao valor 1 para o RR) então a associação
entre a doença e o fator pode ser verificada.
Para obter o intervalo de confiança para ψ basta exponenciar os limites do intervalo acima, isto é:
[ ]
IC(OR) = eLi ; eLs .
Exemplo 7.8. Amamentação na infância e câncer de mama.
Para verificar se o fato de ter sido amamentado pela mãe é um fator de proteção para o câncer de mama,
Freudenheim et al. (1994) realizaram estudo do tipo caso-controle nos condados de Erie e Niágara situados
na parte oeste do estado de New York (EUA).
As pacientes tomadas como controle foram escolhidas na população da região, não existindo portanto o
emparelhamento. Os dados obtidos estão apresentados na Tabela 7.13.

Tabela 7.13: Distribuição de casos e controles segundo a amamentação.


(Fator)
Doença Total
Amamentação
Sim Não
Casos 353 175 528
Controles 449 153 602
Total 802 328 1130

O risco de desenvolver câncer de mama entre mulheres amamentadas pela mãe, aproximado pela razão
de chances (odds-ratio), é estimado por
353 × 153
OR : ψ̂ = = 0, 69
175 × 449
ou seja, nominalmente, o risco do grupo amamentado é apenas 69% do risco do grupo não-amamentado.
Para obtermos um intervalo com 95% de confiança para ψ temos os métodos A e B:
Método A:
1, 96
1± √
IC(OR) = 0, 69 8, 16
= 1, 561±0,69
IC(OR) : [0, 53; 0, 89]
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 91

Método B:
ln ψ̂ = ln(0, 69) = −0, 37
1 1 1 1
V ar(ln ψ̂) = + + + = 0, 02
353 175 449 153

ou seja, a estimativa do desvio-padrão de ln ψ̂ é 0, 02 = 0, 14. Um intervalo de 95% de confiança para ln ψ
é portanto
−0, 37 ± 1, 96.(0, 14)
ou
ln[IC(OR)] = [−0, 64; −0, 10] .
Observe que o número 0 (zero) não pertence ao intervalo, onde concluı́mos na existência de associação
entre as variáveis (Rejeitamos H0 ).
O intervalo para ψ é então obtido tomando-se o exponencial dos limites inferior e superior deste intervalo,
ou seja:
IC(OR) = [0, 53; 0, 89]
indicando uma associação significativa entre ter sido amamentada e câncer de mama (1 ∈ / IC).
Esse resultado deve ser interpretado com cuidado, uma vez que não foram considerados fatores impor-
tantes, como história familiar e idade na primeira gestação. De fato, ao ajustar o modelo incorporando essas
variáveis, a associação deixou de ser significativa.
Capı́tulo 8

Comparações Entre Grupos

8.1 Introdução
Às vezes, é preciso comparar duas populações. Por exemplo, imagine que um pesquisador obteve, para
um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos
e meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Outras vezes, é preciso comparar condições experimentais. Por exemplo, para saber se um tratamento
tem efeito positivo, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (é o
grupo tratado), enquanto o outro não recebe o tratamento (é o grupo controle).
O efeito do tratamento é dado pela comparação dos dois grupos.
Freqüentemente, para comparação de dois tratamentos observam-se caracterı́sticas ou mede-se o valor da
variável resposta de interesse que as caracterı́sticas importantes dos indivı́duos que integram o mesmo par
sejam tão semelhantes quanto possı́vel. O tratamento é administrado a um dos elementos do par e o outro é
mantido como controle. A vantagem do procedimento é clara. Os indivı́duos no par são semelhantes, exceto
no que se refere ao tratamento recebido. Em algumas situações o par é constituı́do do mesmo indivı́duo em
duas ocasiões diferentes (amostras dependentes).
A suposição de Normalidade é necessária em alguns testes estatı́sticos. Nesta seção apresentaremos alguns
testes de normalidade assim como algumas técnicas gráficas, afim de que possamos verificar a normalidade
dos dados (No caso afirmativo optamos por testes paramétricos).

8.2 Normalidade dos Dados


Na prática não podemos fazer suposições arbitrárias a respeito da distribuição de probabilidade dos
dados, logo usamos de técnicas para fazer uma verificação da adequação do modelo suposto.
A verificação pode ser baseada nas caracterı́sticas do modelo, em gráficos especiais e em testes de
aderência.
Para a distribuição normal, em especial, sabemos que:

µ±σ = 68, 26%


µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%

Grandes discrepâncias entre as freqüências relativas observadas e as probabilidades teóricas acima citadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.

• Testes de aderência

1. Kolmogorov-Smirnov (K-S) [µ e σ supostamente conhecidos];


2. Lilliefors é uma variação do K-S [µ e σ estimados pelos dados];
3. Shapiro Wilks (W) [µ e σ estimados pelos dados].

92
8.2 Normalidade dos Dados ROSSI, R. M. 93

Este último, tem sido muito utilizado para dados amostrais devido a sua capacidade de adaptação a uma
variada gama de problemas sobre avaliação de normalidade.
{
H0 : Os dados são normalmente distribuı́dos;
T.H.
Ha Os dados não são normalmente distribuı́dos.

Outros critérios:

• Técnicas Gráficas

1. Normal-plot
2. Q-Q-plot
3. P-P-plot

8.2.1 Faixas de Referência (Método de Gauss)


Toda medida laboratorial é analisada confrontando-se seu valor com uma faixa padrão.
Isto é tão comum que, na própria apresentação do resultado, muitos laboratórios já indicam os limites
inferiores e superiores para o valor da medida que devem servir de base ao raciocı́nio clı́nico. Quando há a
suposição de normalidade nos dados pode-se fazer uso desta informação para obtenção de uma FR (Faixa
de Referência) pelo método gaussiano:

• Devemos fixar, inicialmente, o nı́vel de confiança (1 − α)% ou cobertura;


• Calculamos através da amostra de pessoas supostamente saudáveis: x̄ e s.

Tabela 8.1: Faixas de Referência.


Cobertura (1 − α)% Faixa
90% x̄ ± 1, 64.s
95% x̄ ± 1, 96.s
99% x̄ ± 2, 58.s
.. ..
. .
(1 − α)% x̄ ± Z α2 .s

1-alfa

alfa/2 alfa/2
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx

-Zalfa/2 +Zalfa/2

Figura 8.1: Faixa de Referência.

Observação: Como em geral se trabalha com amostras, então o uso dos Intervalos de Confiança, con-
siderando a DISTRIBUIÇÃO AMOSTRAL DA MÉDIA, é mais adequada para obtenção dessas Faixas de
Referências.
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 94

Exemplo 8.1. Faixa de referência para identificar o Pseudomonas sp (continuação do Exemplo 6.3).

Observe através da Figura 6.8o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição normal.
Para a Amostra 1, foram realizados os testes de normalidade e indicaram ajuste dos dados já que p −
Lillief ors > 0, 20 e p − W ilks = 0, 8892. (Software Statistica).
Observe através da Figura 6.9 uma assimetria do Histograma comparado à normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
normal.
Os testes confirmam isto: Para a Amostra 2 obtemos p − Lillief ors < 0, 01 e p − W ilks < 0, 000013.

8.3 Resposta Dicotômica: Amostras Independentes


Comparar dois grupos através do resultado observado em uma variável dicotômica é um problema comum
na pesquisa médica, aparecendo com freqüência em todos os tipos de estudos clı́nicos.
A variável de interesse é a ocorrência de um evento, como o desenvolvimento de uma doença de certo
atributo, por exemplo, albinismo. O problema de comparações das probabilidades de ocorrência do evento
ou do atributo nos dois grupos (p1 e p2 ) é formulado através das hipóteses:
{
H0 : p1 = p2 “não há diferença significativa entre os grupos”
Ha : p1 ̸= p2 “há diferença significativa entre os grupos”

8.3.1 Teste Qui-Quadrado


A Tabela 8.2 apresenta dados genéricos de uma situação envolvendo a comparação de dois grupos e que
a resposta de interesse é dicotôminca: a ocorrência ou não de um evento.

Tabela 8.2: Distribuição quanto à ocorrência de um evento.


Grupo Ocorrência do Evento Total
Sim Não
I a b n1 = a + b
II c d n2 = c + d
Total m1 = a + c m2 = b + d n = n1 + n2

A estatı́stica teste será:



k
(Oi − Ei )2
χ2c = ∼ χ21;(1−α)%
i=1
Ei
ou, para Tabelas 2×2:
2
n (ad − bc)
χ2c = ∼ χ21;(1−α)% (Tabelas 2 × 2)
n1 n2 m 1 m 2
Há restrições para aplicação do χ2 em tabelas contingência, logo a correção de Yates (1934) é necessária.
Esta correção deve ser feita quando:

• n < 40 ou Ei ≤ 5

• 20 < n < 40 e Ei ≤ 5 para algum i;


• n > 40 e Ei ≤ 5 para algum i;

Para testar as hipóteses acima citadas temos a estatı́stica teste qui-quadrado com correção de continuidade
de Yates, temos
( )2
n |ad − bc| − n2
2
χcY = ∼ χ21;(1−α)% (Tabelas 2 × 2)
n1 n2 m 1 m 2
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 95

Exemplo 8.2. Estudo sobre a associação entre o uso corrente de contraceptivos e o infarto de miocárdio.
Shapiro et al. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes são
mostrados na Tabela 8.3.

Tabela 8.3: Distribuição de uso de contraceptivo oral segundo grupo que sofreu ou não infarto do miocárdio.
Grupo Uso recente Total
Sim Não
Casos 9 12 21
Controles 33 390 423
Total 42 402 444

Entre os casos, ou seja, entre as pacientes que tiveram um infarto do miocárdio, a proporção de uso recente
9 33
de contraceptivos é = 0, 43 e entre os controles, = 0, 08. A diferença entre estas duas proporções
21 423
(0,35) parece indicar que o uso de contraceptivos orais é mais freqüente entre os casos (infartos). Mas será
que este resultado não ocorreu por mero acaso?
A expressão χ2c = 24, 76 > 3, 84 = χ21;95% , nos indica, com alto grau de confiança (95%) afirmar que existe
associação entre o uso de contraceptivos orais e infarto do miocárdio para pacientes entre 30 e 34 anos.

8.3.2 Teste Exato de Fisher


Nos casos em que formamos uma tabela de contingência com formato 2 × 2, com pequeno número de
observações (n < 20 ou próximo) e, conseqüentemente, com freqüências observadas em cada casela muito
baixas, a literatura apresenta a utilização do teste exato de Fisher, no qual estimamos, a partir da menor
freqüência contida na tabela, a probabilidade de ocorrência deste valor e de uma freqüência menor ainda,
∑n
fazendo-se p = pi , em que n é a menor freqüência verificada na tabela.
i=0
Numa tabela de contingência 2 × 2, com os totais marginais fixos, apresentada como a Tabela 5.1, as
freqüências observadas têm distribuição hipergeométrica e a probabilidade de ocorrência i será dada por:
n1 !n2 !m1 !m2 !
pi =
a!b!c!d!n!
Exemplo 8.3. Um estudo foi realizado para verificar a existência de associação entre o tipo de tratamento
e mortalidade por AIDS. A Tabela 8.4 apresenta os dados.

Tabela 8.4: Associação entre o tipo de tratamento e mortalidade por AIDS.


Tratamento Mortalidade Total
Sim Não
A 7 5 12
B 1 9 10
Total 8 14 22


1
Sendo p = pi , temos
i=0
12!10!8!14!
p1 = = 0, 024.
7!5!1!9!22!
e
assim
12!10!8!14!
p0 = = 0, 0015.
8!4!0!10!22!
O valor de p será 0, 024 + 0, 0015 = 0, 0255 (p-valor : 0,0263).
Como este p é menor que o nı́vel de significância, para α = 0, 05 a decisão correta será rejeitar H0 , isto
é, pode-se concluir que há diferença quanto à mortalidade em relação ao tipo de tratamento, sendo B mais
eficáz.
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 96

Tabela 8.5: Associação entre o tipo de tratamento e mortalidade por AIDS.


Tratamento Mortalidade Total
Sim Não
A 8 4 12
B 0 10 10
Total 8 14 22

Exemplo 8.4. Suponha um grupo de dezesseis ratos, divididos em dois grupos, experimental e normal. O
grupo experimental é formado por 9 animais geneticamente modificados, por apresentarem uma disfunção
pancreática com diminuição da capacidade de produção de insulina. Imagine que, após um ano e meio em
ambiente controlado, o número de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela
8.6):

Tabela 8.6: Estudo em ratos sobre disfunção pancreática.


Grupo Sobrevida + 1,5 ano Total
Vivos Mortos
Normal 5 2 7
Experimental 1 8 9
Total 6 10 16

Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos, enquanto a so-
brevida para o grupo experimental é de apenas 11%.
O teste exato de Fisher consiste em elaborar, com base nos totais marginais do fator discriminante da
tabela original, duas outras tabelas, que serão denominadas tabelas ou matrizes extremas, X1 e X2 . A matriz
extrema 1 é a matriz em que todos os animais mortos pertencem ao grupo normal (são 10 mortos, mas o
grupo normal tem 7 ratos, logo, os outros 3 que morreram pertencem ao grupo experimental) e todos que
sobraram do grupo experimental estão vivos (todos os vivos, pois sobraram 9-3 = 6 ratos). Desta forma,
resulta na Matriz X1 (Tabela 8.7):

Tabela 8.7: Matriz X 1 .


Grupo Sobrevida + 1,5 ano Total
Vivos Mortos
Normal 0 7 7
Experimental 6 3 9
Total 6 10 16

A matriz extrema 2, X2 , corresponde a uma tabela com os mesmos totais marginais, mas com todos os
animais vivos no grupo normal. Então, pela matriz X2 (Tabela 8.8):
Observe que existe um óbito no grupo normal, pois o número de ratos do grupo normal é maior que o de
ratos que sobreviveram. Obviamente, os 9 mortos que restaram pertencem ao grupo experimental. Nenhum
rato do grupo experimental sobreviveu.
Finalmente, o valor de significância para o teste é calculado segundo a fórmula apresentada anteriormente:
Para a matriz original:
7!.9!.10!.6!
F0 : = 0, 02360
2!.5!.8!.1!.16!
Para a matriz X 1 :
7!.9!.10!.6!
FX1 : = 0, 0105
0!.7!.6!.3!.16!
Para a matriz X 2 :
7!.9!.10!.6!
FX2 : = 0, 0009
6!.1!.0!.9!.16!
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 97

Tabela 8.8: Matriz X 2 .


Grupo Sobrevida + 1,5 ano Total
Vivos Mortos
Normal 6 1 7
Experimental 0 9 9
Total 6 10 16

Finalmente,

p = F0 + FX1 + FX2 = 0, 0236 + 0, 01505 + 0, 0009 = 0, 035 ou 3, 5%.

Ou seja, a afirmação de que a sobrevida dos ratos geneticamente alterados é menor que a dos ratos
normais envolve uma probabilidade de erro de 3,5%. Portanto, ao nı́vel de 5% de significância, rejeita-se a
hipótese de nulidade (ou seja, de que as vidas dos ratos normais e dos transgênicos são iguais).

8.3.3 Teste z para Comparação de Proporções


Denotamos os dois resultados possı́veis da variável dicotômica por sucesso e fracasso. Sejam p1 e p2 as
proporções de sucesso referentes aos tratamentos a serem comparados, que são estimadas por p̂1 e p̂2 , as
proporções amostrais baseadas em amostras de tamanhos n1 e n2 , respectivamente. Queremos testar as
hipóteses:

H0 : p1 = p2
Ha ̸ p2
: p1 =

isto é, estamos investigando a equivalência entre os dois tratamentos.


Apresentaremos uma alternativa para o teste qui-quadrado para a comparação de proporções. Trata-se
de um teste aproximado que requer amostras grandes para sua aplicação. Um critério é exigir que n1 p̂1 e
n2 p̂2 excedam o valor 5.
O teste é baseado em
p̂1 − p̂2
Zc = √ ∼ N (0, 1).
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
n1 + n2

Exemplo 8.5. Comparação de drogas contra náusea.


Com o objetivo de comparar a eficácia de dois preventivos contra náusea, dividiu-se aleatoriamente uma
amostra de 400 marinheiros em dois grupos de 200. Um grupo recebeu a pı́lula A e o outro a pı́lula B,
sendo que no primeiro grupo 152 não enjoaram durante uma tempestade e no outro grupo apenas 132. Há
indicações de que a eficácia da pı́lula A e B é a mesma?
Sol.: Sejam pA e pB as proporções de marinheiros que não enjoam, respectivamente para as pı́lulas A e
B. Temos que nA = 200, nB = 200, p̂A = 152 132
200 = 0, 76, p̂B = 200 = 0, 66, logo tem-se:

0, 76 − 0, 66
Z=√ = 2, 22 (p-valor : 0,0281).
0,76(1−0,76) 0,66(1−0,66)
200 + 200

Fixando-se o nı́vel de significância em 5%, rejeita-se H0 . Portanto, pode-se concluir que as duas pı́lulas
não são igualmente efetivas. Há indicação de que a pı́lula A oferece maior proteção contra náusea comparada
à pı́lula B.
8.4 Resposta Dicotômica: Amostras Pareadas ROSSI, R. M. 98

8.4 Resposta Dicotômica: Amostras Pareadas


Podemos distingüir três tipos de pareamento: auto-pareamento, pareamento natural e pareamento artifi-
cial.
O auto-pareamento ocorre quando o indivı́duo serve como seu próprio controle, como na situação em
que um indivı́duo recebe duas drogas administradas em ocasiões diferentes. Outra situação é a que um
tratamento é administrado e as variáveis de interesse são observadas antes e depois do programa. Finalmente,
a comparação de dois órgãos no mesmo indivı́duo, como braços, pernas, olhos, narinas, segundo alguma
caracterı́stica estudada também constitui um auto-pareamento.
O pareamento natural consiste em formar pares tão homogêneos quanto possı́vel, controlando os fatores
que possam interferir na resposta, sendo que o pareamento aparece de forma natural. Por exemplo, em ex-
perimentos de laboratório pode-se formar pares de cobaias selecionadas da mesma ninhada; em investigações
clı́nicas, gêmeos univitelinos são muitos usados.
No pareamento artificial escolhe-se indivı́duos com caracterı́sticas semelhantes, tais como, idade, sexo,
nı́vel sócio-econômico, estado de saúde ou, em geral, fatores que podem influenciar de maneira relevante a
variável resposta.

8.4.1 Teste McNemar


O exemplo a seguir ilustra a necessidade de desenvolvimento de um teste especı́fico para a situação de
dados pareados em que a resposta é dicotômica.
Exemplo 8.6. Suponhamos que dois patologistas examinaram, separadamente, o material de 100 tumores
e os classificaram como benignos ou malignos. A questão de interesse é saber se os patologistas diferem nos
seus critérios de decisão.
Neste caso, a forma adequada de apresentação dos dados é mostrada na Tabela 8.9.

Tabela 8.9: Classificação de dois patologistas (A e B) quanto à malignidade de tumores.


Diagnóstico de B Diagnóstico de A Total
Malignos Benignos
Malignos 9 1 10
Benignos 9 81 90
Total 18 82 100

É importante observar que a unidade de análise aqui é o tumor, avaliado por dois patologistas. Embora
tenham sido feitas 200 análises, o total de tumores é, na realidade, apenas 100.
Além disto, alguns tumores serão claramente mais malignos do que outros e, portanto, a hipótese funda-
mental na construção do teste de probabilidade constante de malignidade não é razoável aqui. Isto explica
a necessidade de desenvolvimento de teste especı́fico, isto é, para dados pareados.
Os dados a serem analisados no processo de comparação podem ser resumidos no formato da Tabela 8.10.
H0 : Os patologistas tem o mesmo diagnóstico.

Tabela 8.10: Apresentação de dados obtidos em uma classificação de dados pareados.


Controle Tratamento Total
Sucesso Fracasso
Sucesso a b n1
Fracasso c d n2
Total m1 m2 n

Se p1 e p2 são as probabilidades de sucesso nos grupos controle e tratamento, respectivamente, a hipótese


de interesse é:
H0 : p1 = p2
Ha ̸ p2
: p1 =
8.4 Resposta Dicotômica: Amostras Pareadas ROSSI, R. M. 99

A Estatı́stica Teste: (B/C)


(|b − c| − 1)2
χ2M cN = ∼ χ21 .
b+c
A hipótese nula deverá ser rejeitada quando χ2M cN > χ21 .
Exemplo 8.7. Amigdalectomia e doença de Hodgkin.

Johnson & Johnson (1972), ao analisarem retrospectivamente a história clı́nica de pacientes de doença de
Hodgkin, um tipo de câncer no tecido linfóide, não encontraram evidências que sustentassem a hipótese de
que a amigdalectomia aumenta a suscetibilidade à doença, pela remoção da ”barreira linfática” representada
pela amı́gdala. Neste estudo, usaram um planejamento do tipo caso-controle pareado. A conclusão relatada
no artigo foi feita, entretanto, com uma análise apropriada para dados provenientes de grupos independentes.
Logo após a publicação, vários autores observaram a impropriedade da análise e, utilizando as informações
do artigo, fizeram a análise correta, que é baseada nos dados da Tabela 8.11.

Tabela 8.11: Distribuição de pacientes com e sem doença de Hodgkin em um estudo caso-controle pareado
segundo à amigdalectomia.
Doença de Controle Total
Hodgkin Operados Não operados
Operados 26 15 41
Não operados 7 37 44
Total 33 52 85

O valor da estatı́stica do teste de McNemar é:


(|15 − 7| − 1)2
χ2M cN = = 2, 23 (p-valor : 0,1356).
15 + 7
Este valor dever ser comparado com 3,84 para um nı́vel de significância de 5%. Ou seja, com uma
confiança de 95% acreditamos que não há associação entre a doença de Hodgkin e a amigdalectomia. Esta
conclusão não está de acordo com trabalhos anteriores, como o de Vianna et al. (1971).
8.5 Resposta Contı́nua - Teste de Médias para Amostras Independentes ROSSI, R. M. 100

8.5 Resposta Contı́nua - Teste de Médias para Amostras Indepen-


dentes
Às vezes, é preciso comparar duas populações. Por exemplo, imagine que um pesquisador obteve, para
um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos
e meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Nesta seção apresentamos a metodologia para comparar dois grupos de pacientes (por exemplo, doentes
versus não doentes) em relação a uma resposta contı́nua, por exemplo, pressão sistólica. Testa-se, neste caso,
a igualdade das médias das respostas de dois tratamentos.
Sejam µ1 e µ2 as médias da variável estudada para os dois grupos, respectivamente. As hipóteses a serem
testadas são:
H0 : µ1 = µ2
Ha ̸ µ2
: µ1 =

8.5.1 Teste t
Se a variável em análise tem distribuição normal ou aproximadamente normal, aplica-se o teste t para
comparar duas médias. Mas primeiro é preciso estabelecer o nı́vel de significância, α. Depois, dados os dois
grupos, 1 e 2, calculam-se:
a) as médias de cada grupo:
x̄1 : média do grupo 1
x̄2 : média do grupo 2
b) as variâncias ou os desvios-padrões de cada grupo:
s1 : desvio-padrão do grupo 1
s2 : desvio-padrão do grupo 2
c) a variância ponderada:

(n1 − 1)s21 + (n2 − 1)s22


s2p =
n1 + n2 − 2
d) o valor da estatı́stica teste, tc , definida por:
x̄1 − x̄2
tc = √ ( ) ∼ tn1 +n2 −2;α%
2
1 1
sp +
n1 n2

O intervalo de confiança para (µ1 − µ2 ) será:


√( )
1 1
(x̄1 − x̄2 ) ± tn1 +n2 −2;α% .s2p . +
n1 n2
Exemplo 8.8. Comparação entre tratamentos para dieta.
Para verificar se duas dietas para emagrecer são igualmente eficientes, um médico separou, ao acaso, um
conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para seu grupo. Decorrido
certo tempo, o médico obteve a perda (ou ganho) de peso, em quilogramas, de cada paciente de cada grupo.
Os dados estão apresentados na Tabela 8.12:
Após alguns cálculos preliminares, temos: x̄1 = 12; x̄2 = 15; s21 = 4; s22 = 5; s2p = 4, 4, desta forma, para
α = 5%, temos t15;5% = ±2, 13, assim:
12 − 15
tc = √ ( ) = −2, 902 ∈ Região de rejeição de H0 , logo podemos
1 1
4, 4 +
10 7
p − valor : 0, 010947
8.5 Resposta Contı́nua - Teste de Médias para Amostras Independentes ROSSI, R. M. 101

Tabela 8.12: Perdas de peso, em quilogramas, segundo a dieta.


1 15 19 15 12 13 16 15 - - -
2 12 8 15 13 10 12 14 11 12 13

concluir que, em média, as perdas de peso de pacientes submetidos aos dois tipos de dieta são diferentes.
Em termos práticos, a perda de peso é maior quando os pacientes são submetidos à dieta 2.

8.5.2 Teste z
Um pressuposto importante para aplicar o teste t visto anteriormente é que os dois grupos comparados
tenham a mesma variabilidade, o que nem sempre acontece na prática. No caso de amostras grandes (n1 e
n2 ≥ 30) dispomos de um teste em que não é necessário qualquer suposição adicional sobre σ 21 e σ 22 , ou seja,
as varâncias podem ser iguais ou diferentes.
A estatı́stica teste usada será:
x̄1 − x̄2
Zc = √ ∼ N (0, 1).
s21 s22
+
n1 n2

Exemplo 8.9. Efeito do halotano em cirurgias cardı́acas.


O halotano é uma droga bastante utilizada para induzir a anestesia geral. Trata-se de um poderoso
anestésico de inalação, não inflamável e não explosivo, com um odor relativamente agradável. Pode ser
administrado ao paciente com o mesmo equipamento usado para sua oxigenação.
Após a inalação, a substância chega aos pulmões tornando possı́vel a passagem para o estado anestésico
mais rapidamente do que seria possı́vel com drogas administradas de forma intravenosa.
Entretanto, os efeitos colaterais incluem a depressão do sistema respiratório e cardiovascular, sensibi-
lização a arritmias produzidas por adrenalina e eventualmente o desenvolvimento de lesão hepática. Alguns
anestesistas acreditam que esses efeitos podem causar complicações em pacientes com problemas cardı́acos
e sugerem o uso da morfina como um agente anestésico nesses pacientes devido ao seu pequeno efeito na
atividade cardı́aca.
Conahan et al. (1973) compararam esses dois agentes anestésicos em um grande número de pacientes
submetidos a uma cirurgia de rotina para reparo ou substituição da válvula cardı́aca. Para obter duas
amostras comparáveis, os pacientes foram alocados aleatoriamente a cada tipo de anestesia. Com o objetivo
de estudar o efeito desses dois tipos de anestesia, foram registradas variáveis hemodinâmicas, como pressão
sangüı́nea antes da indução anestésica, após a anestesia mas antes da incisão, e em outros perı́odos impor-
tantes durante a operação. A questão que surge é se o efeito do halotano e da morfina na pressão sangüı́nea
é o mesmo. Para comparar os dois grupos, necessitamos dos resultados apresentados na Tabela 8.13 a seguir:

Tabela 8.13: Média e desvio-padrão da pressão sangüı́nea (mmHg) segundo o tipo de anestesia.
Informações Anestesia
sobre a amostra Halotano Morfina
Média 66,9 73,2
Desvio-Padrão 12,2 14,4
n 61 61

Nas condições do problema, as hipóteses são:


{
H0 : µ1 = µ2
;
Ha : µ1 ̸= µ2

isto é, devemos testar a diferença entre as pressões sangüı́neas médias de indivı́duos anestesiados com halotano
ou morfina.
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas ROSSI, R. M. 102

Como as amostras são grandes, podemos usar o teste Z, cujo valor da estatı́stica do teste é:
66, 9 − 73, 2 6, 30
Zc = √ = −√ = −2, 61 (p-valor : 0,0103).
2
12, 2 14, 4 2 5, 84
+
61 61
Adotando um nı́vel de siginificância de 5%, o resultado é estatisticamente significativo, já que | − 2, 61| >
1, 96, indicando que os dois anestésicos não são equivalentes.

8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas


8.6.1 Teste t-pareado
Para estudar o efeito de um tratamento, muitas vezes comparam-se pares de indivı́duos. Por exemplo, em
alguns estudos de psicologia comparam-se pares de gêmeos: um dos gêmeos recebe o tratamento, enquanto
o outro permanece sem o tratamento (controle).
Outras vezes, comparam-se os dois lados dos mesmos indivı́duos. Por exemplo, par estudar o efeito de um
tratamento para prevenção de cáries, o dentista pode aplicar o tratamento em um lado da arcada dentária
de cada paciente, e deixar o outro lado sem tratamento (controle).
Também são feitos experimentos em que se observam os mesmos indivı́duos duas vezes, isto é, uma vez
antes, outra vez, depois de administrar o tratamento. Por exemplo, para verificar o efeito de um tratamento
sobre pressão arterial, o médico pode obter a pressão arterial de seus pacientes, antes e depois de administrar
o tratamento.
Todos esses exemplos são de observações pareadas (pares de gêmeos, dois lados de um indivı́duo, ob-
servações no mesmo indivı́duo). Para testar o efeito de um tratamento, quando as observações são pareadas,
aplica-se o teste t.
Estatı́stica teste:

tc = √ ∼ tn−1;α%
s2
n
onde:
d¯ : média das diferenças, di = x2 − x1 : a diferença entre as unidades de cada um dos n pares

n
di
i=1
d¯ =
n
s2 : variância das diferenças, di .
Toda vez que o valor absoluto de tc for igual ou maior do que o valor tabelado tn−1;α% , conclui-se que o
tratamento tem efeito ao nı́vel α% estabelecido.
O intervalo de confiança para d, será dado por:
S
d¯ ± tn−1;α% . √
n
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas ROSSI, R. M. 103

Exemplo 8.10. São dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento.

Tabela 8.14: Pesos em Kg de 9 pessoas antes e depois da dieta para emagrecimento.


Dieta
Antes Depois di
77 80 3
62 58 -4
61 61 0
80 76 -4
90 79 11
72 69 -3
86 90 4
59 51 -8
88 81 -7
Total -30

Para fazer o teste, é preciso primeiro estabelecer o nı́vel de significância. Seja α = 1%,

30
d¯ = − = −3, 33
9
s2 = 25

logo
−3, 33
tc = √ = −2, 0 (p-valor : 0,080516).
25
9
Ao nı́vel de siginificância de 1% com g.l. = 8, o valor de t tabelado para t8;1% .é de 3,36. Como o valor
absoluto de tc (2,0) é menor do que o valor da tabela, concui-se que o tratamento não tem efeito significativo.
Em termos práticos, o experimento não provou que a dieta emagrece.
8.7 Testes Não-Paramétricos ROSSI, R. M. 104

8.7 Testes Não-Paramétricos


Os testes não-paramétricos são boas opções para situações em que ocorrem violações dos pressupostos
básicos necessários para a aplicação de um teste paramétrico. Por exemplo, para testar a diferença de dois
ou mais grupos quando a distribuição subjacente é assimétrica ou dos dados foram coletados em uma escala
ordinal.

8.7.1 Teste Mann-Whitney para Amostras Independentes


Este teste corresponde a mais uma alternativa para a comparação de duas amostras independentes,
utilizando, como os demais testes não-paramétricos, os números naturais para classificação conjunta dos
valores observados. Portanto, o posto de um valor de um conjunto de n valores corres-ponde a um número
natural que indicará a sua posição no conjunto anteriormente ordenado (posto, score ou rank ), isto é, todas
as N observações recebem uma pontuação através dos números naturais 1, 2, 3, 4, ..., n. Assim, ao menor valor
se dará o número 1, e assim sucessivamente até o valor maior, que receberá a maior pontuação. Quando
ocorre a presença de valores iguais no conjunto, considera-se um ponto médio, não afetando o posto seguinte.
Portanto, num conjunto de seis valores já ordenados {7-12-18-18-19-23} os postos serão {1-2-3,5-3,5-5-6},
respectivamente.
Quanto ao procedimento mais adequado para a aplicação do teste, baseamo-nos no cálculo de U1 e U2 ,
sendo:
ni (ni + 1)
Ui = n1 n2 + − Ti , i = 1, 2.
2
Os valores n1 e n2 são os tamanhos das duas amostras de T1 e T2 , que correspondem as somas dos pontos
(postos) atribuı́dos aos valores das duas amostras.

Para amostras pequenas (ni ≤ 20)

Uc = mı́n{U1 ; U2 }
Obtemos uma estatı́stica tabelada : UT = Uα,n1 ,n2 e concluı́mos para a rejeição de H0 se UT ≥ Uc .

Para amostras grandes (ni > 20)


Neste caso o teste pode ser aplicado por aproximação normal:

ni (n1 + n2 + 1)
µ∗ = , sendo ni = min{n1 ; n2 }
√ 2
n1 n2 (n1 + n2 + 1)
e σ∗ = ,
12
considerando w = min{T1 ; T2 } tem-se a expressão:

w − µ∗
Z= ∼ N (0, 1).
σ∗
8.7 Testes Não-Paramétricos ROSSI, R. M. 105

Exemplo 8.11. Verificar se os dados das duas amostras apresentam diferença significativa.

Tabela 8.15: Dados hipotéticos.


Amostra A Amostra B
2,6 (9,5) 2,3 (5)
2,9 (13) 2,8 (12)
2,5 (8) 2,0 (2)
2,7 (11) 1,8 (1)
3,2 (14) 2,4 (7)
2,6 (9,5) 2,3 (5)
2,3 (5) 2,2 (3)
3,3 (15) -
T1 = 85, 0 T2 = 35, 0

Procede-se à ordenação dos valores para obtenção dos seus postos e posteriormente seu somatório.
Temos então n1 = 8, n2 = 7, T1 = 85 e T2 = 35.
O valor de U1 e de U2 , respectivamente serão:

8(8 + 1)
U1 = 8(7) + − 85 = 7
2
7(7 + 1)
U2 = 8(7) + − 35 = 49.
2
Assim
Uc = mı́n{7;49} = 7
O valor da estatı́stica tabelada (Anexo) será de:

UT = Uα,n1 ,n2 = U5%,8,7 ≃ 12

Como Uc ≤ UT rejeitamos Ho . Portanto as amostras diferem entre si ao nı́vel de 5% de significância.


Suponho n > 20 O teste pode ser aplicado tanto para U1 ou U2 , pois ambos são simétricos em relação à
média. √
7(8 + 7 + 1) 112 8(7)(8 + 7 + 1)
µ∗ = = = 56 e σ ∗ = = 8, 63.
2 2 12
Sendo assim, w = min{85; 35} = 35, tem-se:
35 − 56
Z= = −2, 43 (p-valor : 0,013986).
8, 63

Como o valor de |Z| é maior do que Zα , quando α = 5%, ou seja, o valor 1,96, rejeitamos H0 . Considera-se
que as amostras diferem entre si ao nı́vel de 5% de significância.

8.7.2 Teste Kruskal-Wallis para k Amostras Independentes


O teste de Kruska-Wallis foi criado como um substituto ao teste F na análise de variância paramétrica
(ANOVA) que será apresentado no próximo capı́tulo.
Ele é utilizado para que se verifique o contraste entre k (k>2) amostras independentes.
Requisitos:

• Comparação entre 3 ou mais grupos independentes;

• Dados ordinais (que possam ser ordenados);


• ni ≥ 6.
8.7 Testes Não-Paramétricos ROSSI, R. M. 106

Os valores obtidos nas diversas amostras diferem entre si e portanto, será uma maneira de verificar se
estas diferenças são devidas ao acaso ou se as amostras provém de populações diferentes.
Da mesma forma que nos outros testes, serão consideradas as hipóteses nula (H0 ) e alternativa (Ha ), isto
é:

H0 : não há diferença significativa entre os tratamentos.


Ha : há diferença significativa entre os tratamentos.

Quanto à metodologia usada no teste de Kruskal-Wallis, a expressão é definida por:


12 ∑k T2
HK−W = i
− 3(N + 1) tal que H ∼ χ2(k−1)
N (N + 1) i=1 ni
em que:
Ti : é a soma das ordens atribuı́das ao tratamento i;
k : corresponde ao número de tratamentos ou amostras a comparar;
ni : o número de observações em cada tratamento k e,
N : o total de observações em todos os tratamentos k.
Exemplo 8.12. Analisar o tempo de sobrevida, em meses, de pacientes atendidos na clı́nica de abdômen
do hospital X, na cidade de Cabrobó.

Tabela 8.16: Tempo de sobrevida.


Radioterapia (n1 = 7) Quimioterapia (n2 = 8) Cirurgia (n3 = 8)
17 (11) 20 (12) 32 (17)
14 (9) 5 (3) 35 (20)
4 (2) 9 (6) 26 (15)
8 (5) 13 (8) 34 (18,5)
29 (16) 34 (18,5) 21 (13)
6 (4) 2 (1) 45 (21)
15 (10) 11 (7) 50 (23)
- 22 (14) 47 (22)
T1 = 57, 0 T2 = 69, 5 T3 = 149, 5

Questões: Há diferença sifnificativa entre os tempos de sobrevivência? Qual o tratamento recomendado
baseado no tempo de sobrevida?
Independentemente do número de observações em cada grupo e utilizando os números naturais, procede-
mos à ordenação dos valores. Assim os valores acima receberiam a seguinte numeração, conforme os valores
já entre parênteses.
Então:
12 ∑k T2
HK−W = i
− 3(N + 1)
N (N + 1) i=1 ni
12 ∑3 T2
= i
− 3(23 + 1)
23(23 + 1) i=1 ni
[ ]
1 572 69, 52 149, 52
= + + − 72
46 7 8 8
1
= (3861, 7) − 72
46
= 11, 95 (p-valor : 0,0025).

Como HK−W ∼ χ2(k−1) , então H ∼ χ2(3−1) ⇒ χ22;5% = 5, 99 e χ22;1% = 9, 21, portanto, considerando que
o valor encontrado de HK−W = 11, 95 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 e conseqüentemente, pela indicação de que o tratamento cirúrgico
se destaca dos demais, pois apresenta maiores valores aos tempos de sobrevida.
8.7 Testes Não-Paramétricos ROSSI, R. M. 107

8.7.3 Teste de Wilcoxon para Amostras Pareadas


Trata-se de um teste não-paramétrico para comparar dois tratamentos quando os dados são obtidos
através do esquema de pareamento. A prova de Wilcoxon avalia a grandeza das diferenças quando
comparados postos de observações. Dada a grandeza das diferenças observadas, atribui-se maior valor para
a maior diferença encontrada, diminuindo este valor de acordo com as menores diferenças existentes.
Procedimento

1. Calcular di : diferença entre as obsevações


(2) (1)
di = xi − xi

2. Ignorar os sinais e atribuir postos


3. Calcular a soma dos postos (T+ e T− ).
4. Obter o valor da estatı́stica calculada

Tc = min{|T− |; |T+ |}

5. Obter o valor da estatı́stica Tabelada (Anexo V)

Tα;n

6. Concluir pela rejeição de H0 se Tc ≤ Tα;n .

Pequenas Amostras (n ≤ 20)


No confronto de dois grupos quando desejamos identificar se existe diferença significativa entre os mesmos
quanto às medidas encontradas, empregamos o teste de Wilcoxon quando a variação dos valores apresenta-se
de forma acentuada.
A aplicação deste teste pressupõe que as duas amostras sejam casualizadas e independentes, e que as
variáveis em confronto sejam contı́nuas.
A metodologia do teste consiste em se proceder à ordenação dos valores das amostras e, posteriormente,
atribuir aos mesmos seus “ranks”. Em seguinda, obtém-se os totais do ranks da amostra de menor tamanho,
consultando-se a tabela (anexo) do referido teste.
Exemplo 8.13. Foi realizado um ensaio clı́nico em que foram utilizadas duas drogas A e B. Com a droga
A foram tratados oito pacientes e com a droga B, cinco pacientes. Os nı́veis de anticorpos corresponderam
a:

Tabela 8.17: Nı́veis de anticorpos.


Tratamento d rank de |d|
A B - -
7,4 9,1 1,7 5
12,3 9,7 -2,6 6
11,8 19,2 7,4 8
16,4 22,4 6,0 7
1,9 1,5 -0,4 1
3,0 3,5 0,5 2,5
6,8 7,8 1,0 4
20,4 19,9 -0,5 2,5

Tem-se:

Soma dos ranks (-) : 9,5


Soma dos ranks (+) : 26,5
8.7 Testes Não-Paramétricos ROSSI, R. M. 108

assim
Tc = min{9, 5; 26, 5} = 9, 5
consultando-se a Tabela de Wilcoxon, verifica-se que Tα;n = T5%;5 = 5 < 9, 5 (no Statistica o p-valor :
0,234).
Assim, não rejeitamos H0 , ou seja, que os valores comparados, referentes às drogas A e B, não apresentam-
se com diferença siginificativa. Conclui-se, então, que os valores de nı́veis de anticorpos em relação aos dois
tipos de drogas se comportam de forma semelhante.

Grandes Amostras (n > 20)


Nos casos de grandes amostras, estas apresentam valores com distribuição normal e, portanto, a com-
paração das medidas será realizada através de determinação de um valor W ∗ .
São enunciadas naturalmente as hipóteses. H0 será rejeitada se o valor de W ∗ for maior ou igual a Zα
para um nı́vel de significância, α, pré-determinado.
Assim, para a comparação de conjuntos de medidas, provenientes de duas amostras, será necessário
utilizar a expressão de W ∗ :
n(n + 1)
Tc −
W =√∗ 4 ∼ N (0, 1)
n(n + 1)(2n + 1)
24
em que:
n : número de elementos da menor amostra;
Exemplo 8.14. Evolução do tratamento com tianeptina: Escores dos pacientes do grupo tianeptina no
primeiro e no último dia:

Tabela 8.18: Tratamento com tianeptina.


Tianeptina
Primeiro dia (m = 8) Último dia (n = 8) d Postos
24 6 -18 (-) 11,5
46 33 -13 (-) 7
26 21 -5 (-) 4,5
44 26 -18 (-) 11,5
27 10 -17 (-) 9,5
34 29 -5 (-) 4,5
33 33 0 (+) 1
25 29 +4 (+) 3
35 37 +2 (+) 2
30 15 -15 (-) 8
38 2 -36 (-) 14
38 21 -17 (-) 9,5
31 7 -24 (-) 13
27 * * *
34 * * *
32 26 -6 (-) 6

Sendo assim temos: |T− | = 99 e |T+ | = 6, então

Tc = min{99; 6} = 6

De acordo com a Tabela de Wilcoxon,

Tα;n = T5%;14 = 21

Como 6 < 21, rejeitamos H0 .


8.7 Testes Não-Paramétricos ROSSI, R. M. 109

Supondo n grande teremos:

14(14 + 1)
6−

W =√ 4 = −2, 92 (p-valor : 0,003).
14(14 + 1)(2.14 + 1)
24
Considerando que o valor de W ∗ = −2, 92 está na área de rejeição de H0 , para o valor de Z5% = ±1, 96,
rejeitamos H0 , ou seja, os valores dos dois conjuntos apresentam diferenças significativas.

8.7.4 Teste Friedman para k Amostras Pareadas


O teste de Friedman é recomendado como um substituto do teste F (ANOVA), quando
procede-se à comparação de k (k>2) amostras relacionadas ou dependentes cujas observações
apresentam valores com acentuadas variações e em cada tratamento são constituı́dos blocos.
Na verdade, procura-se fazer a comparação de tratamentos em que são formados blocos com a intenção de
que isto resulte em um pareamento considerável entre os diversos tratamentos.
A forma de realização do teste é análogo aos demais. Dentro de cada um do n blocos formados procede-se
à classificação das i-ésimas observações em k tratamentos, utilizando-se números naturais.
Assim, tem-se a estatı́stica teste:

12 ∑k
HF r = T 2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1 i

Exemplo 8.15. São prescritos quatro procedimentos técnicos para determinação de certa variável. Foram
formados cinco blocos e obtidos os seguintes valores:

Tabela 8.19: Dados de quatro procedimentos técnicos.


Tratamentos
A B C D
12 (2) 13 (3) 16 (4) 7 (1)
8 (2) 9 (3) 12 (4) 5 (1)
14 (2) 20 (3) 22 (4) 6 (1)
17 (3) 16 (2) 21 (4) 11 (1)
12 (2) 15 (3) 16 (4) 10 (1)
T1 = 11 T2 = 14 T3 = 20 T4 = 5

Substituindo-se os valores na expressão no teste, tem-se:

12 ∑4
HF r = . Ti2 − 3.5(4 + 1)
5.4(4 + 1) i=1
12
= . [121 + 196 + 400] − 75
100
= 14, 04 (p-valor : 0,00285).

Como HF r ∼ χ2(k−1) , então HF r ∼ χ2(4−1) ⇒ χ23;5% = 7, 82 e χ23;1% = 11, 34, portanto, considerando que
o valor encontrado de HF r = 14, 04 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 , logo verifica-se que há diferença significativa entre as medidas dos
tratamentos. O tratamento C apresentou melhores resultados em relação aos demais grupos.
8.7 Testes Não-Paramétricos ROSSI, R. M. 110

8.7.5 Outros Testes Não-Paramétricos


Teste de Concordância ou de Replicabilidade (Coeficiente de Kappa)
O coeficiente de Kappa é utilizado para verificar a concordância entre os diagnósticos de dois especialistas.
Observe a Tabela (8.20) abaixo:

Tabela 8.20: Concordância entre o diagnóstico de dois especialistas.


Diagnóstico Diagnóstico Especialista 1 Total
Especialista 2 Presente (+) Ausente (-)
Presente (+) a (++) b (+-) n1 = a + b
Ausente (-) c (-+) d (–) n2 = c + d
Total m1 = a + c m2 = b + d n

Cálculos auxiliares:

• Proporção de concordância observada:


a+d
po =
n
• Proporção de concordância casual:
n1 m 1 + n2 m 2
pc =
n2
• Coefficiente:
po − pc
Kappa = .
1 − pc
Classificação:
Kappa Concordância
k=0 nenhuma
k < 0, 4 leve
0, 4 ≤ k < 0, 8 moderada
0, 8 ≤ k < 1 forte
k=1 perfeita
Exemplo 8.16. Em uma determinada experiência, foi avaliado o grau de lesão do tecido hepático, em 20
cobaias às quais foi administrada uma certa substância tóxica. Os resultados dos exames efetuados por dois
patologistas foram o seguinte:

Tabela 8.21: Teste Kappa para a concordância entre patologistas quanto ao grau de lesão do tecido hepático.
Cobaia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Patologista 1 + + + + + + - + + + + + + - - + - + + -
Patologista 2 + + - + + + - - + + - + + - - - - - + -

+ : presença de lesão hepática


- : ausência de lesão hepática.

Com base nesses resultados, é possı́vel construir a tabela abaixo:


Então tem-se:
a+d 10 + 5
po = = = 0, 75
n 20
n1 m 1 + n2 m 2 15(10) + 5(10) 200
pc = 2
= 2
= = 0, 5
n 20 400
po − pc 0, 75 − 0, 5
Kappa = = = 0, 5.
1 − pc 1 − 0, 5
Conclui-se que existe uma concordância apenas moderada entre os diagnósticos dos patologistas.
8.7 Testes Não-Paramétricos ROSSI, R. M. 111

Tabela 8.22: Concordância entre o diagnóstico de dois especialistas.


Diagnóstico Diagnóstico Patologista 1 Total
Patologista 2 Presente (+) Ausente (-)
Presente (+) 10 5 15
Ausente (-) 0 5 5
Total 10 10 20

Teste de Cochran
O teste de Cochran é utilizado quando se deseja comparar tratamentos distintos aplicados a uma mesma
amostra (medidas repetidas), o que caracteriza a dependência ou o pareamento das unidades amostrais em
que a resposta é da forma 0 ou 1, isto é, sucesso ou fracasso. O teste de Cochran é uma extensão do teste
de McNemar.
A hipótese a ser testada será:
H0 : Os tratamentos não diferem entre si;
Ha : Pelo menos um par de tratamentos diferem entre si.
Estatı́stica teste:
∑k
2
k(k − 1) (Ti ) − (k − 1)N 2
i=1
Q= ∑n ∼ χ2k−1 .
2
kN − (Sj )
j=1

Sendo k : tratamentos e N : total de un‘s.


A decisão pela rejeição de Ho será tomada se Q ≥ χ2k−1 , assim existe pelo menos um par de tratamentos
que diferem entre si ao nı́vel α de significância.
Um psiquiatra quer testar a eficiência de 4 tratamentos em 10 sujeitos submetidos a um teste cuja resposta
é “sim” ou “não”.

Tabela 8.23: Teste de Cochran: Dez indivı́duos submetidos a quatro tratamentos supostamente homogêneos.
Tratamentos
2
Indivı́duos T1 T2 T3 T4 Sj (Sj )
1 1 1 1 1 4 16
2 1 0 0 1 2 4
3 1 0 1 0 2 4
4 1 1 1 0 3 9
5 0 0 0 0 0 0
6 0 1 1 1 3 9
7 1 0 1 1 3 9
8 0 0 1 0 1 1
9 1 1 1 0 3 9
10 0 1 0 0 1 1
Ti 6 5 7 4 22 62
2
(Ti ) 36 25 49 16 126 -

Assim tem-se:

4
2
4(4 − 1) (Ti ) − (4 − 1)(222 )
i=1
Q =

10
2
4(22) − (Sj )
j=1

4(3) (126) − (4 − 1)(222 )


=
4(22) − (62)
= 2, 31 < χ23 = 7, 815,
8.7 Testes Não-Paramétricos ROSSI, R. M. 112

logo não se rejeita H0 .Concluı́-se que os tratamentos não diferem entre si ao nı́vel de 5% de significância.
Observação: Em caso de rejeição da hipótese nula, um procedimento de comparações múltiplas deve
ser realizado (ver CASTELLANOS e MERINO, 1989).
Capı́tulo 9

Análise de Variância

Às vezes é preciso comparar médias de mais de duas populações. Por exemplo, para verificar se pessoas
com diferentes nı́veis de renda, isto é, alto, médio e baixo têm, em média, o mesmo peso corporal, é preciso
comparar médias de três populações.
Outras vezes, é preciso comparar várias situações experimentais. Por exemplo, se um pesquisador separa,
ao acaso, um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo, terá que
comparar médias de quatro “populações”.
Para comparar médias de mais de duas populações normais ou aproximadamente normais, aplica-se o
teste F. Neste caso convém verificar antecipadamente a normalidade dos dados.
Por exemplo, imagine que 4 amostras casuais simples, todas com cinco elementos mas cada uma prove-
niente de uma população, conduziram aos dados apresentados na Tabela 9.1.

Tabela 9.1: Dados de 4 amostras e respectivas médias.


Amostras
A B C D
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
8 5 7 0
x̄1 = 8 x̄2 = 5 x̄3 = 5 x̄4 = 2

Será que as diferenças das médias das amostras são suficientemente grandes para que se possa afirmar
que as médias das populações são diferentes? Para responder a esta pergunta, é preciso um teste estatı́stico.

9.1 ANOVA para Experimentos ao Acaso


Primeiro, é preciso estudar as causas de variação. Por que os dados variam? Uma explicação é o fato de
as amostras provirem de populações diferentes. Outra explicação é o caso, porque mesmo dados provenientes
da mesma população variam.
O teste F é feito através de uma análise de variância, que separa a variabilidade devido aos “tra-
tamentos” (no exemplo, devido às amostras terem provindo de populações diferentes) da variabilidade
residual, isto é, devido ao acaso. Para aplicar o teste F é preciso fazer uma série de cálculos, que exigem
conhecimento de notação.
A Tabela 9.2, apresenta os dados de k tratamentos, cada um com r repetições (no exemplo, denominam-se
repetições os elementos da mesma amostra). A soma das r repetições de um mesmo tratamento constitui o
total desse tratamento. O total geral é dado pela soma dos k totais de tratamentos.

113
9.1 ANOVA para Experimentos ao Acaso ROSSI, R. M. 114

Tabela 9.2: Notação para a análise de variância.


Tratamentos
1 2 3 ... k Total
x11 x21 x31 ... xk1
x12 x22 x32 ... xk2
. .
. .
. .
x1r x2r x3r xkr ∑ ∑
Total T1 T2 T3 ... Tk T = x
No de repetições r r r ... r n = kr
Média x̄1 x̄2 x̄3 x̄k

Para fazer a análise de variância é preciso calcular as seguintes quantidades:

1. os graus de liberdade:

(a) de tratamento: k − 1
(b) de total: n − 1
(c) de resı́duo: (n − 1) − (k − 1) = n − k

2. o valor C, dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O valor C é
chamado correção. ∑
( x)2
C=
n
3. a soma de quadrados total: ∑
SQT = x2 − C

3. a soma de quadrados de tratamentos:



T2
SQT r = −C
r

4. a soma de quadrados de resı́duos:


SQR = SQT − SQT r

5. o quadrado médio de tratamentos:


SQT r
QM T r =
k−1
6. o quadrado médio de resı́duo:
SQR
QM R =
n−k
7. o valor de F
QM T r
F =
QM R
Em seguida, é preciso comparar o valor calculado de F com o valor tado em tabela, ao nı́vel de significância
estabelecido e com (k − 1) graus de liverdade no numerador e (n − k) graus de liberdade no denominador.
Toda vez que o valor calculado de F for maior ou igual do que o da tabela conclui-se, ao nı́vel de
significância estabelecido, que as médias de tratamentos são iguais.
Exemplo 9.1. Para os dados apresentados na Tabela 9.1, proceder uma análise de variância para verificar
se existe diferença significativa entre os tratamentos.
9.1 ANOVA para Experimentos ao Acaso ROSSI, R. M. 115

1. os graus de liberdade:

(a) de tratamento: k − 1 = 4 − 1 = 3
(b) de total: n − 1 = 20 − 1 = 19
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 20 − 4 = 16

2. o valor C: ∑
( x)2 (11 + 8 + ... + 0)2
C= = = 500
n 20
3. a soma de quadrados total:

SQT = x2 − C = 112 + 82 + ... + 02 − 500 = 658 − 500 = 158

3. a soma de quadrados de tratamentos:


∑ 2
T 402 + 252 + 252 + 102
SQT r = −C = − 500 = 590 − 500 = 90
r 5

4. a soma de quadrados de resı́duos:

SQR = SQT − SQT r = 158 − 90 = 68

5. o quadrado médio de tratamentos:


SQT r 90
QM T r = = = 30
k−1 3

6. o quadrado médio de resı́duo:


SQR 68
QM R = = = 4, 25
n−k 16
7. o valor de F
QM T r
F = = 7, 06
QM R
As quantidades calculadas são apresentadas numa tabela de análise de variância. Veja a Tabela 9.3:

Tabela 9.3: Análise de variância dos dados da Tabela 6.1.


Causas da variação GL SQ QM F p
Tratamentos 3 90 30 7,06 0,003086
Resı́duo 16 68 4,25
Total 19 158

Ao nı́vel de significância de 5%, o valor de F tabelado, com 3 e 16 graus de liberdade (numerador e


denominador, respectivamente), é de 3,24. Como o valor obtido é maior do que 3,24, conclui-se que as
médias não são iguais, ao nı́vel de significância de 5%.
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 116

9.2 Teste de Comparações Múltiplas


9.2.1 Número Igual de Repetições
Teste Tukey
Uma análise de variância permite estabelecer se as médias das populações em estudo são, ou não são, esta-
tisticamente iguais. No entanto, esse tipo de análise não permite detectar quais são as médias estatı́sticamente
diferentes das demais. Por exemplo, a análise de variância apresentada na Tabela 6.3 mostrou que as médias
das populações não são iguais, mas não permite concluir que é, ou quais são, as médias diferentes das demais.
O teste de Tukey permite estabelecer a diferença mı́nima significante (dms), ou seja, a menor diferença
de médias de amostras que deve ser tomada como estatisticamente significante, em determinado nı́vel. Essa
diferença (d.m.s) é dada por: √
QM R
dms = q
r
onde q é um valor dado em tabela, QMR é o quadrado médio do resı́duo da análise de variância e r é o
número de repetições de cada tratamento.
Considere agora os dados da Tabela 9.1. A análise de variância apresentada na Tabela 9.3 mostra um
valor F significante ao nı́vel de 5%. Então as médias de A, B, C e D não são estatı́sticamente iguais. Mas
qual é, ou quais são, as médias diferentes entre si?
A pergunta pode ser respondida com a aplicação do teste de Tukey. Ao nı́vel de significância de 5%,
o valor de q para comparar 4 tratamentos (A,B, C e D), com 16 graus de liberdade no resı́duo, é de 4,05.
Como QMR = 4,25 e r = 5, segue-se que:

4, 25
dms = 4, 05 = 3, 73.
5
De acordo com o teste de Tukey, duas médias são estatisticamente diferentes toda vez que o valor absoluto
da diferença entre elas for igual ou superior ao valor da d.m.s. No caso do Exemplo, o valor da d.m.s. é 3.73
e os valores absolutos das diferenças entre as médias estão apresentados a seguir. É fácil ver que a diferença
entre as médias A e D é maior do que a d.m.s. Então, ao nı́vel de 5%, a média de A é significativamente
mair do que a média de D.

Tabela 9.4: Comparações entre as médias via Tukey.


Pares de médias Valor absoluto da diferença
AeB |8 − 5| = 3
AeC |8 − 5| = 3
AeD |8 − 2| = 6
BeC |5 − 5| = 0
BeD |5 − 2| = 3
CeE |5 − 2| = 3

Exemplo 9.2. Com base nos dados apresentados na Tabela 9.5 abaixo, verifique se existe diferença estatı́stica
entre os grupos. Note que são três grupos em comparação. No grupo operado foi feita a remoção das glândulas
salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cirúrgicos, mas nenhuma
glândula foi removida (Banco de dados: Tukey1 ex.stw).
Sol.: A tabela de análise de variância resume os cálculos:
Para aplicar o teste de Tukey ao nı́vel de significância de 5%, tem-se:
q3;21 ≃ 3, 57
e √
53, 247
dms = 3, 57 = 9, 21.
8
Os valores absolutos das diferenças de médias são:
A taxa de glicose é, em média, maior nos operados do que nos pseudo-operados, ao nı́vel de significância
de 5%.
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 117

Tabela 9.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias,
segundo o grupo.
Grupo
Operado Pseudo-operado Normal
96 90 86
95 93 85
100 89 105
108 88 105
120 87 90
110,5 92,5 100
97 87,5 95
92,5 85 95

Tabela 9.6: ANOVA para a taxa de glicose.


Causas da variação GL SQ QM F p
Grupos 2 717,25 358,625 6,73 0,005509
Resı́duo 21 1118,75 53,274
Total 23 1836,00

Teste Dunnett
Em muitos experimentos, é comum a necessidade de se realizar múltiplas comparações, todas em relação
a um único grupo denominado “Controle”. Neste caso, o test Dunnett (1964) é apropriado.
Teremos (k − 1) comparações a serem realizadas em relação ao controle e queremos testas as seguintes
hipóteses:

H0 : µi = µc i = 1, 2, ..., k − 1
Ha ̸ µc c: controle
: µi =

O procedimento de Dunnett é análogo ao teste t, mas modificado.



2QM R
dms = d
r
onde r é o número de repetições.
Considerando um nı́vel de confiança α, rejeitamos H0 se:
√ ( )
1 1
|x̄i − x̄c | > dα,(k−1),f QM R +
ni nc

onde:
dα,(k−1),f está tabelado (Tabela Dunnett) para k − 1 comarações e f : no de observações dos tratamentos
(exceto o controle);
QM R : proveniente da ANOVA (Quadrado Médio dos Resı́duos);
ni : no de observações do tratamento i;
nc : no de observações do controle;
x̄i e x̄c : médias, do tratamento e controle, respectivamente.
Exemplo 9.3. Deseja-se comparar o efeito de cinco drogas na diminuição da pressão arterial. Para isto
utilizou-se cinco grupos distintos e foram comparadas suas médias em relação a média de um grupo controle,
que recebeu placebo. Ao todo, 30 indivı́duos participaram no experimento. A Tabela abaixo apresenta os
valores referentes a diferença entre a pressão arterial no inı́cio e no fim do experimento (mmHg).
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 118

Tabela 9.7: Comparações para as taxas médias de glicose.


Pares de médias Valor absoluto da diferença p
Operado vs pseudo |102, 375 − 89, 0| = 13, 375 0,0004
Operado vs normal |102, 375 − 95, 125| = 7, 25 0,1403
Pseudo vs normal |89, 000 − 92, 125| = 6, 125 0,2368

Tabela 9.8: Diminuição da pressão arterial, em milı́metros de mercúrio, segundo o tratamento.


Tratamento
A B C D E Controle
25 10 18 23 11 8
17 -2 8 29 23 -6
27 12 4 25 5 6
21 4 14 35 17 0
15 16 6 33 9 2

Após a análise de variância, tem-se:


Como o valor de F apresentado é de 13,08 (p-valor = 0,000003) é significante ao nı́vel de 5%, é razoável
procurar um teste para comparar as médias dos tratamentos. A d.m.s. estabelecida pelo teste Dunnett
(especı́fico para este caso) será:
√ √
2QM R 2(36)
dms = d = 2, 70 = 10, 25
r 5
Obs. O valor d = 2, 70 é proveniente da Tabela Dunnett com 24 graus de liberdade.
Desta forma teremos:
É facil observar que os tratamentos A, D e E apresentam, em média, resultados melhores que os do
controle, ao nı́vel de 5%.

9.2.2 Número Diferente de Repetições


Muitas vezes o pesquisador dispõe de diversas amostras, cada uma proveniente de uma população, mas
essas amostras não têm todas o mesmo tamanho. Mesmo assim, é possı́vel conduzir a análise de variância.
Aliás, todos os cálculos, com exceção da soma de quadrados de tratamentos, são feitos na forma já apresentada
anteriormente.
Para entender como se calcula a soma de quadrados de tratamentos quando os tratamentos não têm o
mesmo número de repetições, primeiro observe a Tabela 9.11.
A soma de quadrados de tratamentos é dada pela fórmula:

T12 T2 T2
SQT r = + 2 + ... + k − C
r1 r2 rk
onde C é a correção já definida anteriormente.
É mais fácil entender a aplicação de fórmulas através de um exemplo.
Exemplo 9.4. Análise de variância para os dados da Tabela 9.12.

1. os graus de liberdade:

(a) de tratamento: k − 1 = 3 − 1 = 2
(b) de total: n − 1 = 15 − 1 = 14
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 15 − 3 = 12

2. o valor C: ∑
( x)2 (15 + 10 + ... + 16)2
C= = = 4001, 67
n 15
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 119

Tabela 9.9: ANOVA para os dados de pressão arterial, em milı́metros de mercúrio, segundo o tratamento.
Causas da variação GL SQ QM F p
Grupos 5 2354,17 470,83 13,08 0,000003
Resı́duo 24 864 36
Total 29 3218,17

Tabela 9.10: Comparações entre as médias dos dados de Pressão arterial.


Pares de médias Valor absoluto da diferença p
A vs Controle |21 − 2| = 19 > 10, 25 0,000182
B vs Controle |8 − 2| = 6 < 10, 25 0,392329
C vs Controle |10 − 2| = 8 < 10, 25 0,162730
D vs Controle |29 − 2| = 27 > 10, 25 0,000007
E vs Controle |13 − 2| = 11 > 10, 25 0,032024

3. a soma de quadrados total:



SQT = x2 − c = 152 + 102 + ... + 162 − 4001, 67 = 159, 33

3. a soma de quadrados de tratamentos:


∑ 2
T 842 762 852
SQT r = −C = + + − 4001, 67 = 63, 33
r 6 4 5

4. a soma de quadrados de resı́duos:

SQR = SQT − SQT r = 159, 33 − 63, 33 = 96, 00

5. o quadrado médio de tratamentos:


SQT r 63, 33
QM T r = = = 31, 67
k−1 2

6. o quadrado médio de resı́duo:


SQR 96
QM R = = = 8, 00
n−k 12
7. o valor de F
QM T r 31, 67
F = = = 3, 96
QM R 8, 00
Os valores calculados estão apresentados na Tabela 9.13.
Ao nı́vel de significância de 5%, com 2 e 12 g.l., o valor de F tabelado é de 3,89, menor do que 3,96,
conclui-se que as médias diferem entre si.
Os métodos de comparação de médias apresentados anteriormente também podem ser usados quando o
número de repetições por tratamento não é constante. Se ri e rj são o número de repetições dos tratamentos
em comparação, as fórmulas para a diferença mı́nima significante ficam como segue:

Teste Tukey
Para comparar as médias de tratamentos duas a duas, pode-se aplicar o teste de Tukey que, neste caso, é
aproximado, porque os tratamentos têm números diferentes de repetições. A diferença mı́nima significativa
(dms) é dada pela fórmula: √( )
1 1 QM R
dms = q +
ri rj 2
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 120

Tabela 9.11: Notação para a análise de variância com diferentes repetições.


Tratamentos
1 2 3 ... k Total
x11 x21 x31 ... xk1
x12 x22 x32 ... xk2
. .
. .
. .
x1r x2r x3r xkr ∑ ∑
Total T1 T2 T3 ... Tk T = x
No de repetições r1 r2 r3 ... rk n = kr
Média x̄1 x̄2 x̄3 x̄k

Tabela 9.12: Dados de 3 amostras e respectivas médias.


Amostras
A B C
15 23 19
10 16 15
13 19 21
18 18 14
15 16
13
x̄1 = 84 x̄2 = 76 x̄3 = 86

onde ri é o número de repetições do i-ésimo tratamento e rj é o número de repetições do j-ésimo tratamento.


No caso do Exemplo anterior com dados na Tabela 9.12, para comparar a média de A com a média de
B, tem-se: √( )
1 1 8
dms = 3, 77 + = 4, 87.
6 4 2
Para comparar A com C, tem-se:
√( )
1 1 8
dms = 3, 77 + = 4, 57.
6 5 2

Para comparar B com C, tem-se:


√( )
1 1 8
dms = 3, 77 + = 5, 06.
4 5 2

Os valores absolutos das diferenças entre as médias estão são apresentados a seguir. Como o valor
absoluto da diferença entre A e B é maior do que a respectiva d.m.s., conclui-se que, em média, A difere de
B, ao nı́vel de significância de 5%.
Existem diferentes testes de comparações múltiplas. Dentre eles destacam-se:

Teste t
A diferença mı́nima significativa é dada pela fórmula:
√ ( )
1 1
dms = t + QM R
ri rj
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 121

Tabela 9.13: Análise de variância.


Causas da variação GL SQ QM F p
Tratamentos 2 63,33 31,67 3,96 0,04784
Resı́duo 12 96 8
Total 14 159,33

Tabela 9.14: Comaparações entre médias.


Pares de médias Valor absoluto da diferença p
AeB |14 − 19| = 5 0,0443*
AeC |14 − 17| = 3 0,2272
BeC |19 − 17| = 2 0,5589

Teste Dunnett
A diferença mı́nima significativa é dada pela fórmula:
√( )
1 1
dms = d + QM R
ri rj

Considerações
A escolha apropriada de um teste é muito flexı́vel. Se o pesquisador quer ter alta chance de rejeitar
H0 : de que as médias são iguais, pode optar pelo teste t ou pelo teste Duncan (Não apresentado neste
material-Ver Vieira, 1999). Estes dois testes têm caracterı́sticas similares, mas o teste t é mais antigo e,
talvez por isso, mais conhecido. Também é de aplicação mais fácil. Entretanto, o pesquisador também pode
optar por aplicar o teste de Tukey ou de Dunnett, com nı́vel de significância mais elevado. Estes testes
teriam, então, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder do que o teste de Tukey
a 5%.
Um pesquisador que pretende somente rejeitar a hipótese de que as médias são iguais com muita confiança,
deve optar pelo teste de Tukey ou de Dunnett, com baixo nı́vel de significância. Esta situação pode ocorrer
quando se comparam novas drogas terapêuticas com uma droga conhecida. Toda droga tem efeitos colaterais.
Então, muitas vezes só é razoável indicar uma nova droga - de efeitos colaterais desconhecidos - quando
existem indicações seguras de que essa nova droga é melhor do que a convencional.
De qualquer forma, fica aqui um alerta: todos os procedimentos para a comparações de médias têm
vantagens e desvantagens. Ainda não existe um teste definitivamente “melhor” que todos os outros.
Capı́tulo 10

Testes Diagnósticos

10.1 Introdução
Uma das experiências mais rotineiras da prática médica é a solicitação de um teste diagnóstico. Os objeti-
vos são vários, incluindo a triagem de paciente, o diagnóstico de doenças e o
acompanhamento ou prognóstico da evolução de um paciente. Para chegar ao diagnóstico, o médico considera
várias possibilidades, com nı́veis de certeza que variam de acordo com as informações disponı́veis.
Um dos objetivo deste capı́tulo é mostrar como se mede o nı́vel de certeza da ocorrência de um evento,
por exemplo: a presença de uma doença após a observação de um teste positivo. Consideraremos o teste
positivo quando indicar a presença da doença e negativo quando indicar a ausência.
Não existe teste perfeito, aquele que com certeza absoluta determina a presença ou ausência da doença.
Estudaremos os ı́ndices nos quais o conceito de qualidade de um teste diagnóstico é usualmente desmenbrado.
Frequentemente, um único teste não é suficiente, e portanto deve-se combinar dois ou mais testes. O
ideal seria que, para cada patologia, fossem determinados os testes a serem incluı́dos no processo diagnóstico
e a melhor forma de combiná-los. Apresentaremos as formas mais comuns de combinações de testes e como
medir a qualidade do teste conjunto.
O bom uso de um teste diagnóstico requer, além de considerações clı́nicas, o conhecimento de medidas
que caracterizam a sua qualidade intrı́nseca: a sensibilidade, a especificidade e os parâmetros que refletem
a sua capacidade de produzir decisões clı́nicas corretas: Valor da Predição Positiva e o Valor da Predição
Negativa.
Na análise da qualidade de testes diagnósticos, interessa conhecer duas probabilidades condicionais, que
por suas importâncias, recebem nomes especiais:

122
10.2 Sensibilidade e Especificidade ROSSI, R. M. 123

10.2 Sensibilidade e Especificidade


A sensibilidade, denotada por s, é definida como a probabilidade de o teste ser positivo dado que o paciente
examinado é doente:
s = Pr(T+ |D+ )
A especificidade, denotada por e, é definida como a probabilidade de o teste ser negativo dado que o
paciente examinado não é doente:
e = Pr(T− |D− )
Os nomes são descritivos: sensibilidade mede a capacidade de reação do teste em um paciente doente
enquanto que especificidade, a reação do teste em pacientes não portadores da doença, isto é, o teste é
especı́fico para a doença em questão.
A análise da definição desses dois ı́ndices (s e e) mostra que, subjacentemente a estes conceitos, estamos
assumindo a existência de um padrão ouro (gold-standart), ou seja, um teste diagnóstico que sempre produz
resultados corretos. Além, disso assumimos que os pacientes são classificados apenas como doentes e não-
doentes não se admitindo estágios intermediários.
De acordo com a Tabela 10.1,

Tabela 10.1: Distribuição quanto à ocorrência de um evento.


Fator Total
Doença Presente Ausente
Presente a b n1 = a + b
Ausente c d n2 = c + d
Total m1 = a + c m2 = b + d n = n1 + n2

os ı́ndices s e e são estimados por:


a a
s= =
a+b n1
e
d d
e= = .
c+d n2
Exemplo 10.1. Diagnóstico de doença coronariana.
Wiener et al. compararam os resultados do teste ergométrico de tolerância a exercı́cios entre indivı́duos
com e sem doença coronariana. O teste foi considerado positivo quando se observou mais de 1 mm de
depressão ou elevação do segmento ST, por no mı́nimo 0,08 s, em comparação com os resultados obtidos
com o paciente em repouso. O diagnóstico definitivo foi feito através de angiografia (gold ). A Tabela (10.2)
sintetiza os resultados encontrados.

Tabela 10.2: Resultados da avaliação da aplicação do teste ergométrico de tolerância a exercı́cios em 1465
pacientes.
Doença Teste ergométrico Total
Coronariana Positivo (T+ ) Negativo (T− )
Presente (D+ ) 815 208 1.023
Ausente (D− ) 115 327 442
Total 930 535 1.465

A sensibilidade e a especificidade são estimadas por:


815
s= = 0, 797
1.023
e
327
e= = 0, 740.
442
O teste ergométrico tem uma sensibilidade de 79,7%, ligeiramente superior que sua especificidade (74%).
10.3 Valor das Predições: VPP e VPN ROSSI, R. M. 124

A proporção bruta de concordância (poder preditivo ou acurácia) do exame pode ser calculada por
a+d
n = 815+327
1.465 ≃ 0, 7795 (77,95%). Dos 930 resultados positivos apresentados pelo exame, 815 estavam
corretos, ou seja, o poder preditivo positivo do exame foi 815 930 ≃ 0, 8763 (87,63%). Por outro lado,
dos 535 resultados negativos apresentados pelo exame, 327 estavam corretos fornecendo, assim, um poder
preditivo negativo de 327535 ≃ 0, 6112 (61,12%).

10.3 Valor das Predições: VPP e VPN


A sensibilidade e a especificidade, embora sendo ı́ndices ilustrativos e bons sintetizadores das qualidades
gerais de um teste, tem uma limitação séria: não ajudam a decisão da equipe médica que, recebendo um
paciente com resultado positivo do teste, precisa avaliar se o paciente está ou não doente. Não se pode
depender apenas da sensibilidade e da especificidade, pois estes ı́ndices são provenientes de uma situação
em que há certeza total sobre o diagnóstico, o que não acontece no consultório médico. Daı́ a necessidade
destes dois outros ı́ndices que refletem melhor a realidade prática. Neste momento, interessa mais conhecer
os seguintes ı́ndices denominados valor da predição positiva (VPP) e valor da predição negativa (VPN),
definidos respectivamente por:
V P P = Pr [D+ |T+ ]
e
V P N = Pr [D− |T− ] .
Em palavras, VPP é a probabilidade do paciente estar realmente doente quando o resultado do teste é
positivo e VPN, a probabilidade do paciente não estar doente quando o resultado do teste é negativo. Estes
valores são probabilidades condicionais, tal que o evento condicionante é o resultado do teste, aquele que na
prática acontece primeiro.
A maneira mais fácil de se calcular o VPP e o VPN é através das fórmulas sugeridas por Vecchio (1966).

Tabela 10.3: Probabilidade necessárias para o cálculo dos ı́ndices VPP e VPN.
População Proporção Proporção com resultado
Positivo Negativo
Doente p ps p(1 − s)
Sadia 1−p (1 − p)(1 − e) (1 − p)e
Total p + (1 − p) ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e

Seja p = Pr(D+ ) a prevalência da doença na população de interesse, isto é, a proporção de pessoas
doentes, ou a probabilidade de doença pré-teste.
O valor de predição positiva é obtido dividindo-se a freqüência dos ”verdadeiros-positivos” (oriundos de
pacientes doentes), pelo total de positivos
ps
V PP = .
ps + (1 − p)(1 − e)

De forma análoga, considerando-se os ”verdadeiros-negativos” obtemos o valor da predição negativa

(1 − p)e
V PN = .
p(1 − s) + (1 − p)e

Ambas as expressões dependem do conhecimento de p, uma estimativa da prevalência da doença na


população de interesse. Estas são probabilidades de resultados corretos de diagnóstico.

Exemplo 10.2. Diagnóstico de doença coronariana (Continuação).


Para uma população cuja prevalência de doença coronariana é de 2%, os valores de predição do teste
ergométrico são:
0, 02 × 0, 797
V PP = = 5, 89%.
0, 02 × 0, 797 + (1 − 0, 02)(1 − 0, 74)
10.4 Decisões Incorretas: PFP e PFN ROSSI, R. M. 125

e
(1 − 0, 02) × 0, 74
V PN = = 99, 29%.
0, 02 × (1 − 0, 797) + (1 − 0, 02) × 0, 74
Portanto, o valor de predição positiva é baixo enquanto que o valor de predição negativa é bastante alto.
Se o resultado da ergometria for negativo, a chance de não haver uma doença coronária é de 99,29%.
Se, antes de qualquer informação, o paciente tinha uma chance de 2% de apresentar a doença, após o
resultado do teste negativo esta chance é de apenas 0,66% (1-0,9929).

10.4 Decisões Incorretas: PFP e PFN


As probabilidades
P F P = Pr [D− |T+ ] = 1 − Pr [D+ |T+ ] = 1 − V P P
e
P F N = Pr [D+ |T− ] = 1 − Pr [D− |T− ] = 1 − V P N
referem-se, respectivamente, ao “falso-positivo” e ao “falso-negativo”, isto é, decisões incorretas baseadas
no teste diagnóstico.
Uma dificuldade com relação à estes ı́ndices é que muitos autores admitem, implicitamente, que a pre-
valência que ocorre na tabela é a mesma na população de interesse e assim usam tabelas 2 × 2 para calcular
os valores de predição. Nada justifica esta hipótese. Este procedimento se usado sistematicamente, leva a
erros sérios.

Exemplo 10.3. Teste ELISA para detecção do HIV.


Entre as várias tecnologias para detectar a presença do HIV, a primeira a se difundir no Brasil foi o
ELISA (Enzymelinked immunosorbent assay). Em 1985 esta foi simultaneamente comercializada por vários
laboratórios americanos. Alguns deles reportaram, em seus testes preliminares, sensibilidade de 95% e
especificidade de 99,8%. Os valores para os outros laboratórios são parecidos, segundo Marwick (1985).
A Tabela 10.4 apresenta os valores dos ı́ndices VPP e VPN para a implementação do teste ELISA e
vários supostos valores da prevalência.

Tabela 10.4: Valores da VPP, VPN, PFP e PFN para o teste ELISA para a detecção do HIV.
Prevalência VPP(%) VPN(%) PFP(%) PFN(%)
1/100.000 0,47 100,00 99,53 0,00
1/10.000 4,54 100,00 95,46 0,00
1/1.000 32,21 99,99 67,77 0,01
1/500 48,77 99,99 51,23 0,01
1/200 70,47 99,99 29,53 0,03
1/100 82,75 99,99 17,25 0,05
1/50 90,65 99,89 9,35 0,10

Considerando-se a população total de um paı́s, a AIDS é uma doença de prevalência pequena. Os


resultados da Tabela 10.4 mostram que em um programa de uso do teste em larga escala, grande parte
dos pacientes com resultado positivo consiste na realidade de falsos-positivos; em outra palavras, o valor da
predição positiva é muito pequeno. Por outro lado, pouquı́ssimos não doentes deixarão de ser detectados e,
portanto, o valor de predição negativa é alto. Isto sugere um cuidado básico: um resultado positivo dever
ser reconfirmado através de teste baseado em tecnologia diferente do ELISA.
10.5 Combinação de Testes Diagnósticos ROSSI, R. M. 126

10.5 Combinação de Testes Diagnósticos


Muitas vezes, para o diagnóstico de certa doença dispomos apenas de testes com VPP ou VPN baixo
ou, se existe um bom teste, este é muito caro ou oferece grande risco e/ou desconforto ao paciente. Nestas
circunstâncias, uma opção freqüentemente usada é o uso de uma combinação de testes mais simples. A
associação de testes eleva a qualidade do diagnóstico, diminuindo o número de resultados incorretos.
Quando dois ou mais testes são usados para se chegar a um diagnóstico é preciso saber como são obtidos
os ı́ndices de qualidade do teste múltiplo, aquele composto pela agregação de dois ou mais testes individuais.
Restringiremos ao caso de apenas dois testes e as idéias apresentadas a seguir podem ser estendidas para o
caso de mais de dois testes. Alguns detalhes podem ser encontrados em Hirsh & Rielgelman (1996).
As maneiras mais simples de se formar um teste múltiplo a partir dos resultados de dois testes são os
esquemas em paralelo e em série. No caso do teste em paralelo, se um dos dois testes é positivo o teste
conjunto também o é. No teste em série, este é considerado positivo se os dois testes individuais são positivos.
A associação de testes em série é bastante empregada, tanto em triagens como no diagnóstico individual,
sendo de grande utilidade quando a questão do custo é relevante.
Chamando os testes originais de A e B, o teste em paralelo de Tp e o em série de Ts , e usando a linguagem
de eventos temos:
Tp+ = A+ ∪ B+
e
Ts+ = A+ ∩ B+ .
As sensibilidade e especificidade de Tp e Ts são calculadas com o auxı́lio das regras de cálculo de proba-
bilidades de eventos.

10.5.1 Combinação em Paralelo


Nesse caso, o resultado do teste será considerado positivo, se pelo menos um dos testes apresentar
resultado positivo. É de maior utilidade em casos de urgência, quando se necessita de uma abordagem
rápida, ou por outro tipo de conveniência, como para pacientes provenientes de lugares distantes. A Tabela
10.5 apresenta de forma explı́cita o procedimento proposto.

Tabela 10.5: Resultado do teste em paralelo dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em paralelo
- - -
- + +
+ - +
+ + +

Em analogia à expressão para obter a sensibilidade temos:

Pr[Tp+ |D+ ] = Pr[A+ ∪ B+ |D+ ]


= Pr[A+ |D+ ] + Pr[B+ |D+ ] − Pr[A+ ∩ B+ |D+ ]

ou seja, a sensibilidade do teste em paralelo (sp ) é dada por

sp = sA + sB − sA × sB .

Admitindo-se que os resultados dos dois testes são independentes, pode-se calcular a especificidade de
um teste em paralelo da seguinte forma:

Pr[Tp− |D− ] = Pr[A− ∩ B− |D− ]


= Pr[A− |D− ] × Pr[B− |D− ]

ou seja, a especificidade do teste em paralelo (ep ) é dada por

ep = eA × eB .
10.5 Combinação de Testes Diagnósticos ROSSI, R. M. 127

Portanto, facilmente calculamos a sensibilidade e a especificidade de um teste em paralelo a partir das


sensibilidades e especificidades dos testes A e B. Além disso, os parâmetros VPP e VPN são calculados da
mesma forma já vista para testes isolados, utilizando-se agora a sensibilidade e especificidade da combinação
em paralelo, e a prevalência da população de interesse.

10.5.2 Combinação em Série


Nesse caso, os testes são aplicados consecutivamente, sendo o segundo teste aplicado apenas se o primeiro
apresentar resultados positivo. O teste só será considerado positivo, se o resultado dos dois testes for positivo.
Esse procedimento é indicado em situações em que não há necessidade de rápido atendimento e quando o
paciente pode ser acompanhado ao longo do tempo, e se a consideração de custo é importante, seja pela
questão financeira, pelo risco ou desconforto induzidos pelo exame. A Tabela 10.6 apresenta de forma
explı́cita o procedimento proposto.

Tabela 10.6: Resultado do teste em série dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em série
- desnecessário -
+ - -
+ + +

Como só serão aplicados dos testes se o primeiro for positivo, o custo desse tipo de combinação é menor.
Uma discussão sobre a ordem mais indicada para a aplicação dos testes a serem combinados em série pode
ser encontrada em Soares & Parenti (1995).
Se os dois testes A e B são independentes, a sensibilidade (ss ) e a especificidade (es ) par o teste combinado
em série são obtidos sa seguinte forma:

Pr[Ts+ |D+ ] = Pr[A+ ∩ B+ |D+ ]


= Pr[A+ |D+ ] × Pr[B+ |D+ ].

Portanto,
ss = sA × sB
e
es = eA + eB − eA × eB .
Para os cálculos da sensibilidade e especificidade da associação em série e em paralelo, a independência
dos dois testes é crucial. Entretanto, não se pode garantir que isto ocorra sempre. Quando os testes não
forem independentes, não há uma forma analı́tica simples para se obter tais ı́ndices para um teste composto.
Exemplo 10.4. Diagnóstico de câncer pancreático.

Imagine um paciente idoso com dores persistentes nas costas e no abdômen e perda de peso. Na ausência
de uma explicação para estes sintomas, a possibilidade de câncer do pâncreas é freqüentemente levantada.
É comum para se verificar esta possibilidade diagnóstica, que ambos os testes de ultrassom (A) e tomografia
computadorizada (B) do pâncreas sejam solicitados. A Tabela 10.7 apresenta dados hipotéticos sobre os
ı́ndices s e e dos testes, quando utilizados separadamente e em conjunto (Griner et al., 1981).

Tabela 10.7: Sensibilidade e especificidade dos testes de ultra-som e tomografia computadorizada no di-
agnóstico do câncer de pâncreas individualmente e em conjunto.
Teste Sensibilidade (%) Especificidade (%)
A: Ultra-Som 80 60
B: Tomografia 90 90
C: A ou B positivo 98 54
D: A e B positivo 72 96
10.5 Combinação de Testes Diagnósticos ROSSI, R. M. 128

Note que os esquemas C e D correspondem respectivamente a testes em paralelo e em série. Admitindo


que os resultados dos dois testes sejam independentes e usando as expressões vistas anteriormente, temos as
seguintes sensibilidades e especificidades combinadas:
Em paralelo:
sC = 0, 8 + 0, 9 − 0, 8 × 0, 9 = 0, 98
e
eC = 0, 6 × 0, 9 = 0, 54;
Em série:
sD = 0, 8 × 0, 9 = 0, 72
eD = 0, 6 + 0, 9 − 0, 6 × 0, 9 = 0, 96.
Quando um ou outro teste é positivo, a sensibilidade combinada é maior que o mais sensı́vel dos testes,
mas a especificidade é menor.
Ao contrário, quando o critério para a positividade do teste é que tanto o ultra-som como a tomografia
sejam positivos, a especificidade combinada é maior que o mais especı́fico dos dois, mas a sensibilidade é
menor. Portanto, a sugestão seria o teste em série.
Exemplo 10.5. Sensibilidade e especificidade de testes em paralelo e em série.

Consideremos dois testes A e B com sensibilidade e especificidade apresentados na Tabela 10.7, supondo
uma prevalência de 1%, então teremos os seguintes valores: s, e, VPP e VPN.

Tabela 10.8: Sensibilidade, especificidade e valores de predição de testes individuais A e B e dos testes em
série e em paralelo considerando-se uma prevalência de 1%.
Teste s e VPP VPN
A 0,8000 0,6000 0,0198 0,9966
B 0,9000 0,9000 0,0833 0,9989
Paralelo 0,9800 0,5400 0,0211 0,9996
Série 0,7200 0,9600 0,1538 0,9971

A combinação em paralelo apresenta alta sensibilidade (0,98) mas sua especificidade é menor que a dos
testes isolados. Já a combinação em série apresenta alta especificidade (0,96) enquanto que a sensibilidade
é relativamente baixa comparada com testes isolados.
Como esperado, os valores de predição negativa são altos, tanto para os testes isolados como para as
duas formas combinadas dos testes. Entretanto, os valores de predição positiva não são altos, sendo que a
combinação em série proporcionou o melhor resultado (V P P = 0, 1538).
É importante lembrar que, na maioria das vezes, os testes usados na combinação são dependentes entre
si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ı́ndices dos testes combinados.
Nesse caso, não é possı́vel determinar os valores dos parâmetros de qualidade conhecendo-se apenas os valores
de cada teste em separado. Torna-se necessário um trabalho de pesquisa realizado em um grupo de pacientes
nos quais são utilizados o teste padrão (gold test) e teste combinado (DiMagno et al., 1977).
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 129

10.6 Escolha entre Testes Diagnósticos


Idealmente, os testes utilizados devem ter alta sensibilidade e especificidade. Entretanto, na prática nem
sempre existem testes disponı́veis com caracterı́sticas ótimas. É relativamente comum a situação em que há
mais de um teste e então surge a necessidade da comparação entre eles para uma escolha mais adequada.
Em processos de escolha do ponto de corte (ponto limite para decidir se um paciente é doente ou sadio),
por exemplo, Galen & Gambino (1975) sugeriram uma medida de eficiência definida pela soma da sensibili-
dade e especificidade, isto é, o valor de referência (k :Ponto de corte) foi obtido através dos valores de s e e
que tinham a maior soma.
Suponha que dois testes diagnósticos estão disponı́veis: um com alta sensibilidade mas relativamente
baixa especificidade e o outro com alta especificidade e relativamente baixa sensibilidade. Qual seria a
melhor escolha?
Embora a avaliação de um teste não seja trivial, já que vários fatores devem ser considerados, apresen-
taremos alguns argumentos baseados nas medidas de qualidades, que podem ajudar na escolha de um teste
diagnóstico.
O primeiro fato importante é que os valores de predição (VPP e VPN) dependem conjuntamente de s, e
e p. Soares & Parenti (1995) apresentam um estudo detalhado através de gráficos que ilustram claramente
o efeito da prevalência nos valores de predição. O exemplo a seguir ilustra numericamente este fato.
Exemplo 10.6. Diagnóstico da gonorréia.
O teste Gonosticon Dri-Drot, desenvolvido para o diagnóstico de gonorréia, tem sensibilidade de 0,80
e especificidade de 0,95. Os valores da predição positiva e negativa são apresentados na Tabela 10.9 para
quatro populações com diferentes prevalências.

Tabela 10.9: Valores de predição (VPP e VPN) do teste Gonosticon Dri-Drot para quatro prevalências (p).
População p VPP VPN
A 0,500 0,940 0,830
B 0,100 0,640 0,980
C 0,020 0,250 0,990
D 0,001 0,020 1,00

Embora o teste tenha parâmetros de qualidades razoáveis, o VPP é baixı́ssimo para populações de baixa
prevalência, tornando o exame sem utilidade nessas condições.
Para simplificar o raciocı́nio sobre a escolha de testes diagnósticos, vamos inicialmente considerar duas
situações extremas, obviamente sem interesse prático, e depois vamos estender para situações mais gerais.
Suponhamos que p = 0, isto é, ninguém tem a doença, ou que p = 1, isto é, toda a população tem a doença
em questão. Facilmente chagamos nos valores apresentados na Tabela 10.10, para quaisquer valores de s e
e.

Tabela 10.10: Valores de predição (VPP e VPN) e proporção de resultados falsos (PFP e PFN) para casos
extremos de prevalências.
p VPP PFP VPN PFN
0 0 1 1 0
1 1 0 0 1

A extensão para o caso mais geral de p pequeno (doença rara) e p grande (doença comum) pode ser
feita pela análise das expressões já estudadas variando-se as quantidades envolvidas (s, e e p), mas nos
restringimos a apresentarmos uma análise numérica. A Tabela 10.11 mostra os valores de predição para
prevalências de 1% e 90%.
Quando a prevalência é baixa, o valor de predição positiva (VPP) é mais influenciado pela especificidade.
O valor de predição negativa (VPN) é pouco influenciado tanto pela sensibilidade quanto pela especificidade
e é alto, como era de se esperar.
Para a prevalência alta, o VPP é próximo de 1, independente dos valores da sensibilidade e da especifi-
cidade. Além disso, o VPN é influenciado mais pela sensibilidade do que pela especificidade.
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 130

Tabela 10.11: Valores de predição (VPP e VPN) para alguns valores de sensibilidade e especificidade para
prevalências de 1% e 90%.
Prevalência de 1% Prevalência de 90%
s e VPP VPN VPP VPN
0,99 0,99 0,5000 0,9999 0,9989 0,9167
0,99 0,90 0,0909 0,9999 0,9889 0,9091
0,99 0,80 0,0476 0,9999 0,9780 0,8989
0,90 0,99 0,4762 0,9990 0,9988 0,5238
0,90 0,90 0,0833 0,9989 0,9878 0,5000
0,90 0,80 0,0435 0,9987 0,9759 0,4706
0,80 0,99 0,4469 0,9980 0,9986 0,3548
0,80 0,90 0,0748 0,9978 0,9863 0,3333
0,80 0,80 0,0388 0,9975 0,9730 0,3077

Embora este não seja um estudo exaustivo, existem evidências para as seguintes conclusões:

1. Um teste com alta especificidade deve ser usado quando a prevalência da doença é relativamente baixa
(doença rara), mesmo que o teste tenha relativamente baixa sensibilidade.
2. Um teste com alta sensibilidade deve ser usado quando a prevalência da doença é alta (doença comum),
mesmo que o teste tenha relativamente baixa especificidade.

É comum a idéia de que se a doença é rara, um teste com alta sensibilidade dever ser usado para achar
os casos e para uma doença de alta prevalência, um teste com alta especificidade deve ser escolhido.
Esse raciocı́nio não coincide com os argumentos apresentados.
Outro tipo de simulação é apresentado nas Figuras 10.1 e 10.2 para algumas situações especı́ficas:

Figura 10.1: Valor Preditivo Positivo em Função da Prevalência

Inicialmente percebe-se na 10.1 que, para qualquer situação, quanto maior a prevalência da doença,
maior o valor preditivo positivo. Para um teste com sensibilidade e especificidade elevadas (s = 99% e e =
99%) o seu valor preditivo positivo será muito alto mesmo em situações de prevalência não muito elevada.
Entretanto, esta situação sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e
especificidade do teste (s = 95% e e = 95%).
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 131

Figura 10.2: Valor Preditivo Negativo em Função da Prevalência

Uma outra situação ocorrerá ao se modificar apenas uma das caracterı́sticas do teste. Por exemplo, ao
se diminuir a sensibilidade mantendo-se a especificidade elevada (s = 70% e e = 90%), percebe-se que prati-
camente não houve impacto nos valores preditivos positivos em função da prevalência. Entretanto, quando
essa mesma diminuição ocorre na especificidade, o impacto é bastante grande, diminuindo-se muito o valor
preditivo positivo do resultado mesmo para prevalências mais elevadas. Dessa forma, pode-se afirmar que o
valor preditivo positivo de um teste é função da prevalência da doença, da sensibilidade e fundamentalmente
da especificidade, conforme já fora observado na fórmula anterior.
Note na Figura 10.2 que, ao reduzir apenas a sensibilidade (s = 70% e e = 99%), ocorre uma drástica
redução no VPN, mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir apenas a
especificidade (s = 99% e e = 70%), o impacto no VPN é muito pequeno, menor do que quando se reduz
apenas um pouco a sensibilidade e a especificidade conjuntamente (s = 95 e e = 95%).
Note também que, para um mesmo teste diagnóstico (exceção apenas para s = 70% e e = 99%), o impacto
do aumento da prevalência na redução do VPN é muito pequeno. Esse impacto se acentua nas prevalências
muitos elevadas. Como na prática clı́nica, as doenças estudadas comumente possuem prevalências relati-
vamente baixas, o VPN irá sofrer apenas pequena variação ao se modificar a especificidade de um teste
diagnóstico e mesmo ao se modificar pouco a sensibilidade.
10.7 Relação entre Sensibilidade e Especificidade ROSSI, R. M. 132

10.7 Relação entre Sensibilidade e Especificidade


O teste diagnóstico ideal seria aquele na qual a sensibilidade e a especificidade fossem 100%, ou seja, não
existiria erro em seu resultado. Entretanto, na prática, isso não é possı́vel. Ao contrário, freqüentemente,
existe uma contra-balanço (trade-off ) entre essas duas propriedades de tal modo que, quando um delas
aumenta a outra diminui e vice-versa. Assim, para um teste expresso em uma escala contı́nua (glicemia, por
exemplo) é necessário determinar um ponto de corte (cut off ) entre os valores considerados normais e os
anormais. Neste caso, uma determinada propriedade do teste (por exemplo, a sensibilidade) somente pode
ser aumentada às custas da diminuição da especificidade e vice-versa.
Frequentemente, na prática clı́nica, escolhe-se um ponto de corte onde exista o menor erro possı́vel, tanto
de falsos positivos quanto de falsos negativos (Figura 10.3).

Figura 10.3: Ponto de corte com o mı́nimo erro possı́vel


10.8 Curva ROC ROSSI, R. M. 133

10.8 Curva ROC


Uma forma de expressar graficamente a relação entre a sensibilidade e a especificidade é através da
construção da curva ROC (receiver operating characteristic curve). Esta curva foi primariamente de-
senvolvida na década de 1950 para avaliar a detecção de sinais de radar (daı́ a sua denominação),
embora somente recentemente tenha se tornado comum o seu uso na área médica.
Sua construção é feita colocando-se os valores da sensibilidade (proporção de verdadeiros positivos) no
eixo Y (ordenadas) e o complemento da especificidade (1 - e), ou seja, a proporção de falsos positivos no
eixo X (abscissas) para diferentes pontos de corte.
A partir dos dados apresentados na Tabela 10.12 foi construı́da a curva ROC.

Tabela 10.12: Trade-off entre Sensibilidade e Especificidade no tratamento de Diabetes (Glicemia pós-
prandial 2(h) mg/100 ml).
Glicemia pós-prandial Sensibilidade (%) Especificidade (%) 1 - Especificidade (%)
(2h) mg/100 ml
70 98,6 8,8 91,2
80 97,1 25,5 74,5
90 94,3 47,6 52,4
100 88,6 69,8 30,2
110 85,7 84,1 15,9
120 71,4 92,5 7,5
130 64,3 96,9 3,1
140 57,1 99,4 0,6
150 50,0 99,6 0,4
160 47,1 99,8 0,2
170 42,9 100,0 0
180 38,6 100,0 0
190 34,3 100,0 0
200 27,1 100,0 0

Figura 10.4: Curva ROC da Glicemia pós-prandial (2h) mg/100 ml

Note que quanto mais próxima a curva estiver do canto superior esquerdo do gráfico, melhor será o poder
discriminatório do teste diagnóstico e quanto mais distante, até o limite da diagonal do gráfico, pior será o
10.8 Curva ROC ROSSI, R. M. 134

seu poder de discriminar doentes e não doentes. A curva ROC pode servir como orientação para a escolha
do melhor ponto de corte de um teste diagnóstico que, em geral, se localiza no extremo da curva próximo
ao canto superior esquerdo do gráfico. *Observe que o ponto de corte adequado está entre 110 e 120 mg/100
ml.
As curvas ROC, além de auxiliarem na identificação do melhor ponto de corte, são muito utilizadas para
comparar dois (ou mais) testes diagnósticos para a mesma doença. Nesse caso, o poder discriminatório do
teste, ou seja, a acurácia global, pode se mensurado através do cálculo da área sob a curva ROC; quanto
maior for a área tanto melhor será o teste diagnóstico.
Um teste diagnóstico ideal, com 100% de sensibilidade e 100% de especificidade, a área total seria igual
a 1 (um), ou seja, a “curva” seria coincidente com o lado esquerdo e o topo do gráfico. Neste caso, o teste
não possuiria erro, identificando perfeitamente todos os indivı́duos sadios e doentes (gold test).
Para um teste sem nenhuma utilidade, a “curva” seria uma linha reta em diagonal, partindo do canto
inferior esquerdo até o canto superior direito. Neste caso, o teste diagnóstico não possuiria nenhum poder
para discriminar doentes de não-doentes.
Exemplo 10.7. Os dados da Tabela 10.13 foram obtidos na UEM/HU - Hospital Universitário da Univer-
sidade Estadual de Maringá, em um estudo para avaliação de equipamentos para dosagem glicêmica capilar
O objetivo do trabalho foi o de escolher o melhor equipamento entre três analisados: Glucotrend, Precision
e Advantage. Os testes foram realizados em 21 indivı́duos. O teste Colorimétrico foi ser utilizado como
Gold Standard (Teste Ouro), que classifica sem erro doentes e não-doentes.

Tabela 10.13: Resultados da avaliação de equipamentos para dosagem glicêmica capilar.


Indivı́duo Gold-Calorimétrico G-Glucotrend P-Precision A-Advantage
1 282 310 336 283
2 121 115 143 137
3 71 71 76 66
4 101 *3 85 99
5 161 *3 215 177
6 192 215 134 *2 211
7 99 97 123 134
8 105 152 156 *1 136
9 190 200 208 205
10 64 69 76 69
11 108 125 105 115
12 99 97 95 116 *1
13 107 107 109 108
14 68 75 81 64
15 81 86 94 91
16 82 84 49 *1 89
17 88 90 93 93
18 71 76 88 77
19 76 90 91 96
20 98 107 89 *1 105
21 87 86 90 96

Obs.: Valores de referência: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hipogli-
cemia) e acima de 120 (hiperglicemia)).
Obs.:
1. *1 foram utilizadas duas fitas por falha na leitura do equipamento;
2. *2 foram utilizadas quatro fitas por falha na leitura do equipamento;
3. *3 equipamento apresentou erro.
10.8 Curva ROC ROSSI, R. M. 135

Exercı́cio 10.1. Utilize o banco de dados referentes a Tabela 10.13 e:

1. Determine as Tabelas Cruzadas: Gold X G; Gold X P e Gold X A.

2. Determine a sensibilidade e especificidade de cada testes acima . Baseado nestes resultados qual (quais)
o(s) melhor(es) teste(s) ?

3. Determine os valores de predição positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para
cada um dos testes, usando a prevalência da doença obtida através da Tabela Cruzada. Interprete-os.

4. Considerando que a prevalência para a doença em questão é de 1%, recalcule os itens anteriores.
5. Combine os testes: G x P, G x A e P x A de forma paralela e em série, considerando uma prevalência
de 1%. Qual a melhor combinação ? porque?
6. Refazer o exercı́cio, considerando a referência 70 ≤ N ormal ≤ 110 e p = 1%.
a
Exercı́cio 10.2. Em que condições o valor de predição positiva (VPP) é igual a a+c ?

Exercı́cio 10.3. Foram examinadas radiografias do tórax de 1.820 indivı́duos, dos quais 30 estavam com
tuberculose e 1.790 não apresentavam a doença, por diagnóstico feito de forma independente da leitura dos
raios X e com uma margem de erro desprezı́vel. Pelo modo como estes 1.820 pacientes foram selecionados,

Tabela 10.14: Resultados da avaliação de tuberculose.


Leitura dos raios X
Tuberculose Positivo Negativo
Presente 22 8
Ausente 51 1.739

a prevalência da doença, tanto neste grupo quanto na população de interesse é de p = 0, 0156.

1. Calcule a sensibilidade e a especificidade do raio X como teste diagnóstico para tuberculose.

2. Calcule as proporções de falso-positivo e falso-negativo.


3. Se um médico tem 75% de certeza sobre o diagnóstico de tuberculose em um dado paciente, quanto
aumenta esta probabilidade depois de se observar um teste de leitura de raios X positivos?

Exercı́cio 10.4. Pesquisadores que tratam de doenças hepáticas em uma clı́nica especializada sugeriram
um novo teste para detectar câncer no fı́gado. Os resultados do experimento, para uma amostra de 2.225
pacientes atendidos nessa clı́nica, foram: Pelo modo como os dados foram obtidos, a prevalência de câncer

Tabela 10.15: Resultados da avaliação de câncer.


Câncer Teste
Hepático Positivo Negativo
Presente 90 17
Ausente 39 2.079

hepático, nesta clı́nica, pode ser calculada usando os dados da tabela.

1. Calcule a sensibilidade e a especificidade do teste.

2. Calcule a probabilidade de um paciente, atendido nessa clı́nica e que não tem câncer no fı́gado, tenha
tenha um resultado positivo no teste.

3. Calcule o valor da predição positiva e o valor da predição negativa.


10.8 Curva ROC ROSSI, R. M. 136

Exercı́cio 10.5. Foi feita avaliação para câncer de próstata em 300 homens hospitalizados devido a sintomas
de obstrução urinária. Um dos testes realizados foi o exame digital do reto. O resultado foi classificado como
”Positivo” segundo o critério padrão (biópsia).

Tabela 10.16: Resultados da avaliação de câncer de próstata.


Resultado Resultado do teste
da Biópsia Positivo Negativo
Presente 48 21
Ausente 25 206

1. Qual é a sensibilidade e a especificidade do exame digital na detecção de câncer de próstata?


2. Nesta população de homens, qual é o valor de predição positiva e o valor de predição negativa do exame
digital?
3. Um clı́nico geral está considerando a possibilidade de realizar o exame digital do reto em todos os
homens com mais de 50 anos que procuram seu consultório, mesmo não apresentando sintomas de
obstrução urinária. Da literatura, ele sabe que a prevalência de câncer de próstata nesta faixa etária
é de 0,5%. Usando os valores para a sensibilidade e especificidade obtidos anteriormente, calcule a
proporção de homens com resultado positivo no exame digital que realmente tem a doença.

Exercı́cio 10.6. A detecção precoce do câncer cervical uterino é crucial para o tratamento e cura de pa-
cientes. O papanicolau é um dos testes utilizados no diagnóstico. Na tabela a seguir temos os resultados
dos testes para 600 mulheres. As mulheres foram classificadas como portadoras ou não da doença através de
biópsia cervical.

Tabela 10.17: Resultados da avaliação de câncer cervical uterino.


Resultado Papanicolau
da Biópsia Positivo Negativo
Presente 94 6
Ausente 250 250

1. Calcule a prevalência de câncer na amostra;

2. Calcule a sensibilidade e a especificidade do papanicolau;

3. Calcule o VPP e o VPN usando a prevalência obtida no item 1).


10.8 Curva ROC ROSSI, R. M. 137

Exercı́cio 10.7. A hemorragia peri-intraventricular (HPIV) é uma das causas mais frequentes de agressão
ao sistema nervoso no perı́odo neonatal e a segunda causa mais frequente de morte em prematuros, precedida
apenas pela doença de membrana hialina. Atualmente, o método de escolha para diagnóstico consiste em
técnicas não invasivas (ultrassonografia e tomografia computadorizada). Tavares (1995) estudou a ocorrência
desta enfermidade em 120 dos 129 recém-nascidos com peso menor que 2000 g, nascidos no Hospital das
Clı́nicas da UFMG, no perı́odo de 18/01/94 a 17/05/95. O critério único para exclusão foi morte neota-
nal precoce, anterior à possibilidade de realização do exame ultrassonográfico. Para avaliar a eficácia do
exame clı́nico neurológico, as crianças (com exceção de uma) foram examinadas por um pediatra clı́nico com
formação em neonatalogia, sem o conhecimento prévio dos exames ultrassonográficos, que confirmam ou não
o diagnóstico fornecido pelo médico.

Tabela 10.18: Resultados da avaliação de HPIV.


HPIV Exame neurológico
Alterado Normal Total
Presente 25 13 38
Ausente 31 50 81
Total 56 63 119

1. Calcule a sensibilidade e a especificidade do exame clı́nico-neurológico e a prevalência dessa condição


na população em questão;

2. O baixo peso ao nascer é usado frequentemente para rastrear HPIV, sendo 1500 g o limite sugerido
para tal fim. Considerando essa informação e os dados mostrados a seguir do peso ao nascer (g) de
39 crianças com HPIV, qual seria a sensibilidade resultante do rastreamento? Abaixo de que peso
encontram-se 95% das crianças com HPIV? Quais as consequências de se alterar o valor de referência
para o novo valor encontrado?

1530 1520 1350 1260 1160 1120 1500 1020


1000 1020 1690 1140 1160 1290 1410 1850
1280 1410 1750 800 1020 830 1620 1430
1150 1230 1660 1430 1590 1280 1040 1810
1420 1760 1670 1520 1680 1650 1180

Exercı́cio 10.8. Suponha que a sensibilidade e a especificidade de dois testes (A e B) para o diagnóstico de
uma determinada doença sejam:

Teste Sensibilidade Especificidade


A 90% 70%
B 70% 90%

Assumindo que os testes sejam realizados de forma independente, qual a ordem que produz as melhores
caracterı́sticas gerais do teste conjunto em paralelo, isto é, o resultado é positivo se ambos são positivos?
10.8 Curva ROC ROSSI, R. M. 138

Exercı́cio 10.9. Os dados seguintes são tomados de um estudo que investiga o uso de uma técnica chamada
ventriculografia radionuclı́dica como teste diagnóstico para se detectar doença da artéria coronária (Begg e
Mcneil, 1988).

Tabela 10.19: Teste de Ventriculografia Redionuclı́dica.


Doença
Teste Ausente Presente
Negativo 179 372
Positivo 102 75

1. Qual a sensibilidade e a especificidade da ventriculografia radionuclı́dica nesse estudo?

2. Para uma população cuja prevalência da doença da artéria coronária seja de 5%, calcule a probabili-
dade de que um indivı́duo NÃO tenha a doença, sendo que ele apresenta resultado positivo usando a
ventriculografia radionuclı́dica;
3. Qual o valor preditivo de um teste negativo? utilize a mesma prevalência populacional.
10.8 Curva ROC ROSSI, R. M. 139

Exercı́cio 10.10. Um teste diagnóstico A relativamente barato utilizado para detecção de gravidez tem
sensibilidade e especificidade, respectivamente dados por: 67% e 80%. Um outro B, tem respectivamente:
91,3% e 77,2%. Uma mulher desconfiada de que estaria grávida resolve fazer os testes. Primeiro faz o teste
A e sendo o resultado positivo então procede ao segundo teste.

1. Determine a chace de o teste A dar resultado falso positivo considerando uma prevalência de 90% para
a gravidez;

2. Considerando que esta mulher realizou o segundo teste, determine a chance de um falso positivo
combinado. O que aconteceu? a chance de ela estar realmente grávida aumenta ou diminui?

3. Considerando uma prevalência de 95%, calcule o valor de Predição Falso Negativo de uma combinação
em paralelo;

4. Considere uma prevalência de 95%. Baseado nos cálculos de probabilidades condicionais, qual o teste
diagnóstico você escolheria, considerando independência nos testes combinados? Porque?

Exercı́cio 10.11. O Ministério da Saúde, através da Portaria no 488, de 17 de junho de 1998, estabeleceu
a obrigatoriedade de uma rotina para a execução de testes para detecção de anticorpos contra o vı́rus da
imunodeficiência humana (anti-HIV) em indivı́duos com idade acima de dois anos. O objetivo da porta-
ria é aumentar a acurácia do procedimento. Em uma primeira etapa, denominada triagem sorológica, a
mesma amostra deve ser submetida a dois testes sorológicos distintos, simultaneamente. Caso a amostra
apresente resultados reagentes nos dois exames, isto é, Positivo no ELISA1 e Positivo no ELISA2 , esta deve
ser submetida às etapas de confirmação sorológica, através da realização dos testes de Imunofluorescência
Indireta e/ou Western Blot. Supondo que você trabalhe em um hospital que disponha de dois testes ELISA
distintos para detecção de anti-HIV na primeira etapa do processo, isto é, realizar simultaneamente os testes,
e sabendo-se que os valores de sensibilidade e especificidade são, respectivamente,

ELISA1 : 99% e 99%.


ELISA2 : 99% e 98%.

e além disso se tenha conhecimento da prevalência de soropositividade para HIV de 0,3%, determine os
valores : VPP, VPN, PFP e PFN, para o teste combinado, proposto pelo Ministério da Saúde.

Exercı́cio 10.12. Um teste diagnóstico A relativamente barato utilizado para detecção de gravidez tem
sensibilidade e especificidade, respectivamente dados por: 87,5% e 88,8%. Um outro B, tem respectivamente:
91,3% e 67,4%. Uma mulher desconfiada de que estaria grávida resolve fazer os testes. Primeiro faz o teste
A e sendo o resultado positivo então procede ao segundo teste.

1. Determine a chace de o teste A dar resultado falso positivo considerando uma porcentagem de 80%
para a gravidez;

2. Considerando que esta mulher realizou o segundo teste, determine a chance de um falso positivo
combinado. O que aconteceu? a chance de ela estar realmente grávida aumenta ou diminui?

Exercı́cio 10.13. A tabela a seguir (incompleta) mostra a sensibilidade, especificidade, VPP e VPN de
testes individuais A e B e dos testes em série e em paralelo.

Teste s e VPP VPN


A 0,80 0,70
B 0,75 0,90
Paralelo
Série

1. complete a tabela acima, considerando uma prevalência de 15%;

2. baseado nos resultados, qual diagnóstico você escolheria, considerando independência nos testes com-
binados? Porque?
Capı́tulo 11

Análise de Regressão

11.1 Introdução
É freqüente o estudo da relação entre séries de variáveis.
Usualmente as companhias telefônicas não guardam o número de todas as chamadas interurbanas origina-
das em determinada localidade. É que, do ponto de vista do faturamento, existem chamadas interurbanas que
são cobradas pelo mesmo sistema usado para chamadas locais. Em estudos de tráfego telefônico é portanto,
necessário criar maneiras de estimar o número de chamadas interurbanas a partir de ı́ndices sócio-econômicos.
Isto é feito obtendo-se o número de chamadas interurbanas em algumas cidades, os correspondentes ı́ndices
sócio-econômicos e relacionando-se estas varáveis através de um modelo de regressão.
Situações como as descritas acima são estudadas pela técnica de análise de regressão, onde são relacio-
nadas por uma equação duas variáveis: uma, chamada variável resposta, ou dependente, e outra, chamada
variável explicativa, ou independente. Conhecido um conjunto de valores da variável explicativa e outro da
variável resposta determina-se os parâmetros da equação.

11.2 Ajustamento da reta


Sempre que desejamos estudar determinada variável em função de outra fazemos uma análise de regressão.
Podemos dizer que a análise de regressão tem por objetivo descrever, através de um modelo matemático,
a relação entre duas variáveis, partindo de n observações das mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra
de variável independente.

11.3 O Modelo de Regressão Linear Simples - MRLS


Supondo X a variável explicativa e Y a variável resposta, diremos que Y = f (X).
Dado um conjunto de valores observados X e Y , construir um modelo de regressão linear de Y sobre
X consiste em obter, a partir desses valores, uma equação que melhor represente a relação verdadeira entre
essas variáveis.
A determinação dos parâmetros dessa equação é denominada ajustamento. O processo de ajustamento
deve partir da escolha da equação através da qual os valores de X explicarão os de Y . Para isso recorre-se
ao diagrama de dispersão.
A equação escolhida será aquela que for sugerida pelo conjunto dos pontos dispostos no diagrama.
Supondo X a variável independente e Y a variável dependente, vamos procurar determinar o ajustamento
de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por:

yi = α + βxi + εi
εi ∼ N (0; σ 2 )

onde α (coeficiente linear) e β (coeficiente angular) são os parâmetros amostrais, xi dados e ε é o erro.

140
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 141

A obtenção dos valores dos parâmetros α e β, pode ser feita via método de Mı́nimos Quadrados (ver
Capı́tulo 2 de Charnet et al. (1999)):

n 1∑ n ∑n
xi y − xi y
Sxy n i=1 i=1
β̂ = = i=1 ( n )2 (11.1)
Sxx ∑
n 1 ∑
xi −
2 xi
i=1 n i=1
e
α̂ = ȳ − β̂ x̄. (11.2)
Sejam ŷi = α̂ + β̂xi , para i = 1, 2, ..., n, os valores da reta de quadrados mı́nimo, ajustada ao conjunto
de n pontos (xi , yi ) para todo i. As quantidades εi = yi − ŷi , são denominadas resı́duos. São variáveis
aleatórias, porque são funções dos elementos da amostra.
Precisamos estimar mais um parâmetro - a variância do erro, σ 2ε - o qual representa a distorção à reta.
Nota-se a sua importância para o modelo - se for um valor relativamente alto, as variâncias de α̂ e de β̂
serão altas e neste caso estes estimadores têm pouca precisão. Intuitivamente, sua estimação deve basear-se
nos resı́duos. Um estimador não viciado para σ 2ε é dado por:

n
2
∧ (yi − ŷi )
i=1
σ 2ε = .
n−2
Este estimador é não viciado e, sob o MRLS

(n − 2)σ 2ε
∼ χ2(n−2) . (11.3)
σ 2ε

Assim, a variância de σ 2ε é dada por

2(σ 2ε )2
V ar[σ 2ε ] = .
n−2

11.3.1 Intervalos de confiança para os parâmetros


Podemos definir intervalos de confiança para os parâmetros, a partir da equação (11.3) e das seguintes
quantidades pivotais: ( [ ])
2 1 x̄2
α̂ ∼ N α; σ ε +
n Sxx
ou
α̂ − α
v   ∼ t(n−2) ,
u
u∧
u 21 
tσ ε + ∑ n
x̄2
n (xi −x̄i )2
i=1

e ( )
σ 2ε
β̂ ∼ N β;
Sxx
ou
β̂ − β
v  ∼ t(n−2) .
u
u ∧
u σ 2ε 
t ∑n
(xi −x̄)2
i=1

Os intervalos de confiança (1 − α)% para os parâmetros α, β são dados, respectivamente, por:


v  
u
u
u∧  
u 1 x̄2
α̂ ± t( α2 ;n−2) uσ 2ε 
 + ∑  (11.4)
t 2
n
n
(xi − x̄)
i=1
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 142

e v 
u
u ∧
u 
u σ 2ε
β̂ ± t( α2 ;n−2) u . (11.5)
t ∑
n
2
(xi − x̄)
i=1

O valor esperado de um valor Y , dado um valor x da variável regressora, é dada por:

E[Y |x] = E[α̂ + β̂x] = E[α̂] + E[β̂x] = α + βx

e variâcia é

V ar[α̂ + β̂x] = V ar[α̂] + V ar[β̂x] + 2xCov[α̂; β̂]


[ ]
2 1 x̄2 σ2 xx̄2 σ 2
= σ + + x2 −2
n Sxx Sxx Sxx
[ ]
1 (x − x̄) 2
= σ2 + .
n Sxx

Então ( [ ])
1 (x − x̄)2
α̂ + β̂x ∼ N α + βx; σ 2
+ .
n Sxx
Usando o estimador de σ 2 , dado por

n
2
∧ (yi − ŷi )
i=1
σ = SY2 |x =
2
, (11.6)
n−2
podemos definir um intervalo de confiança para E[Y|x], através da seguinte quantidade pivotal:

α̂ + β̂x − (α + βx)
√( )
1 2
σ̂ + (x−x̄)
Sxx
n

a qual tem distribuição t de Student com (n-2) graus de liberdade. Portanto, o intervalo de confiança (1−α)%
para E[Y|x] é dado pela expressão:
v( )
u
u 1 (x − x̄)
2
α̂ + β̂x ± t( α2 ;n−2) σ̂ t + . (11.7)
n Sxx

Se calcularmos intervalos de confiança para alguns valores de x, podemos esboçar uma região em torno da
reta estimada, indicando os limites superiores e inferiores desses intervalos. Essa região é também chamada
de bandas de confiança.

11.3.2 Intervalos de predição


Suponha que estamos interessados em fazer uma predição para um valor futuro Y0 - não observado -
correspondente a X = x0 . Se usarmos o MRLS ajustado, dizemos que Ŷ0 = α̂ + β̂x0 é uma predição de Y0 .
Note que a predição de Y0 é igual ao estimador do valor esperado de Y, para X = x0 . O erro de predição é
definido por
Ŷ0 − Y0 ,
o qual será a base para construirmos um intervalo de predição.
Temos
Y0 ∼ N (α + βx; σ 2 ).
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 143

A variável Y0 não faz parte da amostra utilizada no ajuste do modelo, portanto é independente de Ŷ0 .
A variância do erro de predição pode ser escrita como a soma das variâncias das variáveis que a compõem,
dada a independência entre os termos. Os anteriores implicam:

E[Ŷ0 − Y0 ] = 0
V ar[Ŷ0 − Y0 ] = V ar(Ŷ0 ) + V ar(Y0 )
[ ]
2
2 2 1 (x0 − x̄)
= σ +σ +
n Sxx
( [ ])
2
1 (x0 − x̄)
⇒ Ŷ0 − Y0 ∼ N 2
0; σ + σ 2
+ .
n Sxx

Substituindo σ 2 por σ 2 , o intervalo de predição será dado por:
v( )
u
u 1 (x − x̄)
2
Ŷ0 ± t( α2 ;n−2) σ̂ t 1 + +
0
. (11.8)
n Sxx

Pode-se encontrar na literatura outra forma para o intervalo de predição, como:


v( )
u
u 1 (x0 − x̄)
2
ȳ + β̂(x0 − x̄) ± t( α2 ;n−2) σ̂ t 1+ + (11.9)
n (n − 1)Sxx2

onde σ̂ é dado em (11.6) e



n
2
(xi − x̄)
2 i=1
Sxx = .
n−1
Os intervalos de predição têm amplitudes maiores, para um mesmo nı́vel α e para o mesmo valor de X.
As bandas de confiança bem como as de predição têm um formato de hipérbole, o que enfatiza o risco
de se fazer extrapolações, ou seja, predições fora do intervalo observado da variável X. Portanto, os modelos
de regressão devem ser usados com cautela para se fazer previsões sobre a variável resposta.

Exemplo 11.1. Um estudo foi feito para investigar o efeito de um desinfetante. Foram preparadas soluções,
nas quais o desinfetante foi diluı́do em quantidades fixas de água, para concentrações do desinfetante de 1%
a 8%. Foi observado o número de bactérias que sobreviveram, após superfı́cies serem limpas com uma das
soluções.

Após alguns cálculos obtemos as seguintes quantidades:


16 ∑
16
yi = 360 yi2 = 8524
i=1 i=1

16 ∑
16 ∑
16
xi = 63 x2i = 313 yi xi = 1279
i=1 i=1 i=1
⇒ ȳ = 22, 5 e x̄ = 3, 9375
2 2
Sxx = 4, 3292 Syy = 28, 2667
α̂ = 30, 9 e β̂ = −2, 1328

Assim, ajustando-se o MRLS para explicar o número de bactérias (Y), em termos das concentrações do
desinfetante (X), temos:
ŷ = 30, 9 − 2, 13x.
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 144

Tabela 11.1: Número de bactérias em função de concentração do detergente.


Observação X: Concentração (%) Y: No de bactérias
1 1 29
2 1 31
3 2 26
4 2 25
5 3 21
6 3 24
7 3 26
8 3 28
9 4 21
10 4 22
11 5 14
12 5 24
13 6 23
14 6 15
15 7 18
16 8 13

Um cálculo simples, pode nos fornecer um indicativo de que os dados estão ou não bem ajustados, via
R2 (coeficiente de determinação)

2 Sxx SQReg (soma de quadrados devidos a regressão) 295, 39


R2 = β̂ = = = 0, 697. (11.10)
Syy SQT (soma de quadrados totais) 424

O coeficiente de determinação, R2 , é interpretado como a proporção da variabilidade dos Y’s observados,


explicada pelo modelo considerado. O valor de R2 está no intervalo [0;1] e quanto mais próximo de 1, melhor
o ajuste.
Uma ANOVA (Análise de Variância) é necessária para verificar se o ajuste é razoável ou não. A Tabela
11.2 apresenta estes resultados.

Tabela 11.2: Análise de variância para os dados do exemplo 11.1.


Causas da variação GL SQ QM F p
Regressão 1 295,39 295,39 32,14 0,000058
Erro 14 128,61 9,19
Total 15 424
{
H0 : β = 0
Ha : β ̸= 0
Notamos que H0 é rejeitada para um nı́vel de significância de 5%.
Dado que temos replicações para as concentrações 1, 2, 3, 4, 5, e 6, podemos testar a falta de ajuste do
MRLS.
A Tabela 11.3 apresenta a ANOVA

Tabela 11.3: Análise de variância para a falta de ajuste - dados do exemplo 11.1.
Causas da variação GL SQ QM F p
Regressão 1 295,39 295,39 32,14 0,000058
Erro 14 128,61 9,19
Falta de ajuste 6 16,777 2,7962 0,2 0,967333
Erro puro 8 111,823 13,978
Total 15 424
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 145

30
25
Nº de bactérias

20
15

1 2 3 4 5 6 7 8

Concentração de detergente (%)

Figura 11.1: Número de bactérias em função de concentração do detergente.

Sendo p-valor > 5%, não rejeitamos H0 , onde


{
H0 : O MRLS é adequado
Ha : O MRLS não é adequado.

Se usarmos a concentração do detergente como variável auxiliar, os números esperados de bactérias


dependem do valor da concentração e estão dispostos na linha reta: ŷ = 30, 9 − 2, 13x, com variância de 9,19
(σ̂ 2 ) em torno da reta. Para cada aumento de uma unidade do percentual de concentração do detergente, o
número de bactérias diminui em 2,13. Dizemos que a concentração do detergente explica 70% (R2 ) do valor
do número de bactérias. Além disso, σ̂ 2 , a variância em torno da reta está próxima da variação pura e,
portanto, o ajuste é bastante razoável.
Usando (11.7), um intervalo de 95% de confiança para o número esperado de bactérias que sobrevivem
após aplicação de solução 3, 5 do desinfetante é dado por:

2
1 (3, 5 − 3, 9375)
: 30, 9 − 2, 13(3, 5) ± 2, 145.3, 03 +
16 64, 9375
: 23, 45 ± 1, 66
: [21, 8 ; 25, 1].

Agora, usando (11.8), um intervalo de predição de 95% para o número de bactérias que sobrevivem após
aplicação de solução 3, 5 do desinfetante é dada por:

2
1 (3, 5 − 3, 9375)
: 30, 9 − 2, 13(3, 5) ± 2, 145.3, 03 1 + +
16 64, 9375
: 23, 45 ± 6, 71
: [16, 7 ; 30, 2].

Note a diferença entre os dois intervalos: estimamos que a esperança do número de bactérias que sobrevi-
vem à concentração 3, 5 esteja no intervalo [21, 8 ; 25, 1] e fazemos a predição de que uma observação futura
com a concentração 3, 5 esteja no intervalo [16, 7 ; 30, 2].
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 146

30
Reta estimada: Y = 30.9 − 2.13X

R² = 0,69

25
Nº de bactérias

20
15

1 2 3 4 5 6 7 8

Concentração de detergente (%)

Figura 11.2: Número de bactérias em função de concentração do detergente e reta de quadrados mı́nimos
ajustada.
35

Reta estimada: Y = 30.9 − 2.13X


Regressão
Confiança
Predição
30
25
Nº de bactérias

20
15
10

1 2 3 4 5 6 7 8

Concentração de detergente (%)

Figura 11.3: Bandas de confiança e de predição para o número de bactérias que sobrevivem à concentração
de detergente.
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 147

Exercı́cio 11.1. Um experimento foi conduzido para avaliar, em coelhos a disponibilidade relativa do Fósforo
existente. nos Fosfatos de rocha de Araxá e de Patos em relação ao Fósforo existente no Fosfoto Bicálcio.
Os animais foram alimentados com rações contendo nı́veis crescentes de cada Fosfato e foram anotados os
consumos de ração, o que permitiu calcular o consumo de Fósforo em cada unidade experimental. A variável
resposta observada foi a resistência do fêmur à quebra, mensurada com dinamômetro. A disponibilidade
relativa é estimada pela razão entre os coeficientes lineares de regressão (angular no caso da reta) obtido
para o Fosfato de interesse e para o Fosfato Bicálcio.

Araxá Patos Bicálcio


X Y X Y X Y
0,184 21,28 0,195 23,50 0,18 25
0,350 31,60 0,350 34,59 0,36 39
0,516 32,42 0,505 31,18 0,50 43
0,683 41,74 0,661 43,27 0,65 60
0,849 42,06 0,816 40,36 0,78 63
1,015 53,38 0,972 50,45 0,94 71

Os objetivos foram:
a) Estimar a disponibilidae relativa do Fósforo nos dois Fosfatos de rocha;
b) Testar o ajuste dos modelos (apresente os gráficos individuais e simultâneos);
c) Fazer uma seleção de modelos (via análise de resı́duos, por exemplo).
Capı́tulo 12

Regressão Logı́stica

12.1 Introdução
Dos modelos lineares tı́nhamos:

Y = β 0 + β 1 X1 + β 2 X2 + ... + β k Xk + ϵ
ϵ ∼ N (0, σ 2 )

sendo Y: variável dependente ou variável resposta contı́nua (de interesse);


X : variável independente ou covariável explicativa;
β : (β 0 , β 1 , β 2 , ..., β k )′ vetor de parâmetros a serem estimados.
Existem muitas situações, no entanto, em que a resposta, Y, é dicotômica ao em vez de contı́nua, por
exemplo, em estudos médicos onde o interesse é o de verificar a ”cura” ou ”não-cura” de um paciente em
um dado tratamento.
Exemplo 12.1. Representaremos

1: ”sucesso”; p = Pr(Y = 1)
0: ”fracasso”; q = 1 − p = Pr(Y = 1).

12.2 O modelo de Regressão Logı́stica


Consideremos inicialmente apenas uma única covariável X, e assumimos que

p = β 0 + β 1 X. (12.1)

Este é o modelo de regressão linear simples onde Y foi substituı́do por p. β 0 é o intercepto da reta e β 1
é a sua inclinação. Como p está restrito ao intervalo 0 e 1, e o termo β 0 + β 1 X assume qualquer valor real,
então o modelo em (12.1) não está adequado, logo faremos:

p = eβ 0 +β 1 X (12.2)

onde, agora p assume valores somente positivos, e ainda fazendo

eβ 0 +β 1 X
p = Pr(Y = 1) = (12.3)
1 + eβ 0 +β 1 X
e

Pr(Y = 0) = 1 − p
eβ 0 +β 1 X
= 1−
1 + eβ 0 +β 1 X
1 + eβ 0 +β 1 X − eβ 0 +β 1 X
=
1 + eβ 0 +β 1 X

148
12.2 O modelo de Regressão Logı́stica ROSSI, R. M. 149

1
Pr(Y = 0) = (12.4)
1 + eβ 0 +β 1 X
acomodamos os valores entre 0 e 1.
A função dada em (12.3) é conhecida como função logı́stica. Lembrando que p = Pr(Y = 1), um sucesso
ocorre com probabilidade p e a chance em favor de sucesso é
p
= eβ 0 +β 1 X . (12.5)
1−p

Tomando o ln em (12.5), temos: ( )


p
ln = β 0 + β 1 X. (12.6)
1−p
Desta forma, modelar a probabilidade p com uma função logı́stica, é equivalente a ajustar um modelo de
regressão linear o qual a resposta Y, que era contı́nua, foi substituı́da pelo logaritmo da chance do sucesso
de uma v.a. dicotômica, ou , Logito. Dá-se o nome a esta técnica de Regressão Logı́stica.
Exemplo 12.2. (Colosimo, 1997) Se a variável explicativa (X) é a dosagem de um tóxico, e a resposta de
interesse (Y=1) é a morte das cobaias, o modelo logı́stico especifica que:

eβ 0 +β 1 X
p = Pr(Y = 1|X = 1) =
1 + eβ 0 +β 1 X
e que
1
q = 1 − p = Pr(Y = 0|X = 1) = .
1 + eβ 0 +β 1 X
( )
p
O modelo pode ser escrito como ln = β 0 + β 1 X, mostrando que o logito depende linearmente da
1−p
β
dosagem do tóxico. Para a dosagem x = − 0 , temos que
β1
( )
β 1
p = Pr Y = 1|X = − 0 = ou 50%
β1 2

β0 β
ou seja, − é a dosagem do tóxico que mata 50% população. A razão − 0 é parâmetro de grande
β1 β1
importância em estudos toxicológicos.
A Figura 12.1 apresenta a caracterização gráfica da Função Logı́stica.

Figura 12.1: Curva Logı́stica.


12.3 Várias Variáveis Explicativas ROSSI, R. M. 150

12.3 Várias Variáveis Explicativas


Na presença de k variáveis explicativas o modelo logı́stico é dado por

eXi β i
pi = ′ (12.7)
1 + eXi β i
onde Xi : (xi1 , xi2 , ..., xik ) é o vetor dos valores das variáveis explicativas ou covariáveis para a observação i,
e β : (β 0 , β 1 , β 2 , ..., β k )′ é o vetor dos parâmetros a serem estimados.
O modelo logı́stico através do modelo linear será:
( )
pi
ln = β 0 + β 1 Xi1 + β 2 Xi2 + ... + β k Xik (12.8)
1 + pi

12.4 Método da Máxima Verossimilhança


Assumindo que as observações vem de pacientes diferentes e são portanto independentes, a verossimi-
lhança é simplesmente o produto das probabilidade de ocorrências de cada resposta observada:
n
L(β|Y, X) = Π Pr(Yi = yi |Xi = xi , β) (12.9)
i=1
( ′ )
Xi β i yi
n e
= Π( ′
)
i=1
1 + eXi β i

p
β j tj
n e j=1
= Π( ′
)
i=1
1 + eXi β i


n
onde ti é o valor observado de Tj = xij yi .
j=1
Aplicando o logaritmo em (12.9) obtém-se a função log-verossimilhança dada por:


n
l(β|Y, X) = {yi log(pi ) + (1 − yi ) log(1 − pi )}
i=1

onde ( ′
)
Xi β i
e
pi =
′ .
1 + e(Xi β i )
O estimador de máxima verossimilhança do vetor β, é obtido igualando-se a zero a Função Escore de
Fisher (Derivada primeira da função log-verossimilhança) e resolvendo a mesma em β 0 , β 1 , β 2 , ..., β k , ou seja,
 ∂l(β|Y,X)

 =0


∂β 0
 ∂l(β|Y,X)
=0
∂β 1
 ..

 .

 ∂l(β|Y,X)
∂β k = 0.

Para construir um intervalo com (1 − α)% de confiança para os estimadores de máxima verossimilhança
de β 0 , β 1 , β 2 , ..., β k sabe-se que assintoticamente

β̂ ∼ NK (β, IF−1 (β)).

Entretanto, na prática ao invés de trabalhar com o inverso da Informação de Fisher, trabalha-se com o
inverso da informação observada.
12.4 Método da Máxima Verossimilhança ROSSI, R. M. 151

A matriz de informação observada pode ser escrita como:


 2 
∂ l(β|Y,X) ∂ 2 l(β|Y,X) β 1 =β̂ 1 ∂ 2 l(β|Y,X) β k =β̂ k
∂β 20
|β =β̂ ∂β 0 ∂β 1 |β 0 =β̂ 0 ··· ∂β 0 ∂β k |β 0 =β̂ 0
 2 0 0 
 ∂ l(β|Y,X) β 1 =β̂ 1 ∂ 2 l(β|Y,X) 2
∂ l(β|Y,X) β k =β̂ k 
 ∂β 0 ∂β 1 |β =β̂ |β =β̂ ··· ∂β 1 ∂β k |β 1 =β̂ 1 
I(β̂|Y, X) =  .
∂β 21 1 1
 
0 0

 .
.. .
.. .. .. 
 . . 
∂ 2 l(β|Y,X) β k =β̂ k ∂ 2 l(β|Y,X) β k =β̂ k ∂ 2 l(β|Y,X)
∂β 0 ∂β k |β 0 =β̂ 0 ∂β 1 ∂β k |β 1 =β̂ 1 ··· ∂β 2k
|β =β̂
k k

Logo, a matriz inversa da informação observada é definida como:


 
V ar(β̂ 0 ) Cov(β̂ 0 , β̂ 1 ) ··· Cov(β̂ 0 , β̂ k )
 Cov(β̂ 0 , β̂ 1 ) V ar(β̂ 1 ) ··· Cov(β̂ 1 , β̂ k ) 
 
I −1 (β̂) =  .. .. .. .. , (12.10)
 . . . . 
Cov(β̂ 0 , β̂ k ) Cov(β̂ 1 , β̂ k ) · · · V ar(β̂ k )

enfim, para n grande, ou seja, assintoticamente

β̂ ∼ NK (β, I −1 (β)). (12.11)

Onde β̂ é o vetor das estimativas de máxima verossimilhança, de dimensão K + 1 e I −1 (β̂) é a matriz de


variância e covariância de ordem k + 1.
12.4 Método da Máxima Verossimilhança ROSSI, R. M. 152

Exemplo 12.3. Em alguns estudos de coorte apenas uma variável explicativa X precisa ser considerada.
Seja X = 1, se o paciente pertence ao grupo exposto ao fator de risco e X = 0 se o paciente pertence ao
grupo não-exposto. Assumindo um modelo logı́stico para o relacionamento entre X e a variável resposta Y,
que neste caso é o desenvolvimento da doença em estudo, temos que se X = 0 :

eβ 0
p0 = Pr (Y = 1|X = 0) =
1 + eβ 0
e se X = 1 :
eβ 0 +β 1
p1 = Pr (Y = 1|X = 1) = .
1 + eβ 0 +β 1
Os dados para um estudo de coorte como este, onde a variável resposta é dicotômica, reduzem-se a uma
tabela 2 × 2, como a mostrada a seguir.

Doença
Exposição Sim Não
Sim p1 q1
Não p0 q0

Ou seja, a análise consiste basicamente no cálculo da razão das chances (OR):

P (X = 1)[1 − P (X = 1)]
OR =
P (X = 0)[1 − P (X = 0)]
e(β 0 +β 1 )
1+e(β 0 +β 1 )
× 1+e1 β0
= β
e 0
1+e(β 0 +β 1 )
× 1+e(β10 +β1 )
e (β 0 +β 1 )
[1 + eβ 0 ] × [1 + e(β 0 +β 1 ) ]
= ×
[1 + e(β 0 +β 1 ) ] × [1 + eβ 0 ] eβ 0
= e(β 0 +β 1 −β 0 ) = eβ 1

ou simplesmente
p1 q0
OR = ,
p0 q1
assim
ln OR = β 1 .

Ou seja, dado um paciente qualquer, as chances dele desenvolver a doença dado que ele foi exposto ao
fator, é de eβ 1 vezes a chance de um paciente desenvolver a doença dado que ele foi não exposto ao fator.
12.4 Método da Máxima Verossimilhança ROSSI, R. M. 153

Exemplo 12.4. Considerando o Exemplo 12.2 e supondo que apenas três observações foram feitas. Observou-
se uma sobrevivência quando a dosagem do tóxico (X) usada era X=1; uma segunda sobrevivência para X=3
e finalmente uma falha, ou morte da cobaia para X=7. A verossimilhança neste caso de (12.9) será dada
por:

L(β 0 , β 1 ) = Pr(Y1 = 1|X = 1) Pr(Y2 = 1|X = 3) Pr(Y3 = 0|X = 7)


eβ 0 +β 1 eβ 0 +3β 1 1
= .
1 + eβ 0 +β 1 1 + eβ 0 +3β 1 1 + eβ 0 +7β 1
A estimação de β 0 e β 1 será feita via técnicas de maximização de L.

Na generalização para k covariáveis, pode-se calcular a razão de chances entre dois nı́veis
diferentes de uma mesma covariável, fixando-se o valor das outras k − 1 variáveis.
Seja Xj , a j−ésima covariável de interesse, onde deseja-se saber a razão de chances entre um dado
paciente exposto (Xj = 1) e um dado paciente não exposto ao fator (Xj = 0).
Suponha ainda que se tenha k variáveis significativas no modelo logı́stico. Para determinar a razão de
chances na mudança do nı́vel da j−ésima variável tem-se:

[p(X1 = x1 , X2 = x2 , ..., Xj = 1, ..., Xk = xk )] × [1 − p(X1 = x1 , X2 = x2 , ..., Xj = 0, ..., Xk = xk )]


OR(Xj ) =
[p(X1 = x1 , X2 = x2 , ..., Xj = 0, ..., Xk = xk )] × [1 − p(X1 = x1 , X2 = x2 , ..., Xj = 1, ..., Xk = xk )]
ou [ ] [ ]
e(β 0 +β 1 x1 +...+β j +...+β k xk ) 1
1+e(β 0 +β 1 x1 +...+β j +...+β k xk ) 1+e(β 0 +β 1 x1 +...+β k xk )
ORxj = [ (β +β x +...+β x ) ] ×[ ]
e 0 1 1 k k 1
1+e(β 0 +β 1 x1 +...+β k xk ) 1+e(β 0 +β 1 x1 +...+β j +...+β k xk )

e com um pouco de álgebra tem-se:

e(β 0 +β 1 x1 +...+β j +...+β k xk )


ORxj = (12.12)
e(β 0 +β 1 x1 +...+β k xk )
= e(β 0 +β 1 x1 +...+β j +...+β k xk )−(β 0 +β 1 x1 +...+β k xk )
= eβ j .

Desta forma, a razão de chances na mudança do nı́vel da j−ésima covariável (Xj ) é dada pelo exponencial
do j−ésimo estimador de máxima verossimilhança (β̂ j ), sendo j ≥ 1.
O intervalo com (1 − α)% de confiança pode ser obtido exponenciando os limites inferior e superior,
respectivamente, do intervalo de confiança para β̂ j , já visto anteriormente.
12.5 Significância dos Efeitos das Variáveis ROSSI, R. M. 154

12.5 Significância dos Efeitos das Variáveis


Obtidas as estimativas dos parâmetros, faz-se necessário avaliar a adequação do modelo ajustado. O
princı́pio em regressão logı́stica é o mesmo usado em regressão linear, ou seja, comparar os valores observados
da variável resposta com os valores preditos pelos modelos com, e sem, a variável sob investigação. O teste
da razão de verossimilhanças pode ser utilizado:
[ ]
LS
T RV = −2 ln = 2 ln(LS ) − 2 ln(LC ) ∼ χ2(q) (12.13)
LC | {z }
| {z } diferença de Deviances
Deviance

LS : Função de verossimilhança do modelo sem as variáveis, LC : Função de verossimilhança do modelo com


as variáveis, q : diferença de parâmetros entre os dois modelos.

Observação1 : O logaritimo da razão das verossimilhanças é multiplicado por -2 para que se obtenha uma
quantidade cuja distribuição seja conhecida, no caso a Qui-quadrado.

Observação2 : Na presença de dados faltantes, o tamanho amostral nos modelos sequenciais dependerá
das variáveis Xk que os compõem e neste caso o TRV apresentará problemas.

Alternativa: Teste de Wald (Wald, 1943)


()2
β̂ j
W = ( ) ∼ χ2(1) (12.14)
Vd
ar β̂ j

sob a hipótese nula H0 : β j = 0, j : 0, 1, ..., k.

12.6 Qualidade e Diagnóstico do Modelo Ajustado


As estatı́sticas de teste utilizadas para avaliar o quão bem o modelo se ajusta aos dados, em geral, são
denominadas estatı́sticas de qualidade do ajuste.

Qui-quadrado de Pearson e razão de verossimilhança:


Duas tradicionalmente utilizadas são a Qui-quadrado de Pearson, QP , e a da razão de verossimilhança,
QL , respectivamente, dadas por:
∑ (nij − eij )2
QP = ∼ χ2(nl−k) (12.15)
ij
e ij

e
∑ ( )
nij
QL = 2 nij ln ∼ χ2(nl−k) , (12.16)
ij
e ij

sendo nij e eij , respectivamente, os valores observados e preditos eij = ni+ p̂i para j = 1 e eij = ni+ (1 − p̂i )
para j = 2. nl : número de subpopulações (linhas da tabela de dados) e k: o número de parâmetros no
modelo.
Também é importante que outras medidas sejam examinadas a fim de se averiguar se o ajuste é válido
sobre todo o conjunto de padrões (combinações das categorias) das variáveis explanatórias ou fatores. Pre-
gibon (1981) estendeu os métodos de diagnósticos de regressão linear para a regressão logı́stica e, para isso,
fez uso dos componentes individuais das estatı́sticas QP e QL .
Digamos que, se uma tabela de contingência s × 2 tem-se ni+ sujeitos em cada uma das s linhas, dos
quais ni1 apresentam a resposta de interesse predita pelo modelo para a i-ésima linha, define-se o i-ésimo
resı́duo (resı́duos de Pearson), i = 1, 2, .., s, por:

ni1 − ni+ p̂i


ci = √ . (12.17)
ni+ p̂i (1 − p̂i )
12.6 Qualidade e Diagnóstico do Modelo Ajustado ROSSI, R. M. 155

A soma dos quadrados dos componentes ci resulta em QP :



s
2
QP = (ci ) . (12.18)
i=1

Similarmente, o resı́duo deviance, expresso por:


[ ( ) ( )] 21
ni1 ni+ − ni1
di = ± 2ni1 ln + 2 (ni+ − ni1 ) ln (12.19)
ei1 ni+ − ei1

em que ei1 = ni+ p̂i , resulta na soma dos quadrados dos componentes di em QL :


s
2
QL = (di ) . (12.20)
i=1

Em geral, resı́duos excedendo os valores ±2, 5, indicam possı́vel falta de ajuste, presença de
outliers e padrões sistemáticos de variação, visto que tanto ci quanto di seguem distribuição
aproximadamente normal padrão.

Hosmer-Lemeshow:
Um teste de ajuste também bem conhecido e utilizado em regressão logı́stica é o teste de Hosmer-
Lemeshow. O teste avalia o modelo ajustado através das distâncias entre as probabilidades ajustadas e
as probabilidades observadas. Os valores ajustados são dispostos do menor para o maior, e em seguida,
separados em g grupos de tamanho aproximadamente igual. Hosmer e Lemeshow (1980) propõe que seja
utilizado g = 10. Na literatura há pouca orientação sobre como escolher o número de grupos. As simulações
mostradas em Hosmer e Lemeshow (1989) foram baseadas no uso de g > p + 1, em que p é o número de
covariáveis do modelo ajustado. Se as frequências esperadas em alguns dos grupos forem muito pequenas a
estatı́stica do teste de Hosmer-Lemeshow é calculada, entretanto pode não ser confiável. Neste caso, devemos
especificar um número menor de grupos, contudo não se pode utilizar menos de 3 grupos, pois com (g < 3)
a estatı́stica do teste é impossibilitada de ser calculada (Agresti, 2013).
A estatı́stica teste é dada por:
(∑ ∑ )2

g
j y ij − j π̂ ij
HL = (∑ )[ (∑ ) ] ∼ χ2(g−2) . (12.21)
i=1 j π̂ ij 1− j π̂ ij /ni
12.7 Aplicações ROSSI, R. M. 156

12.7 Aplicações
12.7.1 Associação entre Tempo de experiência e Realização de uma tarefa
Um analista está estudando o efeito do tempo de experiência em programação computacional sobre a
habilidade para completar, dentro de um determinado tempo, um tarefa difı́cil. Vinte e cinco (25) progra-
madores foram selecionadas para o estudo. A variável preditora, X, corresponde ao meses de experiência. a
variável Resposta Y é tal que Y = 1 se a tarefa foi realizada e Y = 0 caso contrário.

Y 0 0 0 0 0 1 0 0 0 0 1 0 1
X 4 4 5 6 6 8 9 11 12 13 13 14 18

Y 0 0 1 1 1 0 1 1 0 1 1 1
X 18 19 20 22 22 24 25 28 29 30 30 32

O modelo ajustado foi: [ ]


p
ln = β0 + β1X
1−p
a equação da regressão logı́stica estimada será:
[ ]

ln = −3, 0597 + 0, 1615X.
1 − p̂

Para os dados da tarefa computacional, o valor da razão das chances é:

OR = e0,1615 = 1, 1715

Sua interpretação e que a chance de um indivı́duo aumenta em 17,5% para cada mês adicional de ex-
periência.
Observação: Em geral, a razão das chances estimada quando existe uma diferença de k unidades em X
será ekβ 1 .
Se desejarmos comparar indivı́duos com 10 meses e 25 meses de experiência, respectivamente, então
k = 15, e a razão das chances estimada será dada por:

ekβ̂ 1 = e15(0,1615) = 11, 3

portanto, a chance de um indivı́duo com experiência realizar a tarefa aumenta mais de 11 vezes quando
comparado com outro com pouca experiência.

Como a razão 1− p̂ é uma odds, então a Odds Ratio entre, por exemplo, os indivı́duos com 20 e 10 meses
de experiência pode ser estimada por
∧ odds(20) exp(0, 17)
OR = = ≃ 5, 027
odds(10) exp(−1, 4448)

já que ( )
xi p̂i 1 − p̂i ln p̂i
1−p̂i
10 0, 1908 0, 8092 −1, 4448
20 0, 5424 0, 4576 0, 1700
ou de forma direta:
∧ odds(20)
OR = = exp{β̂ 1 (20 − 10)} = exp{0, 1615(10)} ≃ 5, 027,
odds(10)

que nos permite concluir que a odds de realizar a tarefa entre indivı́duos com 20 meses de experiência é de
5 vezes a dos com 10 meses.
12.7 Aplicações ROSSI, R. M. 157

12.7.2 Diagnóstico de Displasia Bronco Pulmonar (BPD)


(Pagano e Gauvreau, 2004) Considere a população de bebês com baixo peso ao nascer - nesse caso,
definidos como os que pesam menos de 1.750g - que satisfazem ao seguinte critério: estão confinados em
uma unidade de tratamento intensivo neonatal, exigem entubação durante as primeiras 12 horas de vida e
sobrevivem por, no mı́nimo, 28 dias. Na amostra de 223 bebês extraı́da da população original, 76 foram
diagnosticados com displasia broncopulmonar (BPD: bonchopulmonary dysplasia), um tipo crônico de doença
dos pulmões. Os restantes 147 não tinham a doença. Seja Y uma variável aleatória dicotômica para a qual
o valor 1 representa a presença de BPD em uma criança e 0 a sua ausência. Estimamos a probabilidade de
76
que um bebê dessa população desenvolva BPD pela proporção da amostra p̂ = 223 = 0, 341. No total, 34,1%
dessas crianças com baixo peso ao nascer estão diagnosticadas com BPD.
Poderı́amos suspeitar que existem certos fatores - tanto maternais como neonatais - que afetam a pro-
babilidade de que um determinado bebê desenvolva BPD. Se pudermos classificar uma criança de acordo
com essas caracterı́sticas, é possı́vel que possamos estimar a probabilidade de que ela desenvolva a doença
do pulmão com maior precisão do que a proporcionada pelo valor simples e, subsequentemente, tomarmos
medidas para diminuir essa probabilidade.
Um fator de interesse poderia ser o peso de nascimento de um bebê. Se a resposta Y fosse contı́nua,
começarı́amos uma análise com a construção de um gráfico de dispersão bidimensional da resposta versus a
variável explicativa contı́nua, no caso BPD versus peso ao nascer. Talvez o gráfico indique uma tendência
de os bebês que desenvolveram BPD terem peso ao nascer um tanto mais baixo, na média. Em geral, por
ser um indicativo, não fica claro se isso realmente é significativo.
Alternativamente, podemos subdividir a população de bebês em três categorias: os que pesam 950g
ou menos, os que pesam entre 951 e 1.350g e os que pesam 1.351g ou mais. Podemos, então, estimar a
probabilidade de que uma criança desenvolva BPD em cada um desses subgrupos individualmente.

Tabela 12.1: Crianças com baixo peso ao nascer e desenvolvimento de BPD.


Peso ao nascer (g) Peso médio Grupo BP D = 0 BP D = 1 Total p̂
0 − 950 475 G1 19 49 68 0, 721
951 − 1.350 750 G2 62 18 80 0, 225
1.351 − 1.750 1550 G3 66 9 75 0, 120
Total - - 147 76 223 0, 341

A probabilidade estimada de um bebê ser diagnosticado com BPD diminui conforme o peso ao
nascer aumenta, de 72,1% para crianças que pesam 950g ou menos até 12% para os que pesam 1.351g
ou mais (Análise de associação na Tabela (12.1), χ2 = 64, 71; p < 0, 00001). Verificada a existência de
associação entre essas duas variáveis, podemos usar o peso ao nascer de uma criança para nos ajudar a
prever a probabilidade de que ela desenvolva BPD por meio de um modelo de regressão logı́stica.
Ajustando o modelo: [ ]
p
ln = β0 + β1X
1−p
onde X: peso ao nascer, considerando os pontos médios das classes agrupados (475, 1150 ou 1550g) a equação
da regressão logı́stica estimada é: [ ]

ln = 2, 245 − 0, 003X. (12.22)
1 − p̂
O coeficiente do peso implica que, para cada mudança de grupo de peso ao nascer, o logaritmo da chance
de que um bebê desenvolva BPD diminui de 0,003, em média. Quando o logaritmo da chance diminui,
a probabilidade p também diminui.
Para estimarmos a probabilidade de que uma criança com peso no grupo I desenvolva BPD, por exemplo,
substituı́mos o valor X = 475g para encontrar:
[ ]

ln = 2, 245 − 0, 003(475) ⇒ p̂ = 0, 71 ou 71%.
1 − p̂
Para uma criança com peso de X = 750g, tem-se:
[ ]

ln = 2, 245 − 0, 003(750) ⇒ p̂ = 0, 52 ou 52%,
1 − p̂
12.7 Aplicações ROSSI, R. M. 158

Entretanto, ao ajustar um novo modelo com todos as informações individuais (n = 223 crianças), podemos
estimar a probabilidade de que uma criança que pesa 750g no nascimento desenvolva BPD. Digamos que o
modelo ajustado tenha sido:
[ ]

ln = 4, 0343 − 0, 0042X (Pagano e Gauvreau, 2000) (12.23)
1 − p̂
então, [ ]

ln = 4, 0343 − 0, 0042(750) ⇒ p̂ = 0, 708 ou ≃ 71%.
1 − p̂
A Figura 12.2 apresenta a curva estimada de p versus Peso ao nascer, considerando o primeiro modelo
ajustado 12.22.

Figura 12.2: Regressão logı́stica de displasia broncopulmonar sobre o peso ao nascer.

Sendo o valor p̂ = 0, 52 uma estimativa, é importante apresentar seu intervalo com uma certa confiança,
digamos 95%. Para tal, é necessário o conhecimento da matriz de (co)variância dos parâmetros estimados:
[ ]
0, 176664 −0, 000155
V =
−0000155 0, 1615931
Sabe-se, da propriedade de variância, que:

V ar(p) = V ar(β 0 + β 1 X) = V ar(β 0 ) + X 2 V ar(β 1 ) + 2XCov(β 0 , β 1 ) (12.24)

assim,

V ar(p̂) = 0, 176664 + 7502 (0, 1615931) + 2(750)(−0, 000155)
= 0, 03487.

Um intervalo assintótico para p, com (1 − α)% de confiança, é dado por:




IC [p, (1 − α)%] : p̂ ± Z α2 V ar(p̂) (12.25)

então, considerando α = 5%, tem-se:



IC [p, 95%] = 0, 52 ± (1, 96) 0, 03487
= 0, 52 ± 0, 3660
= [0, 54; 0, 71].

Muitas vezes só dispomos dos dados na forma apresentada na Tabela 12.1, neste caso podemos analisar
como se X fosse uma variável categórica:
12.7 Aplicações ROSSI, R. M. 159

Observe a estrutura utilizada no programa utilizado, por exemplo, no R:


 
G1 : Baixo 0 0
 G2 : Média 1 0  : Matriz de planejamento do R (Dummy).
G3 : Alto 0 1

A equação logı́stica estimada para esse caso é dada por:


[ ]

ln = 0, 9474 − 2, 1841G2 − 2, 9398G3 . (12.26)
1 − p̂

Sendo assim, uma criança com baixo peso, por exemplo, terá 72% de probabilidade de desenvolver BPD:
[ ]

ln = 0, 9474 − 2, 1841(0) − 2, 9398(0) = 0, 9474 → p̂ = 0, 72,
1 − p̂

uma criança com médio peso, terá 23% de probabilidade de desenvolver BPD:
[ ]

ln = 0, 9474 − 2, 1841(1) − 2, 9398(0) = −1, 9906 → p̂ = 0, 23,
1 − p̂

e, uma criança com alto peso, terá 12% de probabilidade de desenvolver BPD:
[ ]

ln = 0, 9474 − 2, 1841(0) − 2, 9398(1) = −1, 2368, → p̂ = 0, 12.
1 − p̂

Desta forma, para obter as Odds correspondentes, primeiramente os cálculos auxiliares:

OR1 = log(p1 /(1 − p1 )) = 0, 9474


OR2 = log(p2 /(1 − p2 )) = −1, 2368
OR3 = log(p3 /(1 − p3 )) = −1, 9924

Por fim:

OR12 = exp(OR1 /OR2 ) = 8, 88


OR13 = exp(OR1 /OR3 ) = 18, 91
OR23 = exp(OR2 /OR3 ) = 2, 13

Verifica-se que crianças do grupo G1 tem, aproximadamente, 19 vezes mais chances de desenvolver a
BPD quando comparadas às do grupo G3 , por exemplo.
12.7 Aplicações ROSSI, R. M. 160

12.7.3 Doença na artéria coronariana


Os dados abaixo referem-se a um estudo sobre doença coronariana (koch, Imrey et al. 1985). A amostra
(estratificada) foi realizada de modo conveniente com pacientes que apresentavam caracterı́sticas clı́nicas de
interesse.

Tabela 12.2: Dados de doença na artéria coronariana.


Sexo ECG Doente Sadio Total
Feminino Depressão do Segmento ST < 0.1 4 11 15
Depressão do Segmento ST ≥ 0.1 8 10 18
Masculino Depressão do Segmento ST < 0.1 9 9 18
Depressão do Segmento ST ≥ 0.1 21 6 27

O objetivo é investigar a associação entre a doença e as variáveis descritas acima, utilizando os resultados
do ECG: Eletrocardiograma.
Observação: A análise desses dados será feita em sala de aula por meio de regressão logı́stica.

12.7.4 Estudo de fatores associados a vaso-constrição


No estudo do efeito do Volume (X1 ) e da Taxa (X2 ) de ar inspirado por indivı́duos humanos tem-se como
variável resposta (Y) a ocorrência ou não de vaso-constrição passageira na pele dos dedos. Foram obtidas
39 observações independentes (Banco de dados : vasoconstricao.txt).
Por meio de um programa computacional obtém-se os seguintes estimadores de máxima verossimilhança,
para β 0 , β 1 e β 2 :

Parâmetro Estimativa Erro-Padrão t = estimativa-0


Erro-padrão p-valor IC(β; 95%)
β0 -9,5536 3,2419 -2,95 0,0054 (-16,1109 ; -2,9963)
β1 3,8907 1,4319 2,72 0,0098 (0,9945 ; 6,7869)
β2 2,6561 0,9166 2,90 0,0061 (0,8021 ; 4,5101)

Através do p-valor, pode-se notar que todos os parâmetros são significantes ao nı́vel de 5%. A soma
dos quadrados dos resı́duos de Pearson dá um valor de 38,85, em 36 graus de liberdade, sugerindo um bom
ajuste do modelo aos dados.
Uma vez que obtidas as estimativas de β 0 , β 1 e β 2 , pode-se estimar pi e 1 − pi .
Observando as saı́das no SAS, nota-se que para nı́veis baixos de Volume (X1 ) e de Taxa (X2 ) de ar
inspirado, a probabilidade de ocorrência de vaso-constrição, é muito baixa (por exemplo a observação 10,
onde x1 = 0, 90 e x2 = 0, 45 têm-se p̂ = 0, 008), entretanto a medida que os nı́veis de Volume e de Taxa de
ar inspirado vai aumentando, a probabilidade de que um dado indivı́duo tenha vaso-constrição passageira
na pele dos tecidos dos dedos também aumenta (por exemplo a observação 2, onde x1 = 3, 5 e x2 = 1, 09
têm-se p̂ = 0, 999).
Porém, nota-se ainda que para nı́veis baixos de Volume e nı́veis altos de Taxa de ar inspirado, tem-se
uma probabilidade de ocorrência de vaso-constrição na pele dos dedos relativamente baixa (por exemplo a
observação 21, onde x1 = 0, 40 e x2 = 2, 00 têm-se p̂ = 0, 064), e para nı́veis altos de Volume e nı́veis
baixos de Taxa de ar inspirado, tem-se uma probabilidade de ocorrência de vaso-constrição intermediária
(por exemplo a observação 32, onde x1 = 2, 35 e x2 = 0, 03 têm-se p̂ = 0, 419) dando evidências de que a
covariável Volume de ar inspirado tem mais influência sobre o aumento da probabilidade de ocorrência de
vaso-constrição do que a covariável Taxa de ar inspirado.
Para uma análise mais refinada do problema, tem-se algumas estatı́sticas descritivas das covariáveis
Volume e Taxa de ar inspirado na tabela a seguir.

Covariáveis x̄ Md Q1 Q3 s
Volume (X1 ) 1,3603 1,10 0,80 1,7 0,8154
Taxa (X2 ) 1,6887 1,63 1,08 2,0 0,8804
Contudo, fixando-se a covariável Taxa de ar inspirado (X2 ) no seu nı́vel médio e utilizando o modelo
12.7 Aplicações ROSSI, R. M. 161

logı́stico, obtém-se
( )
p̂i
log = β̂ 0 + β̂ 1 Xi1 + β̂ 2 Xi2
1 − p̂i
= −9, 5536 + 3, 8907Xi1 + 2, 6561(1, 6887)

fazendo ( )
p̂i
ŷi = log
1 − p̂i
tem-se
ŷi = −5, 0682 + 3, 8907Xi1
ou seja, uma função do primeiro grau cujo gráfico é caracterizado por uma reta crescente com uma taxa de
crescimento (coeficiente angular) de 3,8907, como mostrado na Figura 12.3.
Log da chance de ocorrência de VC (Logito)

8
6
4
2

Y = −5.0682 + 3.8907.X1
0
−4 −2

0.5 1.0 1.5 2.0 2.5 3.0 3.5

Volume de ar inspirado

Figura 12.3: Logito versus Volume de ar inspirado.

Sendo assim, pode-se concluir que para um aumento de uma unidade (1) no Volume de ar inspirado,
tem-se um aumento de 3,8907 no logito (logaritmo da chance de sucesso), consequentemente ocorrendo um
aumento na probabilidade da ocorrência de vaso-constrição, uma vez que
( )
p̂i
ŷi = log
1 − p̂i
1
1 − p̂i = .
1 + eŷi
Quanto maior for ŷi menor será 1 − p̂i , e consequentemente tem-se um aumento em p̂i .
Fixando-se agora o nı́vel médio da covariável Volume de ar inspirado (X1 ) e utilizando o modelo logı́stico
obtém-se ( )
p̂i
log = −9, 5536 + 3, 8907(1, 3603) + 2, 6561Xi2
1 − p̂i
fazendo ( )
p̂i
ŷi = log
1 − p̂i
tem-se
ŷi = −4, 2610 + 2, 6561Xi2
ou seja, uma reta crescente com uma taxa de crescimento de 2,6561, como mostra a Figura 12.4.
Sendo assim pode-se concluir que para um aumento de uma unidade (1) na Taxa de ar inspirado tem-se
um aumento de 2,6561 no Logito, consequentemente ocorrendo um aumento na probabilidade da ocorrência
de vaso-constrição.
Plotando as duas retas no mesmo plano cartesiano, obtém-se a Figura 12.5.
12.7 Aplicações ROSSI, R. M. 162

Log da chance de ocorrência de VC (Logito)

6
4
2
0
Y = −4.2610 + 2.6561.X2

−2
−4
0 1 2 3

Taxa de ar inspirado

Figura 12.4: Logito versus Taxa de ar inspirado.


Log da chance de ocorrência de VC (Logito)

6
4

Y = −5.0682 + 3.8907.X1
2
0

Y = −4.2610 + 2.6561.X2
−2
−4

0 1 2 3

Taxa e Volume de ar inspirado

Figura 12.5: Logito versus Volume e Taxa de ar inspirado simultâneos.

Logo pode-se notar que a covariável Volume tem uma maior influência no aumento do Logito do que a
covariável Taxa, ou seja, a probabilidade de ocorrência de vaso-constrição na pele dos dedos aumenta mais
rapidamente para um acréscimo no Volume do que um acréscimo na Taxa de ar inspirado.
Supõe que deseja-se saber a razão de chances quando existe uma variação no nı́vel de Volume de ar
inspirado de 0,80 (1o Quartil) para 1,10 (Mediana), para a Taxa de ar inspirado fixado em um determinado
valor. Sendo assim sabe-se que:
Pr(X1 = 1, 10; X2 = x2 ) × [1 − Pr(X1 = 0, 80; X2 = x2 )]
OR =
Pr(X1 = 0, 80; X2 = x2 ) × [1 − Pr(X1 = 1, 10; X2 = x2 )]
onde
eβ̂ 0 +β̂ 1 X1 +β̂ 2 X2
Pr(X1 = x1 ; X2 = x2 ) = .
1 + eβ̂ 0 +β̂ 1 X1 +β̂ 2 X2
Logo após um pouco de álgebra, tem-se
eβ̂ 0 +β̂ 1 (1,10)+β̂ 2 x2
OR =
eβ̂ 0 +β̂ 1 (0,80)+β̂ 2 x2
= e0,30β̂ 1
OR = e0,30(3,8907) = e1,1672 = 3, 213
ou seja, para um mesmo nı́vel de Taxa de ar inspirado (X2 ), e houver um aumento de 0,30 no Volume de ar
inspirado (X1 ), as chances de ter vaso-constrição passageira na pele dos dedos aumenta em 3,21 vezes.
12.7 Aplicações ROSSI, R. M. 163

Através do SAS (Proc NlMixed) pode-se determinar um intervalo com 95% de confiança para a estimativa
anterior:
Estimativa IC(95%)
OR 3,213 (1,3476 ; 7,6606)
Como o valor “1” não pertence ao intervalo, pode-se concluir que existe uma diferença significativa, ao
nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um aumento de 0,30 no Volume de ar
inspirado.
Generalizando, tem-se que para cada unidade acrescida no Volume de ar inspirado, para um nı́vel fixo
de Taxa de ar inspirado, a razão de chances (OR) é dada por:

eβ̂ 0 +β̂ 1 (x1 +1)+β̂ 2 x2


OR =
eβ̂ 0 +β̂ 1 x1 +β̂ 2 x2
= e = e3,8907 = 48, 9451
β̂ 1

ou seja, para um mesmo nı́vel de Taxa de ar inspirado (X2 ), se houver um aumento de (“1”) uma unidade
no Volume de ar inspirado (X1 ), as chances de ter vaso-constrição passageira na pele dos dedos aumenta em
48,9 vezes, aproximadamente.
Através do SAS (Proc NlMixed) pode-se determinar um intervalo com 95% de confiança para a razão de
chances
Estimativa IC(95%)
OR 48,9451 (2,7036 ; 886,1662)
analogamente, como o valor 1 não pertence ao intervalo, pode-se concluir que existe uma diferença signifi-
cativa, ao nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um aumento de 1 unidade no
Volume de ar inspirado.
Quando se deseja saber qual a razão de chances quando existe uma variação no nı́vel da Taxa de ar
inspirado de 1,08 (1o Quartil) para 1,63 (Mediana), para o Volume de ar inspirado fixado em um determinado
valor, o procedimento é análogo:

Pr(X1 = x1 ; X2 = 1, 63) × [1 − Pr(X1 = x1 ; X2 = 1, 08)]


OR =
Pr(X1 = x1 ; X2 = 1, 08) × [1 − Pr(X1 = x1 ; X2 = 1, 63)]
..
.
eβ̂ 0 +β̂ 1 .x1 +β̂ 2 (1,63)
=
eβ̂ 0 +β̂ 1 .x1 +β̂ 2 (1,06)
= e0,55β̂ 2
= e0,55(2,6561)
= 4, 3674

e seu respectivo IC(95%) será (1,5796 ; 13,0762). Como o valor 1 não pertence ao intervalo, conclui-se que
existe uma diferença significativa, ao nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um
aumento de 0,57 na Taxa de ar inspirada.
Generalizando, obtém-se a razão de chances de 14,2406 (2,2302 ; 90,9309), isto é, para um mesmo nı́vel
de Volume de ar inspirado (X1 ), se houver um aumento de uma unidade na Taxa de ar inspirado (X2 ), as
chances de ter vaso-constrição passageira na pele dos dedos aumenta aproximadamente 14 vezes.
Entretanto, uma consideração importante deve ser feita em relação ao ajuste dos dados, já que o modelo
de regressão logı́stica não se mostrou ajustado por meio do testes de GOF (p = 0, 02041) e de Hosmer e
Lemeshow (p = 0, 0224). Desta forma, uma função alternativa é sugerida, como por exemplo, a probito:

Φ−1 (θ(x)) = β 0 + β 1 X1 + β 2 X2 (12.27)

sendo Φ(.) denota a função de distribuição da normal padrão, N (0, 1). Por exemplo, para valores X̄1 e X̄2 ,
a probabilidade de ocorrência do evento será de 57%.
Para o modelo probito, os testes de GOF (p = 0, 052) e de Hosmer e Lemeshow (p = 0, 05) não rejeitam
a hipótese de bom ajuste dos dados.
12.7 Aplicações ROSSI, R. M. 164

Odds entre valores medianos e do 1o quartil calculadas anteriormente, serão 1,89 e 2,27, respectivamente,
assim como, as OR individuais para cada unidade acrescida na variável Volume e Taxa de ar inspirado,
respectivamente por, 8,35 e 4,39.
As Figuras 12.6, 12.7 e 12.8, apresentam agora as equações de retas ajustadas à função probito.

5
4
3
θ(x)

2
1

Y1 = −2.7073+2.1223*X1
0

1.0 1.5 2.0 2.5 3.0 3.5

Volume (X1)

Figura 12.6: Probito versus Volume de ar inspirado.


−0.85
−0.90
−0.95
θ(x)

−1.00
−1.05

Y2 = −2.3199+1.4801*X2
−1.10

0.85 0.90 0.95 1.00

Taxa (X2)

Figura 12.7: Probito versus Taxa de ar inspirado.


12.7 Aplicações ROSSI, R. M. 165

8
6
4
θ(x)

2
0
Y1
Y2

−2
−4 1.0 1.5 2.0 2.5 3.0 3.5

Volume (X1) e Taxa (X2)

Figura 12.8: Probito versus Volume e Taxa de ar inspirado simultâneos.

Exercı́cio 12.1. Um estudo teve com interesse investigar o processo de cura de um determinado tipo de
câncer. Um diagnóstico inicial era realizado para classificar o câncer do paciente em: ”complicado” ou ”não-
complicado”. Dois grupos foram formados de acordo com o tipo de tratamento a ser realizado: ”Padrão”
ou ”Novo”, então após um determinado tempo de observação, o paciente era classificado como: ”curado”
ou ”não-curado”. Proceda uma análise de regressão logı́stica completa para um modelo baseado em p =
P r(cura), e após preencher a tabela abaixo, conclua a respeito do novo tratamento (Adote um critério de
5% de significância para verificar a significância das variáveis ”Diagnóstico” e ”Tratamento”).

Tabela 12.3: Diagnóstico, tratamento e cura de um determinado tipo de câncer.


Diagnóstico Tratamento Curado Não-curado p
Complicado Padrão 78 38
Complicado Novo 101 11
Não-complicado Padrão 68 5
Não-complicado Novo 75 12

Exercı́cio 12.2. Pine et al. (1983) estudaram pacientes com ”sepis intra-abdominal”, um tipo de inflamação
no intestino. Várias variáveis foram analisadas (Banco de dados: pine1983.txt.) Proceda uma análise
de regressão logı́stica completa e apresente a probabilidade de um indivı́duo ao 60 anos cujo status em todas
variáveis independentes é de risco,
 vir a óbito.
X1 : Shock 


X2 : Desnutrição 1: ”presente” (risco)
X3 : Alcoolismo 
 0: ”ausente”

X4 : Infecção Intestinal
X5 : Idade (em anos) {
1: ”morto”
Y: Variável resposta ;
0: ”vivo”
12.7 Aplicações ROSSI, R. M. 166

Exercı́cio 12.3. Faça uma análise de Regressão Logı́stica completa para os dados referentes a recém-nascidos
no Serviço da Maternidade do HE da Faculdade de Medicina de Itajubá, ano de 1996. Levantamento sequen-
cial, perı́odo aproximado de dois meses. Total de 96 casos, classificados em 9 variáveis, onde o objetivo do
trabalho é verificar qual ou quais variáveis são fatores de risco para o desenvolvimento de anomalia (Banco
de dados: Pediat.xls). Observação: Para a análise Exclua as variáveis Sangue e RH. Apresente a proba-
bilidade de uma Menina desenvolver a anomalia, sendo que o seu tempo gestacional foi de 270 dias, nasceu
com 2.900 gramas, apresentou estatura de 50 cm, perı́metro cefálico de 32cm e perı́metro torácico de 35cm.
Exercı́cio 12.4. Um estudo teve por objetivo verificar a associação das variáveis de risco e tipologia sócio-
ocupacionais na região metropolitana de maringá-PR, 2010 (Banco de dados: mortalidadeinfantil.txt).
Faça uma análise de Regressão Logı́stica completa para os dados. Utilize o arquivo mortalidadeinfantil-
info.txt para procedimentos de análise (Observação: Faça a análise sem distinção de localidade-TSO).
Exercı́cio 12.5. Um trabalho cientı́fico teve como objetivo determinar os fatores de risco para o desen-
volvimento de uma Dislipidemia (Perfil Lipı́dico) em indivı́duos da demanda laboratorial não-hospitalar de
Maringá (PR). O arquivo no Banco de dados: DSPlogistica.xls, reúne as informações a respeito de al-
gumas variáveis a serem investigadas para tal. Faça uma análise de Regressão Logı́stica completa para os
dados.

Exercı́cio 12.6. Um estudo na residência médica da UEM no ano de 2006 teve por objetivo verificar qual(is)
fator(res) de risco estão associação à Depressão Pós-Parto (DPP) (Banco de dados: DeprePosParto.xls).
Faça uma análise de Regressão Logı́stica completa para os dados. Para tal utilize as informações contidas
na planilha (info) e/ou no arquivo DeprePosParto-info.txt. Apresente a probabilidade de uma mulher cujo
status em todas variáveis independentes de risco, vir a desenvolver a DPP.
Exercı́cio 12.7. Um estudo teve por objetivo verificar qual(is) fator(res) de risco estão associação à Ansi-
edade e à Depressão(Banco de dados: Psilogist.xls). Faça uma análise de Regressão Logı́stica completa
para os dados quanto a Ansiedade e em seguinda a Depressão. Para tal utilize as informações contidas no
arquivo Psilogist-info.txt. Apresente a probabilidade de um homem branco, com 40 anos, católico, casado,
analfabeto com 100 meses de diálise, vir a desenvolver uma Ansiedade e uma Depressão.
Referências Bibliográficas

[1] AGRESTI, A. An Introduction to Categorical Data Analysis. 2a Ed. NY: Wiley, 2007.

[2] ARANGO, H. G. Bioestatı́stica: Teórica e computacional. Guanabara Koogan S.A. 3a Ed. RJ, 2009.
[3] BUSSAB, W. O e MORETTIN, P. A. Estatı́stica básica. Ed. Saraiva, 8a Ed. SP, 2013.

[4] CALLEGARI-JACQUES, S. M. Bioestatı́stica: Princı́pios e Aplicações. Ed. Artmed. RS, 2003.


[5] CAMPOS, H. Estatı́stica Experimetal Não-Paramétrica. 4a Ed. USP/ESALQ, 1983.

[6] CARVAJAR, S. S. R. Elementos de Estatı́stica (com aplicações às ciências médicas e biológicas). Rio
de Janeiro: UFRJ, 1970.
[7] CASELLA, G.; BERGER, R. L. Inferência Estatı́stica. Cengage Learning: São Paulo. 2010.

[8] CASTELLANOS, R. S.; MERINO, A. P.. Psicoestadistica-Contrastes Paramétricos y no Paramétricos.


Ediciones Piramide S.A., Madrid, 1989.

[9] CENTENO, A. J. Curso de Estatı́stica aplicada à Biologia. Goiânia: Ed. Universidade Federal de Goiás,
1981.

[10] DIAZ, F, R; LOPES, F. J. B. Bioestatı́stica. 1a Ed. Thomson Learning, 2007.


[11] DOWNING, D.; CLARK, J. Estatı́stica aplicada. 2a Ed. Saraiva. SP, 2002.

[12] FLEISS, J.L. Statistical Methods for rates and proportions. 2a Ed. NY, John Wily and Sons, 1981.
[13] FLETCHER, R. H. e FLETCHER, S. W. Epidemiologia Clı́nica: Elementos Essenciais. 4a . Edição. São
Paulo, ARTMED. 2006.
[14] GAUVREAU, K.; PAGANO. Principios de Bioestatı́stica. 2a Ed. Thonson, 2004.

[15] GUEDES, M. L. S.; GUEDES, J. S. Bioestatı́stica - Para profissionais de saúde. 1a Ed. Ao livro técnico
S.A. RJ, 1988.

[16] MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatı́stica. 6a Ed. EDUSP, 2008.
[17] MARTINEZ, E.Z. Bioestatı́stica para os Cursos de Graduação da Área da Saúde. 1a Ed. 1a Ed. Blucher,
2015.
[18] MONTGOMERY, DOUGLAS. Design and analysis of experiments. 3a Ed. NY, John Wiley & Sons,
1991.
[19] MORETTIN, L. G. Estatı́stica Básica. São Paulo: Makron Books, 2000, vol. I e II.

[20] PAGANO, M.; GAUVREAU, K. Princı́pios de Bioestatı́stica. Ed. Thomson, 2a Edição, SP, 2004.

[21] PEREIRA, M. G.. Epidemiologia: Teoria e Prática. Ed. Guanabara & Koogan, 1995.
[22] SOARES, J. F.; BARTMAN, F. C. Métodos estatı́sticos em medicina e biologia. 14o Colóquio Brasileiro
de Matemática. IMPA/CNPq. RJ, 1983.

167
12.7 Aplicações ROSSI, R. M. 168

[23] SOARES, J. F.; SIQUEIRA, A.L. Introdução à estatı́stica médica. Ed. UFMG. 1999.

[24] SOKAL, R. R. Biometry: The Principles and Practice of Statistics in Biological Research. New York:
W.F. Freeman, 1995.

[25] SIEGEL, S. Estatı́stica não-paramétrica. 1a Ed. RJ, Editora McGraw Hill do Brasil Ltda, 1981.

[26] SIQUEIRA, A. L. e TIBÚRCIO, J. D. Estatı́stica na Área da Saúde: conceitos, metodologia, aplicações


e prática computacional. Ed. Coopmed, 2011.

[27] SOUNIS, E. Bioestatı́stica. Princı́pios fundamentais, metodologia, estatı́stica, aplicação à ciências


biológicas. 2a Ed. Revisada, McGraw-Hill, 1975.

[28] STEEL, R. G. D. Principles and Procedures of Statistics a Biometrical Approach. 2. Ed. New York: Mc
Graw-Hill, 1980.

[29] VIEIRA, S. Introdução à Bioestatı́stica. 5a Edição. Rio de Janeiro: Elsevier, 2016.


[30] VIEIRA, S. Bioestatı́stica. Tópicos Avançados. 3a Edição. Rio de Janeiro: Elsevier, 2010.

[31] WAYNE, W. D. Biostatistics. A foundation for analysis in the health sciences. 10a Ed. J&S. NY, 2014.
12.7 Aplicações ROSSI, R. M. 169

FORMULÁRIOS
Formulário I - Estatı́stica Descritiva 1


AT = xmax − xmin k= n k = 1 + 3, 22 log n e h = AT
k
Linf + Lsup Fi Fac
xi = fi = fac =
2 n n
∑n ∑k
xi xi Fi
h(Fi − Fi−1 )
x̄ = i=1 x̄ = i=1 Mo = li +
n n (Fi − Fi−1 ) + (Fi − Fi+1 )
n+1 xp + xp+1 n h(p − Fac−1 ) n
Md = xp ; p = 2 Md = ;p= Md = li + ;p=
2 2 Fi 2
h(p − Fac−1 ) kn
Sk = li + p= w : 1, 4, 10 ou 100
Fi w
x̄ − Mo (Q3 − Q1 ) √
Ap = k= s = s2
s  90 − P10()
2(P
)2 
∑n ∑
k
(xi − x̄)
2
( ) k xi 
1 ∑ 2 
s2 = i=1 s2 =  xi −
i=1
 -
n−1 n − 1 i=1 n 
 ( )2 

k ∑
k
2
(xi − x̄) Fi ( ) k xi Fi 
i=1 1 ∑ 2 i=1  s
s2 = s2 =  x Fi −  cv = 100
n−1 n − 1 i=1 i n  x̄

Formulário II - Probabilidade e Distribuições Probabilı́sticas

P (A) = #A
#S P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A ∩ B)
P (Ac ) = 1 − P (A) P (A|B) =
∑ P (B)
E(X) = xi p(xi ) V ar(X) = E[(X − E(X))2 ] = E(X 2 ) − [E(X)]2
E(aX ± b) = aE(X) ± b V ar(aX ± b) = a2 V ar(X)
( ) (n) n!
p(X = x) = nx px q n−x x = x!(n − x)!

e−λ λx
p(X = x) =
x!
X −µ
Z=
σ
p(X = x) = λe−λx P (X > x) = e−λx

1 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
12.7 Aplicações ROSSI, R. M. 170

Formulário III - Inferência Paramétrica * Supondo X ∼ N (µ; σ)2


Tamanho de Amostra ( )2
[ ]
Z α2 so 2 so ∗ N n0 ∗
N s2o Z α2
p/ µ : n= onde e = Z 2 √ ;
α n = ou n = ( )2
e n N + (n0 − 1) (N − 1)e2 + s2o Z α2
[ ] [ ]
Z α2 2 Z α2 2 N n0
p/ p : n= p0 q0 ou n= ; n∗ =
e 2e N + (n0 − 1)

Formulário IV - Inferência - IC e TH | Supondo X ∼ N (µ; σ)

Intervalos de Confiança (IC) Testes de Hipóteses (TH)


σ x̄ − µ0
p/ µ : x̄ ± e; e = Z α2 √ {σ ! Zc = σ ∼ N (0, 1)
n √
n
s x̄ − µ0
x̄ ± e; e = Z α2 √ {σ ?e n = 30 Zc = s ∼ N (0, 1)
n √
{ n
s σ ? e n < 30 x̄ − µ0
x̄ ± e; e = t α √ tc = s ∼ tn−1
2 ,ν
n g.l : ν = n − 1 √
√ n
p̂q̂ X p̂ − p0
p/ p : p̂ ± Z α p̂ = Zc = √ ∼ N (0, 1)
2
n n pq
√ n
p/ σ 21 σ2 { 2 x̄1 − x̄2
(x̄1 − x̄2 ) ± Z α2 + 2 σ 1 ! e σ 22 ! Zc = √ ∼ N (0, 1)
µ1 − µ2 : n1 n2 σ 21 σ 22
+
n1 n2
√ {
s21 s2 σ 21 ? e σ 22 ? x̄1 − x̄2
(x̄1 − x̄2 ) ± Z α2 + 2 Zc = √ ∼ N (0, 1)
n1 n2 n1 + n2 ≥ 30
s21 s22
+
 2 n1 n2
√  σ 1 = σ 22 = σ 2 ?
1 1 x̄ − x̄2
(x̄1 − x̄2 ) ± t α2 ,ν sp + n1 + n2 < 30 tc = √1 ∼ tν
n1 n2  1 1
ν = n1 + n2 − 2 sp +
√ n1 n2
(n1 − 1)s21 + (n2 − 1)s22
sp =
n1 + n2 − 2
√ {
s21 s2 σ 21 ̸= σ 22 ? x̄1 − x̄2
(x̄1 − x̄2 ) ± t α2 ,ϕ + 2 tc = √ ∼ tϕ
n1 n2 n1 + n2 < 30
s21 s22
+
n1 n2
s21
(ϖ1 + ϖ2 ) 2 ϖ1 =
ϕ= onde, n1
ϖ21 ϖ22 s2
+ ϖ2 = 2
n1 − 1 n2 − 1 n2 √
p/ µ : sd d¯ n
d ± t α2 ,n−1 √
¯ n < 30 tc = ∼ tn−1
dados pareados n√ sd
p/ p̂1 q̂1 p̂2 q̂2 p̂1 − p̂2
(p̂1 − p̂2 ) ± Z α2 + ni pi > 5; i = 1, 2. Zc = √ ∼ N (0, 1)
p1 − p2 : n1 n2 p̂1 q̂1 p̂2 q̂2
+
n1 n2

2 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
12.7 Aplicações ROSSI, R. M. 171

Formulário IV - Análise em Tabelas de Contingência 3

∑k (O − E )2
i i ∑k (|O − E | − 0.5)2
i i
χ2 = ∼ χ2(l−1)(c−1) χ2Y ates = ∼ χ2(l−1)(c−1)
i=1 Ei i=1 Ei

onde Ei = (Total Linha)(Total


Total Geral
Coluna)

Para Tabelas 2X2


( )2
n (ad − bc)
2
n |ad − bc| − n2 [|b − c| − 1]
2
χ2 = ∼ χ2(1) 2
χY ates = ∼ χ2(1) χ2M cN = ∼ χ2(1)
m 1 m 2 n1 n2 m 1 m 2 n1 n2 b+c
Análise de Resı́duos
O−E Rp
Rp = √ ; Raj = √( )( ) ˜ N (0, 1)
E 1− TC
1− TL
TG TG

Medidas do Efeito
Pr(Doente|Exposto) a/(a+c)
RR = =
Pr(Doente|Não − exposto) b/(b+d)

1± √ 2
IC(RR; 1 − α%) : RR χ2c

Pr(Exposto|Doente)/[1 − Pr(Exposto|Doente)] ac
OR = =
Pr(Exposto|Não − Doente)/[1 − Pr(Exposto|Não − Doente)] bd

1± √ 2
IC(OR; 1 − α%) : OR χc 2

Coeficiente de Kappa (replicabilidade)

po − pe a+d n1 m1 + n2 m2
Kappa = ; po = ; pe =
1 − pe n n2

Kappa Concordância
k=0 nenhuma
k < 0, 4 leve
0, 4 ≤ k < 0, 8 moderada
0, 8 ≤ k < 1 forte
k=1 perfeita

3 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
12.7 Aplicações ROSSI, R. M. 172

Formulário V - Inferência Não-Paramétrica 4


Teste Mann-Whitney para 2 amostras independentes

M -W = Uc = min{U1 ; U2 } ∼ Uα;n1 ;n2


n < 25 ni (ni + 1)
onde Ui = n1 n2 + − Ti
2
nmin (n1 + n2 + 1)
min{T1 ; T2 } −
n ≥ 25 Zc = √ 2 ∼ N (0, 1)
n1 n2 (n1 +n2 +1)
12

Teste Wilcoxon para 2 amostras pareadas

n < 20 Wc = min{ T(−) ; T(+) } ∼ Wα;n


n(n + 1)
Wc −
n ≥ 20 Zc = √ 4 ∼ N (0, 1)
n(n + 1)(2n + 1)
24
Teste Kruskal-Wallis para k amostras independentes

12 ∑k T2
HK−W = i
− 3(N + 1) tal que H ∼ χ2(k−1)
N (N + 1) i=1 ni

Teste Friedman para k amostras pareadas

12 ∑k
HF r = T 2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1 i

Teste Cochran para k amostras pareadas (Resposta dicotômica)


k
2
k(k − 1) (Ti ) − (k − 1)N 2
i=1
Q= ∑
n ∼ χ2k−1
2
kN − (Sj )
j=1

4 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.

Você também pode gostar