Apostila Bioestatistica

Fundação Universidade Estadual de Maringá - UEM
Centro de Ciências Exatas - CCE

Departamento de Estatı́stica - DES
Programa de Pós-Graduação em Bioestatı́stica - PBE
Bioestatı́stica
Prof. Dr. Robson Marcelo Rossi

Sumário
1 Definições e Conceitos 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 BioEstatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Os Conceitos da Bioestatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Experimentação Biométrica 7
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 O Raciocı́nio Indutivo da Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Delineamentos Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.1 Etapa de um levantamento estatı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.1 Estudo de Caso-Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Estudo de Coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.3 Ensaios Clı́nicos Aleatorizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.4 Estudos Descritivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3 Estatı́stica Descritiva 20
3.1 Organização de Dados Estatı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Normas para a Apresentação Tabular de Dados . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Medidas de Tendência Central ou de Posição . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.2 Medida de Variabilidade ou de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4.3 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4 Noções de Probabilidade 43
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Espaço Amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3 Definição Axiomática de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Propriedades Fundamentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.6 Independência Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7 Variável Aleatória Discreta e Contı́nua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.1 Esperança Matemática de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . 49
4.7.2 Variabilidade de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5 Distribuições de Probabilidade 51
5.1 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.3 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.4 Distribuição Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
ii
6 Inferência Estatı́stica 55
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Noções de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.2.1 Plano de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.2.2 Amostragem Aleatória Simples (AAS) . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.2.3 Amostragem Aleatória Simples Sistemática (AASist) . . . . . . . . . . . . . . . . . . . 58
6.2.4 Amostragem Aleatória por Conglomerados (AAC) . . . . . . . . . . . . . . . . . . . . 58
6.2.5 Amostragem Aleatória Estratificada (AAE) . . . . . . . . . . . . . . . . . . . . . . . . 59
6.3 Distribuição Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3.1 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3.2 Distribuição Amostral da Diferença de Médias . . . . . . . . . . . . . . . . . . . . . . 64
6.3.3 Distribuição Amostral da Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.4 Intervalo de Confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4.1 Intervalo de Confiança para Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4.2 Intervalo de Confiança para Diferença de Médias . . . . . . . . . . . . . . . . . . . . . 67
6.4.3 Intervalo de Confiança para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.5 Tamanho da Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5.1 Método Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5.2 Método Inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.6 Testes de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.6.1 Construção de um Teste de Hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.6.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.6.3 Teste de Hipótese para Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.6.4 Teste de Hipótese para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7 Análise em Tabelas 2x2 e LxC 80

7.1 Tabelas de Contingência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.2 Teste de Independência e de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.3 Análise de Resı́duos em Tabelas 2×L . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.4 Medidas do Efeito em Tabelas 2×2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.4.1 Risco Relativo (RR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7.4.2 Odds-Ratio (OR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
8 Comparações Entre Grupos 92

8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.2 Normalidade dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
8.2.1 Faixas de Referência (Método de Gauss) . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.3 Resposta Dicotômica: Amostras Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.3.1 Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.3.2 Teste Exato de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.3.3 Teste z para Comparação de Proporções . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.4 Resposta Dicotômica: Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.4.1 Teste McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.5 Resposta Contı́nua - Teste de Médias para Amostras Independentes . . . . . . . . . . . . . . 100
8.5.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
8.5.2 Teste z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas . . . . . . . . . . . . . . . . . 102
8.6.1 Teste t-pareado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.7 Testes Não-Paramétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
8.7.1 Teste Mann-Whitney para Amostras Independentes . . . . . . . . . . . . . . . . . . . 104
8.7.2 Teste Kruskal-Wallis para k Amostras Independentes . . . . . . . . . . . . . . . . . . . 105
8.7.3 Teste de Wilcoxon para Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . 107
8.7.4 Teste Friedman para k Amostras Pareadas . . . . . . . . . . . . . . . . . . . . . . . . 109
8.7.5 Outros Testes Não-Paramétricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
9 Análise de Variância 113
9.1 ANOVA para Experimentos ao Acaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
9.2 Teste de Comparações Múltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9.2.1 Número Igual de Repetições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9.2.2 Número Diferente de Repetições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
10 Testes Diagnósticos 122

10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
10.2 Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
10.3 Valor das Predições: VPP e VPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
10.4 Decisões Incorretas: PFP e PFN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
10.5 Combinação de Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
10.5.1 Combinação em Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
10.5.2 Combinação em Série . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
10.6 Escolha entre Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
10.7 Relação entre Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
10.8 Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
11 Análise de Regressão 140

11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
11.2 Ajustamento da reta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
11.3 O Modelo de Regressão Linear Simples - MRLS . . . . . . . . . . . . . . . . . . . . . . . . . . 140
11.3.1 Intervalos de confiança para os parâmetros . . . . . . . . . . . . . . . . . . . . . . . . 141
11.3.2 Intervalos de predição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
12 Regressão Logı́stica 148

12.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
12.2 O modelo de Regressão Logı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
12.3 Várias Variáveis Explicativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12.4 Método da Máxima Verossimilhança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12.5 Significância dos Efeitos das Variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
12.6 Qualidade e Diagnóstico do Modelo Ajustado . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
12.7 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
12.7.1 Associação entre Tempo de experiência e Realização de uma tarefa . . . . . . . . . . . 156
12.7.2 Diagnóstico de Displasia Bronco Pulmonar (BPD) . . . . . . . . . . . . . . . . . . . . 157
12.7.3 Doença na artéria coronariana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
12.7.4 Estudo de fatores associados a vaso-constrição . . . . . . . . . . . . . . . . . . . . . . 160
Referências Bibliográficas 167
Formulários 169
Capı́tulo 1
Definições e Conceitos
1.1 Introdução
O objetivo deste capı́tulo é ilustrar o papel que conceitos e técnicas estatı́sticas têm na formação do
especialista na área biométrica, na sua prática profissional e de modo especial no avanço do conhecimento
nesta área especı́fica.
Este objetivo será alcançado principalmente através da apresentação e discussão dos resultados de es-
tudos relevantes. Através destes exemplos, argumenta-se que conceitos estatı́sticos têm importante papel a
desempenhar, tanto no estudo da saúde de populações, como nos tratamentos individuais.
1.2 BioEstatı́stica
A má utilização de dados nas áreas das ciências, com interpretações errôneas ou mal intencionadas, tem
produzido um grande ceticismo em relação à estatı́stica. Podemos encontrar muitos professores, clı́nicos ou
mesmo profissionais de ciências básicas, que acham que “bom senso” é suficiente para tratar desses dados,
que qualquer coisa que exija prova estatı́stica não pode ter valor prático ou que procurarão um matemático
se tiverem algum problema estatı́stico em seu trabalho.
É importante compreender, no entanto, que cada vez que se toma a média de duas leituras de pipeta,
por exemplo, ou o número médio de dias de internação no hospital de pacientes com determinada doença,
se está usando um método estatı́stico. Do mesmo modo, usamos métodos estatı́sticos para concluir que a
pressão arterial do paciente está normal ou que um tratamento cirúrgico é melhor que outro.
Convencionou-ser chamar de Bioestatı́stica o conjunto de conceitos e métodos cientı́ficos usados no trata-
mento da variabilidade nas ciências da saúde, biológicas e farmacêuticas. A Bioestatı́stica fornece métodos
para se tomar decisões ótimas na presença de incerteza, estabelecendo faixas de confiança para a eficácia dos
tratamentos e verificando a influência de fatores de risco no aparecimento de doenças.
A ênfase crescente do papel dos métodos quantitativos torna imperativo que o profissional tenha algum
conhecimento de estatı́stica.
O estudante aprende na escola o melhor método de diagnose e terapêutica; depois de formado dependerá
necessariamente de trabalhos apresentados em reuniões, jornais e revistas médicas, para aprender novos
métodos de terapia, assim como os progressos em diagnose e técnica cirúrgica. Portanto, deverá estar apto
a avaliar por si próprio os resultados de outros pesquisadores, deverá decidir quando uma nova técnica
ou método pode substituir os antigos. Deverá estar apto a responder à pergunta da mãe que o consulta
sobre a vacina mais recente e, com a mesma segurança, aconselhá-la em relação à vacina antipólio ou anti-
sarampo. Deverá estar apto a dar à famı́lia do paciente segurança quanto ao diagnóstico, o que pode depender
de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais, como também de seu
conhecimento sobre a relação da idade, sexo e outras condições do paciente a uma determinada doença. Os
novos conhecimentos virão através do trabalho de pesquisa realizado por ele próprio ou por outros. Deve,
portanto, ser capaz de selecionar, da massa de informações, aquelas que forem válidas e que resistirem a
testes cientı́ficos rı́gidos. Deve desenvolver um ceticismo sadio em relação a tudo que lê.
Uma noção básica em planejamentos experimentais referentes à pesquisa médica, é o reconhecimento de
que os indivı́duos diferem não apenas uns dos outros, mas também em relação a si próprios, de dia para
1
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 2
dia ou mesmo de hora para hora. Uma certa quantidade de variação é normal, mas a questão que desafia o
médico é determinar quando uma variação especı́fica se torna patológica (referente à doença). Para isso, o
estudante deve aprender como medir a variação em indivı́duos normais e definir qual é o limite de variação
normal. Deve aprender que há algum erro aleatório presente em cada medida ou contagem feita. É altamente
improvável que duas contagens sucessivas de glóbulos, feitas na mesma amostra de sangue, sejam idênticas.
Quando, porém, uma diferença se torna maior que o erro de mensuração? Para tratar seu paciente
do melhor modo possı́vel, o médico deve saber responder à questões como essa. Para cada medida ou
determinação fornecida pelo laboratório, o médico deve conhecer a variação que é parte do próprio método,
para saber quando uma dada variação representa uma mudança real no paciente.
Sempre que novos métodos de terapia são introduzidos, é necessário saber se são realmente superiores,
isto é, mais eficientes aos velhos métodos. Será necessário fazer-se a avaliação crı́tica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o fator
em prova foi o único fator de diferença entre o grupo experimental e o grupo controle, se a diferença entre os
resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribuı́da ao acaso. Apenas depois
da avaliação, através de técnicas estatı́sticas adequadas, da fidedignidade dos resultados, comparabilidade
dos grupos experiência e controle e, significância da diferença encontrada é que podemos tirar as conclusões
relativas ao novo método.
O número de falhas encontradas em publicações médicas enfatiza a necessidade de uma avaliação crı́tica
da literatura. Para ajudar o estudante a desenvolver tal atitude são necessários certos conceitos estatı́sticos
básicos e uma certa familiaridade com a terminologia mais usada.
Métodos estatı́sticos são essenciais no estudo de situações em que as variáveis de interesse estão sujeitas,
inerentemente, a flutuações aleatórias. Este é o caso da área da saúde. Mesmo tomando-se um grupo
de pacientes homogêneos, observa-se grande variabilidade, por exemplo, no tempo de sobrevida após um
tratamento adequado. Dosagens de caracterı́sticas hematológicas flutuam não só entre indivı́duos, como
também no mesmo indivı́duo em ocasiões diferentes. Na realidade, há variações entre diferentes pacientes
para qualquer variável de interesse clı́nico. Portanto, para se estudar problemas clı́nicos, é necessária uma
metodologia capaz de tratar a variabilidade de forma adequada.
Deve-se notar, entretanto, que ao tratar um paciente, o médico se vale da experiência de eventos ante-
riores, vivenciada pessoalmente ou transmitida por outros através de livros e artigos. Assim, a Estatı́stica
pode ser vista como ferramenta de organização e validação do conhecimento médico.
Nas áreas da saúde e biológica coletam-se dados de pessoas, de animais experimentais e de fenômenos
fı́sicos e quı́micos. Interessam aos pesquisadores dessas áreas dados sobre mortalidade infantil, eficiência de
medicamentos, incidência de doenças, causas de morte etc. Os dados referem-se a variáveis, classificadas
como qualitativas, ordinais e quantitativas.
O dado qualitativo está fortemente presente nas ciências da saúde. Caracterı́sticas de pessoas, raça,
doenças, etc, são frequentemente medidas como variáveis categóricas. No entanto, mercê de sua tradição
escolástica, as ciências da saúde ainda mostram preferência pelas medidas contı́nuas de alta precisão: medir
em miligramas, milı́metros etc. Engajado no conhecimento do biólogo, o cientista da saúde tende a isentar-se
de reflexão sobre a importância das estratégias de mensuração e análise providas por outras ciências, como
a estatı́stica.
1.3 Os Conceitos da Bioestatı́stica

Para que serve a Estatı́stica?
Imagine um médico e um farmacêutico querendo saber se um remédio em desenvolvimento é bom ou
ruim. Para testar o remédio, é preciso PLANEJAR muito bem o experimento, COLETAR corretamente
os dados, ANALISAR com muito cuidado e rigor os resultados para poder DIVULGAR de forma honesta
e com confiança no que está dizendo. Imagine o perigo de uma pesquisa mal feita num assunto tão importante!
Bom, para não colocar a vida de ninguém em risco, é preciso tomar muitos cuidados. Dentro do planejamento
saber claramente a respeito de algumas questões:
O remédio será testado em quem? Homens? Jovens? Mulheres? Obesos? Idosos? Crianças?...
Quantas pessoas serão necessárias para testar? Basta testar em uma ou duas pessoas? ou será melhor
testar em 10 pessoas? 30? 50? 2.000? como saber?
Há dinheiro para testar em tantas pessoas?
E se houver dois grupos de pessoas? Para o grupo de voluntário dá-se o remédio a ser testado; para
o outro grupo, dá-se um remédio ”de mentirinha”, chamado placebo, mas não se conta a verdade para
ninguém. Será que há diferença nos resultados de um grupo para outro? Mas se o remédio foi testado só
com um grupo de pessoas, em geral voluntários, como é que depois pode-se afirmar que este remédio vai ser
bom para todo mundo? É certeza absoluta?
A estatı́stica pode ser utilizada simplesmente para descrever conjuntos de dados, mostrando sua distri-
buição, média, dispersões, etc. Mas, pode ir além, pode estar presente nas diversas etapas de uma pesquisa,
desde o seu planejamento, até na interpretação de seus resultados, podendo ainda, influenciar na condução
do processo da pesquisa.
Definição: Estatı́stica é um conjunto de conceitos e métodos cientı́ficos para a coleta, a organização, a
descrição, a análise e a interpretação de dados experimentais, que permitem conclusões válidas e tomadas
de decisões razoáveis.
Classificação: Usualmente, a estatı́stica é dividida em três grandes áreas que atuam em conjunto:
Planejamentos de Experimentos e Amostragem, Estatı́stica Descritiva e, Estatı́stica Inferencial.
Amostragem e Planejamento de Experimentos: É a parte que tem por objetivo planejar a pesquisa e se
preocupa com o mecanismo da coleta de dados.
Estatı́stica Descritiva: É a parte que tem por objetivo organizar, apresentar e sintetizar dados observados
de determinada população, sem pretenções de tirar conclusões de caráter extensivo.
Estatı́stica Inferencial ou Indutiva: É a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi
retirada. A estatı́stica inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades.
É, também definida como um conjunto de métodos para a tomada de decisões.
Figura 1.1: Processo Cientı́fico na Análise Estatı́stica.

A Estatı́stica está presente em diversas áreas e em diversas abordagens. Podemos citar alguns exemplos
de suas aplicações:
1. Eleições: Anúncio prévio, em termos percentuais, de que o candidato A é o provável vencedor. (A
previsão pode ser feita após a contagem de 2% dos votos);
2. Marketing: Ajudar a decidir que tipo de modelo de carro deve ser lançado no mercado; ou perfume,
bolacha, sorvete, roupas, etc. Onde deve ser lançado; Avaliação de campanhas publicitárias, etc;
3. Indústria: Teste de lâmpadas ”flash” para máquinas fotográficas. O fabricante deve saber com ante-
cedência se o lote fabricado pode ser colocado no mercado ou não (Ele pode estar sujeito a riscos !
O Recall é um exemplo, onde ocorre a retirada ou troca de produtos devido a uma falha em algum
estágio de fabricação não detectado pelo controle de qualidade);
4. Meteorologia: Informa que a “chance” de chuva para hoje é de 30% (utilização de métodos estatı́sticos
de previsão);
5. Economia: Decisão na compra ou venda de ações – “Risco”; Desenvolver um produto bancário que dê
mais lucro para o banco; Prever a arrecadação de impostos municipais, etc;
6. Instituições bancárias/crédito: Análise de crédito; Desenvolvimento de modelos matemáticos para
seguro de Vida e/ou de automóveis; Mineração de dados e busca de potenciais clientes, etc;
7. IBGE/ı́ndices: Censo; Taxa de desemprego; Inflação; Custo de vida; Valor do salário mı́nimo, cesta
básica, ı́ndices de preços-INPC; Taxa de mortalidade/Natalidade; Índices de analfabetismo, desenvol-
vimento de modelos matemáticos para prever se uma população vai aumentar ou diminuir; fornecer
informações que ajudam no planejamento urbano;
8. Farmácia/Medicina/saúde pública: Analisar a entrada de um novo medicamento, verificando a sua
eficácia; Ajudando a estabelecer nı́veis e padrões para testes clı́nicos; planejar e realizar experimentos
com grupos de controle, para avaliação de tratamentos; desenvolvimento de estudos sobre a distribuição
e incidência de doenças; Analisar o comportamento de epidemias, doenças, cáries, seus tratamentos
e controles, desnutrição; Estabelecer padrões/curvas que servirão como parâmetros de comparação
(idade vs altura, por exemplo);
9. Pesquisas biológicas: Estudo sobre hábitos migratórios de certo animal; Estimação do tamanho popu-
lacional de certas espécies;
10. Experimentação agrı́cola: Estudos de uma nova variedade de semente (modificação genética) ou de
fertilizantes;
11. Telecomunicações: A utilização da Internet gera informações preciosas de clientes; Controle de tráfego
telefônico, chamadas e consumo, forçam a utilização de modelos estatı́sticos complexos; Analisar de-
sempenho de diversos programas de televisão, rádio, jornais, revistas, etc;
12. Esportes: Comparar o aproveitamento dos atletas, acompanhar o desempenho progressivo, etc;
13. Artes: Analisar estilos literários, de pintura, escultura; Atribuição de obra ao autor; Lexologia, etc;
14. Experimentação zootécnica: Estudo do desenvolvimento de um animal e análise de fatores que in-
fluenciam neste desenvolvimento tais como, alimentação, cativeiro e outros; Melhoramento genético;
Pesquisas com vacinas animais entre outros;
15. Universidades e Instituições de Pesquisas: O docente/pesquisador desenvolve novas metodologias de
análise estatı́stica para mais variados problemas práticos e teóricos; Assessoria em pesquisas de outras
áreas, dando suporte tecnocientı́fico para tomada de decisões dentro da variabilidade instrı́nseca de
cada problema auxiliando desde o planejamento até a publicação de resultados.
A revista SUPER INTERESSANTE, da Editora Abril, trouxe na edição 271 de novembro de 2009
(pg. 84) a reportagem 6 razões para Acreditar que Estatı́stica é a Profissão do Futuro,
classificando-a como a ”profissão dos sonhos”, com base na declaração do economista Chefe da
Google, Dr. Hal Varian, de que a estatı́stica será a profissão de destaque dos próximos 10
anos.
A amostragem é naturalmente usada na vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, pode-se provar (observar) uma pequena porção deste alimento. Desta forma, está
se fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito
de avaliar (inferir) sobre a qualidade de tempero de todo o alimento.
Nas pesquisas cientı́ficas em que se quer conhecer algumas caracterı́sticas de uma população, também é
muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra,
obter valores aproximados, ou estimativas, para as caracterı́sticas populacionais de interesse. Este tipo de
pesquisa é usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob
uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar
caracterı́sticas de toda a população.
A população pode ser formada por pessoas da famı́lia, indivı́duos de uma certa espécie, estabelecimentos
industriais, ou qualquer outro tipo de elementos, cujas variáveis que se pretende estudar sejam passı́veis de
serem mensuradas.
Os elementos de uma população diferem entre si com respeito a fatores tais como: sexo, idade, medidas
fı́sicas, cor, susceptibilidade a doença, agressividade, etc. Desta forma o padrão de comportamento no qual
o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por estas
razões, muitos trabalhos nas ciências em geral tendem a ser de natureza comparativa, procurando lidar com
as variações inerentes.
População
É qualquer conjunto de elementos, tendo pelo menos uma variável em comum (Pode ser finita ou infinita).
Censo
Pesquisas utilizando todos os elementos da população.
Obs. Desvantagem quando a população é muito grande Ex.: A população brasileira estimada em 2011:
196.655.014 (Fonte: IBGE - http://www.ibge.gov.br/paisesat).
Amostra
É qualquer subconjunto da população. Pesquisas utilizando amostras da população denominam-se pes-
quisas por amostragem.
Parâmetros
São certas caracterı́sticas populacionais especı́ficas que se deseja descrever.
Estimativas dos Parâmetros ou Estatı́stica
São os valores calculados a partir dos dados da amostra, com o objetivo de avaliar parâmetros desconhe-
cidos, por exemplo, média amostral.
Unidade de Amostragem
É a unidade a ser selecionada para se chegar aos elementos da população. Pode ser os próprios elementos
da população, ou, outras unidades fáceis de serem selecionadas e que, de alguma forma, estejam associadas
aos elementos da população.
Variáveis
São as caracterı́sticas medidas. As variáveis apresentam variabilidade dentro da população. Podem ser
qualitativas ou quantitativas.
Variáveis Qualitativas
Quando seus valores forem expressos por atributos (não-numéricos).
• Nominal quando tem nome (ex.: Cor dos olhos, sexo, raça, consumo de álcool (sim, não), gostar de
estudar ... etc).
• Ordinal quando tem ordem (ex.: classe social, grau de instrução, consumo de álcool (pouco, médio,
muito) ... etc).
Variáveis Quantitativas
Quando seus valores podem ser descritos numericamente.
• Discreta quando seus valores resultam de contagem (ex.: número de filhos, número de reprovações,
número de copos de álcool consumidos... etc).
• Contı́nua quando seus valores resultam de medições e podem assumir qualquer valor em um intervalo
da reta (ex.: estatura, nota na prova, imc, quantidade de álcool consumido ... etc)
Exemplo 1.1. Com o objetivo de levantar conhecimento sobre algumas caracterı́sticas de homens com
doenças cardı́acas de uma clı́nica especializada de Maringá, no Paraná, decidiu-se pesquisar os pacientes
com idade entre 40 e 70 anos. As caracterı́sticas de interesse eram:
1 – Nı́vel de instrução;
2 – Peso;
3 – Altura;
4 – Idade;
5 – Tabagismo;
6 – Atividade fı́sica;
7 – Taxa de glicose;
8 – Taxa de colesterol sérico;
9 – Pressão sanguı́nea diastólica/sistólica;
10 – Uso de medicamentos de controle.
Capı́tulo 2
Experimentação Biométrica
2.1 Introdução
Na medicina como em outros campos da ciência aplicada, o efeito geral da estatı́stica é tornar um
observador mais crı́tico e mais consciente quando, por falta de informação segura, ele tem de agir com base
em impressões ou opinião. Esta é a atitude cientı́fica, e o melhor modo de começar a adquirı́-la é procurar
evidências, e “provar”. Alguns princı́pios dessa procura de evidências serão estudadas neste capı́tulo.
2.2 O Raciocı́nio Indutivo da Biometria

Quando realizamos um experimento, a observação resultante é vista não como um resultado a êsmo e
irreprodutı́vel, mas como um resultado que poderia vir a ser obtido outras vezes, sempre que o experimento
fosse repetido nas mesmas condições. De fato, a generalização é feita sob a hipótese de que o resultado
obtido é tı́pico de uma classe de experimentos similares e, se conseguı́ssemos repetir, exatemente, um experi-
mento, uma única observação constitui-se-ia em base suficiente para fazermos afirmações gerais. Na prática,
obviamente, nunca podemos garantir que dois experimentos sejam exatamente iguais em cada minúcia de
suas circunstâncias, de tal sorte que nunca podemos garantir resultados identicamente reprodutı́veis. As
observações vão, de fato, variar em maior ou menor grau - aquilo que chamamos de erro experimental estará
presente - e, em lugar de um único resultado que se repete exatamente, teremos numerosos resultados que
variam entre si, de acordo com o tamanho do erro experimental. As nossas generalizações não podem ser
absolutamente precisas: devem levar em consideração o erro experimental e conter, em si, um elemento
de incerteza. Essa incerteza é caracterı́stica do raciocı́nio indutivo, e o grande problema no raciocı́nio do
particular ao geral é levar em devida conta essa incerteza.
Em Biologia, o problema da incerteza é muito sério, pois organismos vivos e suas partes são coisas
altamente variáveis. Eles estão influenciados por uma riqueza de fatores - genéticos, ambientais e de de-
senvolvimento - de tal modo que nenhuma situação do sistema pode ser reproduzida exatamente; em geral
elas não podem ser reproduzidas nem com muita aproximação. Poucas (se é que algumas) circunstâncias
de um experimento podem ser supostas triviais em seus efeitos sobre os resultados e raramente consegui-
mos identificar um ou dois fatores cujos controles reduziriam o erro experimental a proporções desprezı́veis.
Efetivamente, com muita freqüência o nosso problema é tentar distinguir um efeito que seja pouco maior
do que o de outros fatores que provocam a variação do sistema; devemos então enfrentar o problema: Qual
deve ser a fidedignidade da mensuração? Ou mesmo: Será o efeito observado atribuı́vel ao fator em que
estamos interessados, ou será conseqüência de alguma outra causa de variação que não pudemos reconhecer
e certamente não pudemos controlar?
2.3 Delineamentos Experimentais

Muitos trabalhos em pesquisas médicas são acometidos de vários erros devido ao procedimento na coleta
e no tratamento de dados. Um dos fenômenos mais comuns é a ocorrência de diferenças entre homens e
mulheres, entre crianças e adultos, entre as estaturas, pesos, cor dos olhos e comportamento de pessoas
7
2.3 Delineamentos Experimentais ROSSI, R. M. 8
da mesma raça, sexo e idade, entre diferentes amostras da mesma substância quı́mica “pura”. Todas essa
diferenças são coletivamente chamadas variação e a estatı́stica pode ser descrita como ciência de tratar a
variação.
Os seres humanos são tão infinitamente variáveis interna quanto o são externamente, mas algumas
matérias básicas do curso médico, como a Anatomia, parecem não reconhecer tal fato, deixando de des-
tacar esse profundo sentido da variação humana. A pseudoprecisão anatômica, criando um conceito artificial
do corpo humano no inı́cio da carreira do estudante, parece que largamente partilham essa responsabilidade;
e mesmo se todos os professores enfatizassem a importância da variação, não iria ajudar muito, a não ser
que o estudante adquirisse prática em enfrentar problemas que surgem da variação - especialmente, prática
na procura de evidências e uma atitude crı́tica em face dos assuntos que lê, ouve ou discute.
2.3.1 Etapa de um levantamento estatı́stico

A. Planejamento experimental. Consiste no planejamento da pesquisa que será realizada:
Mainland, D. (1952) em Elementary medical statistics - The principles of quantitative medicine, sugere
nove questões que constituem um roteiro valioso para desenvolvimento dessa atitude:
1. Quem?...(relativa ao pesquisador)
2. Para quê?...(relativa ao objetivo da pesquisa)
3. O quê?...(refere-se a pessoas, coisas ou fatos estudados)
4. Onde?...(refere-se ao local e ambiente)

5. Quando?...(refere-se ao tempo)
6. Como?...(relativa aos métodos)

7. Quanto?...(relativa às medidas)
8. Quantos?...(relativa à enumeração)
9. Por quê?...(referente à interpretação causal)
Tomadas as devidas precauções, alguns aspectos estatı́sticos deverão ser analisados e o tipo de estudo
adequado deverá ser abordado.
Exemplo 2.1. Considere a seguinte hipótese: ”Associação entre incidência de luz solar e câncer de
mama”. Comparações regionais, na antiga União soviética, mostraram correlação negativa entre incidência
de luz solar e de câncer do seio: em locais de baixa luminosidade solar, foi encontrada alta incidência deste
tipo de neoplasia, e vice-versa. Em muitos paı́ses, semelhante associação também foi detectada. A evidência
sugere, segundo os autores, que a vitamina D possa ter papel de relevo na redução do risco de câncer de
mama, e estudos adicionais devem ser feitos para esclarecer a matéria. (GOHAM et al, 1990).
Os principais delineamentos experimentais para a realização destas pesquisas serão:
1. Quem? GOHAM et al.

2. Para quê? Verificar a associação entre a taxa de incidência de luz solar sobre indivı́duos em diferentes
lugares com luminosidades desiguais e a incidência de câncer de mama.
3. O quê? Número de mulheres com câncer de mama e incidência de luminosidade no local destas onde
habitam estas mulheres. Pelo fato de quanto maior a luminosidade maior a sı́ntese de vitamina D pela
pele, há evidências que a vitamina D possa ter elevo na redução do risco de câncer de mama.
4. Onde? Regiões diferentes que apresentam também diferentes incidências de luminosidade na antiga
União Soviética.
5. Quando? 1990.
6. Como? (Metodologia): considerando que o câncer de mama é o que mais mata nas mulheres, porém
em relação à população de mulheres é uma doença pouco prevalente, como, por exemplo, Transtorno
Pré-Menstrual. Assim, um estudo de caso-controle em mulheres com câncer de mama já diagnosticado
exposto à luminosidade solar por um perı́odo de tempo predeterminado devendo ser razoavelmente
grande, mas não saberia dizer quanto sem revisão bibliográfica. Na entrevista retrospectiva perguntaria
as mulheres há quanto tempo residiam naquela região, e se tivessem dentro do tempo predeterminado
entrariam no estudo. Faria também um grupo controle de mulheres daquela região para comparação dos
dados. Repetindo este mesmo estudo em mulheres de diferentes regiões com diferentes luminosidades, e
comparando-se as taxas de fatores de riscos, poder-se-ia chegar a conclusão de associação e em seguida
calcular o Odds Ratio, isto é, a razão de chances.
7. Quanto? As medidas seriam o número de mulheres diagnosticadas com câncer de mama comparadas
a um número semelhantes de mulheres sem o câncer (controles) separadas após serem examinadas por
médicos. Já a luminosidade colheria as informações com as centrais de meteriológicas locais ou algum
centro de referência deste assunto para o estudo.
8. Quantos? A amostra tentaria ser a maior possı́vel para melhorar a confiabilidade dos resultados, já que
a doença é pouco prevalente. Procuraria os centros de saúdes locais (hospitais, clı́nicas especializadas,
etc) das respectivas regiões a serem estudadas. Se o número de centros for muito grande e for muito
difı́cil abordá-los, sortearia os centros para amostragem.
9. Por quê? Alguns cuidados têm que serem relevados como o vı́cio da seleção, de informação e con-
fundimento. Por exemplo, a ingestão de alimentos ricos em precursores e da própria vitamina D bem
como uso de suplementos alimentares com vitamina D (pı́lulas), poderia influenciar os resultados dos
estudos.
Observação: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa.
Avaliação de informações existentes. Inicialmente, deve-se realizar um levantamento bibliográfico sobre
o assunto para obter subsı́dios que podem representar valiosa colaboração para o estudo e, também, serem
aproveitados nas discussões posteriores.
B. Formulação de hipóteses. Com exceção das pesquisas meramente descritivas, todas as pesquisas
estatı́sticas comportam a formulação de hipóteses. Com base nos dados observados, a hipótese será
rejeitada ou não.
C. Verificação das hipóteses. A verificação das hipóteses será realizada no decorrer da pesquisa.
D. Delineamento da pesquisa. Compreende o estudo (planejamento) detalhado da coleta de dados, da
realização do trabalho e da análise dos dados.
Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por
outros indivı́duos.
Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observação direta, o
questionário ou interrogatório e a entrevista.
Observação: é a observação direta dos fenômenos em laboratórios ou na natureza.
Questionário: é uma seqüência de perguntas previamente preparadas. O questionário é aplicado por
meio de entrevista ou remetido pelo correio. Os valores observados podem ser complementados por ob-
servação.
Execução da pesquisa. Coleta dos dados e realização da análise estatı́stica.
Análise e apresentação dos resultados. Os dados coletados devem ser apresentados na forma de:
gráficos e/ou de tabelas. A análise dos dados deve ser realizada pelo pesquisador, com a ajuda de um
estatı́stico, aplicando os recursos estatı́sticos necessários para refutar ou não as hipóteses previamente for-
muladas.
Exemplo 2.2. Objetivo geral: conhecer o perfil dos homens portadores de doenças cardı́acas em Honolulu,
Havaı́. Para dar seqüência a esta pesquisa, é preciso especificar melhor o que se quer conhecer da população
de portadores de doenças cardı́acas, ou seja, os objetivos especı́ficos. Exemplos de alguns desses objetivos.
(a) conhecer a distribuição do grau de instrução dos portadores de doenças cardı́acas.

(b) Conhecer a idade e o peso médio dos portadores de doenças cardı́acas.
(c) Conhecer os hábitos dos portadores de doenças cardı́acas.

(d) Avaliar a condição de saúde dos portadores de doenças cardı́acas.
Exemplo 2.3. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das in-
formações contidas em uma amostra dos prontuários dos pacientes. Dados observados: resultados de diversos
atributos e medidas relativas aos pacientes selecionados para participarem da amostra. Esquematicamente:
População: Todos os
portadores de
doenças cardíacas de
Honolulu.
Levantamento Plano de
de dados. amostragem.
Amostra:
Parte dos
portadores
de doenças
cardíacas de
Honolulu.
Dados
observados.
Figura 2.1: Esquema 1.
Exemplo 2.4. Objetivo geral: Comparar a eficiência de dois métodos para detectar o bacilo causador de
tuberculose. Em outras palavras, quer-se avaliar se os meios utilizados são equivalentes ou se um é mais
eficiente que o outro. Delineamento da pesquisa: são formados dois grupos de pacientes com tuberculose e
amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). Dados observados: a detecção
ou não do bacilo foi registrada para cada amostra, resultando em dois conjuntos, relativos a cada método.
Esquematicamente:
Meio A. Meio B.
Grupo 1 de Grupo 1 de
pacientes. pacientes.
Amostra 1 de Amostra 2 de
respostas respostas
Sim ou Não. Sim ou Não.
Figura 2.2: Esquema 2.
Este é um delineamento de pesquisa experimental, onde o pesquisador exerce controle sobre o método
utilizado.
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 11
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos

O objetivo central da pesquisa etiológica (parte da medicina que trata das causas das doenças) é deter-
minar se o fato de uma pessoa contrair uma dada doença está associado com um dado fator, o qual pode ser,
por exemplo uma caracterı́stica pessoal, alguma especificidade do ambiente onde viveu ou uma experiência
pela qual passou. Discutiremos maneiras de se organizar um estudo etiológico, métodos estatı́sticos para se
determinar quais fatores estão associados com o contrair da doença e meios de se quantificar esta associação.
A pesquisa etiológica é baseada em dados coletados em pacientes convenientemente escolhidos. O pesqui-
sador não controla quem será exposto ou não ao fator em questão, mas tem liberdade de determinar quem
entrará ou não no estudo. Para que os resultados tenham validade, a pesquisa tem de ser planejada segundo
modelos bem definidos. Os principais tipos de planejamento para estudos etiológicos receberam os nomes
de estudos tipo Caso-Controle, estudos tipo Coorte, Ensaios Clı́nicos Aleatorizados, Estudos Descritivos e
Seccionais ou Tranversais.
2.4.1 Estudo de Caso-Controle

Um estudo tipo caso-controle pode ser definido como um estudo no qual a determinação da associação da
doença com um fator é baseada na observação de freqüências muito altas ou muito pequenas do fator entre
as pessoas doentes. Para isto um grupo de indivı́duos afetados pela doença em questão é comparado com
um grupo controle de indivı́duos não afetados. Como as informações são obtidas de maneira retrospectiva,
freqüentemente, este tipo de planejamento recebe o nome de Estudo Retrospectivo.
Um estudo retrospectivo começa com um grupo de indivı́duos, a serem chamados de ”casos”, que tenham
contraı́dos a doença em questão. O pesquisador escolhe como padrão de comparação, um grupo ”controle”
constituı́do de pacientes que não estão sofrendo da doença. A seguir obtém a história clı́nica de todos os
pacientes selecionados a fim de averiguar a presença ou ausência do fator de risco que está sendo estudado. A
questão é saber se o fator de risco está presente mais freqüentemente ou em nı́vel mais elevados entre os casos
do que entre os controles. Se a evidência for suficiente o pesquisador concluirá que existe uma associação
entre o fator de risco e a doença.
Idealmente, os casos devem ser todos os que ocorreram durante um perı́odo de tempo em uma população
finita. Os controles devem ser pessoas comparáveis aos casos, mas sem a doença, ou seja, pessoas que, se
desenvolvessem a doença, seriam escolhidas como casos.
Os grupos de casos e de controles podem ser formados de forma emparelhada ou de forma independente.
No primeiro esquema, para cada caso ou mais controles semelhantes são escolhidos. Já na formação de grupos
de forma independente, os controles não escolhidos de forma associada a um caso especı́fico. Preocupa-se
apenas em garantir que o grupo de casos seja, na sua totalidade, parecido com o grupo de controles.
O caso particular do emparelhamento em que há apenas um controle para cada caso é denominado
pareamento.
Os estudos de caso-controle são uma forma de pesquisa simples e eficiente, por isso muito utilizada.
Através dela, já se verificaram ou se confirmaram associações entre fatores de risco e vários tipos de câncer.
Não há dificuldades éticas para sua implementação e, portanto, os dados usados são os de seres humanos. Isto
livra o pesquisador de difı́ceis generalizações inerentes aos estudos desenvolvidos em animais. O tempo gasto
e os custos associados são relativamente pequenos, já que, normalmente, são utilizados dados preexistentes.
São particularmente adequados ao estudo de doenças raras, porque o pesquisador começa com um grupo de
pessoas que comprovadamente têm a doença.
Sua grande limitação é a suscetibilidade aos vı́cios de informação e de seleção. Outra é que obtemos
apenas informação sobre associação entre fatores e doença e não sobre causas da doença. O resultado de
tais estudos deve ser considerado um elo a mais em uma cadeia de evidências que levará ao veredito de
causalidade.
Descreveremos abaixo alguns tipos de tendenciosidade aos quais os estudos caso-controle estão sujeitos. O
leitor deve, antes de se envolver no planejamento de um tal estudo, conhecer mais profundamente a literatura
médica da área. Esta experiência é fundamental pois lhe dará conhecimento das formas especı́ficas pelas
quais estas tendenciosidades aparecem.
Embora não existindo associação entre o fator e a doença em questão, existem várias maneiras pelas quais
uma associação pode aparecer em um estudo caso-controle. Uma delas é chamada Vı́cio da Seleção. Ocorre
quando os casos ou os controles são incluı́dos no estudo por causa de alguma caracterı́stica que possuam e
que está relacionada com o fator de risco sendo considerado. Chamamos de Vı́cio de Informação àquele
introduzido pelos pesquisadores que, já desconfiando da associação a ser constatada, são mais cuidadosos ao
levantar a história clı́nica dos casos que dos controles. Dizemos que houve Vı́cio de Confundimento se a
associação observada é produto não do fator considerado mas de outros fatores não controlados no estudo.
O grupo controle é usualmente constituı́do de pacientes de hospitais, onde estão sendo tratados os pa-
cientes do grupo de casos. Deve-se escolher para o grupo controle pacientes de uma grande variedade de
doenças. Isto protege os resultados de uma forma de vı́cio da seleção; o estudo não detecta uma associação
porque a doença dos pacientes-controle e a doença sendo estudada estão ambas associadas com o fator de
risco. Quando existe facilidade na coleta de dados o número de pacientes do grupo controle pode ser até 4
vezes maior que o número de pacientes do grupo de casos. O método de seleção dos indivı́duos do grupo
controle é quase que inteiramente dependente das circunstâncias especı́ficas do estudo. Aqui também é fun-
damental o conhecimento da literatura médica da área, já que é usual apresentar-se uma descrição detalhada
dos controles utilizados.
Exemplo 2.5. Fatores de risco em câncer de mama.

Gomes (1992), em tese de doutorado na Faculdade de Medicina da UFMG, realizou estudo caso-controle
com o objetivo de avaliar a influência de fatores de risco no câncer de mama, utilizando dados de nosso meio.
Como “casos” foram escolhidas pacientes portadoras de câncer de mama registradas no Hospital das Clı́nicas
da UFMG, que satisfizeram os seguintes critérios de inclusão: idade na época do diagnóstico entre 25 e 75
anos, diagnóstico feito entre 1978-1987 e confirmado por exame anátomo-patológico, tumor originário do
tecido epitelial e ter sido submetida a algum tipo de cirurgia na mama.
Como “controles” foram escolhidas pacientes com idade igual à do “caso” (mais ou menos dois anos),
data de admissão ao hospital igual à data de confirmação do diagnóstico do caso (mais ou menos seis
meses) e exame clı́nico da mama sem indicação de patologias mamárias. De acordo com esses critérios,
foram selecionados, através de emparelhamento, dois controles para cada caso. O primeiro foi selecionado
no ambulatório de ginecologia e o segundo no registro geral do hospital. A análise estatı́stica, entre várias
outras conclusões, mostrou que a presença na paciente de história familiar (retrospectivamente) de câncer
de mama aumenta o risco desta patologia em 8,84 vezes.
a
EXPOSTOS
DOENTES
(GRUPOS
DE
b CASOS)
NÃO-EXPOSTOS
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
AMOSTRA
ANÁLISE DE
DE CASOS
DADOS POPULAÇÃO
DE CASOS
E DE AMOSTRA
CONTROLES DE
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
c CONTROLES
EXPOSTOS
NÃO-DOENTES
(GRUPO
DE
CONTROLES)
d NÃO-EXPOSTOS
MENSURAÇÃO FORMAÇÃO DOS GRUPOS

a, b, c, d : os quatro possíveis resultados DA EXPOSIÇÃO POR OBSERVAÇÃO
(note o caráter retrospectivo) DA EXPOSIÇÃO
Figura 2.3: Esquema de Estudo Caso-Controle.

Vantagens do Estudo de Caso-Controle
• Baixo custo relativo;
• Alto potencial analı́tico;

• Adequado para estudar doenças raras.
Desvantagens do Estudo de Caso-Controle
• Incapaz de estimar risco (reduzido poder descritivo);

• Vulnerável a inúmeros biases (seleção, etc.)
• Complexidade analı́tica.
2.4.2 Estudo de Coorte

Em contraste com um estudo retrospectivo, um estudo prospectivo avança no tempo e coloca ênfase no
fator de risco. O Estudo de Coorte é uma forma de pesquisa que visa verificar se indivı́duos, selecionados
porque foram expostos ao fator de risco, desenvolvem a doença em questão, em maior ou menor proporção
do que um grupo de indivı́duos, comparáveis, mas não expostos ao fator de risco.
Identificam-se um grupo exposto ao fator e o grupo controle, constituı́do de pessoas que não foram
expostas a ele. Os dois grupos são acompanhados por um perı́odo de tempo e as taxas de incidência da
doença calculadas. Se essas taxas são significativamente diferentes nos dois grupos, o pesquisador conclui
que há associação significativa entre a doença e o fator.
Os epidemiologistas preferem o termo “Estudo Tipo Coorte” para este tipo de estudo, entretanto “Estudo
Prospectivo” é a nomenclatura mais utilizada.
Os Estudos de Coorte possuem várias vantagens. O pesquisador tem a possibilidade de usar critérios
uniformes, tanto na identificação da presença ou não do fator de risco ao inı́cio do estudo, quanto na veri-
ficação da ocorrência da doença nos vários exames de acompanhamento. Nos dois grupos a comparabilidade
pode ser verificada no inı́cio do estudo e identificadas as variáveis para as quais são necessários ajustamentos
na análise dos dados.
Em um estudo prospectivo, o pesquisador tem muito mais liberdade sobre o que medir e como medir, já
que não se restringirá ao uso de dados já coletados. Uma outra vantagem, que só poderá ser completamente
apreciada ao se estudar a metodologia de análise de dados, é que os estudos de coorte nos permitem obter
diretamente uma estimativa da magnitude do risco relativo. Isto significa que é possı́vel quantificar o risco
de desenvolver a doença comparando-se o grupo de expostos ao fator de risco com o grupo de não expostos.
Estudos de Coorte são grandes, longos e normalmente caros. Quanto mais rara a doença em questão,
maior o número de pacientes que precisam ser examinados, portanto não indicado para doenças raras.
Embora, do ponto de vista teórico, os Estudos de Coorte sejam melhores que os Estudos Caso-Controle,
estes últimos são mais comuns.
Seleção das Coortes

Grupos de pessoas são selecionadas para o Estudo de Coorte por uma variedade de razões. Apresentamos
a seguir dois exemplos:
Exemplo 2.6. Fumo e câncer de pulmão.
O clássico estudo de Doll & Hill (1964) sobre associação entre câncer no pulmão e fumo ilustra a escolha
da coorte pelo fato de o grupo possuir caracterı́sticas que facilitam a obtenção dos dados sobre a exposição
ao fator e o seguimento dos pacientes. Foram acompanhados médicos da Inglaterra desde o fim dos anos
20, um grupo fácil de contactar e no qual todas as mortes são rotineiramente bem documentadas. Estas
pesquisas iniciaram-se devido ao grande aumento da mortalidade causada por este câncer.
No primeiro estudo, publicado em 1950, compararam-se dois grupos de pacientes. O primeiro, constituı́do
de todos os casos de câncer de pulmão de um conjunto de hospitais londrinos. Assistentes sociais, especi-
almente treinadas para o estudo, entrevistaram todos os pacientes internados com diagnóstico de câncer de
pulmão, levantando sua história clı́nica e seus hábitos tabagistas. O segundo grupo, chamado de controle,
foi constituı́do por pacientes dos mesmos hospitais, sem diagnóstico de câncer, na mesma faixa etária, do
mesmo sexo e da mesma região de residência que os casos anteriores. A Tabela 2.1 mostra os resultados
obtidos. A associação é clara e forte.
Tabela 2.1: Número de fumantes e não fumantes entre pacientes do sexo masculino com diagnóstico de
câncer pulmonar e controles.
Grupo Fumantes Não-Fumantes Total
Câncer pulmonar 647 2 650
Controle 622 27 649
Total 1269 29 1299
A forma de organização deste estudo é chamada de Estudo Caso-Controle. À época, esta metodologia
era muito criticada, pois, com facilidade, podia produzir associações espúrias. Por isso, a evidência, embora
clara e forte, não foi convincente o suficiente.
Assim, os mesmos autores iniciaram um segundo estudo, cuja caracterı́stica básica é o fato de que o
acompanhamento dos pacientes foi prospectivo. Este tipo de planejamento é chamado de Estudo de Coorte.
Em outubro de 1951, os pesquisadores enviaram um questionário simples a todos os médicos da Inglaterra,
aproximadamente 60.000 indivı́duos. O questionário perguntava se o respondente já havia fumado ou não.
Em caso afirmativo, pedia informações sobre o que e quanto. Mais de dois terços dos médicos responderam
com detalhe suficiente para que seus dados pudessem ser incluı́dos no estudo.
As respostas possibilitaram aos pesquisadores classificar cada respondente como fumante ou não fumante.
A definição de não-fumante usada foi: um não fumante é uma pessoa que fumou até no máximo um cigarro
diário, em média, por um perı́odo inferior a um ano.
Através de complexo sistema de acompanhamento, observaram-se nos primeiros 10 anos, 136 mortes
associadas ao câncer pulmonar entre os médicos incluı́dos no estudo. Destas, apenas 3 eram de não-fumantes.
Para equalizar os perı́odos de acompanhamento nos vários grupos, trabalhou-se com a taxa de incidência
por 1.000 pessoas-ano de exposição. Os valores desta taxa estão na Tabela 2.2. O risco de morte por câncer
pulmonar das pessoas que fumam mais de 25 cigarros diários é quase 32 vezes maior do que o mesmo risco
para quem não fuma.
Tabela 2.2: Taxa de mortalidade por 1.000 pessoas-ano devida a câncer pulmonar (número de mortes entre
parênteses) para não fumantes e fumantes.
Não-Fumantes Cigarros diários (Fumantes)
1-14 5-24 25+
0,07(3)
0,57(22) 1,39(54) 2,27(57)
Estes dois planejamentos, estudo Caso-Controle e Estudo de Coorte, são as formas usuais de organização
da pesquisa etiológica. Muitos outros estudos como os descritos anteriormente foram feitos em populações
variadas para se verificar o possı́vel papel do fumo. Em todos, a evidência foi clara. Hoje, o papel de agente
causador do câncer de pulmão é amplamente reconhecido e justifica a militância cada vez mais organizada
contra o fumo.
Em muitos Estudos de Coorte os grupos de comparação são obtidos após o inı́cio do estudo, de acordo
com o nı́vel de exposição ao fator. As coortes do estudo de Framingham sobre doenças coranárias (Kannel
et al., 1972), foram construı́das dividindo-se o grupo acompanhado de acordo com hábitos de fumo, nı́veis
de colesterol, etc. Nestes casos não há necessidade de um grupo externo de comparação.
Exemplo 2.7. Personalidade e desenvolvimento de doença coronariana.

Um Estudo de Coorte com o objetivo de avaliar o possı́vel efeito da personalidade no risco de desenvol-
vimento de doença coronariana foi conduzido entre 3.154 trabalhadores do sexo masculino com idade de 30
a 59 anos (Brand et al., 1976). Os indivı́duos entraram no estudo entre 1960-61 e foram acompanhados por
um perı́odo médio de 8 anos e meio. Através de entrevista no inı́cio do estudo, foram classificados em dois
tipos de personalidade, A e B, sendo os primeiros mais agressivos, competitivos e ansiosos.
Os resultados da Tabela 2.3 indicam que nas duas faixas etárias consideradas os percentuais de indivı́duos
do tipo A que desenvolveram doença coronariana são aproximadamente o dobro dos encontrados no outro
grupo.
Em outras situações, particularmente quando um grupo submetido a uma exposição pouco comum é
estudado, é importante comparar o resultado observado com aquele esperado, caso os indivı́duos não tivessem
sido submetidos ao fator de risco. Usa-se a experiência da população em geral, ao tempo em que a coorte é
formada, como padrão de comparação.
Tabela 2.3: Percentual de indivı́duos que desenvolveram doença coronariana segundo faixa etária e tipo de
personalidade.
Faixa etária Personalidade
A B
39-49 8,9 4,2
50-59 15,9 7,6
Finalmente, usa-se também como base de comparações outra coorte formada por pessoas não expostas,
parecidas nas caracterı́sticas demográficas com o grupo exposto. Por exemplo, considerando uma coorte
de radiologistas, Seltser e Sartwell (1965) usaram como padrão de comparação dados de oftalmologistas e
otorrinolaringologistas.
a
DOENTES
POPULAÇÃO
EXPOSTOS
ou
b
grupo-experimental NÃO-DOENTES
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS
c
DOENTES
NÃO-EXPOSTOS
ou
grupo-controle d
NÃO-DOENTES
FORMAÇÃO DOS GRUPOS
POR OBSERVAÇÃO MEDIÇÃO
DA EXPOSIÇÃO DOS EFEITOS
a, b, c, d : os quatro possíveis resultados
Figura 2.4: Esquema de Estudo Coorte.

Vantagens do Estudo de Coorte
• Produz medidas diretas de risco;
• Alto poder analı́tico;

• Facilidade de análise.
Desvantagens do Estudo de Coorte
• Estudos de Coorte são grandes, longos e normalmente caros. Quanto mais rara a doença em questão,
maior o número de pacientes que precisam ser examinados. Portanto este estudo é inadequado para
doenças de baixa frequência;
• Vulnerável a perdas (biases).
2.4.3 Ensaios Clı́nicos Aleatorizados

O Ensaio Clı́nico Aleatorizado é um experimento médico, realizado com o objetivo de verificar, entre dois
ou mais tratamentos, qual é o mais efetivo.
São usados quando é incerto o valor de uma nova terapia ou os méritos da terapia existente estão em
disputa. É a metodologia apropriada para a comparação de tratamentos.
Após um critério de admissão ter sido definido, os pacientes são, à medida que entram no experimento,
alocados de maneira aleatória ao grupo controle, que recebe a terapêutica padrão, ou ao grupo tratamento,
que recebe a terapêutica sendo testada. Todo esforço deve ser feito para oferecer os mesmos cuidados aos
dois grupos. Terminado o experimento, técnicas estatı́sticas são usadas para se decidir se há ou não diferença
na eficácia das terapias envolvidas.
Esta é uma forma experimental de pesquisa, isto é, o pesquisador interfere deliberadamente no curso
natural dos acontecimentos, em contraposição aos estudos observacionais, em que o pesquisador se restringe
à coleta de dados, sem alterar a dinâmica do processo em consideração. Por isto está sujeita a costrangimentos
éticos, disciplinados pela convenção de Helsinque.
O conhecimento pelo paciente ou pelo médico do tratamento a ser administrado pode influir na evolução
da doença, não através de fatores extrı́nsecos, mas diretamente pelo processo de auto-sugestão. É o efeito
placebo, que traz vı́cios ao estudo clı́nico.
A única maneira de eliminar o efeito placebo nos grupos comparados é realizar, sempre que possı́vel,
experimentos cegos, nos quais o paciente ou o médico não conhece o tratamento, ou duplo-cego, no qual
ambas as parte desconhecem o tratamento. Este ideal, entretanto, nem sempre é factı́vel.
Exemplo 2.8. Tamoxifeno e câncer de mama.
Muitos avanços no tratamento do câncer de mama têm sido estabelecidos através de estudos realizados
pelo National Surgical Adjuvant Breast and Bowel Project (NSABP). Em 1985, discutia-se a necessidade de
se submeter à quimioterapia ou hormonioterapia, pacientes de bom prognóstico, logo após a cirurgia. Em
particular, havia evidências de várias origens de que o tamoxifeno poderia melhorar ainda mais o prognóstico
dessas pacientes. Naquela época, o tamoxifeno já era usado largamente no tratamento de pacientes com
câncer de mama. Diante disto, o NSABP iniciou o protocolo B-14 para determinar a eficácia do tamoxifeno
em pacientes consideradas de bom prognóstico, isto é, aquelas com tumores com receptor de estrógeno
positivo (>10 fmol ), idade inferior a 70 anos, com câncer de mama operável e linfonodos axilares negativos
ao exame histológico. Foram criados dois grupos de pacientes através de aleatorização feita dentro de estratos
definidos por idade e tamanho do tumor na análise clı́nica, tipo de cirurgia e concentração de receptor de
estrógeno. Um grupo recebeu tamoxifeno (10 mg por dia, via oral, duas vezes ao dia) e o outro, placebo,
indistinguı́vel do tamoxifeno na aparência e gosto. Além disto, o ensaio foi organizado na forma duplo-cego.
Após acompanhamento das pacientes por um perı́odo de até 4 anos, constatou-se uma diferença signifi-
cativa em termos de tempo livre de doença em favor das pacientes que receberam o tamoxifeno. No grupo
tratamento, 83% estavam livres da doença aos quatro anos após a cirurgia, enquanto que no grupo placebo
esta porcentagem era de 73%. Este estudo, publicado por Fisher et al. (1989), contribuiu decisivamente para
a adoção do tamoxifeno como quimioterapia adjuvante logo após a cirurgia em pacientes de bom prognóstico.
a
EFEITO: PRESENTE
POPULAÇÃO
EXPOSTOS
À INTERVENÇÃO
ou b
grupo-experimental EFEITO: AUSENTE
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS
c
EFEITO: PRESENTE
NÃO-EXPOSTOS
À INTERVENÇÃO
ou
grupo-controle d
EFEITO: AUSENTE
FORMAÇÃO DOS GRUPOS
POR ALEATORIZAÇÃO E MEDIÇÃO
APLICAÇÃO DOS TRATAMENTOS DOS EFEITOS
a, b, c, d : os quatro possíveis resultados
Figura 2.5: Esquema de um Ensaio Clı́nico Aleatorizado.
2.4.4 Estudos Descritivos

As investigações de cunho descritivo, têm o objetivo de informar sobre a distribuição de um evento, na
população, em termos quantitativos.
Elas podem ser de incidência ou de prevalência. Nelas, não há formação de grupo-controle para a
comparação dos resultados, ao menos na forma como é feita nos estudos analı́ticos - daı́ serem considerados
estudos não-controlados.
Exemplos de temas de estudos descritivos
• A incidência de infecção chagásica em habitantes rurais;
• A prevalência da hepatite B entre os voluntários à doação de sangue;
• As caracterı́sticas demográficas e socioeconômicas dos pacientes que sofrem de artrite reumatóide ou

das pessoas que fumam;
• As principais causas de óbito da população residente em um dado municı́pio;

• O estado imunitário de pré-escolares, de um municı́pio, frente à poliomielite;
• Os padrões de crescimento e desenvolvimento de crianças normais ou daquelas acometidas por uma

determinada doença;
• A variação regional na utilização de serviços de saúde.

• A tendência do coeficiente de mortalidade por tuberculose, de uma cidade, nos últimos anos.
Estudo de Caso
Trata-se de observar um ou poucos indivı́duos com uma mesma doença ou evento e, a partir de descrição
dos respectivos casos, traçar um perfil das suas principais caracterı́sticas.
Muitas revistas cientı́ficas apresentam uma seção de ”relato” ou ”apresentação de casos”, para difundir
os resultados destes estudos.
O estudo de casos é empregado para enfocar grupos especı́ficos da população ou um particular aspecto
de interesse, não devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de
suplementação de informações, com maior riqueza de detalhes.
Vantagens do Estudo de Casos
• Em geral, o estudo de caso é relativamente fácil de ser realizado e de baixo custo.

• O relato pode restringir-se a uma simples descrição ou ir mais além, de modo a sugerir explicações
sobre elementos pouco conhecidos, tais como os fatores implicados na etiologia ou no curso de uma
doença, sob vigência ou não de terapêutica.
• Em clı́nica, é possı́vel acompanhar pacientes durante anos, e mesmo décadas, chegando-se a um quadro
repleto de detalhes sobre aspectos evolutivos de uma dada condição.
• O estudo de casos constitui-se em um verdadeiro inventário do que acontece genericamente, à luz da

observação de poucos indivı́duos.
• É um enfoque qualitativo e exploratório, embora muitas facetas possam ser quantificadas. Um aspecto
positivo, convém realçar, é a possibilidade de observação intensiva de cada caso.
Desvantagens do Estudo de Casos
• Os indivı́duos observados costumam ser altamente selecionados. Às vezes, a observação restringe-se a
situações incomuns de enfermos graves, outras vezes, aos casos de evolução atı́pica, de reação inusitada
ou de resultado terapêutico inesperado; muito raramente, abrange pacientes em todas as faces de
manifestação da doença.
• A falta de indivı́duos-controle, para comparar resultados, pode fazer com que simples coincidências
sejam difı́ceis de interpretar: por exemplo, em investigação de um surto de diarréia, se os casos beberam
água de um certo poço a evidência é ainda frágil para incriminar a água do poço na etiologia da doença.
Seria conveniente saber se os sadios também beberam ou não água do mesmo poço.
Em sı́ntese, apesar das vantagens referentes à facilidade de realização e baixo custo, duas limitações
principais estão presentes no estudo de casos:
• a falta de controle - eles serviriam para contornar problemas de aferição e comparação acima mencio-
nados;
• o número pequeno de indivı́duos incluı́dos para observação - o que aponta para a prudência na in-
terpretação dos resultados de estudos de casos, especialmente, na generalização, como ele tem sido
atualmente empregado na área clı́nica, é útil para levantar problemas, muitos dos quais são comple-
mentarmente investigados com o auxı́lio de outros métodos.
Seccionais ou Transversais
Investigações que produzem ”instantâneos” da situação de saúde de uma população ou comunidade,
com base na avaliação individual do estado de saúde de cada um dos membros do grupo, e daı́ produzindo
indicadores globais de saúde para o grupo investigado, são chamadas de estudos seccionais ou de corte-
transversal-seccional.
O Estudo Seccional também é conhecido como Estudo Transversal ou da Prevalência.
Vantagens do Estudo Seccional
• Simplicidade e baixo custo;

• Rapidez;
• Não há necessidade de seguimento das pessoas;

• Alto potencial descritivo (subsı́dio ao planejamento);
• Boa opção para descrever as caracterı́sticas dos eventos na população, para identificar casos na comu-
nidade e para detectar grupos de alto risco, aos quais pode ser oferecida atenção especial.
Desvantagens do Estudo Seccional
• Vulnerabilidade a biases ou vı́cios (especialmente de seleção);

POPULAÇÃO
AMOSTRA PARA
ESTUDO FORMAÇÃO DOS GRUPOS POR
OBSERVAÇÃO SIMULTÂNEA DE
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
EXPOSIÇÃO E DOENÇA
EXPOSTOS EXPOSTOS NÃO-EXPOSTOS NÃO-EXPOSTOS

E E E E
DOENTES NÃO-DOENTES DOENTES NÃO-DOENTES
a b c d
ANÁLISE DOS DADOS
Figura 2.6: Esquema de um Estudo Seccional.
• Baixo poder analı́tico (inadequado para testar hipóteses causais);

• Condições de baixa prevalência exigem amostra de grande
tamanho, logo têm dificuldades operacionais;
• Não determina risco absoluto (ou seja, a incidência);

• A associação entre exposição e doença, se detectada, refere-se à época de realização do estudo e pode
não ser a mesma da época de aparecimento da doença.
Capı́tulo 3
Estatı́stica Descritiva
3.1 Organização de Dados Estatı́sticos

3.1.1 Normas para a Apresentação Tabular de Dados
A representação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em linhas
e colunas, distribuı́das de modo ordenado, segundo algumas regras práticas adotadas pelos diversos sistemas
estatı́sticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de Estatı́stica.
Uma tabela estatı́stica compõe-se de elementos essenciais e elementos complementares.
1. Elementos essenciais
a. Tı́tulo:
É a indicação da natureza do fato estatı́stico observado, fazendo referência ao local e ao tempo
em que foi observado.
b. Cabeçalho:
São as indicações que especificam o conteúdo das colunas.
c. Coluna indicadora:
São as indicações que especificam o conteúdo das linhas.
2. Elementos complementares
a. Fonte
É a entidade responsável pelos dados contidos na tabela.
b. Nota
São informações que esclarecem critérios usados na confecção da tabela.
c. Chamada
É a informação de natureza especı́fica, que serve para complementar determinado dado usado na
confecção da tabela.
20
3.2 Distribuição de Frequências ROSSI, R. M. 21
Tabela 3.1: População brasileira por faixa etária.

Idades (Anos) 1980 (%) 1991 (%)
0 à 9 27, 9 23, 6
10 à 19 20, 6 18, 3
20 à 59 45, 0 50, 9
≥ 60 6, 5 7, 2
Fonte: IBGE
3.2 Distribuição de Frequências

Geralmente após a coleta de dados, estes são apresentados de forma desorganizada e de difı́cil mani-
pulação, logo faz-se necessário organizá-los. Para organizar os dados provenientes de uma variável qualitativa,
é usual fazer uma Tabela de frequências.
Tabela 3.2: Total de alunos matriculados na UEM em 2002.

Sexo Frequência
Feminino 7.545
Masculino 5.905
Total 13.450
Fonte: UEM/2002.
Quando a variável em estudo é do tipo contı́nua e assume muitos valores distintos, o agrupamento dos
dados em classes será sempre necessário na construção das tabelas de frequências.
Em publicações mais antigas sobre construção de tabelas de frequências, há fórmulas para determinação
do número de classes de acordo com o número de dados. Essas fórmulas eram úteis, pois a construção
dos gráficos era muito custosa sem o auxı́lio do computador. Esse procedimento é aconselhável como uma
primeira visualização da distribuição de frequências de uma variável. A seguir é apresentado um roteiro para
construção de distribuições de frequência.
Exemplo 3.1. Considere uma amostra de 25 criança, das quais foram obtidas medidas de intoxicação
alimentar por uma substância desconhecida ( g).
Dados brutos
0, 77 0, 75 0, 80 0, 78 0, 75 0, 65 1, 05 1, 10 0, 75 0, 75
0, 85 0, 61 0, 78 0, 58 0, 52 0, 78 1, 02 0, 99 0, 65 0, 55
0, 85 0, 90 0, 96 0, 79 0, 55
Fonte: Dados hipotéticos
Os dados, como apresentados acima, são chamados brutos, pois não foram ainda submetidos a nenhum
tipo de tratamento. Inicialmente, os dados devem ser colocados em ordem crescente:
Dados em ordem crescente

0, 52 0, 55 0, 55 0, 58 0, 61 0, 65 0, 65 0, 75 0, 75 0, 75
0, 75 0, 77 0, 78 0, 78 0, 78 0, 79 0, 80 0, 85 0, 85 0, 90
0, 96 0, 99 1, 02 1, 05 1, 10
Pode-se observar, agora, que das 25 observações o menor valor é xmı́n = 0, 55 e o maior é xmáx = 1, 10.
Amplitude (AT): é a diferença entre o maior e o menor valor do conjunto de dados observados.
AT = xmáx − xmı́n
3.2 Distribuição de Frequências ROSSI, R. M. 22
Para os dados acima: AT = 1, 10 − 0, 52 = 0, 58

Observe que esse exemplo contém um número pequeno de observações (n = 25), quando há um grande
número de dados observados o processo de ordenação é trabalhoso e a listagem final pouco representará.
Nesses casos, pode-se simplificar o processo agrupando os dados em certo número de classes, cujos limites
serão denominados limite inferior e limite superior. A quantidade de classes e a amplitude destas devem
ser obtidas observando as seguintes normas:
i) as classes devem cobrir a amplitude total;

ii) o extremo superior de uma classe é o extremo inferior da classe seguinte;
iii) cada valor observado deve enquadrar-se em apenas uma classe;
iv) o número total de classes não deve ser inferior a 5 e nem superior a 25;
O número de classes (k), pode ser obtido de uma das fórmulas seguintes:
√
i) k = n ;
ii) k = 1 + 3, 22 log n , (fórmula de Sturges).

√
Para o exemplo 2.1: k = 25 = 5 ou k = 1 + 3, 22log(25) ≃ 5, 50. Dividindo a amplitude total (AT ) por
k = 5 chega-se ao tamanho ou amplitude de cada uma das classes:
AT 0, 58 ∼
h= = = 0, 12
k 5
Obs.: quando os valores observados são números inteiros, os limites das classes também devem ser
AT
números inteiros. Para isso, aconselha-se escolher o número mais próximo de AT que resulte h = em
k
um número inteiro.
Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:
i) o limite inferior da primeira classe pode ser o menor valor da série, neste caso : 0,52.
ii) os demais limites serão obtidos somando aos limites inferiores o valor de h. Isto é,
0, 52 ⊢ (0, 52 + h = 0, 52 + 0, 12) = 0, 64
0, 64 ⊢ (0, 64 + h) = 0, 76
0, 76 ⊢ (0, 76 + h) = 0, 88
0, 88 ⊢ (0, 88 + h) = 1, 00
1, 00 ⊢ (1, 00 + h) = 1, 12.
Lembrando que a notação (⊢) significa que se esta incluindo os valores iguais ao limite inferior e excluindo
os valores iguais ou superiores ao limite superior. A partir da listagem ordenada das classes, pode-se construir
os chamados quadros (ou tabelas) de frequência ou distribuições de frequência, que permitem uma melhor
visualização dos dados.
Frequência: é o número de valores que aparecem no domı́nio de uma classe.
Um quadro de frequências completo deve conter as seguintes informações:
i) xi é o ponto médio da i-ésima classe; representa a média dos pontos limites da classe;
li + Li
xi = ; li : limite inferior e Li : limite superior da classe i.
2
ii) n é o tamanho da amostra;

iv) Fi é a frequência absoluta da i-ésima classe;
3.3 Gráficos ROSSI, R. M. 23
Fi
v) fi é a frequência relativa da i-ésima classe, fi = ;
n
vi) Faci é a frequência acumulada da i-ésima classe;
Faci
vii) faci é a frequência relativa acumulada da i-ésima classe, faci = .
n
Assim, no caso da amostra de 25 criança intoxicadas, a distribuição de frequência pode ser da seguinte
forma:
Tabela 3.3: Distribuição do nı́vel de intoxicação.

Classes xi Fi fi Fac fac
0, 52 ⊢ 0, 64 0, 58 5 0, 20 5 0, 20
0, 64 ⊢ 0, 76 0, 70 6 0, 24 11 0, 44
0, 76 ⊢ 0, 88 0, 82 8 0, 32 19 0, 76
0, 88 ⊢ 1, 00 0, 94 3 0, 12 22 0, 88
1, 00 ⊢ 1, 12 1, 06 3 0, 12 25 1, 00
Total - 25 1 - -
Outras informações:
Nenhuma cela ( casa ) deve ficar em branco;
Hı́fen ( - ), indica que o valor numérico é nulo;
Reticência ( ... ), indica que não se dispõe do dado;
Interrogação ( ? ), indica dúvida quanto a exatidão do valor numérico;
Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em relação a unidade utilizada.
3.3 Gráficos
Os gráficos são representações pictóricas, de grande valia na compreensão e visualização dos dados.
Os principais gráficos utilizados na representação estatı́stica são:
1. Diagramas;
(a) Por Pontos;

(b) Por Linhas;
i. Poligonais;
ii. Curvas;
(c) Por Superfı́cies;
i. em Colunas;
ii. em Barras;
iii. em Histogramas;
iv. em Box;
v. em Setores;
2. Cartogramas;
3. Estereogramas.
3.3.1 Diagramas
São representações gráficas de séries estatı́sticas por intermédio de linhas e superfı́cies. As linhas utilizadas
são as poligonais e as curvas, e as superfı́cies são retângulos, cı́rculos e quadrados. Para suas construções
pode-se utilizar a proporcionalidade entre série de números ou do sistema retilı́nio ortogonal. Este sistema
estabelece uma correspondência biunı́voca entre os pares de números reais e os pontos de um plano. Assim,
de modo geral, num sistema retilı́neo ortogonal, um ponto P do plano está determinado pelos números reais
X e Y, tomados sobre dois eixos divididos em segmentos unitários.
Diagramas por Pontos (Diagramas de Dispersão):

É a representação gráfica dos dados de forma bruta e geral, o que pode fornecer uma idéia da variabilidade
dos dados, pontos extremos etc.
Figura 3.1: Diagrama de dispersão e de relação entre X e Y.
Diagramas por Linha Poligonal:

É a representação gráfica de uma série estatı́stica por meio de uma linha poligonal. É um dos mais impor-
tantes gráficos; representa observações feitas ao longo do tempo, em intervalos iguais ou não. Tais conjuntos
de dados constituem as chamadas séries históricas ou séries temporais. Traduzem o comportamento de um
fenômeno em certo intervalo de tempo.
Figura 3.2: Gráfico para séries temporais.

O polı́gono de frequência é um gráfico que se obtém unindo por uma poligonal os pontos correspondentes
às frequências das diversas classes, centradas nos respectivos pontos médios. Para obter as intersecções do
polı́gono com o eixo, cria-se em cada extremo do histograma uma classe com frequência nula.
Obs.: Suavizando a linha poligonal que define o polı́gono obtém-se uma curva que visualiza a tendência
de variação dos dados.
0.3
Probabilidade
0.2
0.1
0.0
−4 −3 −2 −1 0 1 2 3
Amostra
Figura 3.3: Suavização do polı́gono de frequência.
Ogiva
A Ogiva ou Polı́gono de Frequência Acumulada, consiste de uma linha poligonal das Fac ou das fac .
Figura 3.4: Gráfico da Ogiva.

Diagramas por Linha Curva:

É a representação de uma série estatı́stica por meio de uma linha curva. Pode ser utilizada para repre-
sentar uma tendência do tipo linear ou não-linear.
Figura 3.5: Gráfico para modelos lineares não-lineares.
Diagrama por Superfı́cie em Barras ou Colunas:

É a representação de uma série estatı́stica por intermédio de retângulos em posições verticais. Este tipo
de gráfico proporciona comparar grandezas.
Os valores da variável dependente, dados pela série estatı́stica ou suas diferenças, devem ser proporcionais
às áreas dos retângulos a serem traçados. Para tanto pode-se utilizar o sistema retilı́nio ortogonal marcando-
se os pontos de forma já indicada, e a partir do eixo dos x, construir retângulos de bases iguais e que tenham
respectivamente, por meio de cada base, os valores da variável independente e os pontos marcados.
Figura 3.6: Gráfico Gráfico em Barras ou Colunas.

Diagrama por Superfı́cie em Histogramas:

O Histograma é um conjunto de retângulos com bases sobre um eixo dividido de acordo com os tamanhos
de classe, centrados nos pontos médios das classes e áreas proporcionais às frequências.
Figura 3.7: Gráfico do Histograma.

Diagrama por Superfı́cie em Caixas (BoxPlot):

O BoxPlot é uma representação da forma de distribuição dos dados que visa apresentar a massa de
dados assim como identificar valores extremos e/ou outliers.
Figura 3.8: Gráfico BoxPlot.
Diagrama por Superfı́cie em Setores (Pizza):

É a representação gráfica de uma série estatı́stica por intermédio de superfı́cies setoriais.
É utilizado quando se pretende comparar os valores de uma série com a sua soma total. A representação é
feita tomando como figura básica um cı́rculo que é dividido em setores. O quociente entre a soma dos valores
da série e a área do cı́rculo deve ser o mesmo que entre cada valor da variável dependente e a respectiva área
do setor representativo. Porém em virtude da proporcionalidade das áreas dos setores de um cı́rculo com
seus ângulos centrais, podem-se dividir os valores considerados na série proporcionalmente a estes ângulos.
Figura 3.9: Diagrama por Superfı́cie em Setores (Pizza).

Outros:
Há muitos outros tipos de gráficos em diferentes áreas do conhecimento.
Figura 3.10: Diagrama da prevalência por área.
Figura 3.11: Diagrama de curva de crescimento.

Figura 3.12: Diagrama de pirâmide etária.
Figura 3.13: Diagrama epidemiológico.
Figura 3.14: Curva de superfı́cie.

3.4 Medidas Descritivas ROSSI, R. M. 31
3.4 Medidas Descritivas

3.4.1 Medidas de Tendência Central ou de Posição
São medidas que objetivam representar o ponto central de equilı́brio de uma distribuição de dados. Essas
medidas representam quantitativamente os dados, sendo as mais utilizadas em análise:
Média
Representa o ponto de equilı́brio de um conjunto de dados. Seja (x1 , . . . , xn ) um conjunto de dados. A
média será dada por:
∑
N
xi
µ = i=1 ( dados populacionais ), para dados não-agrupados em tabelas de frequências.
N
∑
n
xi
i=1
x= ( dados amostrais ), para dados não-agrupados em tabelas de frequências.
n
∑
k
xi Fi
i=1
x= ( dados amostrais ), quando os dados agrupados em tabelas de frequências, com k classes.
n
Quando os dados são agrupados em intervalos de classes, xi corresponde ao ponto médio do intervalo.
Exemplo 3.2. Considere do Exemplo anterior, o conjunto de dados da amostra retirada da variável nı́vel
de intoxicação, dado no inı́cio desta parte. A média será dada por:
∑
25
xi
i=1 19, 53
xA = = = 0, 7812, para os dados brutos, ou
n 25
∑
5
xi Fi
i=1 19, 66
xB = = = 0, 7864, para os dados agrupados (Tabela 3.3).
n 25
Observe que x̄A ≃ x̄B .
Propriedades da Média:
1 - A soma algébrica dos desvios tomados em relação a média é nula. Isto é,
∑k ∑k
i=1 di = i=1 (xi − x) = 0 , i = 1, 2, . . . , n
X = {2, 3, 7} → x = 4,
∑k
pela propriedade: i=1 di = (2 − 4) + (3 − 4) + (7 − 4) = 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a média do conjunto
fica aumentada ou diminuı́da dessa constante.
yi = xi ± k ⇒ y =x±k
Para k = +2, tem-se: Y = {4, 5, 9} → y = 6,

pela propriedade: y = x + 2 = 4 + 2 = 6.
3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante k, a média do
conjunto fica multiplicada ou dividida por essa constante.
xi x
yi = k · xi ⇒ y =k·x e yi = ⇒ y= ; .k ̸= 0.
k k
Para k = +5, tem-se Y = {10, 15, 35} → y = 20,

pela propriedade: y = 5.x = 5.4 = 20.
Vantagens e desvantagens da Média:
1 - É uma medida que, pôr uniformizar os dados, não representa bem os conjuntos que revelam tendências
extremas, uma vez que a mesma será grandemente influenciada pelos valores discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno tenha as seguintes notas em uma disciplina:
30, 35, 25, 30, 25 35, 35, 95, 90, 100.
500
Um cálculo rápido nos mostra que sua média final foi x = = 50. Como a média deve traduzir o
10
aproveitamento do aluno durante o ano e a média 50 só foi conseguida à custa das três últimas notas,
concluı́mos que 50 é um valor falho para medir o aproveitamento do aluno.
2 - A média nem sempre tem existência real, isto é, ela nem sempre faz parte do conjunto de dados
(x ∈
/ X).
3 - É a medida de posição mais conhecida e de maior emprego.
4 - É facilmente calculada.
5 - Serve para compararmos conjuntos semelhantes.
6 - Depende de todos os valores do conjunto de dados.
7 - em geral não ocupa a posição central do conjunto (ocupa a posição do centro de equilı́brio).
Moda
A Moda (Mo ) é o valor que ocorre com maior frequência em uma série de dados. Existem séries de dados
em que nenhum valor aparece mais vezes que outros. Neste caso não apresenta moda. São séries amodais.
Em outros casos, pode aparecer dois ou mais valores de concentração. Diz-se então, que a série tem duas ou
mais modas (bimodal, trimodal ou multimodal).
X : {2, 2, 2, 2, 5, 5, 5, 6, 6, 7, 8} → Mo = 2 (unimodal).
Quando os dados se apresentam agrupados em tabelas de frequências é necessário utilizar a expressão de

“Czuber” (a mais precisa), dada a seguir, para calcular o valor que representa a moda: ( onde i é a ordem
da classe de maior frequência).
h(Fi − Fi−1 )
“Czuber”: Mo = li + .
(Fi − Fi−1 ) + (Fi − Fi+1 )
Outras modas:
“Pearson”: Mo = 3.Md − 2.x
e
h.Fi+1
“King”: Mo = li + .
Fi−1 + Fi+1
Graficamente, A equeção de Czuber de dá quando, em um conjunto de dados qualquer, identifica-se a
classe modal como aquela que apresenta o retângulo de maior altura (frequência). A intersecção das retas
que unem os pontos AD e os pontos BC, determina o ponto P que, projetado perpendicularmente no eixo
da variável, corresponderá ao valor da moda M o.
Figura 3.15: Projeção de Czuber para Moda.
Exemplo 3.3. Calcular a moda de Czuber, para os dados agrupados da amostra dada na Tabela 3.3.
i = 3 (Classe de maior frequência)
h = 0, 12
l3 = 0, 76
Fi = F3 = 8
Fi−1 = F2 = 6
Fi+1 = F4 = 3
0, 12(8 − 6)
Mo = 0, 76 + ≃ 0, 794
(8 − 6) + (8 − 3)
Isto significa que o nı́vel de toxicidade mais frequente é de 0,794 g.
Mediana
A mediana (Md ) de um conjunto de valores ordenados segundo uma ordem de grandeza, é o valor situado
de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos (é o valor
que está no meio !).
Quando o conjunto de observações tem um número ı́mpar de valores, não-agrupados em classes, então
n+1
a mediana é dada pela expressão: Md = xp , onde p = .
2
x1 x2 x3 x4 x5
→ Md = 5.
3 5 5 6 7
Quando o conjunto de observações tem um número par de valores, não-agrupados em classes, então a
xp + xp+1
mediana será, a média aritmética dos dois números que ocuparem o meio da série: Md = , onde
2
n
p= .
2
x1 x2 x3 x4 x5 x6 5+6
→ Md = = 5, 5.
3 5 5 6 7 7 2
Quando o conjunto de observações se apresenta agrupados em classes em uma tabela de frequências,

então a mediana é dada pela expressão abaixo, onde onde i representa a classe mediana, isto é, a classe onde
n
estará presente o valor de p = .
2
h(p − Fac−1 )
Md = li +
Fi
Exemplo 3.4. Calcular a mediana para os dados agrupados da amostra da Tabela 3.3.
n = 25( )
n
i = 3 p = = 12, 5 está na terceira linha −→ olhar em Fac
2
h = 0, 12
Fi = 8
Fac−1 = 11 (frequência acumulada da classe anterior)
l3 = 0, 76
0, 12(12, 5 − 11)
Md = 0, 76 + ≃ 0, 783
8
Isto significa que o 50% das crianças apresenta nı́vel de toxicidade acima de 0,783 g.
3.4.2 Medida de Variabilidade ou de Dispersão

São medidas estatı́sticas que indicam o grau de dispersão, ou variabilidade do conjunto de observações
pesquisados, em relação a uma medida de tendência central, por exemplo, x̄.
Uma única medida não é suficiente para descrever de modo satisfatório um conjunto de observações. Por
exemplo, dois conjuntos de dados podem ter a mesma média aritmética e, no entanto, a dispersão de um
pode ser muito maior que a dispersão do outro.
As principais medidas de dispersão são: amplitude total (AT), variância (σ 2 ou s2 ), desvio-padrão (σ
ou s) e coeficiente de variação (CV).
Amplitude total
Amplitude total ou AT é a diferença entre o maior e o menor valor observado
AT = xmáx − xmı́n
Desvio absoluto médio

Desvio absoluto médio ou Dm é a média aritmética dos valores absolutos dos desvios tomados em
relação a uma das seguintes medidas de tendência central: média ou mediana.
Desvio médio em relação à média para dados não tabulados:
∑
n
|xi − x̄|
i=1
Dm =
n
Desvio médio em relação à média para dados tabulados:
∑
n
|xi − x̄| Fi
i=1
Dm =
n
Variância
Variância ou Var(X) é a medida que fornece o grau de dispersão, ou variabilidade dos valores do
conjunto de observações em torno da média. Ela é calculada somando os quadrados dos desvios em relação
à média:
Amostral Populacional
∑n
2
(xi − x̄) ∑
N
(xi −µ)2
D. Brutos s2 = i=1 2
σ = i=1
n−1  ( )2 
N
∑k ∑
k
2
(xi − x̄) Fi ( ) k xi Fi  ∑
k
i=1 1 ∑ 2 i=1  (xi −µ)2 Fi

D. Agrupados s2 = ou s2 =  xi Fi −  σ2 = i=1
n−1 n−1 i=1 n  N
Desvio-padrão
Desvio-padrão ou DP(X) - Como a variância calculada a partir do quadrados dos desvios, sua unidade
é quadrada em relação à variável estudada, o que, sob o ponto de vista prático é um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão,
definida como a raiz quadrada da variância e representada por:
Amostral
√ Populacional
√
s = s2 σ = σ2
Propriedades da Variância e do Desvio-Padrão
1 - V ar(X) ≥ 0 =⇒ DP (X) ≥ 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a variância e o
desvio-padrão do novo conjunto permanecem inalterados:
Y =X ±k ⇒ V ar(Y ) = V ar(X) + 0
Y =X ±k ⇒ DP (Y ) = DP (X) + 0
X: Variável Aleatória e k: constante real.

3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante, k, a variância e
o desvio-padrão do novo conjunto são alterados da seguinte forma:
Y = kX ⇒ V ar(Y ) = k 2 V ar(X)
Y = kX ⇒ DP (Y ) = |k|DP (X)
e para k ̸= 0,
X V ar(X)
Y = ⇒ V ar(Y ) =
k k2
X DP (X)
Y = ⇒ DP (Y ) =
k |k|
4 - Sejam X e W variáveis aleatórias independentes, a e b constantes reais, tal que Y = aX ± bW, tem-se:
Y = aX ± bW ⇒ V ar(Y ) = V ar(aX ± bW ) = a2 V ar(X) + b2 V ar(W ).
Variância Relativa
A variância relativa de uma série X é indicada por VR(X) e definida por:
s2
V R(X) = 2 (amostral)
(x̄)
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro.
Portanto, pode ser expresso em percentual.
Coeficiente de variação
Coeficiente de variação ou CV é uma medida relativa da dispersão ou variabilidade dos dados:
s σ
CV(x) = (amostral) ou CV(x) = (populacional).
x̄ µ
Critérios para interpretação: Quanto menor for o coeficiente de variação (CV ≤ 25%), mais representa-
tiva dos dados será a média.
Exemplo 3.5. Calcular a variância, o desvio-padrão e o coeficiente de variação para o conjunto de dados
da amostra X: {2, 3, 5, 7}.
Sabemos que x = 4, 25 ≃ 4, 3, então:

∑n
2
(xi − x̄) 2 2 2 2
(2 − 4, 3) + (3 − 4, 3) + (5 − 4, 3) + (7 − 4, 3)
s2 = i=1 = ≃ 4, 92
√ n−1 3
s = 4, 92 ≃ 2, 12, assim:
2, 12
CV = ≃ 0, 522 (sendo CV = 52,2% > 25%, há indicativo de que a média não é representativa).
4, 25
Exemplo 3.6. Calcular a variância, o desvio-padrão e o coeficiente de variação para o conjunto de dados
amostrais apresentados na tabela abaixo.
Tabela 3.4: Exemplo de Tabela de Frequência.

xi Fi
1 2
3 4
5 2
Total 8
∑
3
xi Fi
i=1 1 × 2 + 3 × 4 + 5 × .2
sendo x = = = 3, temos
n 8
∑
k
2
(xi − x̄) Fi 2 2 2
i=1 (1 − 3) 2 + (3 − 3) 4 + (5 − 3) 2
s2 = = ≃ 2, 29, ou
n − 1 7
( k )2 
∑
( ) k xi Fi 
1 ∑ 2 i=1 
s2 =  x F i −  = s2
n − 1 i=1 i n 
( )[ 2
]
1 (24) 16
= 88 − = ≃ 2, 29
8−1 8 7
√
logo, s = 2, 29 ≃ 1, 51, assim:
1, 51
cv = ≃ 0, 50 (há indicativo de que a média não é representativa).
3
3.4.3 Medidas Separatrizes

Quartis, Decis e Percentis
As medidas de posição denominadas “Separatrizes” para valores agrupados são calculadas através da
expressão:
h(p − Fac−1 )
Sk = li +
Fi
onde
SK : é a medida de posição separatriz desejada (Md : M ediana, Qk : Quartil, Dk : Decil ou Pk :
P ercentil de ordem k);
k : é a ordem da medida;
w : é o divisor;
Sk k w
Md 1 2
Q 1, 2, 3 4
D 1, 2, ...,9 10
P 1, 2, ...,99 100
p : é a posição da observação, dado por:
n.k
p=
w
Exemplo 3.7. Calcule o Q1 , Q2 , Q3 , D7 , P10 e P90 para os dados da Tabela 3.3.
Tabela 3.5: Distribuição do nı́vel de intoxicação (g) em 25 crianças.

Classes xi Fi fi Fac fac
0,52 ⊢ 0,64 0,58 5 0,20 5 0,20
0,64 ⊢ 0,76 0,70 6 0,24 11 0,44
0,76 ⊢ 0,88 0,82 8 0,32 19 0,76
0,88 ⊢ 1,00 0,94 3 0,12 22 0,88
1,00 ⊢ 1,12 1,06 3 0,12 25 1,00
Total - 25 1 - -
Solução:
Cálculo de Q1 : {k = 1; w = 4; }
25 × 1
p= = 6, 25 (i = 2 : olhar em Fac )
4
h = 0, 12
Fi = F2 = 6
li = 0, 64
Fac−1 = 5
0, 12(6, 25 − 5)
Q1 = 0, 64 + = 0, 64 + 0, 025 = 0, 665
6
Obs.: O valor Q1 = 0, 665 representa o nı́vel de intoxicação que deixa 25% dos demais valores abaixo dele.
Cálculo de Q2 : {k = 2; w = 4; }
25 × 2
p= = 12, 5 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(12, 5 − 11)
Q2 = 0, 76 + ≃ 0, 783 = Md
8
Obs.: O valor Q2 ≃ 0, 783 representa o o nı́vel de intoxicação que deixa 50% dos demais valores abaixo dele,
isto é, é o valor mediano.
Cálculo de Q3 : {k = 3; w = 4; }
25 × 3
p= = 18, 75 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(18, 75 − 11)
Q3 = 0, 76 + ≃ 0, 876
8
Obs.: O valor Q3 ≃ 0, 876 representa o nı́vel de intoxicação que deixa 75% dos demais valores abaixo dele.
Cálculo de D7 : {k = 7; w = 10; }
25 × 7
p= = 17, 5 (i = 3)
10
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(17, 5 − 11)
D7 = 0, 76 + ≃ 0, 858
8
Obs.: O valor D7 ≃ 0, 858 representa o o nı́vel de intoxicação que deixa 70% dos demais valores abaixo dele.
Cálculo de P10 : {k = 10; w = 100; }
25 × 10
p= = 2, 5 (i = 1)
100
h = 0, 12
Fi = 5
li = 0, 52
Fac−1 = 0
0, 12(2, 5 − 0)
P10 = 0, 52 + = 0, 58
5
Obs.: O valor P10 = 0, 58 representa o o nı́vel de intoxicação que deixa 10% dos demais valores abaixo dele.
Cálculo de P90 : {k = 90; w = 100; }
25 × 90
p= = 22, 5 (i = 1)
100
h = 0, 12
Fi = 3
li = 1, 00
Fac−1 = 22
0, 12(22, 5 − 22)
P90 = 1 + = 1, 02
3
Obs.: O valor P90 = 1, 02 representa o o nı́vel de intoxicação que deixa 90% dos demais valores abaixo dele
ou 10% acima dele.
Medidas de Assimetria
Tem por objetivo básico medir o quanto a distribuição de frequências do conjunto de valores observados
se afasta da condição de simetria.
(A) Distribuição Assimétrica negativa. Quando a média é menor que a mediana que é menor que a
moda.
(B) Distribuição Simétrica. Quando a média, moda e mediana são iguais, ou muito próximas.
(C) Distribuição Assimétrica positiva. Quando a média é maior que a mediana que é maior que a
moda.
Gráfico das distribuições quanto à assimetria
Figura 3.16: (A) Assimétrica Negativa (x̄ < Md < Mo )
Figura 3.17: (B) Simétrica (x̄ = Md = Mo )
Figura 3.18: (C) Assimétrica Positiva (Mo < Md < x̄)
Uma das medidas para quantificar a assimetria de uma distribuição pode ser dada pelo primeiro coe-
ficiente de assimetria de Pearson (Ap ) :
x̄ − Mo 3 (x̄ − Md )
Ap = ou Ap =
s s
Outra é através do coeficiente quartilı́tico de Bowley (Ab ) :
Q3 + Q1 − 2Md
Ab =
Q3 − Q1
Em ambos temos:
Se A < 0 a distribuição é assimétrica negativa.
Se A = 0 a distribuição é distribuição simétrica.
Se A > 0 a distribuição é assimétrica positiva.
Obs.: 0, 15 < |A| < 1 a assimetria é considerada moderada e se |A| > 1, forte.
Exemplo 3.8. Considerando o conjunto de dados da Tabela 3.3, obter Ap .

sabemos que: x = 0, 7864; s = 0, 153 e Mo ≃ 0, 794, assim:
x̄ − Mo 0, 786 − 0, 794
Ap = = ≃ −0, 04967 (Ap < 0 : assimétrica negativa).
s 0, 153
Medidas de Curtose
A curtose ou achatamento mede a concentração ou dispersão dos valores de um conjunto de valores
em relação às medidas de tendência central em uma distribuição de frequências conhecida (a distribuição
Normal).
(A) Distribuição Leptocúrtica. Quando a distribuição apresenta uma curva de frequência mais “fe-
chada” que a da distribuição Normal.
(B) Distribuição Mesocúrtica. Quando a distribuição apresenta uma curva de frequência “parecida”
a da distribuição Normal.
(C) Distribuição Platicúrtica. Quando a distribuição apresenta uma curva de frequência mais “aberta”
que a da distribuição Normal.
Gráfico das distribuições quanto à curtose
Figura 3.19: Leptocúrtica
Figura 3.20: Mesocúrtica
Figura 3.21: Platicúrtica
As medidas de curtose podem ser calculadas através da expressão:
(Q3 − Q1 )
k=
2(P90 − P10 )
Obs.1 : k : coeficiente de curtose

Obs.2 : DQ: Q3 − Q1 é denominado Desvio interquartilı́tico.
Relativamente à curva da distribuição Normal, temos:
Se k < 0, 263 ( leptocúrtica );
Se k = 0, 263 ( mesocúrtica );
Se k > 0, 263 ( platicúrtica ).
Podemos utilizar também, o coeficiente de curtose baseado nos momentos centrados (k4 ), para dados
tabelados:
∑
(xi − x̄)4 Fi
∑
Fi
k4 = 4
−3
σ
Lembrando que
(∑ )2
( )2 (xi − x̄)2 Fi
σ = σ2 =
4
(populacional).
N
e (∑ )2
( )2 (xi − x̄)2 Fi
s = s2 =
4
(amostral).
n−1
Analogamente, temos:
Se k4 > 0 a distribuição é leptocúrtica;
Se k4 = 0 a distribuição é mesocúrtica;
Se k4 < 0 a distribuição é platicúrtica.
Exemplo 3.9. Considerando o conjunto de dados da Tabela 3.3, obter k, o coeficiente de curtose interquar-
tilı́tico.
Sabemos que Q1 = 0, 665, Q3 = 0, 876, P10 = 0, 58 e P90 = 1, 02 , então:
(Q3 − Q1 ) (0, 876 − 0, 665)
k= = = 0, 2398 (k < 0, 263 : leptocúrtica).
2(P90 − P10 ) 2(1, 02 − 0, 58)
Do exemplo ??, tem-se a Figura 3.22:
Figura 3.22: Histograma do nı́vel de intoxicação (g).

Capı́tulo 4
Noções de Probabilidade
4.1 Introdução
Uma das ferramentas fundamentais da Inferência Estatı́stica é a Probabilidade, a qual teve seu inı́cio
formal com jogos de azar no século XVII.
Muitas decisões precisam ser tomadas na presença da incerteza. Os preços e modelos de novos carros
devem ser selecionados com base na previsão instável do consumidor, na tendência da economia nacional
e nas ações competitivas. A locação e o quadro de funcionários de um hospital devem ser decididos com
informação limitada na quantidade de pacientes. O estoque de um produto deve ser feito em face da incerteza
sobre a demanda. Probabilidade é a linguagem da incerteza. Assim sendo, probabilidade será estudada como
o mecanismo de fazer inferências.
Independente de qual seja a aplicação em particular, a utilização da teoria de probabilidade indica que
existe um elemento de acaso, ou de incerteza, quanto a ocorrência ou não de um acontecimento futuro.
Assim é que, em muitos casos, pode ser virtualmente impossı́vel afirmar por antecipação o que ocorrerá;
mas é possı́vel dizer o que pode ocorrer. Por exemplo, se uma moeda for jogada para o ar, de modo
geral não se pode afirmar se vai dar cara ou coroa. Entretanto, é reconhecido que embora o resultado
seja incerto, existe um resultado previsı́vel a longo prazo. É sabido que se a moeda é ideal (balanceada,
simétrica) cerca de metade das provas resultarão em caras. Além disso, mediante determinada combinação
de julgamento, experiência passada e dados históricos, em geral é possı́vel dizer quão provável é a ocorrência
de determinado acontecimento futuro. Neste longo prazo, a regularidade previsı́vel possibilitam que as casas
de jogos se empenhem no negócio.
4.2 Espaço Amostral e Eventos

Suponha que um experimento seja realizado sob certas condições fixas. Seja Ω o conjunto de resultados
possı́veis, onde por “resultado possı́vel” entende-se resultado elementar e indivisı́vel do experimento. Ω será
chamado espaço amostral do experimento.
Exemplo 4.1. Lançar um dado equilibrado e observar o número da face superior. É claro que Ω = {1, 2,
3, 4, 5, 6}, pois esses 6 resultados são os únicos possı́veis.
Às vezes, o conjunto de resultados possı́veis não é tão fácil de ser definido, veja o exemplo:
Exemplo 4.2. Selecionar ao acaso um habitante de Maringá e medir sua altura em metros. Quais os resul-
tados possı́veis deste experimento? Números reais entre 0 e ? Supondo que não exista uma altura máxima,
talvez seja razoável fazer Ω = (0, ∞). Mas é evidente que esse conjunto contém resultados impossı́veis.
Outros candidatos para Ω seriam, por exemplo, os intervalos limitados (0, 3) e [1/10, 3]. Os dois interva-
los contém, aparentemente, todos os resultados possı́veis do experimento. Esta propriedade já é suficiente
para os propósitos aqui estudados, e qualquer desses intervalos (incluindo (0, ∞)) pode ser escolhido para
ser espaço amostral. De fato, a própria reta R, embora contenha muitı́ssimos resultados impossı́veis, pode
representar uma escolha muito conveniente para Ω.
43
4.3 Definição Axiomática de Probabilidade ROSSI, R. M. 44
O importante, então, é que Ω contenha todo resultado possı́vel; por isso suponha que a todo resultado
possı́vel corresponda um, e somente um, ponto ω ∈ Ω; e resultados distintos correspondem a pontos distintos
em Ω, i. e., não pode representar mais de um resultado.
Para uma terminologia uniforme os resultados dos experimentos serão denominados eventos.
Quando se realiza um experimento há certos eventos que ocorrem ou não. Por exemplo, no primeiro
exemplo alguns eventos são:
A = “observa-se um número par”
B = “observa-se o número 2”
C = observa-se um número > 3”.
Note que cada um desses eventos pode ser identificado a um subconjunto de Ω, a saber: A = {2, 4, 6},
B = {2} e C = {4, 5, 6}. Esta identificação costuma ser realizável no caso de um experimento qualquer.
Definição: Seja Ω o espaço amostral do experimento. Todo subconjunto A ⊂ Ω será chamado evento.
Ω é o evento certo, ϕ o evento impossı́vel. Se ω ∈ Ω, o evento {ω} é dito evento elementar (ou
simples).
Notações de conjuntos e eventos:
A ∪ B é o evento “A ou B”;
A ∩ B é o evento “A e B”;
Ac é o evento “não A” ou Ω − A (isto é, ocorre o evento Ac se, e só se, não ocorre A);
A ⊂ B significa: a ocorrência do evento A implica a ocorrência do evento B;
A ∩ B = ϕ significa: A e B são eventos mutuamente exclusivos ou incompatı́veis.
Definição de Probabilidade
A esta altura pode-se perguntar: a que será atribuı́do probabilidade?
Seja A um evento, i. e., A ⊂ Ω. Desta forma pode-se atribuir probabilidade a A:
#A
P (A) =
#Ω
#A : número de resultados favoráveis a A;
#Ω : número de resultados possı́veis.
Outro método de definir probabilidade é o da frequência relativa: pode-se definir P (A) como o limite da
frequência relativa da ocorrência de A em n repetições independentes do experimento, com n tendendo ao
infinito, isto é:
#A
P (A) = lim
n→∞ n
em que #A é o número de ocorrências de A em n “ensaios” independentes do experimento.
Essa é a definição “frequentista” de probabilidade. Baseia-se na experiência, comum a todos, da estabili-
dade da frequência relativa de ocorrência de eventos, quando é realizado muitas repetições do experimento.
Essa definição foi utilizada por Von Mises na construção de uma teoria de probabilidade.
Observação: Embora nenhuma destas definições - clássica e frequêncial - seja completamente rigorosa,
sendo, portanto, ambas insatisfatórias do ponto de vista teórico, elas servem para que se avance bastante no
conhecimento das principais idéias da Teoria das Probabilidades.
4.3 Definição Axiomática de Probabilidade

Suponha agora que existam as probabilidades em uma certa famı́lia A de eventos, chamados eventos
aleatórios. Suponha também que a todo A seja associado um número real P (A), chamado probabilidade de
A, de modo que os itens a seguir sejam satisfeitos:
1. 0 ≤ P (A) ≤ 1;
2. P (Ω) = 1.
4.4 Propriedades Fundamentais ROSSI, R. M. 45
4.4 Propriedades Fundamentais

Seja P uma probabilidade em uma famı́lia de eventos A. Então e as propriedades a seguir são con-
sequências dos axiomas:
• Se ϕ é o conjunto vazio, então P (ϕ) = 0;

• Se Ac for o evento complementar de A, então P (A) = 1 − P (Ac ) já que P (Ω) = P (A) + P (Ac );
• Se A e B são dois eventos quaisquer e A − B é o complemento de A em relação a B, então

P (A − B) = P (A) − P (A ∩ B).
Prova. Pelo diagrama de Venn podemos notar que A = (A − B) ∪ (A ∩ B) e que A − B e A ∩ B são

disjuntos, logo:
P (A) = P ((A − B) ∪ (A ∩ B)) → P (A) = P (A − B) + P (A ∩ B) → P (A − B) = P (A) − P (A ∩ B);
• Se A e B forem dois eventos quaisquer, então, P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
Prova. Pelo diagrama de Venn podemos notar que A ∪ B = B ∪ (A − B). Uma vez que, B e A − B são
mutuamente exclusivos, segue que:
P (A ∪ B) = P (B ∪ (A − B)) → P (A ∪ B) = P (B) + P (A − B) → P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
• Se A, B e C forem três eventos quaisquer, então:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B − P (A ∩ C) − P (B ∩ C) − P (A ∩ B ∩ C).
Exemplo 4.3. Se A e B são eventos de A mutuamente exclusivos, e é conhecido que P(A)=0,20 enquanto
P(B)=0,30, pode-se avaliar varias probabilidades:
a. P (Ac ) = 1 − P (A) = 0, 80
b. P (B c ) = 1 − P (B) = 0, 70
c. P (A ∪ B) = P (A) + P (B) = 0, 2 + 0, 3 = 0, 5
d. P (B ∩ A) = 0
e. P (Ac ∩ B c ) = P ((A ∪ B)c ), pela Lei de Morgan = 1 − P (A ∪ B) = 1 − (P (A) + P (B)) = 0, 5
Exercı́cio 4.1. Suponha que os eventos A e B não sejam mutuamente exclusivos e que P (A) = 0, 20,
P (B) = 0, 30 e P (B ∩ A) = 0, 10. Então, calcule as mesmas probabilidades do exemplo anterior.
Exercı́cio 4.2. Entre os 1.820 indivı́duos em um estudo, 30 sofriam de tuberculose e 1.790 não. Raios X
do tórax foram administrados para todos; 73 tiveram raio X positivo – o que implica evidência significante
de doença inflamatória – enquanto os resultados dos outros 1.747 foram negativos. Os dados pra esse estudo
são apresentados a seguir:
Raio X Tuberculose Total
Não Sim
Negativo 1.739 8 1.747
Positivo 51 22 73
Total 1.790 30 1.820
Escolhido um individuo ao acaso, qual a probabilidade:
a) de ter raio X negativo? b) de ter tuberculose e o raio X positivo?
4.5 Probabilidade Condicional ROSSI, R. M. 46
4.5 Probabilidade Condicional

Definição: Se A e B são eventos tal que P (B) > 0, a probabilidade condicional de A dado B é definida
por:
P (A ∩ B)
P (A|B) = .
P (B)
Do diagrama de Venn se A e B são desenhados de modo que áreas de A, B e A ∩ B sejam proporcionais
às suas probabilidades, então P (A|B) é a proporção do evento B ocupada pelo evento A.
Note que P (A|B), é realmente uma probabilidade. Consequentemente as propriedade de probabilidade

são mantidas, por exemplo: P (Ac |B) = 1 − P (A|B).
Decorre da definição que:
P (A ∩ B) = P (B)P (A|B) ou P (A ∩ B) = P (A)P (B|A).
Esta igualdade se generaliza: sendo A, B e C eventos aleatórios, tem-se
P (A ∩ B ∩ C) = P (A)P (B|A)P (C|A ∩ B).
Isto pode ser visto pelo diagrama, pensando nas probabilidades de todos os eventos como proporcionais
às suas áreas:
P (A ∩ B ∩ C) = P (A ∩ B)P (C|A ∩ B) = P (A)P (B|A)P (C|A ∩ B).
Exercı́cio 4.3. Para os dados do exercı́cio anterior, escolhido um indivı́duo ao acaso, qual a probabilidade:
a) de ter raio X negativo e ser tubérculo?
b) de ter tuberculose, dado que o resultado do raio X foi negativo?
c) de ter raio X positivo, dado que não é tuberculoso?
Teorema da Probabilidade Total: Se a sequência (finita ou enumerável) de eventos aleatórios B e A1 ,
A2 , ... formar uma partição de Ω, i.é., se são eventos aleatórios mutuamente exclusivos e exaustivos,
os Ai são disjuntos (2 a 2) então ∪Ai = Ω, então:
∑
P (B) = P (Ai )P (B|Ai ).
i
4.5 Probabilidade Condicional ROSSI, R. M. 47
Teorema de Bayes:
Considerando o Teorema da Probabilidade Total, segue que:

P (B|Ai )P (Ai )
P (Ai |B) = ∑
n .
P (B|Ai )P (Ai )
i=1
Exemplo 4.4. Uma caixa contém 5 bolas brancas e 3 bolas pretas. Duas bolas são retiradas simultaneamente
ao acaso e substituı́das por 3 bolas azuis. Em seguida, duas novas bolas são retiradas ao acaso da caixa.
a) calcular a probabilidade de que essas duas últimas bolas sejam da mesma cor;
b) se as duas ultimas bolas retiradas forem uma branca e uma preta, calcular a probabilidade de que, na
primeira extração, tenham sido duas bolas brancas.
Solução:
a) Uso do teorema da probabilidade total .
Para a primeira retirada de duas bolas, os eventos

E1 : saı́rem duas bolas brancas
E2 : sair uma bola branca e uma preta
E3 : saı́rem duas bolas pretas
formam uma participação de Ω, isto é, são mutuamente exclusivos e exaustivos tal que:
5 4 10
P (E1 ) = × =
8 7 28
5 3 15
P (E2 ) = P (BP ) + P (P B) = 2 × × =
8 7 28
3 2 3
P (E3 ) = × =
8 7 28
Observe que P (E1 ) + P (E2 ) + P (E3 ) = 1
Agora sendo F : duas últimas bolas da mesma cor, podemos calcular as P (F |Ei ), cada uma sendo
calculada, em cada caso, pela soma das probabilidades de saı́rem duas brancas, duas pretas ou duas azuis.
Para isso basta analisar a nova composição da caixa condicionada à ocorrência de cada um dos eventos
da famı́lia Ei . Teremos:
3 2 3 2 3 2 9
P (F |E1 ) = P (BB|E1 ) + P (P P |E1 ) + P (AA|E1 ) = × + × + × =
9 8 9 8 9 8 36
4 3 2 1 3 2 10
9 8 9 8 9 8 36
5 4 1 0 3 2 13
9 8 9 8 9 8 36
Finalmente, utilizando a equação da probabilidade total, temos que:
10 9 15 10 3 13 579
P (F ) = P (E1 )P (F |E1 ) + P (E2)P (F |E2 ) + P (E3 )P (F |E3 ) = × + × + × = ≃
28 36 28 36 28 36 1008
0, 5744.
b) A solução desta parte é dada pelo teorema de Bayes. Seja G : as duas últimas bolas retiradas serem
uma preta e uma branca, temos que:
4.6 Independência Estatı́stica ROSSI, R. M. 48
3 3 3 3 9
P (G|E1 ) = P (P B|E1 ) + P (BP |E1 ) = × + × =
9 8 9 8 36
4 2 4 2 8
P (G|E2 ) = P (P B|E2 ) + P (BP |E2 ) = × + × =
9 8 9 8 36
5 1 5 1 5
P (G|E3 ) = P (BP |E3 ) + P (P B|E3 ) = × + × =
9 8 9 8 36
O denominador da formula de Bayes é a probabilidade do evento que ocorreu dado pelo teorema da
probabilidade total. No caso
∑3 10 9 15 8 3 5 225
P (G) = P (Ei )P (G|Ei ) = × + × + × =
i=1 28 36 28 36 28 36 1008
Logo pela formula de Bayes
10 9
P (E ∩ G) P (Ei )P (G|Ei ) × 90
P (E1 |G) = = = 2822536 = = 0, 4.
P (G) P (G) 225
1008
∑3
Exercı́cio 4.4. Encontrar P (E2 |G), P (E3 |G) e somas P (Ei |G).
i=1
Exemplo 4.5. Experimento de duas etapas (experimento composto). Supor que uma caixa contenha três
moedas: duas honestas e uma de duas caras. Retirar uma moeda ao acaso e jogá-la. Pergunta: qual a
probabilidade condicional da moeda ter sido a de duas caras, dado que o resultado final foi cara?
Solução: Nesse experimento, deseja-se calcular a probabilidade de um evento determinado pela primeira
etapa dado um evento determinado pela segunda etapa. Sejam, então A1 = “moeda retirada é honesta”,
A2 = “moeda retirada é a de duas caras” e B = “resultado final é cara”.
Aplicando a fórmula de Bayes, tem-se:
1
P (B|A2 )P (A2 ) 1× 1
P (A2 |B) = = 3 = .
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) 1 1 2 2
1× + ×
3 3 3
Esse resultado pode ser interpretado em termos de freqüência relativa: se o experimento fosse repetido
independentemente um grande número de vezes, então a moeda de duas caras seria a escolhida na primeira
etapa de aproximadamente metade dos experimentos em que o resultado final fosse cara.
4.6 Independência Estatı́stica

Definição: Os eventos aleatórios A e B são independentes se P (A ∩ B) = P (A)P (B).
Obs.: Eventos de probabilidade 0 (zero) ou 1 são independentes de qualquer outro:
se P (A) = 0, então P (A ∩ B) = 0 e A e B são independentes;
se P (B) = 1, então P (A ∩ B) = P (A) − P (A ∩ B c ) e, como A ∩ B c ⊂ B c implica P (A ∩ B c ) ≤ P (B c ) = 0,
tem-se que P (A ∩ B c ) = 0 e P (A ∩ B) = P (A) = P (A)P (B). Logo A e B são independentes.
Exemplo 4.6. No experimento em que os eventos A: ”observa-se um número par” e Ac : “observa-se um
número ı́mpar” em que Ω : {1, 2, 3, 4} não são independentes. Intuitivamente, porque não são compatı́veis,
1
e formalmente, porque P (A ∩ Ac ) = P (ϕ) = 0 ̸= = P (A)P (Ac ).
4
4.7 Variável Aleatória Discreta e Contı́nua

São provenientes de Experimentos Aleatórios (todos as possibilidades são equiprováveis, isto é, tem
a mesma chance de ocorrência). As v.as. geralmente são representadas por letras maiúsculas A, X, Y ou W,
que podem assumir qualquer um dos conjuntos de valores que lhe são atribuı́dos.
Exemplo 4.7. Em um experimento de lançar uma moeda e observar a sua face, existem duas possibili-
dades:“Cara ou Coroa“. Considerando uma v.a. discreta X: “número de caras em dois lançamentos“,
temos: {
Cara: c
possibilidades {cc,ck,kc,kk}: → X : {0, 1, 2}.Muitos experimentos produzem resultados não-
Coroa: k
numéricos. Antes de analisá-los, é conveniente transformar seus resultados em números, o que é feito através
4.7 Variável Aleatória Discreta e Contı́nua ROSSI, R. M. 49
da variável aleatória (v.a.), que é uma regra de associação de um valor numérico a cada ponto do espaço
amostral.
As variáveis aleatórias podem ser discretas, contı́nuas ou mistas. No caso discreto, a distribuição de pro-
babilidade pode ser caracterizada por uma função de probabilidade, que indica diretamente as probabilidades
associadas a cada valor.
O passo fundamental para se entender uma v.a. é associar a cada valor a sua probabilidade, obtendo
o que se chama uma distribuição de probabilidades, que fica caracterizada pelos valores da v.a. X e pela
função que associa a cada valor uma probabilidade. Esta função é chamada função de probabilidade.
No caso discreto, a função p(xi ) que associa a cada valor xi (de uma variável aleatória discreta X) sua
probabilidade de ocorrência, isto é:
p(xi) = P (Xi = xi ) = p.
Para que uma função p(x) seja uma distribuição de probabilidade, é necessário que:
1. p(x) ≥ 0;
∑
2. p(x) = 1 (somatório para todos os valores de x do domı́nio de X);
3. P (X = x) = p(x).
No caso contı́nuo, a distribuição de probabilidade é caracterizada pela função de densidade de probabi-

lidade, que é uma função contı́nua gozando das seguintes propriedades:
1. f (x) ≥ 0;
∫b
2. f (x)dx = P (a ≤ x ≤ b) (área sobre a curva f (x) entre os pontos a e b é a probabilidade entre a e b);
a
∫
∞
3. f (x)dx = 1.
−∞
Para melhor entender a abrangência do conceito de v.a., é necessário proceder a algumas etapas assim
como estudar caracterı́sticas gerais das distribuições das v.a. para as distribuições mais importantes, que
descrevem um grande número de fenômenos aleatórios. Neste texto será apresentado apenas conceitos
básicos.
4.7.1 Esperança Matemática de uma Variável Aleatória

A Média ou Esperança matemática de uma variável aleatória é definida como:
• Para variáveis aleatórias discretas:

∑
E(X) = µ(X) = xi P (xi ).
i
• Para variáveis aleatórias contı́nuas, por:

∫∞
E(X) = xf (x)dx.
−∞
Propriedades da Média:
1. E(k) = k, k é uma constante;

2. E(kX) = kE(X);
3. E(X ± Y ) = E(X) ± E(Y );
4. E(X ± k) = E(X) ± k.
4.7 Variável Aleatória Discreta e Contı́nua ROSSI, R. M. 50
4.7.2 Variabilidade de uma Variável Aleatória

A Variância, o Desvio-padrão e o Coeficiente de Variação são parâmetros que caracterizam a
variabilidade das variáveis aleatórias, sendo de grande importância.
A Variância de uma Variável Aleatória é definida por:
σ 2 = σ 2 (X) = E[(X − µx )2 ] = E(X2) − [E(X)]2 ,
em que, de acordo com a definição da média, tem-se:

∑
E(X 2 ) = x2i P (xi ),
i
para variáveis aleatórias discretas, e

∫∞
E(X 2 ) = x2 f (x)dx,
−∞
e para variáveis aleatórias contı́nuas.

Propriedades da Variância:
1. σ 2 (k) = 0, k é uma constante;

2. σ 2 (kX) = k 2 σ 2 (X);
3. se X e Y são variáveis aleatórias independentes, σ 2 (X ± Y ) = σ 2 (X) + σ 2 (Y );

4. σ 2 (X ± k) = σ 2 (X).
O Desvio-padrão de uma Variável Aleatória é a raiz quadrada positiva da variância. Tem a vantagem
de ser expresso na mesma unidade da variável. Suas propriedades decorrem da variância. É denotado por σ
ou σ(X).
σ
O Coeficiente de Variação de uma Variável Aleatória é definido como: CV = .
µ(X)
É uma medida adimensional da dispersão. É utilizado para comparar conjuntos de dados quanto a
dispersão.
Capı́tulo 5
Distribuições de Probabilidade
O objetivo da Inferência Estatı́stica é obter afirmações sobre uma dada caracterı́stica da população, na
qual se tem interesse, a partir de informações colhidas de uma amostra.
Essa caracterı́stica de interesse pode ser representada por uma variável aleatória.
Se informações completa sobre a distribuição de probabilidade da variável em estudo, fosse conhecida
não haveria necessidade de colher uma amostra. Então, toda afirmação desejada seria obtida através desta
distribuição.
Mas isso raramente acontece. A informação que se tem a respeito da variável é parcial ou nada se conhece.
Exemplos:
• a altura dos brasileiros adultos, apresenta uma distribuição Normal?
• a prevalência (proporção) de uma determinada doença infecciosa segue uma distribuição Binomial?
• o número de filhos de um casal humano segue uma distribuição de Poisson ?
• o tempo de vida de pacientes soropositivos segue uma distribuição Exponencial?
Se não há informações nem sobre os parâmetros, nem sobre a forma da curva, então, o uso de uma
amostra nos dá uma idéia sobre o comportamento da variável na população. Através de suas carac-
terı́sticas e através de testes de aderência, podemos verificar qual o modelo probabilı́stico (conhecido)
será mais adequado aos dados.
Muitas vezes isto não acontece. Nestes casos um novo modelo deverá ser produzido, ou a distribuição
é produzida através de simulação computacional.
5.1 Distribuição Binomial

Considere n ensaios independentes e todos com a mesma probabilidade de sucesso p.
A variável aleatória discreta que conta o número total de sucessos é denominada Binomial com parâmetros
n e p, isto é
X ∼ Bin(n; p)
onde sua função de probabilidade é dada por:
( )
n x n−x
P (X = x) = p q , q = 1 − p; x = 0, 1, 2, ..., n.
x
Exemplo 5.1. Uma certa doença pode ser curada através de procedimentos cirúrgicos em 80% dos casos.
Dentre os que têm essa doença, sorteamos 15 pacientes que serão submetidos à cirurgia.
Fazendo alguma suposição adicional que julgar necessária. Qual a probabilidade de todos serem curados?
X ∼ Bin(15; 0, 8)
( )
15
P (X = 15) = 0, 815 0, 215−15
15
≃ 0, 0352 ou 3, 52%.
51
5.2 Distribuição de Poisson ROSSI, R. M. 52
Obs.: Se X tem uma distribuição Binomial então:
Média : E(X) = np
e
Variância : V ar(X) = npq.
5.2 Distribuição de Poisson

Uma variável X tem distribuição de Poisson com parâmetro λ > 0 se sua função de probabilidades é dada
por
λe−λ
P (X = x) = , x = 0, 1, 2, ...
x!
com parâmetro λ sendo usualmente referido como a taxa de ocorrência. A notação utilizada será
X ∼ P o(λ).
O modelo Poisson é um modelo discreto muito utilizado em experimentos biológicos e, nesses casos, λ é
a frequência média ou esperada de ocorrências num determinado intervalo de tempo.
Exemplo 5.2. Chegada de pacientes em um pronto socorro. Suponha que o número de pacientes que chegam
a um pronto socorro de uma pequena cidade durante a madrugada tenha distribuição de Poisson com média
3 (λ = 3). Calcular as probabilidades de chegadas desses pacientes:
3e−3
Solução: Para X valendo 0 temos P (X = 0) = = 0, 05. Para os demais (x = 1, 2, ...) o cálculo é
0!
análogo e os resultados estão na Tabela 5.1.
Tabela 5.1: Distribuição de Poisson com parâmetro λ = 3.

x P(X = x) x P(X = x)
0 0,050 7 0,022
1 0,149 8 0,008
2 0,224 9 0,003
3 0,224 10 0,001
4 0,168 11 0,000
5 0,101 12 0,000
6 0,050 ≥ 13 ≈0
5.3 Distribuição Normal

Esta distribuição é muito importante na teoria e na aplicação de estatı́stica.
A distribuição Normal foi inicialmente estudada no século XVIII quando foi observado que os erros de
mensurações seguem uma distribuição em forma de sino. Ela foi apresentada na forma matemática em
1733 por DeMoivre, que derivou-a como uma forma limitante da distribuição binomial. Esta distribuição
foi também descoberta por Laplace por volta de 1775. Devido aos erros históricos, seu descobrimento tem
sido atribuı́do a Gauss, porém suas primeiras publicações com referência a ela apareceu em 1809. Várias
tentativas foram feitas durante os séculos dezoito e dezenove para estabelecer sua distribuição como a lei
básica de probabilidade para todas as variáveis aleatórias; assim o nome normal foi aplicado.
A maioria dos fenômenos da natureza, em especial os biológicos, apresenta variações dentro de um
intervalo definido.
Se coletássemos os dados quanto ao peso de mil indivı́duos, encontrarı́amos diversos valores, dos quais
haveria pequena quantidade de baixos e altos, e grande quantidade em torno dos valores centrais.
Numa representação gráfica dos dados obtidos, encontrarı́amos uma distribuição normal, conforme Figura
5.1.
5.3 Distribuição Normal ROSSI, R. M. 53
Figura 5.1: Distribuição Normal.
A Distribuição de Probabilidade Normal, ou Distribuição Gaussiana (curva de Gauss), se caracteriza por

reunir um grande número de valores em torno da média, que diminuem gradualmente de frequência à medida
que se afastam dela.
A distribuição de probabilidade é dada por:
( )2
1 x−µ
1 −
P (X = x) = √ e 2 σ , − ∞ < x < +∞
σ 2π
X ∼ N (µ, σ)
Lê-se: O conjunto de dados X, têm distribuição Normal com média : µ e desvio-padrão : σ.
Devido a complexidade da função de probabilidade, fazemos uso da Tabela Normal-Padrão ou Normal-
Reduzida, construı́da através da transformação na variável X:
X −µ
Z= ∼ N (0, 1)
σ
Caracterı́sticas:
1. é contı́nua;
2. a curva em forma de sino, que engloba o total de frequências ou 100%;
3. é simétrica: a média (µ) = a moda (Mo ) = a mediana (Md );
4. é unimodal;
5. o desvio-padrão é σ;
6. a curva de inflexão ocorre nos pontos x = µ ± σ;
Como já dissemos, a área subordinada à curva normal representa 100% das frequências. Em torno da
média determinamos intervalos com utilização do desvio-padrão, conforme abaixo:
µ±σ = 68, 26%
µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%
Exemplo 5.3. Pressão sistólica em jovens saudáveis.
Suponha que a pressão arterial sistólica em pessoas jovens gozando de boa saúde tenha distribuição
N (120, 10) mmHg.
Qual é a probabilidade de se encontrar uma pessoa com pressão sistólica acima de 140 mmHg ?
Solução:
X −µ 140 − 120
Z= = =2
σ 10
P (X ≥ 140) = P (Z ≥ 2) = P (Z ≤ −2) = 0, 0228 ou 2, 28%.
Isto é, 2, 28% das pessoas jovens e sadias têm pressão sistólica acima de 140 mmHg.
5.4 Distribuição Exponencial ROSSI, R. M. 54
Exemplo 5.4. O peso ( mg) de um determinado medicamento é denotada por X e é distribuı́da como N(800,
12). Um técnico em farmácia ao testá-lo requer que ele tenha peso de pelo menos 772 mg. Uma amostra do
medicamento é selecionada aleatoriamente e testada.
Solução: Para encontrar P (X ≥ 772), primeiro calculamos:
P (X ≥ 772) = 1 − P (Z < −2, 33) = 1 − 0, 001 = 0, 99.
Figura 5.2: P(X < 772) onde X Ñ(800, 12).
5.4 Distribuição Exponencial

Uma variável aleatória X, que toma todos os valores não negativos, terá uma distribuição exponencial
com parâmetro λ > 0, se sua função de densidade for dada por:
{
λe−λx ; x ≥ 0
f (x) =
0; c.c.
onde o parâmetro λ é uma constante real positiva.

1 1
Sua média é dada por E(X) = e sua variância por V (X) = 2 .
λ λ
Obs.: Uma informação útil é que P (T ≤ x) = 1 − e−λx , x ≥ 0.
Exemplo 5.5. A vida útil de um componente eletrônico pode ser representada por uma função densidade
exponencial com razão de falha 0, 5 falhas por hora (isto é, λ = 0, 5). O tampo médio de falhas, E(X), é
de 2 horas. Suponha que se deseje determinar a fração dos tais componentes que irão falhar antes do tempo
médio ou tempo de vida esperado.
Solução: Como P (T ≤ 2) = 1 − e−0,5×2 = 0, 6321. Neste caso, 63,212% dos ı́tens irão falhar antes de
2 horas.
Figura 5.3: A média de uma distribuição exponencial.

Capı́tulo 6
Inferência Estatı́stica
6.1 Introdução
Inferência Estatı́stica ou Estatı́stica indutiva é a parte da estatı́stica que utiliza métodos cientı́ficos para
fazer afirmações e tirar conclusões sobre caracterı́sticas ou parâmetros de uma população, baseando-se em
resultados de uma amostra. O próprio termo “indutiva” decorre da existência de um processo de indução, isto
é, um processo de raciocı́nio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões
sobre a realidade no todo. O uso de informações da amostra para concluir sobre o todo faz parte da atividade
diária da maioria das pessoas. Basta observar como uma cozinheira verifica se o prato que ela está preparando
tem ou não a quantidade adequada de sal. Ou ainda, quando uma dona de casa, após experimentar um
pedaço de uma laranja numa banca de feira, decide se as compra ou não. Essas são decisões baseadas em
procedimentos amostrais.
O objetivo é procurar a conceituação formal desses princı́pios intuitivos do dia-a-dia para que possam ser
utilizados cientificamente em situações mais complexas.
É fácil perceber que um processo de inferência ou indução ( em estatı́stica) não pode ser exato. A
Inferência Estatı́stica, entretanto, irá dizer até que ponto pode-se estar errando nas inferências, e com que
probabilidade. Esse fato é fundamental para que uma inferência possa ser considerada estatı́stica, e faz parte
dos objetivos da Inferência Estatı́stica.
Em suma, a Inferência Estatı́stica busca obter resultados sobre as populações a partir das amostras,
dizendo também, qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões
obtidas. Evidentemente, a forma como as inferências serão realizadas irá depender de cada tipo de problema,
conforme será estudado posteriormente.
Segue-se que a teoria da Inferência Estatı́stica recorre intensamente a conceitos e resultados do Cálculo
de Probabilidades.
O objetivo da Inferência Estatı́stica é obter afirmações sobre uma dada caracterı́stica da população, na
qual se tem interesse, a partir de informações colhidas de uma amostra.
Essa caracterı́stica de interesse pode ser representada por uma variável aleatória. Se informações completa
sobre a distribuição de probabilidade da variável em estudo, fosse conhecida não haveria necessidade de
colher uma amostra. Toda afirmação desejada seria obtida através da distribuição da variável, usando-se as
propriedades estudadas anteriormente. Mas isso raramente acontece. A informação que se tem a respeito
da variável é parcial ou nada se conhece. Por exemplo, a altura dos brasileiros adultos, apresenta uma
distribuição normal, mas os parâmetros que a caracterizam (média e variância) são desconhecidos. Em
outros casos, pode-se ter uma idéia da média e variância, mas se desconhece a forma da curva. Ou ainda,
não há informações nem sobre os parâmetros, nem sobre a forma da curva. Então, o uso de uma amostra
permite ter uma idéia sobre o comportamento da variável na população.
55
6.2 Noções de Amostragem ROSSI, R. M. 56
6.2 Noções de Amostragem

Uma questão das mais comuns em planejamentos de pesquisas cientı́ficas é: Por que amostragem?
São quatro as principais razões para o uso de amostragem em levantamento de grandes populações:
Economia. Em geral, torna-se bem mais econômico o levantamento de somente uma parte da população.
Tempo. Em geral a pesquisa por amostragem é bem mais rápida que o censo. Numa pesquisa eleitoral,
a três dias de uma eleição presidencial não haveria tempo suficiente para pesquisar a população de eleitores
do paı́s, mesmo que houvesse recurso financeiros em abundância.
Confiabilidade dos dados. Quando se pesquisa uma número reduzido de elementos, pode-se dar mais
atenção aos casos individuais, evitando erros nas respostas.
Operacionalidade. É mais fácil realizar operações de pequena escala. Um dos problemas tı́picos nos
grandes censos é o controle dos entrevistados.
Situações em que o uso da amostragem NÃO é interessante
População pequena. Sob o enfoque de amostragem aleatórias que será estudado no próximo item,
se a população for pequena (digamos de 50 elementos ou menos) para se ter uma amostra capaz de gerar
resultados precisos para os parâmetros da população, será necessário uma amostra relativamente grande (em
torno de 80% da população).
Caracterı́stica de fácil mensuração. Mesmo que a população não seja tão pequena, mas a variável
que se quer observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por
exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de
trabalho, pode-se entrevistar toda a população no próprio local de trabalho.
Necessidade de alta precisão. A cada dez anos o IBGE realiza um censo demográfico para estudar
diversas caracterı́sticas da população brasileira. Dentre estas caracterı́sticas têm-se o parâmetro número de
habitantes residentes no paı́s, que é fundamental para o planejamento do paı́s. Desta forma este parâmetro
precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.
6.2.1 Plano de Amostragem

Para se fazer um plano de amostragem é necessário ter bem definidos os objetivos da pesquisa, a população
a ser amostrada, bem como os parâmetros que precisam ser estimados para atingir os objetivos da pesquisa.
Num plano de amostragem deve constar a definição da unidade de amostragem, a forma de seleção dos
elementos da população e o tamanho da amostra.
Amostras Probabilı́sticas e Não Probabilı́sticas
A seleção dos elementos que farão parte da amostra pode ser feita sob alguma forma de sorteio ou
por escolha deliberada. As amostras obtidas através de algum tipo de sorteio são chamadas amostras
probabilı́sticas ou aleatórias.
Estes tipos de amostragens são particularmente interessante por permitir a utilização das técnicas clássicas
inferência estatı́sticas, facilitando a análise dos dados e fornecendo maior segurança ao generalizar resultados
da amostra para a população.
As amostras não aleatórias ou não probabilı́sticas podem levar a resultados úteis, não se prestam, entre-
tanto, à utilização de processos estatı́sticos inferências.
Exemplo 6.1. Exemplos de casos de amostragens não probabilı́sticas:
• Amostragem sem critério (escolha desordenada);
• Amostragem intencional ou por conveniência (o pesquisador escolhe certos elementos para a amostra);
• Amostragem com desigualdade de acesso aos elementos da população (há elementos com mais facilidade
de figurarem na amostra);
• Outras.
Alguns Tipos de Amostragens Probabilı́sticas
6.2.2 Amostragem Aleatória Simples (AAS)

Para a seleção de uma amostra aleatória simples é necessário ter uma lista completa dos elementos da
população (ou de unidades de amostragens apropriadas). Este tipo de amostragem consiste em selecionar a
amostra através de um sorteio, sem restrição
Seja uma única população com N elementos. Uma forma de extrair uma amostra aleatória simples de
tamanho n, sendo n < N , é identificar os elementos da população em pequenos pedaços de papel e retirar,
ao acaso, n pedaços. Será considerado sorteio realizado sem reposição.
A amostragem aleatória simples tem a seguinte propriedade: qualquer subconjunto da população, com
o mesmo número de elementos, tem a mesma chance de fazer parte da amostra. Em particular tem-se que
cada elemento da população tem a mesma probabilidade de pertencer à amostra.
O uso de tabelas de números aleatórios
As tabelas de números aleatórios facilitam o processo de seleção de uma amostra aleatória simples. Tais
tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, 3, ..., 9}, com reposição. Uma
parte destas tabelas é apresentada a seguir.
Figura 6.1: Esquema de uma Amostragem Aleatória Simples e uma Tabela de Números Aleatórios.
Procedimento:
1. Numere todos os elementos da população;
2. Sorteie uma linha ou coluna da tabela de números aleatórios;

3. Leia os números na tabela de números aleatórios de modo que o número de algarismos em cada um
seja igual ao número de algarismos do último da sua listagem. Assim, se o último número é 56, devem
ser lidos números com dois algarismos;
4. Despreze quaisquer números que não correspondam a números da lista. No caso de amostragem sem
reposição, despreze também os números que sejam repetições de números lidos anteriormente. Continue
o processo até obter o número desejado de observações;
5. Use os números assim escolhidos para identificar os ı́tens da lista a serem incluı́dos na amostra.
6.2.3 Amostragem Aleatória Simples Sistemática (AASist)

Muitas vezes é possı́vel obter uma amostra de caracterı́sticas parecidas com a amostra aleatória simples,
por um processo bem mais rápido. Por exemplo, tirar uma amostra de 1.000 fichas, dentre uma população
de 5.000 fichas, pode-se tirar, sistematicamente, uma ficha a cada cinco (5.000/1.000 = 5). Para garantir
que cada ficha da população tenha a mesma probabilidade de pertencer á amostra, a primeira ficha deve ser
sorteada, dentre as cinco primeiras.
Numa amostragem sistemática a relação N/n é chamada intervalo de seleção. No exemplo das fichas o
intervalo de seleção é 5.000/1.000 = 5.
Figura 6.2: Esquema de uma Amostragem Aleatória Sistemática.
6.2.4 Amostragem Aleatória por Conglomerados (AAC)

A população é dividida em diferentes conglomerados (grupos), extraindo-se uma amostra apenas dos
conglomerados selecionados, e não de toda a população. O ideal seria que cada conglomerado representasse
tanto quanto possı́vel o total da população. Na prática, selecionam-se os conglomerados geograficamente.
Escolhem-se aleatoriamente algumas regiões, em seguida algumas sub-regiões e finalmente, alguns lares.
Esse processo possibilita ao pesquisador entrevistar apenas poucas pessoas.
Suponha que desejamos selecionar uma amostra de domicı́lios na cidade de Maringá. Para se proceder,
a seleção precisamos de uma lista atualizada dos endereços dos domicı́lios.
A elaboração dessa lista é uma tarefa que requer um considerável esforço fı́sico e financeiro. É muito mais
conveniente identificarmos no mapa da cidade alguns conglomerados naturais ou seja, as ruas ou quarteirões.
Algumas vezes é possı́vel a construção de conglomerados, nesse caso a melhor técnica consiste em se
colocar num mesmo conglomerado unidades elementares com caracterı́sticas ou valores bem diferentes. Isto
é justamente o princı́pio oposto da estratificação onde os estratos eram formados com unidades elementares
com caracterı́sticas ou valores bem próximos. Se cada conglomerado é uma miniatura da população, nó
podemos fazer boas estimativas pela seleção de poucos conglomerados.
No entanto rara são às vezes que temos oportunidade de construir conglomerados, pois na maioria dos
casos somos obrigados a nos valer de conglomerados naturais, como ruas, quarteirões ou municı́pios. Isso
devido ao fato de que é necessário se ter os limites dos conglomerados plenamente identificados no campo.
Normalmente os conglomerados naturais não são tão eficientes, por exemplo as pessoas que moram numa
mesma rua tem aproximadamente as mesmas caracterı́sticas (renda). Esse fato faz com que o conglomerado
seja internamente bem homogêneo.
Figura 6.3: Congromerados da cidade de Maringá e Região.
6.2.5 Amostragem Aleatória Estratificada (AAE)

A técnica de amostragem estratificada consiste em dividir a população em subgrupos, que são denomi-
nados de estratos. Estes estratos devem ser internamente mais homogêneos do que a população toda, com
respeito às variáveis em estudo. Por exemplo, para estudar alguns parâmetros, de um conjunto de hotéis,
pode-se estratificar esta população por quantidade de estrelas, pelo tipo de acomodações (quarto, aparta-
mento, chalé etc), ou pela distância até o cento da cidade. Deve-se escolher um critério de estratificação
que forneça estratos bem homogêneos, com respeito ao que se está estudando. Neste contexto, um prévio
conhecimento sobre a população em estudo é fundamental. Sobre os diversos estratos da população, são
realizadas seleções aleatórias, de forma independente. A amostra completa é obtida através da agregação
das amostras de cada estrato
Amostragem Aleatória Estratificada Proporcional (AAEp)

Neste caso particular de amostragem estratificada, a proporcionalidade do tamanho de cada estrato da
população é mantida na amostra.
Por exemplo: se um estrato corresponde a 20% do tamanho da população ele também deve corresponder
a 20% da amostra.
A amostragem estratificada proporcional garante que cada elemento da população tem a mesma probabi-
lidade de pertencer a amostra e a soma dos tamanhos dos subgrupos na amostra deve ser igual ou maior ao
tamanho da amostra. Desde que no problema em estudo, os estratos formam subgrupos mais homogêneos
do que a população como um todo, uma amostra estratificada proporcional tende a gerar resultados mais
precisos, quando comparada com uma amostra aleatória simples.
Figura 6.4: Ilustração de uma amostragem estratificada proporcional.

Exemplo 6.2. A população de N=1.200 indivı́duos de uma escola é composta por 20% de professores, 20%
de servidores e 60% de alunos. Separam-se os grupos e sorteia-se uma amostra de tamanho 10% de N, com
24 professores, 24 servidores e 72 alunos.
Figura 6.5: Ilustração de uma amostragem estratificada proporcional dos indivı́duos de uma escola.
FONTES DE ERROS
O erro amostral, definido como a diferença entre uma estatı́stica (calculada a partir de uma amostra de
n elementos) e o verdadeiro valor do parâmetro (caracterı́stica de uma população de N elementos), parte do
princı́pio de que as n observações que compõem a amostra são obtidas sem erro. Na prática, isso geralmente
não acontece.
Havendo erros ou desvios nos dados da própria amostra, a diferença entre a estatı́stica e o parâmetro
pode ser maior que o limite tolerável, que será usado para o cálculo do tamanho da amostra. Por isso, o
planejamento e a execução da pesquisa devem ser feitos com muita cautela, para evitar ou reduzir, os erros
nos próprios dados da amostra, conhecidos como erros não amostrais. Alguns dos erros são:
• População acessı́vel diferente da população alvo;

Exemplo: Em uma pesquisa sobre febre amarela no Amazonas, a investigação se dá no centro da cidade
ao invés de ser a beira dos rios e/ou mata.
• Falta de resposta;
Exemplo: Geralmente em questionários em que não há orientação ao indivı́duo selecionado, ou então
quando a pergunta cria dúvida ou constrangimento em sua resposta.
• Erros de mensuração;
Exemplo: Aparelhos desajustados e/ou cansaço do experimentador (ou inexperiência).
• Efeito placebo;
Exemplo: O indivı́duo ”acredita” realmente que tomou o medicamento com o princı́pio ativo, certo
que obteve melhoras significativas (efeito psicológico).
• Efeito experimentador;
Exemplo: Quando o pesquisador (dono de uma empresa, por exemplo) influencia involuntariamente
nas respostas ao questionar se o seu funcionário está satisfeito com salário.
6.3 Distribuição Amostral ROSSI, R. M. 61
6.3 Distribuição Amostral

Já foi visto, que o problema da Inferência Estatı́stica é fazer uma afirmação sobre parâmetros da população
através da amostra. Suponha que uma afirmação deva ser feita sobre um parâmetro populacional (média,
variância ou qualquer outra medida). Será utilizado uma amostra aleatória simples, com reposição, de n
elementos sorteados dessa população. A decisão será baseada em uma estatı́stica calculada em função da
amostra, (X1 , X2 , ..., Xn ).
A validade da resposta seria melhor compreendida se fosse conhecido o que acontece com a estatı́stica,
quando todas as amostras de uma população conhecida são retiradas, segundo o plano amostral adotado.
Isto é, qual a distribuição da estatı́stica quando (X1 , X2 , ..., Xn ) assume todos os valores possı́veis. Esta
distribuição é chamada de distribuição amostral da estatı́stica e desempenha papel fundamental na teoria
de Inferência Estatı́stica. Didaticamente, tem-se o seguinte esquema:
1. Uma população X, com um certo parâmetro de interesse;

2. Todas as amostras retiradas da população, de acordo com um certo procedimento;
3. Para cada amostra, calcula-se o valor da estatı́stica;
4. Os valores da estatı́stica formam uma nova população, cuja distribuição recebe o nome de distribuição
amostral da estatı́stica.
Para a obtenção das distribuições amostrais em sua forma matemática, precisamos entender o Teorema
do Limite Central.
6.3.1 Distribuição Amostral da Média

Considere uma população identificada pela variável X, cujos parâmetros média populacional (µ ) e
variância (σ 2 ), são supostamente conhecidos. Todas as possı́veis amostras aleatórias simples de tamanho n
dessa população, devem ser retirada e para cada uma deve-se calcular x, a média da amostra. Em seguida,
será construı́do a distribuição amostral de e estudadas as suas propriedade.
Teorema do Limite Central
Teorema. Para amostras aleatórias simples (X1 , X2 , ..., Xn ), retiradas de uma população com média
µ e variância σ 2 , a distribuição amostral da média aproxima-se de uma distribuição Normal com média µ e
σ2
variância , quando n → ∞, isto é
n ( )
σ2
X̄ ∼ N µ; .
n
∑
n x1 + x2 + ... + xn σ2
Prova: X̄ = 1
n xi = → E(X̄) = µ e V ar(X̄) = .
i=1 n ( ) n
( ) σ2
Portanto se X ∼ N µ; σ 2 , então X̄ ∼ N µ; ou
n
X̄ − µ
Z= σ Ñ (0; 1) .
√
n
Figura 6.6: Distribuição Amostral.
Verificação da Adequação do Modelo

Na prática não podemos fazer suposições arbitrárias a respeito da distribuição de probabilidade dos
dados, logo usamos de técnicas para fazer uma verificação da adequação do modelo suposto.
A verificação pode ser baseada nas caracterı́sticas do modelo, em gráficos especiais e em testes de
aderência.
Para a distribuição Normal, em especial, sabemos que:
µ±σ = 68, 26%

µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%
Figura 6.7: Faixa de Referência.
Grandes discrepâncias entre as frequências relativas observadas e as probabilidades teóricas acima citadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.
Outros critérios:
• Técnicas Gráficas: Normal-plot, Q-Q-plot e P-P-plot;
• Testes de aderência: Kolmogorov-Smirnov (K-S) [µ e σ conhecidos], Shapiro Wilks (W) e/ou Lilliefors
(L) [µ e σ desconhecidos e estimados pelos dados através de x̄ e s, respectivamente].
Faixas de Referência
Toda medida laboratorial é analisada confrontando-se seu valor com uma faixa padrão.
Isto é tão comum que, na própria apresentação do resultado, muitos laboratórios já indicam os limites
inferiores e superiores para o valor da medida que devem servir de base ao raciocı́nio clı́nico.
• Devemos fixar, inicialmente, o nı́vel de confiança (1 − α)% ou cobertura;
• Calculamos através da amostra de pessoas supostamente saudáveis: x̄ e s.

Tabela 6.1: Faixas de Referência.

Cobertura (1 − α)% Faixa
90% x̄ ± 1, 64.s
95% x̄ ± 1, 96.s
99% x̄ ± 2, 58.s
.. ..
. .
(1 − α)% x̄ ± Z α2 .s
Exemplo 6.3. Faixa de referência para identificar o Pseudomonas sp.

Um pesquisador deseja criar um padrão para identificar presença de infecção bacteriana (Pseudomonas
sp) no trato respiratório através de cultura de escarro. Para isto, coletaram-se dados de pessoas sabidamente
sadias e determinou-se o número de colônias encontradas em cada cultura. Foram encontrados os seguintes
resultados, em duas etapas amostrais distintas.
Amostra 1:
20 21 23 24 25 25 25 25 25 25
26 26 27 28 29 29 29 29 29 30
30 30 30 30 30 31 31 31 32 32
32 32 32 33 33 33 34 34 34 35
35 35 36 36 37 37 38 38 41 42
Amostra 2:
17 22 23 23 23 23 24 24 24
24 24 23 25 25 25 25 25 25
25 26 28 28 29 30 30 31 31
35 35 35 36 40 41 41 41 42
51 54 56 56 56 58 60 68 79
0.10
Q-QPlot
40
0.08
35
Freqüências
0.06
amostra
30
0.04
25
0.02
0.0
20
20 25 30 35 40 -2 -1 0 +1 +2
Figura 6.8: Histograma e Q-Q Plot da Amostra 1
Observe através da Figura 6.8 o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição Normal.
Para a Amostra 1, foram realizados alguns testes de normalidade com uso de um software estatı́stico e
indicaram ajuste dos dados já (mais detalhes serão apresentados no capı́tulo referente a Testes de Hipóteses).
Observe através da Figura 6.9 uma assimetria do histograma comparado à normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
normal. Testes confirmam isto para a Amostra 2.
Neste caso duas metodologias distintas deverão ser utilizadas para construir faixas de referência:
0.05
Q-=Q Plot
70
0.04
60
0.03
Freqüências
amostra2
50
0.02
40
30
0.01
20
0.00
20 40 60 80 -2 -1 0 1 2
Figura 6.9: Histograma e Q-Q Plot da Amostra 2
• Método de Gauss para a Amostra 1:
[x̄ ± 1, 96s] : [30, 7 ± 1, 96(4, 9)]

[21; 40] colônias - “Adequado”
Observe que devido a normalidade temos praticamente a mesma faixa, utilizando o método dos per-
centis:
Sendo assim, considerando esse método, um indivı́duo será considerado ”doente” se tiver com o número
de colônias acima de 41 unidades.
• e Método dos Percentis para a Amostra 2, isto é, obter uma faixa de inclua, por exemplo, 95% dos
elementos, excluindo os 2,5% valores menores e os 2,5 % maiores valores
Considerando esse método, um indivı́duo na amostra 2 será considerado ”doente” se tiver com o número
de colônias acima de 68 unidades.
Observe que, se optássemos pelo método de gauss para a amostra 2 terı́amos:
[7; 63] colônias - “Inadequado”
Um teste estatı́stico a ser usado depende do tipo de variável e do tipo de planejamento.
6.3.2 Distribuição Amostral da Diferença de Médias

Analogamente ao caso da média, consideremos o caso em que temos duas populações de modo que o
caráter que estudamos em ambas (X1 e X2 ) são v.a. distribuı́das conforme as leis gaussianas:
( )
X1 ∼ N µ1 ; σ 21
( )
X2 ∼ N µ2 ; σ 22
De cada uma dessas populações, extraem-se, mediante amostragem aleatória simples, amostras que não
têm por que serem necessariamente do mesmo tamanho (respectivamente, n1 e n2 ): X̄1 e X̄2 , então: consi-
derando que σ 21 = σ 22 = σ 2 , tem-se que:
( )
X̄1 − X̄2 − (µ1 − µ2 )
Z= √ ∼ N (0; 1) .
σ n11 + n2
1
Quando as variâncias das populações são desconhecidas, mas podemos assumir que, pelo menos, são
iguais, a seguinte estatı́stica distribui-se como uma t de Student com n1 + n2 − 2 graus de liberdade, isto é:
( )
X̄1 − X̄2 − (µ1 − µ2 )
T = √ ∼ tn1 +n2 −2
Ŝ n11 + n2
1
em que Ŝ 2 é a quase-variância amostral ponderada de Ŝ12 e Ŝ22 :
(n1 − 1)Ŝ12 + (n2 − 1)Ŝ22

Ŝ 2 = .
n1 + n2 − 2
6.3.3 Distribuição Amostral da Proporção

Seja uma população em que a proporção de elementos portadores de uma certa caracterı́stica é p. Assim,
a população pode ser considerada como a variável aleatória X, tal que:
{
1, se o indivı́duo possui a caracterı́stica;
X:
0, se o indivı́duo não possui a caracterı́stica.
assim, para n suficientemente grande, pelo Teorema Limite Central, a variável aleatória X que conta o
número de sucessos na amostra terá a distribuição Normal com média np e variância np(1 − p), ou seja,
ˆ
X ∼ N (np; np(1 − p)). Assim, para n → ∞, pode-se considerar a distribuição amostral de p como:
( )
ˆ p(1 − p)
p ∼ N p; .
n
X
em que a proporção de indivı́duos portadores da caracterı́stica na amostra é dada por: p̂ = .
n
6.4 Intervalo de Confiança ROSSI, R. M. 66
6.4 Intervalo de Confiança

Utilizando-se deste teorema, podemos construir um Intervalo de Confiança de (1 − α)% para o parâmetro
de interesse, para um nı́vel de significância, α, fixo.
6.4.1 Intervalo de Confiança para Média

Se a população original é próxima da normal, sua convergência é rápida; já, se a distribuição da população
tem outra distribuição, essa convergência é mais demorada. Como regra prática, aceita-se que para amostras
com mais de 30 elementos a aproximação já pode ser considerada muito boa.
σ
IC(µ) : X̄ ± Z α2 √
n
já que
X̄ − µ
Z= σ ∼ N (0; 1) .
√
n
Figura 6.10: Intervalo de Confiança.
Exemplo 6.4. Sabe-se que o peso dos recém-nascidos segue uma distribuição normal com um desvio padrão
de 0,75 kg. Se em uma amostra aleatória simples de 100 deles, se obtém uma média amostral de 3 kg e um
desvio padrão de 0,5 kg, o IC(µ) com uma confiança de 95% é dado por:
σ 0, 75
IC(µ) : X̄ ± Z α2 √ = 3 ± 1, 96 √ = 3 ± 0, 147 : [2, 853; 3, 147]kg.
n 100
No caso de amostras pequenas ou no desconhecimento da dispersão populacional, usa-se uma aproximação
através da distribuição t de Student, substituindo σ por s, desvio-padrão amostral.
s
IC(µ) : X̄ ± t(n−1; α2 ) √ .
n
Exemplo 6.5. Suponha o exemplo anterior em que não se conheça a dispersão populacional, assim o IC(µ)
com uma confiança de 95% é dado por:
s 0, 5
IC(µ) : X̄ ± t(n−1; α2 ) √ = 3 ± t(99;2,5%) √ = 3 ± 1, 98(0, 05) : [2, 901; 3, 099]kg.
n 100
6.4 Intervalo de Confiança ROSSI, R. M. 67
6.4.2 Intervalo de Confiança para Diferença de Médias

Se (1 − α)% é o nı́vel de significância com que desejamos estabelecer o intervalo para a diferença das
duas médias, calculamos o valor tn1 +n2 −2 que deixa além de si α/2 da massa da probabilidade de Tn1 +n2 −2 ,
o intervalo de confiança para variâncias desconhecidas será:
√
( ) 1 1
IC(µ1 − µ2 ) : X̄1 − X̄2 ± tn1 +n2 −2; 2 Ŝ
α +
n1 n2
(n1 − 1)Ŝ12 + (n2 − 1)Ŝ22

sendo Ŝ 2 = .
n1 + n2 − 2
Exemplo 6.6. Deseja-se estudar a influência que pode exercer o tabaco no peso de crianças ao nascer. Para
isso, consideram-se dois grupos de mulheres grávidas (um de fumante e outro de não-fumante) e obtém-se
os seguintes dados sobre o peso (X) de seus filhos:
Mães fumantes → n1 = 35, X̄1 = 3, 6 kg, Ŝ1 = 0, 5 kg
Mães não-fumantes → n2 = 27, X̄2 = 3, 2 kg, Ŝ2 = 0, 8 kg
Em ambos os grupos, os pesos dos recém-nascidos provém de distribuições normais de médias desconhe-
cidas e com variâncias que, embora sejam desconhecidas, podemos supor que sejam as mesmas. É possı́vel
determinar quanto a mãe fumante influi no peso de seu filho !
(n1 − 1)Ŝ12 + (n2 − 1)Ŝ22 (35 − 1)0, 52 + (27 − 1)0, 82
Solução: Ŝ 2 = = = 0, 419 → Ŝ = 0, 6473.
n1 + n2 − 2 35 + 27 − 2
Considerando um nı́vel de confiança de 5%, √ o IC(µ1 − µ2 ) será dado por:
IC(µ1 − µ2 ) : (3, 6 − 3, 2) ± t60;2,5% 0, 6473 351 1
+ 27 = 0, 4 ± 2(0, 6473)(0, 256)
IC(µ1 − µ2 ) : 0, 4 ± 0, 3316 : [0, 068; 0, 731] kg, com o qual pode-se dizer que em um filho de mãe não-
fumante supera o de mãe fumante, está compreendido, com um nı́vel de confiança de 95%, entre 0,068 kg e
0,731 kg.
6.4.3 Intervalo de Confiança para Proporção

Analogamente ao processo de obtenção do IC para a média, podemos obter um IC com uma confiança
de (1 − α)%, para a proporção populacional, considerando um nı́vel de significância, α, fixo:
√
p̂(1 − p̂)
IC(p) : p̂ ± Z α2 .
n
Exemplo 6.7. Deseja-se estimar o resultado de um referendo mediante uma sondagem. Para isso, realiza-
se uma amostragem aleatória simples com n=100 pessoas e obtêm-se 35% que votarão a favor e 65% que
votarão contra (supomos que não haja indecisos para simplificar o problema a uma variável dicotômica).
Com um nı́vel de significância de 5%, o Intervalo de Confiança para a proporção de favoráveis é dado por:
√
35 0, 35(1 − 0, 35)
IC(p) : ± 1, 96 = 0, 35 ± 0, 093 : [25, 7; 44, 3]%.
100 100
Portanto, estima-se com 95% de confiança que a proporção de favoráveis ao referendo é de no mı́nimo 25,7%
e no máximo 44,3% ou de 35% com uma margem de erro de 9,3% para mais ou para menos.
6.5 Tamanho da Amostra ROSSI, R. M. 68
6.5 Tamanho da Amostra

O assunto pertence à Teoria da Amostragem. Pode-se, entretanto, calcular, para algumas situações
especiais, o tamanho da amostra necessário para se fazer inferências.
6.5.1 Método Simples

Tamanho de uma amostra aleatória simples. Será abordado cálculo do tamanho da amostra para
amostragem aleatória simples.
A diferença entre a estatı́stica descritiva dos elementos da amostra e o verdadeiro valor do parâmetro
que se deseja estimar como o erro amostral. Para determinar o tamanho da amostra o pesquisador deve
especificar o erro amostral tolerável, ou seja, quanto ele admite errar na avaliação dos parâmetros de
interesse.
A especificação do erro amostral tolerável deve ser feita sob um enfoque probabilı́stico, pois por maior
que seja a amostra, existe sempre o risco do sorteio gerar uma amostra com caracterı́sticas bem diferentes
da população de onde ela foi extraı́da.
O calcular do tamanho mı́nimo de uma amostra aleatória simples é dado por:
Sejam:
N: tamanho (número de elementos) da população;
n: tamanho (número de elementos) da amostra;
n0 : uma primeira aproximação do tamanho da amostra, e
E0 : erro amostral tolerável.
onde
1
n0 = .
E0
Conhecendo N o tamanho da população, pode-se corrigir o cálculo:
N n0
n= .
N + (n0 − 1)
Exemplo 6.8. Com objetivo de conhecer algumas caracterı́sticas dos pacientes de uma clı́nica com 35
pacientes. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas
caracterı́sticas da população de pacientes. Qual deve ser o tamanho mı́nimo da amostra aleatória simples,
tal que se possa admitir, com alta confiança, que os erros amostrais não ultrapassem 4% (E0 = 0,04)?
Solução: Uma primeira aproximação é dada por:

1
n0 = = 625 pacientes.
0, 042
Corrigindo, em função do tamanho N da população, tem-se:
35(625)
n= ≃ 34.
35 + 624
Exemplo 6.9. Suponha que na clinica do Exemplo anterior a população fosse de N = 200 pacientes. Qual
deve ser o tamanho mı́nimo da amostra aleatória simples, tal que se possa admitir, com alta confiança, que
os erros amostrais não ultrapassem 4% (E0 = 0, 04)?
Solução: O valor de n0 continua sendo o mesmo do exemplo anterior, pois não depende de N . Fazendo
a correção em termos do novo valor de N , tem-se:
200(625)
n= ≃ 152.
200 + 624
Exemplo 6.10. Suponha agora que a população fosse de N = 200.000 pacientes.
Solução: Da mesma forma, o valor de n0 continua sendo o mesmo dos exemplos anteriores. E a correção
em termos do novo valor de N , é:
200.000(625)
n= ≃ 623 pacientes.
200.000 + 624
Observe que para manter o mesmo erro amostral, no Exemplo ?? foi necessária uma amostra abrangendo
quase 100% da população; enquanto no Exemplo 6.9 a amostra abrange 76%; e no Exemplo 6.10 abrange
0,3% da população. É, portanto, errônea a idéia de que para uma amostra ser representativa
deva abranger uma percentagem fixa da população.
Tamanho da amostra em subgrupos da população
É muito comum termos interesse em estudar separadamente certos subgrupos da população. Nesta
situação, é preciso calcular o tamanho da amostra para cada uma destas partes. O tamanho total da
amostra vai corresponder à soma dos tamanhos das amostras de cada parte.
O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos
subgrupos da população, por isso, é comum o pesquisador não ser muito exigente na precisão das estimativas
nos subgrupos, tolerando erros amostrais maiores.
6.5.2 Método Inferencial

Erro Tipo I e Tipo II
Muitas vezes temos necessidade de saber:
• Que estatı́sticas serão utilizadas e retiradas dessa amostra?

• Qual o comportamento desta estatı́stica? é razoável?
Dois tipos de erros podem ser cometidos em um TH:
H0
Decisão Verdadeira Falsa
Correto
Não Rejeitar Erro tipo II: β
Probabilidade: (1 − α)
Correto
Rejeitar Erro tipo I: α
Probabilidade: (1 − β)
Figura 6.11: Erro tipo I e Erro tipo II.

Tamanho da Amostra para estimar a Média e a Proporção

Se o objetivo é estimar a média, ou uma proporção, pode-se usar os intervalos de confiança anteriormente
estabelecidos para obter n, o tamanho da amostra. Para isto, é preciso fixar o maior erro aceitável e o nı́vel
de confiança com que se quer trabalhar.
Sendo o tamanho máximo do erro aceitável : e (fixo), com probabilidade (1 − α) (fixo), o intervalo de
confiança de nı́vel 100(1 − α)% serão, respectivamente, para a média e para a proporção, considerando a
população infinita, tem-se:
[ ]
Z α2 so 2 so
Média: n= onde e = Z α2 √
e n
[ ] [ ]
Z α2 2 Z α2 2
Proporção: n= p̂0 (1 − p̂0 ) ou n≤ se p̂ é desconhecido.
e 2e
onde p̂0 e so são estimativas da proporção e da dispersão, respectivamente, obtidos através de uma amostra
piloto, ou de informações populacionais.
Exemplo 6.11. Numa amostra de classificação de veteranos de um colégio com. x̄ = 2, 6 e so = 0, 3, qual

deve ser o tamanho da amostra para que tenhamos 95% de confiança em que erro da estimativa de µ não
supere 0,05?
Solução:
[ ]2
Z α2 so
n =
e
[ ]2
1, 96(0, 3)
=
0, 05
≃ 139.
Exemplo 6.12. Suponha que, em uma amostra de 500 famı́lias que possuem aparelho de televisão em certa
cidade, haja 340 com televisor em cores. Se o objetivo é estimar o número de famı́lias que possuem televisor
em cores, qual o tamanho da amostra necessário para que tenhamos 95% de confiança em que o erro da
estimativa não seja superior a 0,02 ?
Solução: Trate as 500 famı́lias como uma mostra preliminar que fornece a estimativa p̂0 = 0, 68. Então:
[ ]2
Z α2
n = p̂0 (1 − p̂0 )
e
[ ]2
1, 96
= 0, 68(0, 32)
0, 02
≃ 2.090.
Para o caso em que a população é finita (N conhecido), onde a amostragem é sem reposição, temos as
fórmulas para o cálculo do tamanho amostral, respectivamente, para a média e para a proporção:
( )2
N Z α2 so
Média: n= ( )2 ;
(N − 1)e2 + Z α2 so
( )2 ( )2
N p̂0 q̂0 Z α2 N Z α2
Proporção: n= ( )2 ou n ≤ ( )2 se p̂0 for desconhecido.
p̂0 q̂0 Z α2 + (N − 1)e2 Z α2 + 4(N − 1)e2
Alternativamente, temos tanto para o caso em que estudamos variáveis quantitativas discretas, quanto
contı́nuas, utilizamos as fórmula descritas anteriormente, e tomamos n = n0 , e conhecendo N , o cálculo de
n, tamanho amostral poderá ser obtido através de:
N n0
n= .
N + (n0 − 1)
Exemplo 6.13. Determinado trabalho, realizado para investigar a prevalência de hansenı́ase em trabalha-
dores rurais, apresentou um valor igual a 22%. Para estimar o tamanho da amostra para novo projeto sobre
hansenı́ase, desejamos um nı́vel de confiança de 95% e erro de amostragem de 5%. Determine n, o tamanho
da amostra necessária para uma população de tamanho N = 100.000.
Solução:
[ ]2
Z α2
n0 = p̂0 (1 − p̂0 )
e
[ ]2
1, 96
n0 = 0, 22(0, 78)
0, 05
n0 ≃ 264,
logo, o tamanho da amostra corresponderá a:
100.000(264)
n =
1 + 263
n ≃ 253.
Por definição o Poder do teste é: 1 − β e na prática, utilizam-se valores entre 80% a 90% no cálculo
dos tamanhos amostrais para a Média e para a Proporção, agora podem ser dados, respectivamente por:
[( ) ]2
Z α2 + Zβ s0
Média: n0 = ;
e
[ √ √ ]2
Z α2 p0 (1 − p0 ) + Zβ p1 (1 − p1 )
Proporção: n0 =
e
e = p1 − p0 ;
p0 : proporção presumida da população (referente a H0 );
p1 : é a alternativa ou proporção esperada na população.
Exemplo 6.14. Suponha que desejemos testar a hipótese nula H0 : µ = 180 mg/100 ml ao nı́vel de
significância α = 1%. Neste contexto µ é o nı́vel médio sérico de colesterol da população de homens de 20 a
74 anos. O desvio-padrão é σ = 46 mg/100 ml. Se uma amostra piloto indica que o nı́vel médio sérico de
colesterol é de 201 mg/100 ml (e = 201 − 180 = 21), queremos adotar um poder do teste de 95%. Qual o
tamanho da amostra para inferir em uma população de 1.500 indivı́duos?
[( ) ]2 [ ]2
Z α2 + Zβ s0 (2, 58 + 1, 65) 46
n0 = = n0 = ≃ 85,
e 201 − 180
e corrigindo para N, temos:

1.500(85)
n= ≃ 81.
1 + 84
Exemplo 6.15. A proporção de pacientes com câncer nos pulmões abaixo dos 40 anos no diagnóstico, que
sobrevivem pelo menos 5 anos é conhecida e igual a p0 = 8, 2%. Deseja-se testar essa hipótese baseado em
dados de uma amostra que acusou uma proporção de p1 = 20%. Qual o tamanho desta amostra, considerando
um nı́vel de confiança de 99% e um poder do teste com 95%?
[ √ √ ]2
Z α2 p0 (1 − p0 ) + Zβ p1 (1 − p1 )
n0 =
e
[ √ √ ]2
2, 57 0, 082(0, 918) + 1, 65 0, 2(0, 8)
n0 = ≃ 134.
0, 2 − 0, 082
Tamanho da Amostra Ensaios Clı́nicos

Aqui devem ser considerados outros fatores.
n0 : tamanho amostral;
n2
r : razão entre grupos controles (n2 ) e os casos (n1 ), ou seja: r = ;
n1
p0 : proporção de indivı́duos não-expostos (ou controles);
p1 : proporção de indivı́duos expostos (ou tratados);
p1 + rp0
p̄ = ;
1+r
s0 : desvio-padrão obtida através de uma amostra piloto;
α : nı́vel de significância ou erro tipo I (1%, 5%, 10%, ...);
β : erro tipo II (10%, 15%, 20%, ...);
e : erro máximo de estimação.
Tamanho de amostra para duas médias:
( )2
Z α2 + Zβ s20 (r + 1)
n0 = ;
e2 r
Tamanho de amostra para duas proporções:

( )2
Z α2 + Zβ (r + 1)
n0 = p̄(1 − p̄).
e2 r
Exemplo 6.16. Com objetivo de comparar médias de teor de hemoglobina devido a dois tratamentos dis-
tintos, um experimento será realizado com duas amostras independentes.Sabe-se que α = 0, 05, e portanto
n2
Z α2 = 1, 96; β = 0, 20, ou seja, um poder de 80%, portanto Zβ = 0, 84; r = = 3, ou seja, 3 controles
n1
para cada caso; s0 = 1, 5 mg variação observada em estudos anteriores; e = 0, 5 mg erro máximo desejado,
assim, tem-se que:
2 2
(1, 96 + 0, 84) (1, 5) (3 + 1)
n= ≃ 94.
(0, 5)2 3
Portanto, o grupo tratado deverá ter 94 indivı́duos, enquanto o grupo controle, o triplo : 282.
Exemplo 6.17. Um ensaio clı́nico aleatório será realizado e para a determinação do tamanho das amostras,
n2
as seguintes informações foram utilizadas: α = 0, 05; β = 0, 10, ou seja, Zβ = 1, 28; r= = 2; p0 = 0, 40 e
n1
p1 = 0, 60; e = 0, 20, assim tem-se:
2
(1, 96 + 1, 28) (2 + 1)
n= ≃ 98.
(0, 2)2 2
Portanto, o grupo tratado deverá ter 98 indivı́duos, enquanto o grupo controle, o dobro : 196.
6.6 Testes de Hipóteses ROSSI, R. M. 73
6.6 Testes de Hipóteses

Frequentemente é necessário tomar decisões sobre parâmetros ou distribuições populacionais com base
em informações amostrais, as quais são denominadas decisões estatı́sticas. Na tomada de decisões, são
formuladas hipóteses que serão rejeitadas ou não rejeitadas. Tais hipóteses, que podem ser verdadeiras ou
não, chamam-se hipóteses estatı́sticas e, em geral, consistem de afirmações sobre os parâmetros populacionais
ou sobre as distribuições de probabilidade das populações, como, por exemplo:
1. a média populacional da altura dos brasileiros é 1,65 m;
2. a proporção de brasileiros com a doença X é 40% (p = 0, 40);
3. a distribuição dos pesos dos pacientes adultos do hospital X é normal.
Os processos que nos permitem decidir por rejeitar ou não rejeitar uma hipótese, ou determinar se amos-
tras observadas diferem significativamente dos resultados esperados são chamados Testes de Hipóteses.
O objetivo é fornecer ferramentas que nos permitam validar ou refutar uma hipótese, através de resultados
da amostra. Os Testes de Hipóteses podem ser de dois tipos:
(a) Não Paramétricos: quando formulamos hipóteses com respeito à natureza da distribuição da população.
Estes testes não dependem dos parâmetros populacionais, nem de suas respectivas estimativas. Veja o
ı́tem (3.);
(b) Paramétricos: quando formulamos hipóteses com respeito ao valor de um parâmetro populacional.
Veja ı́tens (1.) e (2.).
6.6.1 Construção de um Teste de Hipótese

Inicialmente, para a construção de um teste, deve-se formular duas hipóteses a cerca da afirmação:
(a) Hipótese Nula (H0 ): é uma afirmação que diz que o parâmetro populacional é tal como especificado.
(b) Hipótese alternativa (Ha ): é uma afirmação que oferece uma alegação alternativa (isto é, o parâmetro
é diferente do valor alegado).
As hipóteses estatı́sticas para um parâmetro θ, podem ser formuladas como segue:
1. Teste Bilateral: quando utilizamos ambas as “caudas” da distribuição.
H0 : θ = θ0
Ha : θ ̸= θ0
2. Teste Unilateral à Direita: quando utilizamos a “cauda” direita da distribuição.

H0 : θ = θ0
Ha : θ > θ0
3. Teste Unilateral à Esquerda: quando utilizamos a “cauda” esquerda da distribuição.

H0 : θ = θ0
Ha : θ < θ0
Ao se testar uma hipótese, o que se deseja verificar é, através de uma estatı́stica obtida de uma amostra,
se a hipótese pode ou não rejeitada com o nı́vel de significância pré-fixado, α. Esta conclusão é tomada com
base na Região Crı́tica (RC: cuja área corresponde a α) que é construı́da de modo que:
P (θ̂ ∈ RC|H0 verdadeira) = α.

RA é denominada Região de não rejeição cuja área corresponde a 1 − α.
O procedimento que será utilizado para a construção de um teste de hipótese é o que consiste em
apresentar o nı́vel descritivo ou p-valor.
A sequência abaixo pode ser usada sistematicamente para qualquer teste de hipótese:
1-alfa
alfa/2 alfa/2
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
-Zalfa/2 +Zalfa/2
Figura 6.12: Teste de Hipótese Bilateral.
1. Passo 1: Definir as hipóteses H0 e Ha ;
2. Passo 2: Use a teoria estatı́stica e as informações para decidir qual a distribuição da estatı́stica
(estimador) que será utilizada no julgamento de H0 ;
Exemplos:
• para µ (n ≥ 30) • para µ (n < 30 ou σ desconhecido)
x̄ − µ x̄ − µ
Zc = √ ∼ N (0, 1) Tc = √ ∼ tn−1
σ/ n s/ n
• para p (supondo normalidade)
p̂ − p0
Zc = √ ∼ N (0, 1)
p0 (1 − p0 )
n
3. Passo 3: Escolher o nı́vel de significância α (erro tipo I) e utilizando as informações fornecidas pela
amostra para encontrar o valor do estimador do parâmetro (estatı́stica) que está sendo testado;
Dois tipos de erros podem ser cometidos em um TH:
H0
Decisão Verdadeira Falsa
Correto
Não Rejeitar Erro tipo II: β
Probabilidade: (1 − α)
Correto
Rejeitar Erro tipo I: α
Probabilidade: (1 − β)
4. Passo 4: Com o valor da estatı́stica observada na amostra encontrar a probabilidade (probabilidade

de significância p-valor) de ocorrer amostras com valores mais extremos do que o valor obtido.
5. Passo 5: Conclusão. Compare a probabilidade obtida, p-valor, com o valor de α:
“Rejeitamos H0 quando p-valor < α”.
6.6.2 O p-valor
O procedimento de teste de hipótese descrito acima fornece informação sobre a força da evidência contra
H0 obtida a partir dos dados. Isto é, é informado se o valor observado para a estatı́stica de teste que levou
à rejeição de H0 está próxima da fronteira da RC-região crı́tica ou RR-região de rejeição (baixa evidência
contra H0 ) ou se está muito afastada da fronteira (alta evidência contra H0 ).
O p-valor é a probabilidade de ocorrência do valor particular observado para a estatı́stica de teste ou de
valores mais extremos, na direção da região crı́tica, quando a hipótese nula H0 é verdadeira. Quanto maior
for a força da evidência contra H0 , menor será o p-valor.
6.6.3 Teste de Hipótese para Média

Existem diferentes estatı́sticas para se testar uma média:
Desvio-padrão conhecido
• Caso 1. σ conhecido (σ!). Nessa situação a estatı́stica teste é a Z, isto é:
x̄ − µ
Zc = √ ∼ N (0, 1).
σ/ n
Exemplo 6.18. Deseja-se investigar se uma certa moléstia que ataca o rim altera o consumo de oxigênio
desse órgão. Para indivı́duos sadios, admite-se que esse consumo tem distribuição Normal com média 12
cm3 /min. Os valores medidos em cinco pacientes com a moléstia foram:
14, 4 12, 9 15, 0 13, 7 13, 5
Qual seria a conclusão, ao nı́vel de 5% de significância?
Solução: O teste de interesse é:
H0 : A moléstia não altera a média de consumo renal de oxigênio;

Ha : Indivı́duos portadores da moléstia têm média alterada.
Em termos da média populacional, estamos testando as hipóteses:
H0 : µ = 12
Ha : µ ̸= 12,
e a região crı́tica, considerando um teste bilateral, é da forma:
RR = {z ∈ R|z < z1 ou z > z2 }.
Sendo σ conhecido e igual a 0,5, temos como valor calculado:

x̄ − µ
Zc = √ ∼ N (0, 1)
σ/ n
13, 9 − 12
= √
1, 5/ 5
( )
p-valor
= +2, 83 = 0, 002327 → p-valor = 0, 0047 .
2
Os valores tabelados para α = 5%, são: Z0,025 = ±1, 96.

Portanto, como Zc ∈ RR, decidimos pela rejeição da hipótese nula, ou seja, a média de consumo de
oxigênio difere de 12 cm3 /min ao nı́vel de 5% (p-valor = 0, 0047 < 0, 05 = α).
Figura 6.13: Teste de hipótese - Desvio-padrão conhecido.
Desvio-padrão desconhecido e n ≥ 30
• Caso 2. σ desconhecido (σ?, n ≥ 30). Nessa situação a estatı́stica teste continua sendo a Z, porém
σ = s, isto é:
x̄ − µ
Zc = √ ∼ N (0, 1).
s/ n
Exemplo 6.19. Considere o Exemplo 6.18, e que não há conhecimento de σ, além disso o tamanho amostral
tivesse sido 50, refaça o teste ao nı́vel de 5%.
Solução: Sendo σ desconhecido e n = 50, usaremos s como seu estimador e a estatı́stica teste será:
x̄ − µ
Zc = √ ∼ N (0, 1)
s/ n
13, 9 − 12
= √
0, 82/ 50
( )
p-valor
= +16, 4 =0 .
2
Os valores tabelados para α = 5%, são: Z0,025 = ±1, 96.

Portanto, como Zc ∈ RR, decidimos pela rejeição da hipótese nula, ou seja, o nı́vel médio de consumo
de oxigênio difere de 12 cm3 /min ao nı́vel de 5% (p-valor = 0 < 0, 05 = α).
Figura 6.14: Teste de hipótese - Desvio-padrão desconhecido e n >= 30.
Desvio-padrão desconhecido e n < 30

• Caso 3. σ desconhecido (σ?, n < 30). Nessa situação a estatı́stica teste é a t-Student, porém σ = s,
isto é:
x̄ − µ
Tc = √ ∼ t(n−1) .
s/ n
Exemplo 6.20. Considere o Exemplo 6.18, e que não há conhecimento de σ, refaça o teste ao nı́vel de 5%.
Solução: Sendo σ desconhecido e n = 5, usaremos s como seu estimador e a estatı́stica teste será:
x̄ − µ
Tc = √ ∼ t(4)
s/ n
13, 9 − 12
= √
0, 82/ 5
= +5, 21 (p-valor = 0, 0066).
Os valores tabelados para α = 5%, são: t(4;0,025) = ±2, 78.

Portanto, como Tc ∈ RR, decidimos pela rejeição da hipótese nula, ou seja, o nı́vel médio de consumo de
oxigênio difere de 12 cm3 /min ao nı́vel de 5%.
Figura 6.15: Teste de hipótese - Desvio-padrão desconhecido e n < 30.
6.6.4 Teste de Hipótese para Proporção

Exemplo 6.21. Suponha que um laboratório alegue que uma determinada droga que ele comercializa é
eficiente em pelo menos 85% dos casos em que é utilizada. Suponha que, para comprovar a alegação do
laboratório, um organismo de controle testou 180 pacientes, verificando a ação da droga em 146 casos.
Solução: O teste da eficiência alegada pelo laboratório, aos nı́veis clássicos de significância, seria feito
da seguinte forma:
Y 146
p̂ = = ≃ 0, 811 (proporção de eficiência na amostra)
n 180
H0 : θ ≥ 0, 85
Ha : θ < 0, 85
A Estatı́stica teste é
p̂ − p0
Zc = √
p0 (1 − p0 )
n
0, 811 − 0, 85
= √
0, 85(1 − 0, 85)
180
−0, 0389
=
0, 0266
Zc = −1, 46 (p = 0, 072145 ou 7, 2%)
Os valores tabelados para os nı́veis de significância de interesse são:
α 10% 5% 1%
Zα −1, 28 −1, 65 −2, 33
Observe que Rejeitamos H0 para α : 10%, mas não para α : 1% e 5%.

Conclusão: Ao nı́vel de significância α = 10%, há evidências estatı́sticas de que a droga é menos eficaz
do que o alegado.
Figura 6.16: Teste de Hipótese para Proporção.

Capı́tulo 7
Análise em Tabelas 2x2 e LxC
Neste tópico estudaremos a relação entre duas variáveis categóricas (ou qualitativas), onde as observações
podem ser classificadas em uma das várias categorias (nı́veis ou células) mutuamente exclusivas.
O problema de mensuração do grau de associação entre dois conjuntos de escores é de caráter bem
diferente do teste da simples existência de uma associação em determinada população. Naturalmente, há
interesse em avaliar o grau de associação entre dois conjuntos de escores referentes a um grupo de indivı́duos.
Mas é talvez de muito maior interesse podermos afirmar que determinada associação observada em uma
amostra de escores indica, ou não, probabilidade de associação entre as variáveis na população da qual se
extraiu a amostra (Siegel, 1956).
7.1 Tabelas de Contingência

Segundo o dicionário Webster o termo “contingency” significa the quality or state of having a close
connection or relationship. O termo “contingency table” se refere ao fato de que as tabelas construı́das são
usadas para testar a existência de relações entre duas variáveis. Observamos que infelizmente este termo
em português não tem o mesmo significado. Segundo o Aurélio, “contingência” significa qualidade do que é
contingente, incerteza se uma coisa vai acontecer ou não e “contingente” significa que pode ou não suceder,
eventual, incerto. Logo, em estatı́stica, quando nos referimos a palavra “contingência” estamos tomando o
mesmo significado da lı́ngua inglesa.
O teste chi-quadrado (χ2 ) pode ser usado para avaliar a relação entre duas variáveis qualitativas. Este
teste é um teste não-paramétrico, que é muito útil, pois não precisa da suposição de normalidade das variáveis
para analisar o grau de associação entre as duas variáveis, porém este teste é menos poderoso que o teste
paramétrico.
Dentro deste teste devemos distinguir dois tipos de testes: o de independência e o de homogeneidade.
Vejamos quando estamos tratando de um teste de independência e quando estamos tratando com um teste
de homogeneidade, através de exemplos.
7.2 Teste de Independência e de Homogeneidade

Suponha que uma educadora quer analisar se existe relação entre a participação ativa dos pais dos
alunos nos deveres extra-escolares e o desempenho dos alunos em Matemática. Suponha que ela categoriza
o desempenho dos alunos em três grupos: baixo, médio, alto e, do mesmo modo, categoriza a participação
dos pais em dois grupos: participação ativa, participação fraca. Suponha que ela deseja trabalhar com 300
crianças.
Neste caso a educadora pode delinear sua pesquisa de duas formas:
80
7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 81
Caso 1. Selecionar uma amostra de crianças aleatoriamente e examinar em que célula cada uma está
alocada, logo o único valor fixo será o total geral que será de 300. Mas os totais de colunas e de linhas
serão frutos da pesquisa, portanto, aleatórios, neste caso estamos frente a um teste de independência
de variáveis.
Logo a tabela de contingência será:
Tabela 7.1: Exemplo de tabela de contingência.

Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Teste de
Ativa Aleatório =⇒ Independência
Fraca Aleatório
Total Aleatório Aleatório Aleatório 300
Porém ela pode fixar o número de alunos de acordo com seu desempenho.
Caso 2. Pegar uma amostra aleatória de tamanho 100 de cada grupo de alunos, logo os totais das
colunas serão fixos, mas os totais das linhas serão aleatórios e assim estaremos frente a um teste de
homogeneidade:
Logo a tabela de contingência será:
Tabela 7.2: Exemplo de tabela de contingência.

Participação Desempenho do aluno em Matemática Total
dos pais Baixo Médio Alto
Teste de
Ativa Aleatório =⇒ Homogeneidade
Fraca Aleatório
Total 100 (fixo) 100 (fixo) 100 (fixo) 300
Os valores totais, das colunas e das linhas, são chamados de “totais marginais”. Quando os totais
marginais variam livremente, o teste de associação é chamado de independência, e quando
um dos conjuntos, linha ou coluna é fixado pelo pesquisador então é chamado de teste de
homogeneidade. Isso vai depender do pesquisador. No exemplo da educadora, observemos que para ela é
muito mais fácil fixar o número de alunos segundo seu desempenho, do que fixar pela participação dos pais,
que, apriori será quase impossı́vel.
Teste de Independência
Apresentaremos a lógica do teste com um exemplo bastante simples.
Exemplo 7.1. Suponha que 125 crianças foram expostas a três tipos de comerciais de TV, sobre cereais
para café da manhã. Após a exposição foi solicitado a cada criança para indicar qual dos comerciais ela
gostou mais. O que se deseja saber é se a escolha do comercial está relacionado ao gênero da criança: pois
suspeita-se de que o gênero pode estar influenciando na escolha do comercial. Os dados podem ser apreciados
na Tabela 7.3.
Tabela 7.3: Número de crianças segundo tipo de comercial escolhido e gênero.

Tipo de comercial
Gênero A B C Total
Meninos 30 29 16 75
Meninas 12 33 5 50
Total 42 62 21 125
Analisando atentamente a Tabela 7.3, composta por valores absolutos, percebemos:

• a amostra está composta por mais meninos do que meninas,

• nos comerciais A e C o número de meninos é maior do que meninas, e
• no comercial B essa relação se inverte.
Contudo, essa análise fica prejudicada pela composição da amostra, que tem mais meninos do que me-
ninas. Portanto, a primeira coisa a fazer é analisar as estruturas percentuais, mostradas na Tabela 4.3, ou
seja retirar a influência da amostragem.
Tabela 7.4: Porcentagem para os valores absolutos de crianças por tipo de comercial escolhido e gênero
apresentados na tabela anterior.
Tipo de comercial
Meninos 71% 47% 76% 60%
Meninas 29% 53% 24% 40%
Total 100% 100% 100% -
Observe cuidadosamente a Tabela 7.4, onde 60% da amostra é composta por meninos. Se a preferência das
crianças pelos comerciais independe do gênero, esperarı́amos que a estrutura percentual para cada comercial
ficasse em torno de 60% para os meninos e 40% para as meninas, desvios grandes destes percentuais estariam
mostrando evidências de que existe alguma relação entre essas variáveis. Essa inspeção intuitiva, também,
pode ser feita analisando a estrutura dentro de cada gênero como mostra a Tabela 7.5.
Tabela 7.5: Porcentagem de crianças por gênero e tipo de comercial escolhido.

Tipo de comercial
Meninos 40% 39% 21% 100%
Meninas 24% 66% 10% 100%
Total 33% 50% 17% -
Analisando a Tabela 7.5 observamos que as meninas tem uma forte preferência pelo comercial B, enquanto
que os meninos se dividem entre o comercial A e B.
Assim, intuitivamente percebemos que existe interferência do gênero na preferência, agora precisamos
saber até que ponto essas diferenças se devem ao acaso, ou a existência de associação entre as duas variáveis:
X: preferência pelo comercial ( A, B e C) → qualitativa;

Y: gênero (meninos, meninas) → qualitativa.
Hipótese nula (H0 ): A preferência pelo comercial independe do gênero da criança;

Hipótese alternativa (Ha ): A preferência pelo comercial depende do gênero da criança (ou, o gênero
interfere na preferência pelo comercial);
Analogamente, temos:
Ho : independência de variáveis
H1 : dependência de variáveis
Como deveriam ser os valores a serem observados se as variáveis fossem independentes?, ou dito de outra
forma, sob a hipótese de nulidade, de independência de variáveis, como deveriam ser os valores a serem
observados? A lógica nos diz que esses valores devem estar muito próximos da estrutura percentual global.
Esses valores são chamados de valores esperados.
Cada valor esperado será calculado supondo que a estrutura percentual global se mantenha em cada
coluna:
Calculando os valores esperados, sobre a suposição de independência:

Tabela 7.6:
Valores percentuais Valores absolutos
Tipo de comercial Valores esperados
Gênero A B C Total Gênero A B C Total
e
Meninos 60% 60% 60% 60% Meninos 25 37 13 75
Meninas 40% 40% 40% 40% Meninas 17 25 8 50
Total 42 62 21 125 Total 42 62 21 125
Valor esperado menino, comercial A: 60% de 42 = 25,2

Valor esperado menino, comercial B: 60% de 62 = 37,2
...
O mesmo teria acontecido se fixarmos primeiro o comercial:
Valor esperado comercial A, menino: 33,7% de 75 = 25,2

Valor esperado comercial A, menina: 33,7% de 50 = 16,8
...
Tanto faz fixar a linha ou a coluna pois:
Tl × Tc Tc Tl
Ei = = Tl × = Tc ×
T T T
Por exemplo, calculemos o valor esperado da primeira linha e primeira coluna:
75 × 42 42 75
Ei = = 75 × = 42 × = 25, 2
125 125 125
Assim calculando os valores esperados para todas as células temos:
Tabela 7.7:
Tipo de comercial
Oi = 30 Ei = 25,2 29 37,2 16 12,6
Meninos 75
di = +4,8 -8,2 +3,4
12 16,8 33 24,8 5 8,4
Meninas 50
-4,8 +8,2 -3,4
Total 42 62 21 125
Dentro de cada célula, no canto superior esquerdo colocamos o valor observado, no canto superior direito
o valor esperado (sob a hipótese de independência) e, na parte inferior, a distância entre o observado e o
esperado. Logo, se as variáveis fossem independentes, as distâncias entre os valores observados e esperados
deveriam ser muito pequenas, caso contrário haverá indı́cios de dependência. A pergunta agora é: quando a
distância é pequena ou grande? Para isto devemos calcular o valor (χ2 ) qui-quadrado da amostra:
∑k (observado − esperado)2 ∑k (O − E )2
i i
χ2amostra = =
i=1 esperado i=1 Ei
que terá uma distribuição chi-quadrado com graus de liberdade igual ao produto do número de linhas menos
um vezes o número de colunas menos um, isto é:
ν : graus de liberdade
χ2amostra ∼ χ2ν ⇒
ν : (no colunas - 1)×(no linhas - 1)
Para testar as hipóteses, temos a estatı́stica teste qui-quadrado com correção de continuidade de Yates:
( )2
∑
k |O − E | − 1
i i
2
χcY = 2
∼ χ2[L−1×C−1;(1−α)%] (Tabelas L × C)
i=1 Ei
No nosso exemplo sem a correção de Yates, temos:

(+4, 8)2 (−8, 2)2 (+3, 4)2 (−4, 8)2 (+8, 2)2 (−3, 4)2
χ2amostra = + + + + +
25, 2 37, 2 12, 6 16, 8 24, 8 8, 4
= 0, 914 + 1, 808 + 0, 917 + 1, 371 + 2, 711 + 1, 376
= 9, 09818 (p-valor : 0,0106)
onde v = (2 − 1) × (3 − 1) = 1 × 2 = 2
Para aceitar ou rejeitar a hipótese devemos conhecero valor de χ2calculado na tabela qui-quadrado, com
dois graus de liberdade. Para α = 5%, o valor crı́tico é 5, 991, como o valor da amostra é maior que o valor
crı́tico, logo rejeitamos a hipótese nula, concluindo que o gênero interfere na preferência pelos comerciais.
No caso de dispormos de um pacote estatı́stico, este, via de regra, calcula o p-valor, nesse caso é só
comparar esse valor com o nı́vel de significância desejado. No nosso caso o p − valor = 0, 01058, ou seja,
rejeitamos ao nı́vel de 5% mas não ao nı́vel de 1%.
Obs.: Quando as variáveis são independentes (H0 ), as freqüências observadas tendem a ficar perto das
esperadas. Neste caso, o valor de χ2 deve ser pequeno.
Limitações do teste χ2 :
1. Infelizmente, o teste qui-quadrado não permite concluir como se dá a relação, uma vêz que ele testa
apenas a hipótese geral de que as duas variáveis são independentes. Examinando a distância entre
valor observado e esperado, por exemplo, observamos que as meninas tem uma maior preferência pelo
comercial B, porém não podemos concluir nada.
2. Uma outra limitação do teste qui-quadrado é que o valor esperado das células não deve ser menor ou
igual a 5 e devido a isso torna vulnerável a estatı́stica. Nesse caso usamos outra estratégia: o teste
exato de Fisher.
Teste de Homogeneidade
Quando testamos independência de variáveis, o pesquisador só controla o tamanho total da amostra, mas
os totais para cada coluna e linha são aleatórios.
Exemplo 7.2. No caso do exemplo anterior, os pesquisadores selecionaram aleatoriamente 125 crianças,
das quais 75 eram meninos e 50 meninas. Ele não fixou o numero de meninos e o número de meninas.
Vejamos um exemplo de teste de homogeneidade. Retomemos o exemplo inicial e suponhamos que a
professora fixou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes:
Tabela 7.8: Número de alunos segundo seu desempenho em Matemática e participação dos pais nas atividades
extra-escolares.
Desempenho em Matem.
Participação
Baixo Médio Alto Total
dos pais
Ativa 5 25 70 100
Fraca 95 75 30 200
Total 100 100 100 300
H0 : p11 = p12 = p13 → igualdade de proporções

H1 : p1i ̸= p1j ; para algum i ̸= j → existe pelo menos uma proporção diferente
A hipótese nula esta testando que a proporção de alunos com baixo desempenho é igual a proporção de
alunos médio e igual a proporção de alunos com desempenho alto quando seus pais participam ativamente
das atividades extra-escolares, contra a hipótese alternativa que indica que existe pelo menos uma proporção
diferente.
O teste é idêntico ao teste de independência.
7.3 Análise de Resı́duos em Tabelas 2×L ROSSI, R. M. 85
O Coeficiente de Contingência.
O coeficiente de contingência é uma medida do alcance da associação ou relação entre dois conjuntos de
atributos. Ele é calculado em função do valor calculado na tabela de contingência e independe de ordenação
das categorias das variáveis:
√
χ2
C= 2
, onde n é o tamanho da amostra.
χ +n
Exemplo 7.3. No exemplo dos comerciais de TV, o coeficiente de contingência será:

√
9, 09818
C= = 0, 26047.
9, 09818 + 125
Para testar a significância deste coeficiente terı́amos que recorrer a tabela própria.
H0 : C=0
H1 : C ̸= 0
Se o p-valor associado for menor que alfa rejeitamos H0 e concluı́mos de que existe associação entre as
variáveis, caso contrário não.
Para facilitar a interpretação, usaremos uma modificação deste coeficiente. Chamaremos de k o menor
entre l (no de linhas da tabela) e c (no de colunas da tabela), isto é:
k = min{l; c}.
O chamado coeficiente de contingência modificado (C ∗ ) é dado por:

√
∗ k.χ2
C = .
(k − 1)(χ2 + n)
O valor C ∗ sempre estará no intervalo de 0 a 1. Será 0, somente quando houver completa independência e
será 1 quando houver associação perfeita. Valores de C ∗ próximos de 1 descrevem associação forte, enquanto
que valores de C ∗ próximos de 0 indicam associação fraca. Os valores de C ∗ em torno de 50% podem ser
interpretados como associação moderada.
Exemplo 7.4. Cálculo do coeficiente de contingência para os dados do exemplo anterior.
k = min{2; 3} = 2
√
k.χ2
C∗ =
(k − 1)(χ2 + n)
√
2.(9, 09818)
=
(2 − 1)(9, 09818 + 125)
= 0, 3684 ou 36, 84%.
Este resultado indica uma fraca associação entre X: preferência pelo comercial e Y: gênero.
7.3 Análise de Resı́duos em Tabelas 2×L

Exemplo 7.5. Vieira e Prolla (1979) estudaram uma amostra de 384 pacientes com problemas pulmonares,
classificando-os segundo a presença ou não de eosinófilos no escarro e o tipo de pneumopatia diagnosticada.
Grupo 1: asmas; Grupo 2: bronquite crônica com broncoespasmo; Grupo 3: bronquite crônica
ou enfisema sem broncoespasmo; Grupo 4: outras doenças pulmonares.
7.3 Análise de Resı́duos em Tabelas 2×L ROSSI, R. M. 86
Tabela 7.9: Presença de eosinófilos no escarro e tipo de doença pulmonar em 384 pacientes porto-alegrenses.
Grupo quanto a pneumopatia
Eosinófilos no escarro Grupo 1 Grupo 2 Grupo 3 Grupo 4 Total
Sim 142 26 32 28 228
Não 55 19 41 41 156
Total 197 45 73 69 384
{
H0 : Não existe associação entre Eosinófilos no escarro e pneumopatia;
Hipóteses :
Ha : Existe associação entre Eosinófilos no escarro e pneumopatia.
O teste χ2 de associação indica haver associação entre o tipo de pneumopotia e a ocorrência de eosinófilos
no escarro (χ2c = 30, 6465; p < 0, 001) ao nı́vel de 1%.
Uma conclusão simples de existência de associação é em geral insatisfatória para os pesquisadores, que
gostariam de entender melhor o tipo de associação observada. Para responder a esta indagação, existem
várias técnicas estatı́sticas; a análise de resı́duos é uma das mais interessantes.
A análise de resı́duos é usada como auxiliar na interpretação de dados organizados em tabelas L x C.
Por seu intermédio, é possı́vel avaliar como as diferentes caselas contribuem para o valor do χ2c .
Calcula-se inicialmente o resı́duo padronizado (R p ) para cada casela:
O−E
Rp = √ .
E
A seguir, cada resı́duo deve sofrer uma correção, passando a denominar-se resı́duo ajustado (Raj ) :
Rp
Raj = √( )( ).
1− TC
TG 1− TL
TG
Finalmente, os valores de Raj são comparados com valores crı́ticos da distribuição normal, por exemplo,
zα = 1,96, para um nı́vel de 5% de significância. Se Raj for maior do que zα , conclui-se que o valor
observado na casela (O) desvia-se significativamente (para mais ou para menos, conforme o sinal de Raj ) do
valor esperado (E).
Os resı́duos ajustados obtidos para os dados da Tabela 7.9, estão apresentados na Tabela 7.10. Na
primeira casela, o resı́duo ajustado foi obtido do seguinte modo:
O−E 142 − 117
Rp (Sim; G1) = √ = √ = +2, 311
E 117
Rp +2, 311
Raj (Sim; G1) = √( )( ) = √( )( ) = +5, 20.
1− TC
TG 1 − TT G
L
1− 197
384 1− 228
384
Como Raj = |+5, 20| > Z5% = 1, 96, conclui-se que o número de asmáticos que apresentam eosinófilos
no escarro foi significantemente maior (pois Raj é positivo) do que o esperado se as variáveis fossem inde-
pendentes. Portanto, existe associação positiva entre asma e presença de eosinófilos no escarro.
A interpretação dos demais resı́duos ajustados é feita do mesmo modo, após compará-los com Zα . Por
exemplo, no Grupo 3 a freqüência de indivı́duos com eosinófilos no escarro é significantemente menor do que
o esperado ao acaso (Raj = |+3, 00| > 1, 96).
Na Tabela 7.10 há seis resı́duos significativos. Cambinando este resultado com as percentagens observadas
na Tabela 7.9, a conclusão geral é a de que indivı́duos com eosinófilos no escarro são mais freqüentes entre os
asmáticos (142/197 = 72%) e menos comuns em pacientes dos Grupos 3 (44%) e 4 (41%). Em pacientes do
Grupo 2, a percentagem de pessoas com eosinófilos no escarro (58%) não diferem significativamente daquela
observada para o total da amostra (59%).
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 87
Tabela 7.10: Resı́duos ajustados (Raj) obtidos para os dados da tabela anterior. Os valores com (*) são
significativos ao nı́vel de 5%.
Grupo quanto a pneumopatia
Eosinófilos no escarro Grupo 1* Grupo 2 Grupo 3* Grupo 4*
Sim 5,20 -0,23 -3,00 -3,51
Não -5,20 0,23 3,00 3,51
7.4 Medidas do Efeito em Tabelas 2×2

7.4.1 Risco Relativo (RR)
Os pesquisadores em saúde investigam a todo momento a ocorrência de doenças, sua forma de apre-
sentação, sua freqüência, localização, enfim, reúnem uma série de informações que são apresentadas de
forma expositiva, dando ciência de tudo o que encontraram a respeito.
Porém, existe uma preocupação maior, que é a de se estudar o vardadeiro sistema no qual está inserido
o fato, a fim de pesquisarem-se os fatores que a ele estariam associados.
Com o objetivo de analisar os fatores responsáveis e quantificar em sua grandeza a participação desses
fatores, vale a pena ressaltar que um dos estudos mais importantes que visa a responder a essas indagações
seria a análise dos fatores de risco, que podem ser um agente quı́mico, um tipo de acidente ou mesmo um
hábito de vida.
Em determinados tipos de estudo, através de um procedimento metodológico estatı́stico, é possı́vel realizar
estimativas como indicadores relevantes de causa e efeito.
O risco relativo é uma forma de expressarmos a força de associação entre exposição ao fator e a doença.
Os estudos longitudinais prospectivos e retrospectivos proporcionam ao investigador a oportunidade de
identificar, dentro do sitema composto das variáveis que são selecionadas e estudadas, os fatores de risco e
de proteção, considerando as variáveis independentes e dependentes contidas no modelo de estudo.
Um dos primeiros procedimentos no estudo é identificar a variável dependente e as variáveis indepen-
dentes. Tanto seja variável discreta ou contı́nua, podemos realizar a análise dos dados, com o intuito de
verificar o risco de ocorrência de um fato, pela presença de um ou mais fatores, considerando inclusive a sua
intensidade.
Exemplificando, poderı́amos verificar a hipótese de que o consumo de cigarros tenha associação com câncer
de pulmão, determinando-se o risco para tabagistas, baseando-se em indivı́duos não fumantes, tendo-se em
conta que os não tabagistas também podem contrair a doença.
Conceituar o que seja risco é fundamental para nossa apresentação. Portanto, considera-se como risco a
probabilidade de que pessoas que estão sem a doença, mas expostas a certos fatores, possam adquirı́-la.
Na verificação da ocorrência de doentes na população, variável chave da investigação epidemiológica, as
medidas de incidência, prevalência e outros coeficientes servem como indicadores de risco.
Incidência (I): número de casos novos registrados em determinado perı́odo de tempo (dia, mês ou ano).
Prevalência: número de casos (novos+antigos) registrados no perı́odo de tempo determinado.
Coeficiente de incidência: número de casos novos em relação ao total de indivı́duos expostos na unidade
de tempo.
Coeficiente de prevalência: número de casos novos + antigos, em relação ao total de indivı́duos expostos
na unidade de tempo.
Risco Relativo (RR): relação existente entre o coeficiente de incidência de casos expostos (IE ) e o coefi-
ciente de incidência de casos não-expostos (IN E )
IE P (doente|exposto)
RR = =
IN E P (doente|não-exposto)
Risco Atribuı́vel (RA): diferença entre coeficiente de incidência no grupo exposto ao fator e o coeficiente
de incidência do grupo não exposto ao fator
RA = IE − IN E
Risco Atribuı́vel na População (RAP%): expresso em porcentagem, é uma medida de associação que
depende da ocorrência do fator de risco na população (é o excesso de risco na população devido ao fator de
risco)
IN − IN E (RR − 1)p
RAP % = =
IN (RR − 1)p + 1
onde IN : é a incidência global nos expostos e não expostos e p: prevalência do fator de risco.
No estudo de coorte é bastante natural pensar na razão entre a proporção dos que desenvolveram a
doença dentre os pacientes expostos e a proporção análoga entre os pacientes não-expostos. Observando a
disposição dos grupos na Tabela 7.11 a seguir,
Tabela 7.11: Distribuição quanto à ocorrência de um evento

Doença Fator Total
(Exposto) (Não-exposto)
Presente Ausente
Presente a b n1 = a + b
Ausente c d n2 = c + d
Total m1 = a + c m2 = b + d n = n1 + n2
de modo geral, podemos encarar o RR como

a
IE a + c.
RR = =
IN E b
b+d
Ensaios clı́nicos podem ser vistos como um estudo de coortes, em que os grupos foram criados através
de alocação aleatória de pacientes aos grupos. Portanto, o risco relativo também pode ser calculado para
ensaios clı́nicos.
Exemplo 7.6. Quando estamos interessados em estimar probabilidades condicionais, por exemplo, de um
nascituro ter aberração cromossômica, dado que a gestante está na faixa etária de 35 até 40 anos, e a
probabilidade (condicional) de um nascituro ter aberração cromossômica, dado que a gestante tem 40 anos
ou mais, é comum na área da saúde usar a palavra risco para identificar esta probabilidade.
Tabela 7.12: Resultados de casos de diagnóstico pré-natal segundo a idade da gestante e a presença ou
ausência de aberração cromossômica.
Doença Fator (Idade em anos) Total
(Exposto) (Não-exposto)
(Aberração)
≥ 40 35 − 40
Presente 18 10 28
Ausente 510 447 957
Total 528 457 985
Então, com base nas dados da Tabela 7.12, podemos calcular:
1. o risco de um nascituro ter aberração cromossômica, dado que a gestante tem 40 anos ou mais (IE ):
18
IE = = 0, 0341 ou 3, 41%.
528
2. o risco de um nascituro ter aberração cromossômica, dado que a gestante está na faixa etária de 35
até 40 anos (IN E ):
10
IN E = = 0, 0219 ou 2, 19%.
457
3. a incidência global (I N ) :
10 + 18
IN = = 0, 0284 ou 2, 84%.
985
4. o risco atribuı́vel (RA):

RA = IE − IN E = 3, 41% − 2, 19% = 1, 22%.
5. o risco atribuı́vel na população (RAP%):
IN − IN E 2, 84% − 2, 19%
RAP % = = = 0, 2289 ou 22, 89%.
IN 2, 84%
6. o Risco Relativo (RR) é a razão entre duas probabilidades condicionais (ou dois riscos condicionais).
Com base na Tabela 7.12, tem-se o risco relativo
3, 41
RR = = 1, 56.
2, 19
Este resultado mostra que o risco de um nascituro apresentar aberração cromossômica é 1,56 maior se a
gestante tiver 40 anos ou mais do que se a gestante estiver na faixa etária de 35 até 40 anos.
Intervalo de Confiança para RR

Nos estudos longitudinais de coorte, em que procedemos à verificação e à identificação dos fatores con-
siderados de risco ou de proteção, determinamos os valores referentes ao risco relativo. Entretanto, para
que possamos concluir sobre os verdadeiros fatores de risco ou proteção, utilizamos IC(RR) o intervalo de
confiança para o RR, o IC(RR):
Zα
1± √
IC(RR) = RR χ2c
onde χ2c é o valor da estatı́stica teste calculada através dos dados na tabela de contingência formada.
Exemplo 7.7. Dos dados da Tabela 7.12, para RR = 1,56, podemos obter seu respectivo IC(RR), já que
χ2c = 1, 32 e para um nı́vel de significância de 5%, o valor de Z5% = 1, 96 :
1, 96
1± √
IC(RR) = 1, 56 1, 32
= 1, 561±1,71
IC(RR) : [0, 73; 3, 34]
Observação: Este intervalo não incluindo a unidade, isto é, (o no 1) possibilita-nos rejeitar H0 : ”Não
existe associação entre as variáveis”.
Para o exemplo portanto, concluimos que existe associação entre idade e aberração cromossômica, isto
é, a idade é realmente um fator de risco para a doença em estudo.
7.4.2 Odds-Ratio (OR)

O risco relativo, embora seja uma medida de efeito com muitas qualidades, tem uma grande limitação: não
pode ser estimado em estudo de caso-controle, forma mais freqüente de estudo comparativo. Isto porque,
neste tipo de estudo, as incidências observadas são meras conseqüências do número escolhido
de casos e controles e não caracterı́sticas dos grupos em estudo. Por isto, buscaram-se maneiras
alternativas para se definir o efeito da exposição de forma adequada a todos os estudos epidemiológicos. A
solução encontrada foi o uso de uma medida denominada razão das chances ou Odds-Ratio (OR).
Define-se chance de se desenvolver a doença entre os expostos e os não expostos como a seguinte estima-
tiva:
a/(a + c)
c/(a + c) a/c ad
OR = ψ̂ = = =
b/(b + d) b/d bc
c/(b + d)
P (doente|exposto)
1−P (doente|exposto)
OR = P (doente|não-exposto)
.
1−P (doente|exposto)
Também pode ser definida como a chance de exposição entre indivı́duos doentes dividia pela chance de
exposição entre os não-doentes, isto é:
P (exposto|doente)
1−P (exposto|doentes)
OR = P (exposto|não-doente)
.
1−P (exposto|não-doentes)
Intervalo de Confiança para o OR

Método A: O intervalo de confiança para a razão de chances, IC(OR), pode ser obtido analogamente
ao processo do IC(RR):
Zα
1± √
IC(OR) = OR χ2c
Método B: Alternativamente podemos por razões teóricas obter o IC(OR), já que muitas vezes a variação
de ψ é mais facilmente calculada na escala logarı́tmica. Vale o seguinte resultado:
1 1 1 1
V ar(ln ψ̂) = + + + .
a b c d
Como lnψ tem aproximadamente distribuição gaussiana, construı́mos intervalos de confiança para lnψ̂:
[ √ ]
ln[IC(OR)] = [Li ; Ls ] = ln ψ̂ ± Zα V ar(ln ψ̂) .
Obs.: Se este intervalo contém o número 0 (zero) (correspondente ao valor 1 para o RR) então a associação
entre a doença e o fator pode ser verificada.
Para obter o intervalo de confiança para ψ basta exponenciar os limites do intervalo acima, isto é:
[ ]
IC(OR) = eLi ; eLs .
Exemplo 7.8. Amamentação na infância e câncer de mama.
Para verificar se o fato de ter sido amamentado pela mãe é um fator de proteção para o câncer de mama,
Freudenheim et al. (1994) realizaram estudo do tipo caso-controle nos condados de Erie e Niágara situados
na parte oeste do estado de New York (EUA).
As pacientes tomadas como controle foram escolhidas na população da região, não existindo portanto o
emparelhamento. Os dados obtidos estão apresentados na Tabela 7.13.
Tabela 7.13: Distribuição de casos e controles segundo a amamentação.

(Fator)
Doença Total
Amamentação
Sim Não
Casos 353 175 528
Controles 449 153 602
Total 802 328 1130
O risco de desenvolver câncer de mama entre mulheres amamentadas pela mãe, aproximado pela razão
de chances (odds-ratio), é estimado por
353 × 153
OR : ψ̂ = = 0, 69
175 × 449
ou seja, nominalmente, o risco do grupo amamentado é apenas 69% do risco do grupo não-amamentado.
Para obtermos um intervalo com 95% de confiança para ψ temos os métodos A e B:
Método A:
1, 96
1± √
IC(OR) = 0, 69 8, 16
= 1, 561±0,69
IC(OR) : [0, 53; 0, 89]
Método B:
ln ψ̂ = ln(0, 69) = −0, 37
1 1 1 1
V ar(ln ψ̂) = + + + = 0, 02
353 175 449 153
√
ou seja, a estimativa do desvio-padrão de ln ψ̂ é 0, 02 = 0, 14. Um intervalo de 95% de confiança para ln ψ
é portanto
−0, 37 ± 1, 96.(0, 14)
ou
ln[IC(OR)] = [−0, 64; −0, 10] .
Observe que o número 0 (zero) não pertence ao intervalo, onde concluı́mos na existência de associação
entre as variáveis (Rejeitamos H0 ).
O intervalo para ψ é então obtido tomando-se o exponencial dos limites inferior e superior deste intervalo,
ou seja:
IC(OR) = [0, 53; 0, 89]
indicando uma associação significativa entre ter sido amamentada e câncer de mama (1 ∈ / IC).
Esse resultado deve ser interpretado com cuidado, uma vez que não foram considerados fatores impor-
tantes, como história familiar e idade na primeira gestação. De fato, ao ajustar o modelo incorporando essas
variáveis, a associação deixou de ser significativa.
Capı́tulo 8
Comparações Entre Grupos
8.1 Introdução
Às vezes, é preciso comparar duas populações. Por exemplo, imagine que um pesquisador obteve, para
um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos
e meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Outras vezes, é preciso comparar condições experimentais. Por exemplo, para saber se um tratamento
tem efeito positivo, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (é o
grupo tratado), enquanto o outro não recebe o tratamento (é o grupo controle).
O efeito do tratamento é dado pela comparação dos dois grupos.
Freqüentemente, para comparação de dois tratamentos observam-se caracterı́sticas ou mede-se o valor da
variável resposta de interesse que as caracterı́sticas importantes dos indivı́duos que integram o mesmo par
sejam tão semelhantes quanto possı́vel. O tratamento é administrado a um dos elementos do par e o outro é
mantido como controle. A vantagem do procedimento é clara. Os indivı́duos no par são semelhantes, exceto
no que se refere ao tratamento recebido. Em algumas situações o par é constituı́do do mesmo indivı́duo em
duas ocasiões diferentes (amostras dependentes).
A suposição de Normalidade é necessária em alguns testes estatı́sticos. Nesta seção apresentaremos alguns
testes de normalidade assim como algumas técnicas gráficas, afim de que possamos verificar a normalidade
dos dados (No caso afirmativo optamos por testes paramétricos).
8.2 Normalidade dos Dados

Na prática não podemos fazer suposições arbitrárias a respeito da distribuição de probabilidade dos
dados, logo usamos de técnicas para fazer uma verificação da adequação do modelo suposto.
A verificação pode ser baseada nas caracterı́sticas do modelo, em gráficos especiais e em testes de
aderência.
Para a distribuição normal, em especial, sabemos que:
µ±σ = 68, 26%

µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%
Grandes discrepâncias entre as freqüências relativas observadas e as probabilidades teóricas acima citadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.
• Testes de aderência
1. Kolmogorov-Smirnov (K-S) [µ e σ supostamente conhecidos];

2. Lilliefors é uma variação do K-S [µ e σ estimados pelos dados];
3. Shapiro Wilks (W) [µ e σ estimados pelos dados].
92
8.2 Normalidade dos Dados ROSSI, R. M. 93
Este último, tem sido muito utilizado para dados amostrais devido a sua capacidade de adaptação a uma
variada gama de problemas sobre avaliação de normalidade.
{
H0 : Os dados são normalmente distribuı́dos;
T.H.
Ha Os dados não são normalmente distribuı́dos.
Outros critérios:
• Técnicas Gráficas
1. Normal-plot
2. Q-Q-plot
3. P-P-plot
8.2.1 Faixas de Referência (Método de Gauss)

Toda medida laboratorial é analisada confrontando-se seu valor com uma faixa padrão.
Isto é tão comum que, na própria apresentação do resultado, muitos laboratórios já indicam os limites
inferiores e superiores para o valor da medida que devem servir de base ao raciocı́nio clı́nico. Quando há a
suposição de normalidade nos dados pode-se fazer uso desta informação para obtenção de uma FR (Faixa
de Referência) pelo método gaussiano:
• Devemos fixar, inicialmente, o nı́vel de confiança (1 − α)% ou cobertura;

• Calculamos através da amostra de pessoas supostamente saudáveis: x̄ e s.
Tabela 8.1: Faixas de Referência.

Cobertura (1 − α)% Faixa
90% x̄ ± 1, 64.s
95% x̄ ± 1, 96.s
99% x̄ ± 2, 58.s
.. ..
. .
(1 − α)% x̄ ± Z α2 .s
1-alfa
alfa/2 alfa/2
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
-Zalfa/2 +Zalfa/2
Figura 8.1: Faixa de Referência.
Observação: Como em geral se trabalha com amostras, então o uso dos Intervalos de Confiança, con-
siderando a DISTRIBUIÇÃO AMOSTRAL DA MÉDIA, é mais adequada para obtenção dessas Faixas de
Referências.
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 94
Exemplo 8.1. Faixa de referência para identificar o Pseudomonas sp (continuação do Exemplo 6.3).
Observe através da Figura 6.8o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição normal.
Para a Amostra 1, foram realizados os testes de normalidade e indicaram ajuste dos dados já que p −
Lillief ors > 0, 20 e p − W ilks = 0, 8892. (Software Statistica).
Observe através da Figura 6.9 uma assimetria do Histograma comparado à normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
normal.
Os testes confirmam isto: Para a Amostra 2 obtemos p − Lillief ors < 0, 01 e p − W ilks < 0, 000013.
8.3 Resposta Dicotômica: Amostras Independentes

Comparar dois grupos através do resultado observado em uma variável dicotômica é um problema comum
na pesquisa médica, aparecendo com freqüência em todos os tipos de estudos clı́nicos.
A variável de interesse é a ocorrência de um evento, como o desenvolvimento de uma doença de certo
atributo, por exemplo, albinismo. O problema de comparações das probabilidades de ocorrência do evento
ou do atributo nos dois grupos (p1 e p2 ) é formulado através das hipóteses:
{
H0 : p1 = p2 “não há diferença significativa entre os grupos”
Ha : p1 ̸= p2 “há diferença significativa entre os grupos”
8.3.1 Teste Qui-Quadrado

A Tabela 8.2 apresenta dados genéricos de uma situação envolvendo a comparação de dois grupos e que
a resposta de interesse é dicotôminca: a ocorrência ou não de um evento.
Tabela 8.2: Distribuição quanto à ocorrência de um evento.

Grupo Ocorrência do Evento Total
Sim Não
I a b n1 = a + b
II c d n2 = c + d
Total m1 = a + c m2 = b + d n = n1 + n2
A estatı́stica teste será:

∑
k
(Oi − Ei )2
χ2c = ∼ χ21;(1−α)%
i=1
Ei
ou, para Tabelas 2×2:
2
n (ad − bc)
χ2c = ∼ χ21;(1−α)% (Tabelas 2 × 2)
n1 n2 m 1 m 2
Há restrições para aplicação do χ2 em tabelas contingência, logo a correção de Yates (1934) é necessária.
Esta correção deve ser feita quando:
• n < 40 ou Ei ≤ 5
• 20 < n < 40 e Ei ≤ 5 para algum i;

• n > 40 e Ei ≤ 5 para algum i;
Para testar as hipóteses acima citadas temos a estatı́stica teste qui-quadrado com correção de continuidade
de Yates, temos
( )2
n |ad − bc| − n2
2
χcY = ∼ χ21;(1−α)% (Tabelas 2 × 2)
n1 n2 m 1 m 2
Exemplo 8.2. Estudo sobre a associação entre o uso corrente de contraceptivos e o infarto de miocárdio.
Shapiro et al. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes são
mostrados na Tabela 8.3.
Tabela 8.3: Distribuição de uso de contraceptivo oral segundo grupo que sofreu ou não infarto do miocárdio.
Grupo Uso recente Total
Sim Não
Casos 9 12 21
Controles 33 390 423
Total 42 402 444
Entre os casos, ou seja, entre as pacientes que tiveram um infarto do miocárdio, a proporção de uso recente
9 33
de contraceptivos é = 0, 43 e entre os controles, = 0, 08. A diferença entre estas duas proporções
21 423
(0,35) parece indicar que o uso de contraceptivos orais é mais freqüente entre os casos (infartos). Mas será
que este resultado não ocorreu por mero acaso?
A expressão χ2c = 24, 76 > 3, 84 = χ21;95% , nos indica, com alto grau de confiança (95%) afirmar que existe
associação entre o uso de contraceptivos orais e infarto do miocárdio para pacientes entre 30 e 34 anos.
8.3.2 Teste Exato de Fisher

Nos casos em que formamos uma tabela de contingência com formato 2 × 2, com pequeno número de
observações (n < 20 ou próximo) e, conseqüentemente, com freqüências observadas em cada casela muito
baixas, a literatura apresenta a utilização do teste exato de Fisher, no qual estimamos, a partir da menor
freqüência contida na tabela, a probabilidade de ocorrência deste valor e de uma freqüência menor ainda,
∑n
fazendo-se p = pi , em que n é a menor freqüência verificada na tabela.
i=0
Numa tabela de contingência 2 × 2, com os totais marginais fixos, apresentada como a Tabela 5.1, as
freqüências observadas têm distribuição hipergeométrica e a probabilidade de ocorrência i será dada por:
n1 !n2 !m1 !m2 !
pi =
a!b!c!d!n!
Exemplo 8.3. Um estudo foi realizado para verificar a existência de associação entre o tipo de tratamento
e mortalidade por AIDS. A Tabela 8.4 apresenta os dados.
Tabela 8.4: Associação entre o tipo de tratamento e mortalidade por AIDS.

Tratamento Mortalidade Total
Sim Não
A 7 5 12
B 1 9 10
Total 8 14 22
∑
1
Sendo p = pi , temos
i=0
12!10!8!14!
p1 = = 0, 024.
7!5!1!9!22!
e
assim
12!10!8!14!
p0 = = 0, 0015.
8!4!0!10!22!
O valor de p será 0, 024 + 0, 0015 = 0, 0255 (p-valor : 0,0263).
Como este p é menor que o nı́vel de significância, para α = 0, 05 a decisão correta será rejeitar H0 , isto
é, pode-se concluir que há diferença quanto à mortalidade em relação ao tipo de tratamento, sendo B mais
eficáz.
Tabela 8.5: Associação entre o tipo de tratamento e mortalidade por AIDS.

Tratamento Mortalidade Total
Sim Não
A 8 4 12
B 0 10 10
Total 8 14 22
Exemplo 8.4. Suponha um grupo de dezesseis ratos, divididos em dois grupos, experimental e normal. O
grupo experimental é formado por 9 animais geneticamente modificados, por apresentarem uma disfunção
pancreática com diminuição da capacidade de produção de insulina. Imagine que, após um ano e meio em
ambiente controlado, o número de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela
8.6):
Tabela 8.6: Estudo em ratos sobre disfunção pancreática.

Grupo Sobrevida + 1,5 ano Total
Vivos Mortos
Normal 5 2 7
Experimental 1 8 9
Total 6 10 16
Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos, enquanto a so-
brevida para o grupo experimental é de apenas 11%.
O teste exato de Fisher consiste em elaborar, com base nos totais marginais do fator discriminante da
tabela original, duas outras tabelas, que serão denominadas tabelas ou matrizes extremas, X1 e X2 . A matriz
extrema 1 é a matriz em que todos os animais mortos pertencem ao grupo normal (são 10 mortos, mas o
grupo normal tem 7 ratos, logo, os outros 3 que morreram pertencem ao grupo experimental) e todos que
sobraram do grupo experimental estão vivos (todos os vivos, pois sobraram 9-3 = 6 ratos). Desta forma,
resulta na Matriz X1 (Tabela 8.7):
Tabela 8.7: Matriz X 1 .

Vivos Mortos
Normal 0 7 7
Experimental 6 3 9
Total 6 10 16
A matriz extrema 2, X2 , corresponde a uma tabela com os mesmos totais marginais, mas com todos os
animais vivos no grupo normal. Então, pela matriz X2 (Tabela 8.8):
Observe que existe um óbito no grupo normal, pois o número de ratos do grupo normal é maior que o de
ratos que sobreviveram. Obviamente, os 9 mortos que restaram pertencem ao grupo experimental. Nenhum
rato do grupo experimental sobreviveu.
Finalmente, o valor de significância para o teste é calculado segundo a fórmula apresentada anteriormente:
Para a matriz original:
7!.9!.10!.6!
F0 : = 0, 02360
2!.5!.8!.1!.16!
Para a matriz X 1 :
7!.9!.10!.6!
FX1 : = 0, 0105
0!.7!.6!.3!.16!
Para a matriz X 2 :
7!.9!.10!.6!
FX2 : = 0, 0009
6!.1!.0!.9!.16!
Tabela 8.8: Matriz X 2 .

Vivos Mortos
Normal 6 1 7
Experimental 0 9 9
Total 6 10 16
Finalmente,
p = F0 + FX1 + FX2 = 0, 0236 + 0, 01505 + 0, 0009 = 0, 035 ou 3, 5%.
Ou seja, a afirmação de que a sobrevida dos ratos geneticamente alterados é menor que a dos ratos
normais envolve uma probabilidade de erro de 3,5%. Portanto, ao nı́vel de 5% de significância, rejeita-se a
hipótese de nulidade (ou seja, de que as vidas dos ratos normais e dos transgênicos são iguais).
8.3.3 Teste z para Comparação de Proporções

Denotamos os dois resultados possı́veis da variável dicotômica por sucesso e fracasso. Sejam p1 e p2 as
proporções de sucesso referentes aos tratamentos a serem comparados, que são estimadas por p̂1 e p̂2 , as
proporções amostrais baseadas em amostras de tamanhos n1 e n2 , respectivamente. Queremos testar as
hipóteses:
H0 : p1 = p2
Ha ̸ p2
: p1 =
isto é, estamos investigando a equivalência entre os dois tratamentos.

Apresentaremos uma alternativa para o teste qui-quadrado para a comparação de proporções. Trata-se
de um teste aproximado que requer amostras grandes para sua aplicação. Um critério é exigir que n1 p̂1 e
n2 p̂2 excedam o valor 5.
O teste é baseado em
p̂1 − p̂2
Zc = √ ∼ N (0, 1).
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
n1 + n2
Exemplo 8.5. Comparação de drogas contra náusea.

Com o objetivo de comparar a eficácia de dois preventivos contra náusea, dividiu-se aleatoriamente uma
amostra de 400 marinheiros em dois grupos de 200. Um grupo recebeu a pı́lula A e o outro a pı́lula B,
sendo que no primeiro grupo 152 não enjoaram durante uma tempestade e no outro grupo apenas 132. Há
indicações de que a eficácia da pı́lula A e B é a mesma?
Sol.: Sejam pA e pB as proporções de marinheiros que não enjoam, respectivamente para as pı́lulas A e
B. Temos que nA = 200, nB = 200, p̂A = 152 132
200 = 0, 76, p̂B = 200 = 0, 66, logo tem-se:
0, 76 − 0, 66
Z=√ = 2, 22 (p-valor : 0,0281).
0,76(1−0,76) 0,66(1−0,66)
200 + 200
Fixando-se o nı́vel de significância em 5%, rejeita-se H0 . Portanto, pode-se concluir que as duas pı́lulas
não são igualmente efetivas. Há indicação de que a pı́lula A oferece maior proteção contra náusea comparada
à pı́lula B.
8.4 Resposta Dicotômica: Amostras Pareadas ROSSI, R. M. 98
8.4 Resposta Dicotômica: Amostras Pareadas

Podemos distingüir três tipos de pareamento: auto-pareamento, pareamento natural e pareamento artifi-
cial.
O auto-pareamento ocorre quando o indivı́duo serve como seu próprio controle, como na situação em
que um indivı́duo recebe duas drogas administradas em ocasiões diferentes. Outra situação é a que um
tratamento é administrado e as variáveis de interesse são observadas antes e depois do programa. Finalmente,
a comparação de dois órgãos no mesmo indivı́duo, como braços, pernas, olhos, narinas, segundo alguma
caracterı́stica estudada também constitui um auto-pareamento.
O pareamento natural consiste em formar pares tão homogêneos quanto possı́vel, controlando os fatores
que possam interferir na resposta, sendo que o pareamento aparece de forma natural. Por exemplo, em ex-
perimentos de laboratório pode-se formar pares de cobaias selecionadas da mesma ninhada; em investigações
clı́nicas, gêmeos univitelinos são muitos usados.
No pareamento artificial escolhe-se indivı́duos com caracterı́sticas semelhantes, tais como, idade, sexo,
nı́vel sócio-econômico, estado de saúde ou, em geral, fatores que podem influenciar de maneira relevante a
variável resposta.
8.4.1 Teste McNemar

O exemplo a seguir ilustra a necessidade de desenvolvimento de um teste especı́fico para a situação de
dados pareados em que a resposta é dicotômica.
Exemplo 8.6. Suponhamos que dois patologistas examinaram, separadamente, o material de 100 tumores
e os classificaram como benignos ou malignos. A questão de interesse é saber se os patologistas diferem nos
seus critérios de decisão.
Neste caso, a forma adequada de apresentação dos dados é mostrada na Tabela 8.9.
Tabela 8.9: Classificação de dois patologistas (A e B) quanto à malignidade de tumores.

Diagnóstico de B Diagnóstico de A Total
Malignos Benignos
Malignos 9 1 10
Benignos 9 81 90
Total 18 82 100
É importante observar que a unidade de análise aqui é o tumor, avaliado por dois patologistas. Embora
tenham sido feitas 200 análises, o total de tumores é, na realidade, apenas 100.
Além disto, alguns tumores serão claramente mais malignos do que outros e, portanto, a hipótese funda-
mental na construção do teste de probabilidade constante de malignidade não é razoável aqui. Isto explica
a necessidade de desenvolvimento de teste especı́fico, isto é, para dados pareados.
Os dados a serem analisados no processo de comparação podem ser resumidos no formato da Tabela 8.10.
H0 : Os patologistas tem o mesmo diagnóstico.
Tabela 8.10: Apresentação de dados obtidos em uma classificação de dados pareados.

Controle Tratamento Total
Sucesso Fracasso
Sucesso a b n1
Fracasso c d n2
Total m1 m2 n
Se p1 e p2 são as probabilidades de sucesso nos grupos controle e tratamento, respectivamente, a hipótese

de interesse é:
H0 : p1 = p2
Ha ̸ p2
: p1 =
8.4 Resposta Dicotômica: Amostras Pareadas ROSSI, R. M. 99
A Estatı́stica Teste: (B/C)

(|b − c| − 1)2
χ2M cN = ∼ χ21 .
b+c
A hipótese nula deverá ser rejeitada quando χ2M cN > χ21 .
Exemplo 8.7. Amigdalectomia e doença de Hodgkin.
Johnson & Johnson (1972), ao analisarem retrospectivamente a história clı́nica de pacientes de doença de
Hodgkin, um tipo de câncer no tecido linfóide, não encontraram evidências que sustentassem a hipótese de
que a amigdalectomia aumenta a suscetibilidade à doença, pela remoção da ”barreira linfática” representada
pela amı́gdala. Neste estudo, usaram um planejamento do tipo caso-controle pareado. A conclusão relatada
no artigo foi feita, entretanto, com uma análise apropriada para dados provenientes de grupos independentes.
Logo após a publicação, vários autores observaram a impropriedade da análise e, utilizando as informações
do artigo, fizeram a análise correta, que é baseada nos dados da Tabela 8.11.
Tabela 8.11: Distribuição de pacientes com e sem doença de Hodgkin em um estudo caso-controle pareado
segundo à amigdalectomia.
Doença de Controle Total
Hodgkin Operados Não operados
Operados 26 15 41
Não operados 7 37 44
Total 33 52 85
O valor da estatı́stica do teste de McNemar é:

(|15 − 7| − 1)2
χ2M cN = = 2, 23 (p-valor : 0,1356).
15 + 7
Este valor dever ser comparado com 3,84 para um nı́vel de significância de 5%. Ou seja, com uma
confiança de 95% acreditamos que não há associação entre a doença de Hodgkin e a amigdalectomia. Esta
conclusão não está de acordo com trabalhos anteriores, como o de Vianna et al. (1971).
8.5 Resposta Contı́nua - Teste de Médias para Amostras Independentes ROSSI, R. M. 100
8.5 Resposta Contı́nua - Teste de Médias para Amostras Indepen-

dentes
Às vezes, é preciso comparar duas populações. Por exemplo, imagine que um pesquisador obteve, para
um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos
e meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Nesta seção apresentamos a metodologia para comparar dois grupos de pacientes (por exemplo, doentes
versus não doentes) em relação a uma resposta contı́nua, por exemplo, pressão sistólica. Testa-se, neste caso,
a igualdade das médias das respostas de dois tratamentos.
Sejam µ1 e µ2 as médias da variável estudada para os dois grupos, respectivamente. As hipóteses a serem
testadas são:
H0 : µ1 = µ2
Ha ̸ µ2
: µ1 =
8.5.1 Teste t
Se a variável em análise tem distribuição normal ou aproximadamente normal, aplica-se o teste t para
comparar duas médias. Mas primeiro é preciso estabelecer o nı́vel de significância, α. Depois, dados os dois
grupos, 1 e 2, calculam-se:
a) as médias de cada grupo:
x̄1 : média do grupo 1
x̄2 : média do grupo 2
b) as variâncias ou os desvios-padrões de cada grupo:
s1 : desvio-padrão do grupo 1
s2 : desvio-padrão do grupo 2
c) a variância ponderada:
(n1 − 1)s21 + (n2 − 1)s22

s2p =
n1 + n2 − 2
d) o valor da estatı́stica teste, tc , definida por:
x̄1 − x̄2
tc = √ ( ) ∼ tn1 +n2 −2;α%
2
1 1
sp +
n1 n2
O intervalo de confiança para (µ1 − µ2 ) será:

√( )
1 1
(x̄1 − x̄2 ) ± tn1 +n2 −2;α% .s2p . +
n1 n2
Exemplo 8.8. Comparação entre tratamentos para dieta.
Para verificar se duas dietas para emagrecer são igualmente eficientes, um médico separou, ao acaso, um
conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para seu grupo. Decorrido
certo tempo, o médico obteve a perda (ou ganho) de peso, em quilogramas, de cada paciente de cada grupo.
Os dados estão apresentados na Tabela 8.12:
Após alguns cálculos preliminares, temos: x̄1 = 12; x̄2 = 15; s21 = 4; s22 = 5; s2p = 4, 4, desta forma, para
α = 5%, temos t15;5% = ±2, 13, assim:
12 − 15
tc = √ ( ) = −2, 902 ∈ Região de rejeição de H0 , logo podemos
1 1
4, 4 +
10 7
p − valor : 0, 010947
8.5 Resposta Contı́nua - Teste de Médias para Amostras Independentes ROSSI, R. M. 101
Tabela 8.12: Perdas de peso, em quilogramas, segundo a dieta.

1 15 19 15 12 13 16 15 - - -
2 12 8 15 13 10 12 14 11 12 13
concluir que, em média, as perdas de peso de pacientes submetidos aos dois tipos de dieta são diferentes.
Em termos práticos, a perda de peso é maior quando os pacientes são submetidos à dieta 2.
8.5.2 Teste z
Um pressuposto importante para aplicar o teste t visto anteriormente é que os dois grupos comparados
tenham a mesma variabilidade, o que nem sempre acontece na prática. No caso de amostras grandes (n1 e
n2 ≥ 30) dispomos de um teste em que não é necessário qualquer suposição adicional sobre σ 21 e σ 22 , ou seja,
as varâncias podem ser iguais ou diferentes.
A estatı́stica teste usada será:
x̄1 − x̄2
Zc = √ ∼ N (0, 1).
s21 s22
+
n1 n2
Exemplo 8.9. Efeito do halotano em cirurgias cardı́acas.

O halotano é uma droga bastante utilizada para induzir a anestesia geral. Trata-se de um poderoso
anestésico de inalação, não inflamável e não explosivo, com um odor relativamente agradável. Pode ser
administrado ao paciente com o mesmo equipamento usado para sua oxigenação.
Após a inalação, a substância chega aos pulmões tornando possı́vel a passagem para o estado anestésico
mais rapidamente do que seria possı́vel com drogas administradas de forma intravenosa.
Entretanto, os efeitos colaterais incluem a depressão do sistema respiratório e cardiovascular, sensibi-
lização a arritmias produzidas por adrenalina e eventualmente o desenvolvimento de lesão hepática. Alguns
anestesistas acreditam que esses efeitos podem causar complicações em pacientes com problemas cardı́acos
e sugerem o uso da morfina como um agente anestésico nesses pacientes devido ao seu pequeno efeito na
atividade cardı́aca.
Conahan et al. (1973) compararam esses dois agentes anestésicos em um grande número de pacientes
submetidos a uma cirurgia de rotina para reparo ou substituição da válvula cardı́aca. Para obter duas
amostras comparáveis, os pacientes foram alocados aleatoriamente a cada tipo de anestesia. Com o objetivo
de estudar o efeito desses dois tipos de anestesia, foram registradas variáveis hemodinâmicas, como pressão
sangüı́nea antes da indução anestésica, após a anestesia mas antes da incisão, e em outros perı́odos impor-
tantes durante a operação. A questão que surge é se o efeito do halotano e da morfina na pressão sangüı́nea
é o mesmo. Para comparar os dois grupos, necessitamos dos resultados apresentados na Tabela 8.13 a seguir:
Tabela 8.13: Média e desvio-padrão da pressão sangüı́nea (mmHg) segundo o tipo de anestesia.
Informações Anestesia
sobre a amostra Halotano Morfina
Média 66,9 73,2
Desvio-Padrão 12,2 14,4
n 61 61
Nas condições do problema, as hipóteses são:

{
H0 : µ1 = µ2
;
Ha : µ1 ̸= µ2
isto é, devemos testar a diferença entre as pressões sangüı́neas médias de indivı́duos anestesiados com halotano
ou morfina.
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas ROSSI, R. M. 102
Como as amostras são grandes, podemos usar o teste Z, cujo valor da estatı́stica do teste é:
66, 9 − 73, 2 6, 30
Zc = √ = −√ = −2, 61 (p-valor : 0,0103).
2
12, 2 14, 4 2 5, 84
+
61 61
Adotando um nı́vel de siginificância de 5%, o resultado é estatisticamente significativo, já que | − 2, 61| >
1, 96, indicando que os dois anestésicos não são equivalentes.
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas

8.6.1 Teste t-pareado
Para estudar o efeito de um tratamento, muitas vezes comparam-se pares de indivı́duos. Por exemplo, em
alguns estudos de psicologia comparam-se pares de gêmeos: um dos gêmeos recebe o tratamento, enquanto
o outro permanece sem o tratamento (controle).
Outras vezes, comparam-se os dois lados dos mesmos indivı́duos. Por exemplo, par estudar o efeito de um
tratamento para prevenção de cáries, o dentista pode aplicar o tratamento em um lado da arcada dentária
de cada paciente, e deixar o outro lado sem tratamento (controle).
Também são feitos experimentos em que se observam os mesmos indivı́duos duas vezes, isto é, uma vez
antes, outra vez, depois de administrar o tratamento. Por exemplo, para verificar o efeito de um tratamento
sobre pressão arterial, o médico pode obter a pressão arterial de seus pacientes, antes e depois de administrar
o tratamento.
Todos esses exemplos são de observações pareadas (pares de gêmeos, dois lados de um indivı́duo, ob-
servações no mesmo indivı́duo). Para testar o efeito de um tratamento, quando as observações são pareadas,
aplica-se o teste t.
Estatı́stica teste:
d¯
tc = √ ∼ tn−1;α%
s2
n
onde:
d¯ : média das diferenças, di = x2 − x1 : a diferença entre as unidades de cada um dos n pares
∑
n
di
i=1
d¯ =
n
s2 : variância das diferenças, di .
Toda vez que o valor absoluto de tc for igual ou maior do que o valor tabelado tn−1;α% , conclui-se que o
tratamento tem efeito ao nı́vel α% estabelecido.
O intervalo de confiança para d, será dado por:
S
d¯ ± tn−1;α% . √
n
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas ROSSI, R. M. 103
Exemplo 8.10. São dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento.
Tabela 8.14: Pesos em Kg de 9 pessoas antes e depois da dieta para emagrecimento.

Dieta
Antes Depois di
77 80 3
62 58 -4
61 61 0
80 76 -4
90 79 11
72 69 -3
86 90 4
59 51 -8
88 81 -7
Total -30
Para fazer o teste, é preciso primeiro estabelecer o nı́vel de significância. Seja α = 1%,
30
d¯ = − = −3, 33
9
s2 = 25
logo
−3, 33
tc = √ = −2, 0 (p-valor : 0,080516).
25
9
Ao nı́vel de siginificância de 1% com g.l. = 8, o valor de t tabelado para t8;1% .é de 3,36. Como o valor
absoluto de tc (2,0) é menor do que o valor da tabela, concui-se que o tratamento não tem efeito significativo.
Em termos práticos, o experimento não provou que a dieta emagrece.
8.7 Testes Não-Paramétricos ROSSI, R. M. 104
8.7 Testes Não-Paramétricos

Os testes não-paramétricos são boas opções para situações em que ocorrem violações dos pressupostos
básicos necessários para a aplicação de um teste paramétrico. Por exemplo, para testar a diferença de dois
ou mais grupos quando a distribuição subjacente é assimétrica ou dos dados foram coletados em uma escala
ordinal.
8.7.1 Teste Mann-Whitney para Amostras Independentes

Este teste corresponde a mais uma alternativa para a comparação de duas amostras independentes,
utilizando, como os demais testes não-paramétricos, os números naturais para classificação conjunta dos
valores observados. Portanto, o posto de um valor de um conjunto de n valores corres-ponde a um número
natural que indicará a sua posição no conjunto anteriormente ordenado (posto, score ou rank ), isto é, todas
as N observações recebem uma pontuação através dos números naturais 1, 2, 3, 4, ..., n. Assim, ao menor valor
se dará o número 1, e assim sucessivamente até o valor maior, que receberá a maior pontuação. Quando
ocorre a presença de valores iguais no conjunto, considera-se um ponto médio, não afetando o posto seguinte.
Portanto, num conjunto de seis valores já ordenados {7-12-18-18-19-23} os postos serão {1-2-3,5-3,5-5-6},
respectivamente.
Quanto ao procedimento mais adequado para a aplicação do teste, baseamo-nos no cálculo de U1 e U2 ,
sendo:
ni (ni + 1)
Ui = n1 n2 + − Ti , i = 1, 2.
2
Os valores n1 e n2 são os tamanhos das duas amostras de T1 e T2 , que correspondem as somas dos pontos
(postos) atribuı́dos aos valores das duas amostras.
Para amostras pequenas (ni ≤ 20)
Uc = mı́n{U1 ; U2 }
Obtemos uma estatı́stica tabelada : UT = Uα,n1 ,n2 e concluı́mos para a rejeição de H0 se UT ≥ Uc .
Para amostras grandes (ni > 20)

Neste caso o teste pode ser aplicado por aproximação normal:
ni (n1 + n2 + 1)
µ∗ = , sendo ni = min{n1 ; n2 }
√ 2
n1 n2 (n1 + n2 + 1)
e σ∗ = ,
12
considerando w = min{T1 ; T2 } tem-se a expressão:
w − µ∗
Z= ∼ N (0, 1).
σ∗
Exemplo 8.11. Verificar se os dados das duas amostras apresentam diferença significativa.
Tabela 8.15: Dados hipotéticos.

Amostra A Amostra B
2,6 (9,5) 2,3 (5)
2,9 (13) 2,8 (12)
2,5 (8) 2,0 (2)
2,7 (11) 1,8 (1)
3,2 (14) 2,4 (7)
2,6 (9,5) 2,3 (5)
2,3 (5) 2,2 (3)
3,3 (15) -
T1 = 85, 0 T2 = 35, 0
Procede-se à ordenação dos valores para obtenção dos seus postos e posteriormente seu somatório.
Temos então n1 = 8, n2 = 7, T1 = 85 e T2 = 35.
O valor de U1 e de U2 , respectivamente serão:
8(8 + 1)
U1 = 8(7) + − 85 = 7
2
7(7 + 1)
U2 = 8(7) + − 35 = 49.
2
Assim
Uc = mı́n{7;49} = 7
O valor da estatı́stica tabelada (Anexo) será de:
UT = Uα,n1 ,n2 = U5%,8,7 ≃ 12
Como Uc ≤ UT rejeitamos Ho . Portanto as amostras diferem entre si ao nı́vel de 5% de significância.

Suponho n > 20 O teste pode ser aplicado tanto para U1 ou U2 , pois ambos são simétricos em relação à
média. √
7(8 + 7 + 1) 112 8(7)(8 + 7 + 1)
µ∗ = = = 56 e σ ∗ = = 8, 63.
2 2 12
Sendo assim, w = min{85; 35} = 35, tem-se:
35 − 56
Z= = −2, 43 (p-valor : 0,013986).
8, 63
Como o valor de |Z| é maior do que Zα , quando α = 5%, ou seja, o valor 1,96, rejeitamos H0 . Considera-se
que as amostras diferem entre si ao nı́vel de 5% de significância.
8.7.2 Teste Kruskal-Wallis para k Amostras Independentes

O teste de Kruska-Wallis foi criado como um substituto ao teste F na análise de variância paramétrica
(ANOVA) que será apresentado no próximo capı́tulo.
Ele é utilizado para que se verifique o contraste entre k (k>2) amostras independentes.
Requisitos:
• Comparação entre 3 ou mais grupos independentes;
• Dados ordinais (que possam ser ordenados);

• ni ≥ 6.
Os valores obtidos nas diversas amostras diferem entre si e portanto, será uma maneira de verificar se
estas diferenças são devidas ao acaso ou se as amostras provém de populações diferentes.
Da mesma forma que nos outros testes, serão consideradas as hipóteses nula (H0 ) e alternativa (Ha ), isto
é:
H0 : não há diferença significativa entre os tratamentos.

Ha : há diferença significativa entre os tratamentos.
Quanto à metodologia usada no teste de Kruskal-Wallis, a expressão é definida por:

12 ∑k T2
HK−W = i
− 3(N + 1) tal que H ∼ χ2(k−1)
N (N + 1) i=1 ni
em que:
Ti : é a soma das ordens atribuı́das ao tratamento i;
k : corresponde ao número de tratamentos ou amostras a comparar;
ni : o número de observações em cada tratamento k e,
N : o total de observações em todos os tratamentos k.
Exemplo 8.12. Analisar o tempo de sobrevida, em meses, de pacientes atendidos na clı́nica de abdômen
do hospital X, na cidade de Cabrobó.
Tabela 8.16: Tempo de sobrevida.

Radioterapia (n1 = 7) Quimioterapia (n2 = 8) Cirurgia (n3 = 8)
17 (11) 20 (12) 32 (17)
14 (9) 5 (3) 35 (20)
4 (2) 9 (6) 26 (15)
8 (5) 13 (8) 34 (18,5)
29 (16) 34 (18,5) 21 (13)
6 (4) 2 (1) 45 (21)
15 (10) 11 (7) 50 (23)
- 22 (14) 47 (22)
T1 = 57, 0 T2 = 69, 5 T3 = 149, 5
Questões: Há diferença sifnificativa entre os tempos de sobrevivência? Qual o tratamento recomendado
baseado no tempo de sobrevida?
Independentemente do número de observações em cada grupo e utilizando os números naturais, procede-
mos à ordenação dos valores. Assim os valores acima receberiam a seguinte numeração, conforme os valores
já entre parênteses.
Então:
12 ∑k T2
HK−W = i
− 3(N + 1)
N (N + 1) i=1 ni
12 ∑3 T2
= i
− 3(23 + 1)
23(23 + 1) i=1 ni
[ ]
1 572 69, 52 149, 52
= + + − 72
46 7 8 8
1
= (3861, 7) − 72
46
= 11, 95 (p-valor : 0,0025).
Como HK−W ∼ χ2(k−1) , então H ∼ χ2(3−1) ⇒ χ22;5% = 5, 99 e χ22;1% = 9, 21, portanto, considerando que
o valor encontrado de HK−W = 11, 95 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 e conseqüentemente, pela indicação de que o tratamento cirúrgico
se destaca dos demais, pois apresenta maiores valores aos tempos de sobrevida.
8.7.3 Teste de Wilcoxon para Amostras Pareadas

Trata-se de um teste não-paramétrico para comparar dois tratamentos quando os dados são obtidos
através do esquema de pareamento. A prova de Wilcoxon avalia a grandeza das diferenças quando
comparados postos de observações. Dada a grandeza das diferenças observadas, atribui-se maior valor para
a maior diferença encontrada, diminuindo este valor de acordo com as menores diferenças existentes.
Procedimento
1. Calcular di : diferença entre as obsevações

(2) (1)
di = xi − xi
2. Ignorar os sinais e atribuir postos

3. Calcular a soma dos postos (T+ e T− ).
4. Obter o valor da estatı́stica calculada
Tc = min{|T− |; |T+ |}
5. Obter o valor da estatı́stica Tabelada (Anexo V)
Tα;n
6. Concluir pela rejeição de H0 se Tc ≤ Tα;n .
Pequenas Amostras (n ≤ 20)

No confronto de dois grupos quando desejamos identificar se existe diferença significativa entre os mesmos
quanto às medidas encontradas, empregamos o teste de Wilcoxon quando a variação dos valores apresenta-se
de forma acentuada.
A aplicação deste teste pressupõe que as duas amostras sejam casualizadas e independentes, e que as
variáveis em confronto sejam contı́nuas.
A metodologia do teste consiste em se proceder à ordenação dos valores das amostras e, posteriormente,
atribuir aos mesmos seus “ranks”. Em seguinda, obtém-se os totais do ranks da amostra de menor tamanho,
consultando-se a tabela (anexo) do referido teste.
Exemplo 8.13. Foi realizado um ensaio clı́nico em que foram utilizadas duas drogas A e B. Com a droga
A foram tratados oito pacientes e com a droga B, cinco pacientes. Os nı́veis de anticorpos corresponderam
a:
Tabela 8.17: Nı́veis de anticorpos.

Tratamento d rank de |d|
A B - -
7,4 9,1 1,7 5
12,3 9,7 -2,6 6
11,8 19,2 7,4 8
16,4 22,4 6,0 7
1,9 1,5 -0,4 1
3,0 3,5 0,5 2,5
6,8 7,8 1,0 4
20,4 19,9 -0,5 2,5
Tem-se:
Soma dos ranks (-) : 9,5

Soma dos ranks (+) : 26,5
assim
Tc = min{9, 5; 26, 5} = 9, 5
consultando-se a Tabela de Wilcoxon, verifica-se que Tα;n = T5%;5 = 5 < 9, 5 (no Statistica o p-valor :
0,234).
Assim, não rejeitamos H0 , ou seja, que os valores comparados, referentes às drogas A e B, não apresentam-
se com diferença siginificativa. Conclui-se, então, que os valores de nı́veis de anticorpos em relação aos dois
tipos de drogas se comportam de forma semelhante.
Grandes Amostras (n > 20)

Nos casos de grandes amostras, estas apresentam valores com distribuição normal e, portanto, a com-
paração das medidas será realizada através de determinação de um valor W ∗ .
São enunciadas naturalmente as hipóteses. H0 será rejeitada se o valor de W ∗ for maior ou igual a Zα
para um nı́vel de significância, α, pré-determinado.
Assim, para a comparação de conjuntos de medidas, provenientes de duas amostras, será necessário
utilizar a expressão de W ∗ :
n(n + 1)
Tc −
W =√∗ 4 ∼ N (0, 1)
n(n + 1)(2n + 1)
24
em que:
n : número de elementos da menor amostra;
Exemplo 8.14. Evolução do tratamento com tianeptina: Escores dos pacientes do grupo tianeptina no
primeiro e no último dia:
Tabela 8.18: Tratamento com tianeptina.

Tianeptina
Primeiro dia (m = 8) Último dia (n = 8) d Postos
24 6 -18 (-) 11,5
46 33 -13 (-) 7
26 21 -5 (-) 4,5
44 26 -18 (-) 11,5
27 10 -17 (-) 9,5
34 29 -5 (-) 4,5
33 33 0 (+) 1
25 29 +4 (+) 3
35 37 +2 (+) 2
30 15 -15 (-) 8
38 2 -36 (-) 14
38 21 -17 (-) 9,5
31 7 -24 (-) 13
27 * * *
34 * * *
32 26 -6 (-) 6
Sendo assim temos: |T− | = 99 e |T+ | = 6, então
Tc = min{99; 6} = 6
De acordo com a Tabela de Wilcoxon,
Tα;n = T5%;14 = 21
Como 6 < 21, rejeitamos H0 .

Supondo n grande teremos:
14(14 + 1)
6−
∗
W =√ 4 = −2, 92 (p-valor : 0,003).
14(14 + 1)(2.14 + 1)
24
Considerando que o valor de W ∗ = −2, 92 está na área de rejeição de H0 , para o valor de Z5% = ±1, 96,
rejeitamos H0 , ou seja, os valores dos dois conjuntos apresentam diferenças significativas.
8.7.4 Teste Friedman para k Amostras Pareadas

O teste de Friedman é recomendado como um substituto do teste F (ANOVA), quando
procede-se à comparação de k (k>2) amostras relacionadas ou dependentes cujas observações
apresentam valores com acentuadas variações e em cada tratamento são constituı́dos blocos.
Na verdade, procura-se fazer a comparação de tratamentos em que são formados blocos com a intenção de
que isto resulte em um pareamento considerável entre os diversos tratamentos.
A forma de realização do teste é análogo aos demais. Dentro de cada um do n blocos formados procede-se
à classificação das i-ésimas observações em k tratamentos, utilizando-se números naturais.
Assim, tem-se a estatı́stica teste:
12 ∑k
HF r = T 2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1 i
Exemplo 8.15. São prescritos quatro procedimentos técnicos para determinação de certa variável. Foram
formados cinco blocos e obtidos os seguintes valores:
Tabela 8.19: Dados de quatro procedimentos técnicos.

Tratamentos
A B C D
12 (2) 13 (3) 16 (4) 7 (1)
8 (2) 9 (3) 12 (4) 5 (1)
14 (2) 20 (3) 22 (4) 6 (1)
17 (3) 16 (2) 21 (4) 11 (1)
12 (2) 15 (3) 16 (4) 10 (1)
T1 = 11 T2 = 14 T3 = 20 T4 = 5
Substituindo-se os valores na expressão no teste, tem-se:
12 ∑4
HF r = . Ti2 − 3.5(4 + 1)
5.4(4 + 1) i=1
12
= . [121 + 196 + 400] − 75
100
= 14, 04 (p-valor : 0,00285).
Como HF r ∼ χ2(k−1) , então HF r ∼ χ2(4−1) ⇒ χ23;5% = 7, 82 e χ23;1% = 11, 34, portanto, considerando que
o valor encontrado de HF r = 14, 04 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 , logo verifica-se que há diferença significativa entre as medidas dos
tratamentos. O tratamento C apresentou melhores resultados em relação aos demais grupos.
8.7.5 Outros Testes Não-Paramétricos

Teste de Concordância ou de Replicabilidade (Coeficiente de Kappa)
O coeficiente de Kappa é utilizado para verificar a concordância entre os diagnósticos de dois especialistas.
Observe a Tabela (8.20) abaixo:
Tabela 8.20: Concordância entre o diagnóstico de dois especialistas.

Diagnóstico Diagnóstico Especialista 1 Total
Especialista 2 Presente (+) Ausente (-)
Presente (+) a (++) b (+-) n1 = a + b
Ausente (-) c (-+) d (–) n2 = c + d
Total m1 = a + c m2 = b + d n
Cálculos auxiliares:
• Proporção de concordância observada:

a+d
po =
n
• Proporção de concordância casual:
n1 m 1 + n2 m 2
pc =
n2
• Coefficiente:
po − pc
Kappa = .
1 − pc
Classificação:
Kappa Concordância
k=0 nenhuma
k < 0, 4 leve
0, 4 ≤ k < 0, 8 moderada
0, 8 ≤ k < 1 forte
k=1 perfeita
Exemplo 8.16. Em uma determinada experiência, foi avaliado o grau de lesão do tecido hepático, em 20
cobaias às quais foi administrada uma certa substância tóxica. Os resultados dos exames efetuados por dois
patologistas foram o seguinte:
Tabela 8.21: Teste Kappa para a concordância entre patologistas quanto ao grau de lesão do tecido hepático.
Cobaia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Patologista 1 + + + + + + - + + + + + + - - + - + + -
Patologista 2 + + - + + + - - + + - + + - - - - - + -
+ : presença de lesão hepática

- : ausência de lesão hepática.
Com base nesses resultados, é possı́vel construir a tabela abaixo:

Então tem-se:
a+d 10 + 5
po = = = 0, 75
n 20
n1 m 1 + n2 m 2 15(10) + 5(10) 200
pc = 2
= 2
= = 0, 5
n 20 400
po − pc 0, 75 − 0, 5
Kappa = = = 0, 5.
1 − pc 1 − 0, 5
Conclui-se que existe uma concordância apenas moderada entre os diagnósticos dos patologistas.
Tabela 8.22: Concordância entre o diagnóstico de dois especialistas.

Diagnóstico Diagnóstico Patologista 1 Total
Patologista 2 Presente (+) Ausente (-)
Presente (+) 10 5 15
Ausente (-) 0 5 5
Total 10 10 20
Teste de Cochran
O teste de Cochran é utilizado quando se deseja comparar tratamentos distintos aplicados a uma mesma
amostra (medidas repetidas), o que caracteriza a dependência ou o pareamento das unidades amostrais em
que a resposta é da forma 0 ou 1, isto é, sucesso ou fracasso. O teste de Cochran é uma extensão do teste
de McNemar.
A hipótese a ser testada será:
H0 : Os tratamentos não diferem entre si;
Ha : Pelo menos um par de tratamentos diferem entre si.
Estatı́stica teste:
∑k
2
k(k − 1) (Ti ) − (k − 1)N 2
i=1
Q= ∑n ∼ χ2k−1 .
2
kN − (Sj )
j=1
Sendo k : tratamentos e N : total de un‘s.

A decisão pela rejeição de Ho será tomada se Q ≥ χ2k−1 , assim existe pelo menos um par de tratamentos
que diferem entre si ao nı́vel α de significância.
Um psiquiatra quer testar a eficiência de 4 tratamentos em 10 sujeitos submetidos a um teste cuja resposta
é “sim” ou “não”.
Tabela 8.23: Teste de Cochran: Dez indivı́duos submetidos a quatro tratamentos supostamente homogêneos.
Tratamentos
2
Indivı́duos T1 T2 T3 T4 Sj (Sj )
1 1 1 1 1 4 16
2 1 0 0 1 2 4
3 1 0 1 0 2 4
4 1 1 1 0 3 9
5 0 0 0 0 0 0
6 0 1 1 1 3 9
7 1 0 1 1 3 9
8 0 0 1 0 1 1
9 1 1 1 0 3 9
10 0 1 0 0 1 1
Ti 6 5 7 4 22 62
2
(Ti ) 36 25 49 16 126 -
Assim tem-se:
∑
4
2
4(4 − 1) (Ti ) − (4 − 1)(222 )
i=1
Q =
∑
10
2
4(22) − (Sj )
j=1
4(3) (126) − (4 − 1)(222 )

=
4(22) − (62)
= 2, 31 < χ23 = 7, 815,
logo não se rejeita H0 .Concluı́-se que os tratamentos não diferem entre si ao nı́vel de 5% de significância.
Observação: Em caso de rejeição da hipótese nula, um procedimento de comparações múltiplas deve
ser realizado (ver CASTELLANOS e MERINO, 1989).
Capı́tulo 9
Análise de Variância
Às vezes é preciso comparar médias de mais de duas populações. Por exemplo, para verificar se pessoas
com diferentes nı́veis de renda, isto é, alto, médio e baixo têm, em média, o mesmo peso corporal, é preciso
comparar médias de três populações.
Outras vezes, é preciso comparar várias situações experimentais. Por exemplo, se um pesquisador separa,
ao acaso, um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo, terá que
comparar médias de quatro “populações”.
Para comparar médias de mais de duas populações normais ou aproximadamente normais, aplica-se o
teste F. Neste caso convém verificar antecipadamente a normalidade dos dados.
Por exemplo, imagine que 4 amostras casuais simples, todas com cinco elementos mas cada uma prove-
niente de uma população, conduziram aos dados apresentados na Tabela 9.1.
Tabela 9.1: Dados de 4 amostras e respectivas médias.

Amostras
A B C D
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
8 5 7 0
x̄1 = 8 x̄2 = 5 x̄3 = 5 x̄4 = 2
Será que as diferenças das médias das amostras são suficientemente grandes para que se possa afirmar
que as médias das populações são diferentes? Para responder a esta pergunta, é preciso um teste estatı́stico.
9.1 ANOVA para Experimentos ao Acaso

Primeiro, é preciso estudar as causas de variação. Por que os dados variam? Uma explicação é o fato de
as amostras provirem de populações diferentes. Outra explicação é o caso, porque mesmo dados provenientes
da mesma população variam.
O teste F é feito através de uma análise de variância, que separa a variabilidade devido aos “tra-
tamentos” (no exemplo, devido às amostras terem provindo de populações diferentes) da variabilidade
residual, isto é, devido ao acaso. Para aplicar o teste F é preciso fazer uma série de cálculos, que exigem
conhecimento de notação.
A Tabela 9.2, apresenta os dados de k tratamentos, cada um com r repetições (no exemplo, denominam-se
repetições os elementos da mesma amostra). A soma das r repetições de um mesmo tratamento constitui o
total desse tratamento. O total geral é dado pela soma dos k totais de tratamentos.
113
9.1 ANOVA para Experimentos ao Acaso ROSSI, R. M. 114
Tabela 9.2: Notação para a análise de variância.

Tratamentos
1 2 3 ... k Total
x11 x21 x31 ... xk1
x12 x22 x32 ... xk2
. .
. .
. .
x1r x2r x3r xkr ∑ ∑
Total T1 T2 T3 ... Tk T = x
No de repetições r r r ... r n = kr
Média x̄1 x̄2 x̄3 x̄k
Para fazer a análise de variância é preciso calcular as seguintes quantidades:
1. os graus de liberdade:
(a) de tratamento: k − 1
(b) de total: n − 1
(c) de resı́duo: (n − 1) − (k − 1) = n − k
2. o valor C, dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O valor C é
chamado correção. ∑
( x)2
C=
n
3. a soma de quadrados total: ∑
SQT = x2 − C
3. a soma de quadrados de tratamentos:

∑
T2
SQT r = −C
r
4. a soma de quadrados de resı́duos:

SQR = SQT − SQT r
5. o quadrado médio de tratamentos:

SQT r
QM T r =
k−1
6. o quadrado médio de resı́duo:
SQR
QM R =
n−k
7. o valor de F
QM T r
F =
QM R
Em seguida, é preciso comparar o valor calculado de F com o valor tado em tabela, ao nı́vel de significância
estabelecido e com (k − 1) graus de liverdade no numerador e (n − k) graus de liberdade no denominador.
Toda vez que o valor calculado de F for maior ou igual do que o da tabela conclui-se, ao nı́vel de
significância estabelecido, que as médias de tratamentos são iguais.
Exemplo 9.1. Para os dados apresentados na Tabela 9.1, proceder uma análise de variância para verificar
se existe diferença significativa entre os tratamentos.
9.1 ANOVA para Experimentos ao Acaso ROSSI, R. M. 115
(a) de tratamento: k − 1 = 4 − 1 = 3
(b) de total: n − 1 = 20 − 1 = 19
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 20 − 4 = 16
2. o valor C: ∑
( x)2 (11 + 8 + ... + 0)2
C= = = 500
n 20
3. a soma de quadrados total:
∑
SQT = x2 − C = 112 + 82 + ... + 02 − 500 = 658 − 500 = 158

∑ 2
T 402 + 252 + 252 + 102
SQT r = −C = − 500 = 590 − 500 = 90
r 5
SQR = SQT − SQT r = 158 − 90 = 68

SQT r 90
QM T r = = = 30
k−1 3

SQR 68
QM R = = = 4, 25
n−k 16
7. o valor de F
QM T r
F = = 7, 06
QM R
As quantidades calculadas são apresentadas numa tabela de análise de variância. Veja a Tabela 9.3:
Tabela 9.3: Análise de variância dos dados da Tabela 6.1.

Causas da variação GL SQ QM F p
Tratamentos 3 90 30 7,06 0,003086
Resı́duo 16 68 4,25
Total 19 158
Ao nı́vel de significância de 5%, o valor de F tabelado, com 3 e 16 graus de liberdade (numerador e

denominador, respectivamente), é de 3,24. Como o valor obtido é maior do que 3,24, conclui-se que as
médias não são iguais, ao nı́vel de significância de 5%.
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 116
9.2 Teste de Comparações Múltiplas

9.2.1 Número Igual de Repetições
Teste Tukey
Uma análise de variância permite estabelecer se as médias das populações em estudo são, ou não são, esta-
tisticamente iguais. No entanto, esse tipo de análise não permite detectar quais são as médias estatı́sticamente
diferentes das demais. Por exemplo, a análise de variância apresentada na Tabela 6.3 mostrou que as médias
das populações não são iguais, mas não permite concluir que é, ou quais são, as médias diferentes das demais.
O teste de Tukey permite estabelecer a diferença mı́nima significante (dms), ou seja, a menor diferença
de médias de amostras que deve ser tomada como estatisticamente significante, em determinado nı́vel. Essa
diferença (d.m.s) é dada por: √
QM R
dms = q
r
onde q é um valor dado em tabela, QMR é o quadrado médio do resı́duo da análise de variância e r é o
número de repetições de cada tratamento.
Considere agora os dados da Tabela 9.1. A análise de variância apresentada na Tabela 9.3 mostra um
valor F significante ao nı́vel de 5%. Então as médias de A, B, C e D não são estatı́sticamente iguais. Mas
qual é, ou quais são, as médias diferentes entre si?
A pergunta pode ser respondida com a aplicação do teste de Tukey. Ao nı́vel de significância de 5%,
o valor de q para comparar 4 tratamentos (A,B, C e D), com 16 graus de liberdade no resı́duo, é de 4,05.
Como QMR = 4,25 e r = 5, segue-se que:
√
4, 25
dms = 4, 05 = 3, 73.
5
De acordo com o teste de Tukey, duas médias são estatisticamente diferentes toda vez que o valor absoluto
da diferença entre elas for igual ou superior ao valor da d.m.s. No caso do Exemplo, o valor da d.m.s. é 3.73
e os valores absolutos das diferenças entre as médias estão apresentados a seguir. É fácil ver que a diferença
entre as médias A e D é maior do que a d.m.s. Então, ao nı́vel de 5%, a média de A é significativamente
mair do que a média de D.
Tabela 9.4: Comparações entre as médias via Tukey.

Pares de médias Valor absoluto da diferença
AeB |8 − 5| = 3
AeC |8 − 5| = 3
AeD |8 − 2| = 6
BeC |5 − 5| = 0
BeD |5 − 2| = 3
CeE |5 − 2| = 3
Exemplo 9.2. Com base nos dados apresentados na Tabela 9.5 abaixo, verifique se existe diferença estatı́stica
entre os grupos. Note que são três grupos em comparação. No grupo operado foi feita a remoção das glândulas
salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cirúrgicos, mas nenhuma
glândula foi removida (Banco de dados: Tukey1 ex.stw).
Sol.: A tabela de análise de variância resume os cálculos:
Para aplicar o teste de Tukey ao nı́vel de significância de 5%, tem-se:
q3;21 ≃ 3, 57
e √
53, 247
dms = 3, 57 = 9, 21.
8
Os valores absolutos das diferenças de médias são:
A taxa de glicose é, em média, maior nos operados do que nos pseudo-operados, ao nı́vel de significância
de 5%.
Tabela 9.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias,
segundo o grupo.
Grupo
Operado Pseudo-operado Normal
96 90 86
95 93 85
100 89 105
108 88 105
120 87 90
110,5 92,5 100
97 87,5 95
92,5 85 95
Tabela 9.6: ANOVA para a taxa de glicose.

Grupos 2 717,25 358,625 6,73 0,005509
Resı́duo 21 1118,75 53,274
Total 23 1836,00
Teste Dunnett
Em muitos experimentos, é comum a necessidade de se realizar múltiplas comparações, todas em relação
a um único grupo denominado “Controle”. Neste caso, o test Dunnett (1964) é apropriado.
Teremos (k − 1) comparações a serem realizadas em relação ao controle e queremos testas as seguintes
hipóteses:
H0 : µi = µc i = 1, 2, ..., k − 1
Ha ̸ µc c: controle
: µi =
O procedimento de Dunnett é análogo ao teste t, mas modificado.

√
2QM R
dms = d
r
onde r é o número de repetições.
Considerando um nı́vel de confiança α, rejeitamos H0 se:
√ ( )
1 1
|x̄i − x̄c | > dα,(k−1),f QM R +
ni nc
onde:
dα,(k−1),f está tabelado (Tabela Dunnett) para k − 1 comarações e f : no de observações dos tratamentos
(exceto o controle);
QM R : proveniente da ANOVA (Quadrado Médio dos Resı́duos);
ni : no de observações do tratamento i;
nc : no de observações do controle;
x̄i e x̄c : médias, do tratamento e controle, respectivamente.
Exemplo 9.3. Deseja-se comparar o efeito de cinco drogas na diminuição da pressão arterial. Para isto
utilizou-se cinco grupos distintos e foram comparadas suas médias em relação a média de um grupo controle,
que recebeu placebo. Ao todo, 30 indivı́duos participaram no experimento. A Tabela abaixo apresenta os
valores referentes a diferença entre a pressão arterial no inı́cio e no fim do experimento (mmHg).
Tabela 9.7: Comparações para as taxas médias de glicose.

Pares de médias Valor absoluto da diferença p
Operado vs pseudo |102, 375 − 89, 0| = 13, 375 0,0004
Operado vs normal |102, 375 − 95, 125| = 7, 25 0,1403
Pseudo vs normal |89, 000 − 92, 125| = 6, 125 0,2368
Tabela 9.8: Diminuição da pressão arterial, em milı́metros de mercúrio, segundo o tratamento.

Tratamento
A B C D E Controle
25 10 18 23 11 8
17 -2 8 29 23 -6
27 12 4 25 5 6
21 4 14 35 17 0
15 16 6 33 9 2
Após a análise de variância, tem-se:

Como o valor de F apresentado é de 13,08 (p-valor = 0,000003) é significante ao nı́vel de 5%, é razoável
procurar um teste para comparar as médias dos tratamentos. A d.m.s. estabelecida pelo teste Dunnett
(especı́fico para este caso) será:
√ √
2QM R 2(36)
dms = d = 2, 70 = 10, 25
r 5
Obs. O valor d = 2, 70 é proveniente da Tabela Dunnett com 24 graus de liberdade.
Desta forma teremos:
É facil observar que os tratamentos A, D e E apresentam, em média, resultados melhores que os do
controle, ao nı́vel de 5%.
9.2.2 Número Diferente de Repetições

Muitas vezes o pesquisador dispõe de diversas amostras, cada uma proveniente de uma população, mas
essas amostras não têm todas o mesmo tamanho. Mesmo assim, é possı́vel conduzir a análise de variância.
Aliás, todos os cálculos, com exceção da soma de quadrados de tratamentos, são feitos na forma já apresentada
anteriormente.
Para entender como se calcula a soma de quadrados de tratamentos quando os tratamentos não têm o
mesmo número de repetições, primeiro observe a Tabela 9.11.
A soma de quadrados de tratamentos é dada pela fórmula:
T12 T2 T2
SQT r = + 2 + ... + k − C
r1 r2 rk
onde C é a correção já definida anteriormente.
É mais fácil entender a aplicação de fórmulas através de um exemplo.
Exemplo 9.4. Análise de variância para os dados da Tabela 9.12.
(a) de tratamento: k − 1 = 3 − 1 = 2
(b) de total: n − 1 = 15 − 1 = 14
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 15 − 3 = 12
2. o valor C: ∑
( x)2 (15 + 10 + ... + 16)2
C= = = 4001, 67
n 15
Tabela 9.9: ANOVA para os dados de pressão arterial, em milı́metros de mercúrio, segundo o tratamento.
Grupos 5 2354,17 470,83 13,08 0,000003
Resı́duo 24 864 36
Total 29 3218,17
Tabela 9.10: Comparações entre as médias dos dados de Pressão arterial.

A vs Controle |21 − 2| = 19 > 10, 25 0,000182
B vs Controle |8 − 2| = 6 < 10, 25 0,392329
C vs Controle |10 − 2| = 8 < 10, 25 0,162730
D vs Controle |29 − 2| = 27 > 10, 25 0,000007
E vs Controle |13 − 2| = 11 > 10, 25 0,032024
3. a soma de quadrados total:

∑
SQT = x2 − c = 152 + 102 + ... + 162 − 4001, 67 = 159, 33

∑ 2
T 842 762 852
SQT r = −C = + + − 4001, 67 = 63, 33
r 6 4 5
SQR = SQT − SQT r = 159, 33 − 63, 33 = 96, 00

SQT r 63, 33
QM T r = = = 31, 67
k−1 2

SQR 96
QM R = = = 8, 00
n−k 12
7. o valor de F
QM T r 31, 67
F = = = 3, 96
QM R 8, 00
Os valores calculados estão apresentados na Tabela 9.13.
Ao nı́vel de significância de 5%, com 2 e 12 g.l., o valor de F tabelado é de 3,89, menor do que 3,96,
conclui-se que as médias diferem entre si.
Os métodos de comparação de médias apresentados anteriormente também podem ser usados quando o
número de repetições por tratamento não é constante. Se ri e rj são o número de repetições dos tratamentos
em comparação, as fórmulas para a diferença mı́nima significante ficam como segue:
Teste Tukey
Para comparar as médias de tratamentos duas a duas, pode-se aplicar o teste de Tukey que, neste caso, é
aproximado, porque os tratamentos têm números diferentes de repetições. A diferença mı́nima significativa
(dms) é dada pela fórmula: √( )
1 1 QM R
dms = q +
ri rj 2
Tabela 9.11: Notação para a análise de variância com diferentes repetições.

Tratamentos
1 2 3 ... k Total
x11 x21 x31 ... xk1
x12 x22 x32 ... xk2
. .
. .
. .
x1r x2r x3r xkr ∑ ∑
Total T1 T2 T3 ... Tk T = x
No de repetições r1 r2 r3 ... rk n = kr
Média x̄1 x̄2 x̄3 x̄k
Tabela 9.12: Dados de 3 amostras e respectivas médias.

Amostras
A B C
15 23 19
10 16 15
13 19 21
18 18 14
15 16
13
x̄1 = 84 x̄2 = 76 x̄3 = 86
onde ri é o número de repetições do i-ésimo tratamento e rj é o número de repetições do j-ésimo tratamento.

No caso do Exemplo anterior com dados na Tabela 9.12, para comparar a média de A com a média de
B, tem-se: √( )
1 1 8
dms = 3, 77 + = 4, 87.
6 4 2
Para comparar A com C, tem-se:
√( )
1 1 8
dms = 3, 77 + = 4, 57.
6 5 2
Para comparar B com C, tem-se:

√( )
1 1 8
dms = 3, 77 + = 5, 06.
4 5 2
Os valores absolutos das diferenças entre as médias estão são apresentados a seguir. Como o valor
absoluto da diferença entre A e B é maior do que a respectiva d.m.s., conclui-se que, em média, A difere de
B, ao nı́vel de significância de 5%.
Existem diferentes testes de comparações múltiplas. Dentre eles destacam-se:
Teste t
A diferença mı́nima significativa é dada pela fórmula:
√ ( )
1 1
dms = t + QM R
ri rj
Tabela 9.13: Análise de variância.

Tratamentos 2 63,33 31,67 3,96 0,04784
Resı́duo 12 96 8
Total 14 159,33
Tabela 9.14: Comaparações entre médias.

AeB |14 − 19| = 5 0,0443*
AeC |14 − 17| = 3 0,2272
BeC |19 − 17| = 2 0,5589
Teste Dunnett
A diferença mı́nima significativa é dada pela fórmula:
√( )
1 1
dms = d + QM R
ri rj
Considerações
A escolha apropriada de um teste é muito flexı́vel. Se o pesquisador quer ter alta chance de rejeitar
H0 : de que as médias são iguais, pode optar pelo teste t ou pelo teste Duncan (Não apresentado neste
material-Ver Vieira, 1999). Estes dois testes têm caracterı́sticas similares, mas o teste t é mais antigo e,
talvez por isso, mais conhecido. Também é de aplicação mais fácil. Entretanto, o pesquisador também pode
optar por aplicar o teste de Tukey ou de Dunnett, com nı́vel de significância mais elevado. Estes testes
teriam, então, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder do que o teste de Tukey
a 5%.
Um pesquisador que pretende somente rejeitar a hipótese de que as médias são iguais com muita confiança,
deve optar pelo teste de Tukey ou de Dunnett, com baixo nı́vel de significância. Esta situação pode ocorrer
quando se comparam novas drogas terapêuticas com uma droga conhecida. Toda droga tem efeitos colaterais.
Então, muitas vezes só é razoável indicar uma nova droga - de efeitos colaterais desconhecidos - quando
existem indicações seguras de que essa nova droga é melhor do que a convencional.
De qualquer forma, fica aqui um alerta: todos os procedimentos para a comparações de médias têm
vantagens e desvantagens. Ainda não existe um teste definitivamente “melhor” que todos os outros.
Capı́tulo 10
Testes Diagnósticos
10.1 Introdução
Uma das experiências mais rotineiras da prática médica é a solicitação de um teste diagnóstico. Os objeti-
vos são vários, incluindo a triagem de paciente, o diagnóstico de doenças e o
acompanhamento ou prognóstico da evolução de um paciente. Para chegar ao diagnóstico, o médico considera
várias possibilidades, com nı́veis de certeza que variam de acordo com as informações disponı́veis.
Um dos objetivo deste capı́tulo é mostrar como se mede o nı́vel de certeza da ocorrência de um evento,
por exemplo: a presença de uma doença após a observação de um teste positivo. Consideraremos o teste
positivo quando indicar a presença da doença e negativo quando indicar a ausência.
Não existe teste perfeito, aquele que com certeza absoluta determina a presença ou ausência da doença.
Estudaremos os ı́ndices nos quais o conceito de qualidade de um teste diagnóstico é usualmente desmenbrado.
Frequentemente, um único teste não é suficiente, e portanto deve-se combinar dois ou mais testes. O
ideal seria que, para cada patologia, fossem determinados os testes a serem incluı́dos no processo diagnóstico
e a melhor forma de combiná-los. Apresentaremos as formas mais comuns de combinações de testes e como
medir a qualidade do teste conjunto.
O bom uso de um teste diagnóstico requer, além de considerações clı́nicas, o conhecimento de medidas
que caracterizam a sua qualidade intrı́nseca: a sensibilidade, a especificidade e os parâmetros que refletem
a sua capacidade de produzir decisões clı́nicas corretas: Valor da Predição Positiva e o Valor da Predição
Negativa.
Na análise da qualidade de testes diagnósticos, interessa conhecer duas probabilidades condicionais, que
por suas importâncias, recebem nomes especiais:
122
10.2 Sensibilidade e Especificidade ROSSI, R. M. 123
10.2 Sensibilidade e Especificidade

A sensibilidade, denotada por s, é definida como a probabilidade de o teste ser positivo dado que o paciente
examinado é doente:
s = Pr(T+ |D+ )
A especificidade, denotada por e, é definida como a probabilidade de o teste ser negativo dado que o
paciente examinado não é doente:
e = Pr(T− |D− )
Os nomes são descritivos: sensibilidade mede a capacidade de reação do teste em um paciente doente
enquanto que especificidade, a reação do teste em pacientes não portadores da doença, isto é, o teste é
especı́fico para a doença em questão.
A análise da definição desses dois ı́ndices (s e e) mostra que, subjacentemente a estes conceitos, estamos
assumindo a existência de um padrão ouro (gold-standart), ou seja, um teste diagnóstico que sempre produz
resultados corretos. Além, disso assumimos que os pacientes são classificados apenas como doentes e não-
doentes não se admitindo estágios intermediários.
De acordo com a Tabela 10.1,
Tabela 10.1: Distribuição quanto à ocorrência de um evento.

Fator Total
Doença Presente Ausente
Presente a b n1 = a + b
Ausente c d n2 = c + d
Total m1 = a + c m2 = b + d n = n1 + n2
os ı́ndices s e e são estimados por:

a a
s= =
a+b n1
e
d d
e= = .
c+d n2
Exemplo 10.1. Diagnóstico de doença coronariana.
Wiener et al. compararam os resultados do teste ergométrico de tolerância a exercı́cios entre indivı́duos
com e sem doença coronariana. O teste foi considerado positivo quando se observou mais de 1 mm de
depressão ou elevação do segmento ST, por no mı́nimo 0,08 s, em comparação com os resultados obtidos
com o paciente em repouso. O diagnóstico definitivo foi feito através de angiografia (gold ). A Tabela (10.2)
sintetiza os resultados encontrados.
Tabela 10.2: Resultados da avaliação da aplicação do teste ergométrico de tolerância a exercı́cios em 1465
pacientes.
Doença Teste ergométrico Total
Coronariana Positivo (T+ ) Negativo (T− )
Presente (D+ ) 815 208 1.023
Ausente (D− ) 115 327 442
Total 930 535 1.465
A sensibilidade e a especificidade são estimadas por:

815
s= = 0, 797
1.023
e
327
e= = 0, 740.
442
O teste ergométrico tem uma sensibilidade de 79,7%, ligeiramente superior que sua especificidade (74%).
10.3 Valor das Predições: VPP e VPN ROSSI, R. M. 124
A proporção bruta de concordância (poder preditivo ou acurácia) do exame pode ser calculada por
a+d
n = 815+327
1.465 ≃ 0, 7795 (77,95%). Dos 930 resultados positivos apresentados pelo exame, 815 estavam
corretos, ou seja, o poder preditivo positivo do exame foi 815 930 ≃ 0, 8763 (87,63%). Por outro lado,
dos 535 resultados negativos apresentados pelo exame, 327 estavam corretos fornecendo, assim, um poder
preditivo negativo de 327535 ≃ 0, 6112 (61,12%).
10.3 Valor das Predições: VPP e VPN

A sensibilidade e a especificidade, embora sendo ı́ndices ilustrativos e bons sintetizadores das qualidades
gerais de um teste, tem uma limitação séria: não ajudam a decisão da equipe médica que, recebendo um
paciente com resultado positivo do teste, precisa avaliar se o paciente está ou não doente. Não se pode
depender apenas da sensibilidade e da especificidade, pois estes ı́ndices são provenientes de uma situação
em que há certeza total sobre o diagnóstico, o que não acontece no consultório médico. Daı́ a necessidade
destes dois outros ı́ndices que refletem melhor a realidade prática. Neste momento, interessa mais conhecer
os seguintes ı́ndices denominados valor da predição positiva (VPP) e valor da predição negativa (VPN),
definidos respectivamente por:
V P P = Pr [D+ |T+ ]
e
V P N = Pr [D− |T− ] .
Em palavras, VPP é a probabilidade do paciente estar realmente doente quando o resultado do teste é
positivo e VPN, a probabilidade do paciente não estar doente quando o resultado do teste é negativo. Estes
valores são probabilidades condicionais, tal que o evento condicionante é o resultado do teste, aquele que na
prática acontece primeiro.
A maneira mais fácil de se calcular o VPP e o VPN é através das fórmulas sugeridas por Vecchio (1966).
Tabela 10.3: Probabilidade necessárias para o cálculo dos ı́ndices VPP e VPN.
População Proporção Proporção com resultado
Positivo Negativo
Doente p ps p(1 − s)
Sadia 1−p (1 − p)(1 − e) (1 − p)e
Total p + (1 − p) ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e
Seja p = Pr(D+ ) a prevalência da doença na população de interesse, isto é, a proporção de pessoas
doentes, ou a probabilidade de doença pré-teste.
O valor de predição positiva é obtido dividindo-se a freqüência dos ”verdadeiros-positivos” (oriundos de
pacientes doentes), pelo total de positivos
ps
V PP = .
ps + (1 − p)(1 − e)
De forma análoga, considerando-se os ”verdadeiros-negativos” obtemos o valor da predição negativa
(1 − p)e
V PN = .
p(1 − s) + (1 − p)e
Ambas as expressões dependem do conhecimento de p, uma estimativa da prevalência da doença na

população de interesse. Estas são probabilidades de resultados corretos de diagnóstico.
Exemplo 10.2. Diagnóstico de doença coronariana (Continuação).

Para uma população cuja prevalência de doença coronariana é de 2%, os valores de predição do teste
ergométrico são:
0, 02 × 0, 797
V PP = = 5, 89%.
0, 02 × 0, 797 + (1 − 0, 02)(1 − 0, 74)
10.4 Decisões Incorretas: PFP e PFN ROSSI, R. M. 125
e
(1 − 0, 02) × 0, 74
V PN = = 99, 29%.
0, 02 × (1 − 0, 797) + (1 − 0, 02) × 0, 74
Portanto, o valor de predição positiva é baixo enquanto que o valor de predição negativa é bastante alto.
Se o resultado da ergometria for negativo, a chance de não haver uma doença coronária é de 99,29%.
Se, antes de qualquer informação, o paciente tinha uma chance de 2% de apresentar a doença, após o
resultado do teste negativo esta chance é de apenas 0,66% (1-0,9929).
10.4 Decisões Incorretas: PFP e PFN

As probabilidades
P F P = Pr [D− |T+ ] = 1 − Pr [D+ |T+ ] = 1 − V P P
e
P F N = Pr [D+ |T− ] = 1 − Pr [D− |T− ] = 1 − V P N
referem-se, respectivamente, ao “falso-positivo” e ao “falso-negativo”, isto é, decisões incorretas baseadas
no teste diagnóstico.
Uma dificuldade com relação à estes ı́ndices é que muitos autores admitem, implicitamente, que a pre-
valência que ocorre na tabela é a mesma na população de interesse e assim usam tabelas 2 × 2 para calcular
os valores de predição. Nada justifica esta hipótese. Este procedimento se usado sistematicamente, leva a
erros sérios.
Exemplo 10.3. Teste ELISA para detecção do HIV.

Entre as várias tecnologias para detectar a presença do HIV, a primeira a se difundir no Brasil foi o
ELISA (Enzymelinked immunosorbent assay). Em 1985 esta foi simultaneamente comercializada por vários
laboratórios americanos. Alguns deles reportaram, em seus testes preliminares, sensibilidade de 95% e
especificidade de 99,8%. Os valores para os outros laboratórios são parecidos, segundo Marwick (1985).
A Tabela 10.4 apresenta os valores dos ı́ndices VPP e VPN para a implementação do teste ELISA e
vários supostos valores da prevalência.
Tabela 10.4: Valores da VPP, VPN, PFP e PFN para o teste ELISA para a detecção do HIV.
Prevalência VPP(%) VPN(%) PFP(%) PFN(%)
1/100.000 0,47 100,00 99,53 0,00
1/10.000 4,54 100,00 95,46 0,00
1/1.000 32,21 99,99 67,77 0,01
1/500 48,77 99,99 51,23 0,01
1/200 70,47 99,99 29,53 0,03
1/100 82,75 99,99 17,25 0,05
1/50 90,65 99,89 9,35 0,10
Considerando-se a população total de um paı́s, a AIDS é uma doença de prevalência pequena. Os

resultados da Tabela 10.4 mostram que em um programa de uso do teste em larga escala, grande parte
dos pacientes com resultado positivo consiste na realidade de falsos-positivos; em outra palavras, o valor da
predição positiva é muito pequeno. Por outro lado, pouquı́ssimos não doentes deixarão de ser detectados e,
portanto, o valor de predição negativa é alto. Isto sugere um cuidado básico: um resultado positivo dever
ser reconfirmado através de teste baseado em tecnologia diferente do ELISA.
10.5 Combinação de Testes Diagnósticos ROSSI, R. M. 126
10.5 Combinação de Testes Diagnósticos

Muitas vezes, para o diagnóstico de certa doença dispomos apenas de testes com VPP ou VPN baixo
ou, se existe um bom teste, este é muito caro ou oferece grande risco e/ou desconforto ao paciente. Nestas
circunstâncias, uma opção freqüentemente usada é o uso de uma combinação de testes mais simples. A
associação de testes eleva a qualidade do diagnóstico, diminuindo o número de resultados incorretos.
Quando dois ou mais testes são usados para se chegar a um diagnóstico é preciso saber como são obtidos
os ı́ndices de qualidade do teste múltiplo, aquele composto pela agregação de dois ou mais testes individuais.
Restringiremos ao caso de apenas dois testes e as idéias apresentadas a seguir podem ser estendidas para o
caso de mais de dois testes. Alguns detalhes podem ser encontrados em Hirsh & Rielgelman (1996).
As maneiras mais simples de se formar um teste múltiplo a partir dos resultados de dois testes são os
esquemas em paralelo e em série. No caso do teste em paralelo, se um dos dois testes é positivo o teste
conjunto também o é. No teste em série, este é considerado positivo se os dois testes individuais são positivos.
A associação de testes em série é bastante empregada, tanto em triagens como no diagnóstico individual,
sendo de grande utilidade quando a questão do custo é relevante.
Chamando os testes originais de A e B, o teste em paralelo de Tp e o em série de Ts , e usando a linguagem
de eventos temos:
Tp+ = A+ ∪ B+
e
Ts+ = A+ ∩ B+ .
As sensibilidade e especificidade de Tp e Ts são calculadas com o auxı́lio das regras de cálculo de proba-
bilidades de eventos.
10.5.1 Combinação em Paralelo

Nesse caso, o resultado do teste será considerado positivo, se pelo menos um dos testes apresentar
resultado positivo. É de maior utilidade em casos de urgência, quando se necessita de uma abordagem
rápida, ou por outro tipo de conveniência, como para pacientes provenientes de lugares distantes. A Tabela
10.5 apresenta de forma explı́cita o procedimento proposto.
Tabela 10.5: Resultado do teste em paralelo dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em paralelo
- - -
- + +
+ - +
+ + +
Em analogia à expressão para obter a sensibilidade temos:
Pr[Tp+ |D+ ] = Pr[A+ ∪ B+ |D+ ]

= Pr[A+ |D+ ] + Pr[B+ |D+ ] − Pr[A+ ∩ B+ |D+ ]
ou seja, a sensibilidade do teste em paralelo (sp ) é dada por
sp = sA + sB − sA × sB .
Admitindo-se que os resultados dos dois testes são independentes, pode-se calcular a especificidade de
um teste em paralelo da seguinte forma:
Pr[Tp− |D− ] = Pr[A− ∩ B− |D− ]

= Pr[A− |D− ] × Pr[B− |D− ]
ou seja, a especificidade do teste em paralelo (ep ) é dada por
ep = eA × eB .
Portanto, facilmente calculamos a sensibilidade e a especificidade de um teste em paralelo a partir das

sensibilidades e especificidades dos testes A e B. Além disso, os parâmetros VPP e VPN são calculados da
mesma forma já vista para testes isolados, utilizando-se agora a sensibilidade e especificidade da combinação
em paralelo, e a prevalência da população de interesse.
10.5.2 Combinação em Série

Nesse caso, os testes são aplicados consecutivamente, sendo o segundo teste aplicado apenas se o primeiro
apresentar resultados positivo. O teste só será considerado positivo, se o resultado dos dois testes for positivo.
Esse procedimento é indicado em situações em que não há necessidade de rápido atendimento e quando o
paciente pode ser acompanhado ao longo do tempo, e se a consideração de custo é importante, seja pela
questão financeira, pelo risco ou desconforto induzidos pelo exame. A Tabela 10.6 apresenta de forma
explı́cita o procedimento proposto.
Tabela 10.6: Resultado do teste em série dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em série
- desnecessário -
+ - -
+ + +
Como só serão aplicados dos testes se o primeiro for positivo, o custo desse tipo de combinação é menor.
Uma discussão sobre a ordem mais indicada para a aplicação dos testes a serem combinados em série pode
ser encontrada em Soares & Parenti (1995).
Se os dois testes A e B são independentes, a sensibilidade (ss ) e a especificidade (es ) par o teste combinado
em série são obtidos sa seguinte forma:
Pr[Ts+ |D+ ] = Pr[A+ ∩ B+ |D+ ]

= Pr[A+ |D+ ] × Pr[B+ |D+ ].
Portanto,
ss = sA × sB
e
es = eA + eB − eA × eB .
Para os cálculos da sensibilidade e especificidade da associação em série e em paralelo, a independência
dos dois testes é crucial. Entretanto, não se pode garantir que isto ocorra sempre. Quando os testes não
forem independentes, não há uma forma analı́tica simples para se obter tais ı́ndices para um teste composto.
Exemplo 10.4. Diagnóstico de câncer pancreático.
Imagine um paciente idoso com dores persistentes nas costas e no abdômen e perda de peso. Na ausência
de uma explicação para estes sintomas, a possibilidade de câncer do pâncreas é freqüentemente levantada.
É comum para se verificar esta possibilidade diagnóstica, que ambos os testes de ultrassom (A) e tomografia
computadorizada (B) do pâncreas sejam solicitados. A Tabela 10.7 apresenta dados hipotéticos sobre os
ı́ndices s e e dos testes, quando utilizados separadamente e em conjunto (Griner et al., 1981).
Tabela 10.7: Sensibilidade e especificidade dos testes de ultra-som e tomografia computadorizada no di-
agnóstico do câncer de pâncreas individualmente e em conjunto.
Teste Sensibilidade (%) Especificidade (%)
A: Ultra-Som 80 60
B: Tomografia 90 90
C: A ou B positivo 98 54
D: A e B positivo 72 96
Note que os esquemas C e D correspondem respectivamente a testes em paralelo e em série. Admitindo

que os resultados dos dois testes sejam independentes e usando as expressões vistas anteriormente, temos as
seguintes sensibilidades e especificidades combinadas:
Em paralelo:
sC = 0, 8 + 0, 9 − 0, 8 × 0, 9 = 0, 98
e
eC = 0, 6 × 0, 9 = 0, 54;
Em série:
sD = 0, 8 × 0, 9 = 0, 72
eD = 0, 6 + 0, 9 − 0, 6 × 0, 9 = 0, 96.
Quando um ou outro teste é positivo, a sensibilidade combinada é maior que o mais sensı́vel dos testes,
mas a especificidade é menor.
Ao contrário, quando o critério para a positividade do teste é que tanto o ultra-som como a tomografia
sejam positivos, a especificidade combinada é maior que o mais especı́fico dos dois, mas a sensibilidade é
menor. Portanto, a sugestão seria o teste em série.
Exemplo 10.5. Sensibilidade e especificidade de testes em paralelo e em série.
Consideremos dois testes A e B com sensibilidade e especificidade apresentados na Tabela 10.7, supondo
uma prevalência de 1%, então teremos os seguintes valores: s, e, VPP e VPN.
Tabela 10.8: Sensibilidade, especificidade e valores de predição de testes individuais A e B e dos testes em
série e em paralelo considerando-se uma prevalência de 1%.
Teste s e VPP VPN
A 0,8000 0,6000 0,0198 0,9966
B 0,9000 0,9000 0,0833 0,9989
Paralelo 0,9800 0,5400 0,0211 0,9996
Série 0,7200 0,9600 0,1538 0,9971
A combinação em paralelo apresenta alta sensibilidade (0,98) mas sua especificidade é menor que a dos
testes isolados. Já a combinação em série apresenta alta especificidade (0,96) enquanto que a sensibilidade
é relativamente baixa comparada com testes isolados.
Como esperado, os valores de predição negativa são altos, tanto para os testes isolados como para as
duas formas combinadas dos testes. Entretanto, os valores de predição positiva não são altos, sendo que a
combinação em série proporcionou o melhor resultado (V P P = 0, 1538).
É importante lembrar que, na maioria das vezes, os testes usados na combinação são dependentes entre
si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ı́ndices dos testes combinados.
Nesse caso, não é possı́vel determinar os valores dos parâmetros de qualidade conhecendo-se apenas os valores
de cada teste em separado. Torna-se necessário um trabalho de pesquisa realizado em um grupo de pacientes
nos quais são utilizados o teste padrão (gold test) e teste combinado (DiMagno et al., 1977).
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 129
10.6 Escolha entre Testes Diagnósticos

Idealmente, os testes utilizados devem ter alta sensibilidade e especificidade. Entretanto, na prática nem
sempre existem testes disponı́veis com caracterı́sticas ótimas. É relativamente comum a situação em que há
mais de um teste e então surge a necessidade da comparação entre eles para uma escolha mais adequada.
Em processos de escolha do ponto de corte (ponto limite para decidir se um paciente é doente ou sadio),
por exemplo, Galen & Gambino (1975) sugeriram uma medida de eficiência definida pela soma da sensibili-
dade e especificidade, isto é, o valor de referência (k :Ponto de corte) foi obtido através dos valores de s e e
que tinham a maior soma.
Suponha que dois testes diagnósticos estão disponı́veis: um com alta sensibilidade mas relativamente
baixa especificidade e o outro com alta especificidade e relativamente baixa sensibilidade. Qual seria a
melhor escolha?
Embora a avaliação de um teste não seja trivial, já que vários fatores devem ser considerados, apresen-
taremos alguns argumentos baseados nas medidas de qualidades, que podem ajudar na escolha de um teste
diagnóstico.
O primeiro fato importante é que os valores de predição (VPP e VPN) dependem conjuntamente de s, e
e p. Soares & Parenti (1995) apresentam um estudo detalhado através de gráficos que ilustram claramente
o efeito da prevalência nos valores de predição. O exemplo a seguir ilustra numericamente este fato.
Exemplo 10.6. Diagnóstico da gonorréia.
O teste Gonosticon Dri-Drot, desenvolvido para o diagnóstico de gonorréia, tem sensibilidade de 0,80
e especificidade de 0,95. Os valores da predição positiva e negativa são apresentados na Tabela 10.9 para
quatro populações com diferentes prevalências.
Tabela 10.9: Valores de predição (VPP e VPN) do teste Gonosticon Dri-Drot para quatro prevalências (p).
População p VPP VPN
A 0,500 0,940 0,830
B 0,100 0,640 0,980
C 0,020 0,250 0,990
D 0,001 0,020 1,00
Embora o teste tenha parâmetros de qualidades razoáveis, o VPP é baixı́ssimo para populações de baixa
prevalência, tornando o exame sem utilidade nessas condições.
Para simplificar o raciocı́nio sobre a escolha de testes diagnósticos, vamos inicialmente considerar duas
situações extremas, obviamente sem interesse prático, e depois vamos estender para situações mais gerais.
Suponhamos que p = 0, isto é, ninguém tem a doença, ou que p = 1, isto é, toda a população tem a doença
em questão. Facilmente chagamos nos valores apresentados na Tabela 10.10, para quaisquer valores de s e
e.
Tabela 10.10: Valores de predição (VPP e VPN) e proporção de resultados falsos (PFP e PFN) para casos
extremos de prevalências.
p VPP PFP VPN PFN
0 0 1 1 0
1 1 0 0 1
A extensão para o caso mais geral de p pequeno (doença rara) e p grande (doença comum) pode ser
feita pela análise das expressões já estudadas variando-se as quantidades envolvidas (s, e e p), mas nos
restringimos a apresentarmos uma análise numérica. A Tabela 10.11 mostra os valores de predição para
prevalências de 1% e 90%.
Quando a prevalência é baixa, o valor de predição positiva (VPP) é mais influenciado pela especificidade.
O valor de predição negativa (VPN) é pouco influenciado tanto pela sensibilidade quanto pela especificidade
e é alto, como era de se esperar.
Para a prevalência alta, o VPP é próximo de 1, independente dos valores da sensibilidade e da especifi-
cidade. Além disso, o VPN é influenciado mais pela sensibilidade do que pela especificidade.
Tabela 10.11: Valores de predição (VPP e VPN) para alguns valores de sensibilidade e especificidade para
prevalências de 1% e 90%.
Prevalência de 1% Prevalência de 90%
s e VPP VPN VPP VPN
0,99 0,99 0,5000 0,9999 0,9989 0,9167
0,99 0,90 0,0909 0,9999 0,9889 0,9091
0,99 0,80 0,0476 0,9999 0,9780 0,8989
0,90 0,99 0,4762 0,9990 0,9988 0,5238
0,90 0,90 0,0833 0,9989 0,9878 0,5000
0,90 0,80 0,0435 0,9987 0,9759 0,4706
0,80 0,99 0,4469 0,9980 0,9986 0,3548
0,80 0,90 0,0748 0,9978 0,9863 0,3333
0,80 0,80 0,0388 0,9975 0,9730 0,3077
Embora este não seja um estudo exaustivo, existem evidências para as seguintes conclusões:
1. Um teste com alta especificidade deve ser usado quando a prevalência da doença é relativamente baixa
(doença rara), mesmo que o teste tenha relativamente baixa sensibilidade.
2. Um teste com alta sensibilidade deve ser usado quando a prevalência da doença é alta (doença comum),
mesmo que o teste tenha relativamente baixa especificidade.
É comum a idéia de que se a doença é rara, um teste com alta sensibilidade dever ser usado para achar
os casos e para uma doença de alta prevalência, um teste com alta especificidade deve ser escolhido.
Esse raciocı́nio não coincide com os argumentos apresentados.
Outro tipo de simulação é apresentado nas Figuras 10.1 e 10.2 para algumas situações especı́ficas:
Figura 10.1: Valor Preditivo Positivo em Função da Prevalência
Inicialmente percebe-se na 10.1 que, para qualquer situação, quanto maior a prevalência da doença,
maior o valor preditivo positivo. Para um teste com sensibilidade e especificidade elevadas (s = 99% e e =
99%) o seu valor preditivo positivo será muito alto mesmo em situações de prevalência não muito elevada.
Entretanto, esta situação sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e
especificidade do teste (s = 95% e e = 95%).
Figura 10.2: Valor Preditivo Negativo em Função da Prevalência
Uma outra situação ocorrerá ao se modificar apenas uma das caracterı́sticas do teste. Por exemplo, ao
se diminuir a sensibilidade mantendo-se a especificidade elevada (s = 70% e e = 90%), percebe-se que prati-
camente não houve impacto nos valores preditivos positivos em função da prevalência. Entretanto, quando
essa mesma diminuição ocorre na especificidade, o impacto é bastante grande, diminuindo-se muito o valor
preditivo positivo do resultado mesmo para prevalências mais elevadas. Dessa forma, pode-se afirmar que o
valor preditivo positivo de um teste é função da prevalência da doença, da sensibilidade e fundamentalmente
da especificidade, conforme já fora observado na fórmula anterior.
Note na Figura 10.2 que, ao reduzir apenas a sensibilidade (s = 70% e e = 99%), ocorre uma drástica
redução no VPN, mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir apenas a
especificidade (s = 99% e e = 70%), o impacto no VPN é muito pequeno, menor do que quando se reduz
apenas um pouco a sensibilidade e a especificidade conjuntamente (s = 95 e e = 95%).
Note também que, para um mesmo teste diagnóstico (exceção apenas para s = 70% e e = 99%), o impacto
do aumento da prevalência na redução do VPN é muito pequeno. Esse impacto se acentua nas prevalências
muitos elevadas. Como na prática clı́nica, as doenças estudadas comumente possuem prevalências relati-
vamente baixas, o VPN irá sofrer apenas pequena variação ao se modificar a especificidade de um teste
diagnóstico e mesmo ao se modificar pouco a sensibilidade.
10.7 Relação entre Sensibilidade e Especificidade ROSSI, R. M. 132
10.7 Relação entre Sensibilidade e Especificidade

O teste diagnóstico ideal seria aquele na qual a sensibilidade e a especificidade fossem 100%, ou seja, não
existiria erro em seu resultado. Entretanto, na prática, isso não é possı́vel. Ao contrário, freqüentemente,
existe uma contra-balanço (trade-off ) entre essas duas propriedades de tal modo que, quando um delas
aumenta a outra diminui e vice-versa. Assim, para um teste expresso em uma escala contı́nua (glicemia, por
exemplo) é necessário determinar um ponto de corte (cut off ) entre os valores considerados normais e os
anormais. Neste caso, uma determinada propriedade do teste (por exemplo, a sensibilidade) somente pode
ser aumentada às custas da diminuição da especificidade e vice-versa.
Frequentemente, na prática clı́nica, escolhe-se um ponto de corte onde exista o menor erro possı́vel, tanto
de falsos positivos quanto de falsos negativos (Figura 10.3).
Figura 10.3: Ponto de corte com o mı́nimo erro possı́vel

10.8 Curva ROC ROSSI, R. M. 133
10.8 Curva ROC

Uma forma de expressar graficamente a relação entre a sensibilidade e a especificidade é através da
construção da curva ROC (receiver operating characteristic curve). Esta curva foi primariamente de-
senvolvida na década de 1950 para avaliar a detecção de sinais de radar (daı́ a sua denominação),
embora somente recentemente tenha se tornado comum o seu uso na área médica.
Sua construção é feita colocando-se os valores da sensibilidade (proporção de verdadeiros positivos) no
eixo Y (ordenadas) e o complemento da especificidade (1 - e), ou seja, a proporção de falsos positivos no
eixo X (abscissas) para diferentes pontos de corte.
A partir dos dados apresentados na Tabela 10.12 foi construı́da a curva ROC.
Tabela 10.12: Trade-off entre Sensibilidade e Especificidade no tratamento de Diabetes (Glicemia pós-
prandial 2(h) mg/100 ml).
Glicemia pós-prandial Sensibilidade (%) Especificidade (%) 1 - Especificidade (%)
(2h) mg/100 ml
70 98,6 8,8 91,2
80 97,1 25,5 74,5
90 94,3 47,6 52,4
100 88,6 69,8 30,2
110 85,7 84,1 15,9
120 71,4 92,5 7,5
130 64,3 96,9 3,1
140 57,1 99,4 0,6
150 50,0 99,6 0,4
160 47,1 99,8 0,2
170 42,9 100,0 0
180 38,6 100,0 0
190 34,3 100,0 0
200 27,1 100,0 0
Figura 10.4: Curva ROC da Glicemia pós-prandial (2h) mg/100 ml
Note que quanto mais próxima a curva estiver do canto superior esquerdo do gráfico, melhor será o poder
discriminatório do teste diagnóstico e quanto mais distante, até o limite da diagonal do gráfico, pior será o
seu poder de discriminar doentes e não doentes. A curva ROC pode servir como orientação para a escolha
do melhor ponto de corte de um teste diagnóstico que, em geral, se localiza no extremo da curva próximo
ao canto superior esquerdo do gráfico. *Observe que o ponto de corte adequado está entre 110 e 120 mg/100
ml.
As curvas ROC, além de auxiliarem na identificação do melhor ponto de corte, são muito utilizadas para
comparar dois (ou mais) testes diagnósticos para a mesma doença. Nesse caso, o poder discriminatório do
teste, ou seja, a acurácia global, pode se mensurado através do cálculo da área sob a curva ROC; quanto
maior for a área tanto melhor será o teste diagnóstico.
Um teste diagnóstico ideal, com 100% de sensibilidade e 100% de especificidade, a área total seria igual
a 1 (um), ou seja, a “curva” seria coincidente com o lado esquerdo e o topo do gráfico. Neste caso, o teste
não possuiria erro, identificando perfeitamente todos os indivı́duos sadios e doentes (gold test).
Para um teste sem nenhuma utilidade, a “curva” seria uma linha reta em diagonal, partindo do canto
inferior esquerdo até o canto superior direito. Neste caso, o teste diagnóstico não possuiria nenhum poder
para discriminar doentes de não-doentes.
Exemplo 10.7. Os dados da Tabela 10.13 foram obtidos na UEM/HU - Hospital Universitário da Univer-
sidade Estadual de Maringá, em um estudo para avaliação de equipamentos para dosagem glicêmica capilar
O objetivo do trabalho foi o de escolher o melhor equipamento entre três analisados: Glucotrend, Precision
e Advantage. Os testes foram realizados em 21 indivı́duos. O teste Colorimétrico foi ser utilizado como
Gold Standard (Teste Ouro), que classifica sem erro doentes e não-doentes.
Tabela 10.13: Resultados da avaliação de equipamentos para dosagem glicêmica capilar.

Indivı́duo Gold-Calorimétrico G-Glucotrend P-Precision A-Advantage
1 282 310 336 283
2 121 115 143 137
3 71 71 76 66
4 101 *3 85 99
5 161 *3 215 177
6 192 215 134 *2 211
7 99 97 123 134
8 105 152 156 *1 136
9 190 200 208 205
10 64 69 76 69
11 108 125 105 115
12 99 97 95 116 *1
13 107 107 109 108
14 68 75 81 64
15 81 86 94 91
16 82 84 49 *1 89
17 88 90 93 93
18 71 76 88 77
19 76 90 91 96
20 98 107 89 *1 105
21 87 86 90 96
Obs.: Valores de referência: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hipogli-
cemia) e acima de 120 (hiperglicemia)).
Obs.:
1. *1 foram utilizadas duas fitas por falha na leitura do equipamento;
2. *2 foram utilizadas quatro fitas por falha na leitura do equipamento;
3. *3 equipamento apresentou erro.
Exercı́cio 10.1. Utilize o banco de dados referentes a Tabela 10.13 e:
1. Determine as Tabelas Cruzadas: Gold X G; Gold X P e Gold X A.
2. Determine a sensibilidade e especificidade de cada testes acima . Baseado nestes resultados qual (quais)
o(s) melhor(es) teste(s) ?
3. Determine os valores de predição positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para
cada um dos testes, usando a prevalência da doença obtida através da Tabela Cruzada. Interprete-os.
4. Considerando que a prevalência para a doença em questão é de 1%, recalcule os itens anteriores.
5. Combine os testes: G x P, G x A e P x A de forma paralela e em série, considerando uma prevalência
de 1%. Qual a melhor combinação ? porque?
6. Refazer o exercı́cio, considerando a referência 70 ≤ N ormal ≤ 110 e p = 1%.
a
Exercı́cio 10.2. Em que condições o valor de predição positiva (VPP) é igual a a+c ?
Exercı́cio 10.3. Foram examinadas radiografias do tórax de 1.820 indivı́duos, dos quais 30 estavam com
tuberculose e 1.790 não apresentavam a doença, por diagnóstico feito de forma independente da leitura dos
raios X e com uma margem de erro desprezı́vel. Pelo modo como estes 1.820 pacientes foram selecionados,
Tabela 10.14: Resultados da avaliação de tuberculose.

Leitura dos raios X
Tuberculose Positivo Negativo
Presente 22 8
Ausente 51 1.739
a prevalência da doença, tanto neste grupo quanto na população de interesse é de p = 0, 0156.
1. Calcule a sensibilidade e a especificidade do raio X como teste diagnóstico para tuberculose.
2. Calcule as proporções de falso-positivo e falso-negativo.

3. Se um médico tem 75% de certeza sobre o diagnóstico de tuberculose em um dado paciente, quanto
aumenta esta probabilidade depois de se observar um teste de leitura de raios X positivos?
Exercı́cio 10.4. Pesquisadores que tratam de doenças hepáticas em uma clı́nica especializada sugeriram
um novo teste para detectar câncer no fı́gado. Os resultados do experimento, para uma amostra de 2.225
pacientes atendidos nessa clı́nica, foram: Pelo modo como os dados foram obtidos, a prevalência de câncer
Tabela 10.15: Resultados da avaliação de câncer.

Câncer Teste
Hepático Positivo Negativo
Presente 90 17
Ausente 39 2.079
hepático, nesta clı́nica, pode ser calculada usando os dados da tabela.
1. Calcule a sensibilidade e a especificidade do teste.
2. Calcule a probabilidade de um paciente, atendido nessa clı́nica e que não tem câncer no fı́gado, tenha
tenha um resultado positivo no teste.
3. Calcule o valor da predição positiva e o valor da predição negativa.

Exercı́cio 10.5. Foi feita avaliação para câncer de próstata em 300 homens hospitalizados devido a sintomas
de obstrução urinária. Um dos testes realizados foi o exame digital do reto. O resultado foi classificado como
”Positivo” segundo o critério padrão (biópsia).
Tabela 10.16: Resultados da avaliação de câncer de próstata.

Resultado Resultado do teste
da Biópsia Positivo Negativo
Presente 48 21
Ausente 25 206
1. Qual é a sensibilidade e a especificidade do exame digital na detecção de câncer de próstata?

2. Nesta população de homens, qual é o valor de predição positiva e o valor de predição negativa do exame
digital?
3. Um clı́nico geral está considerando a possibilidade de realizar o exame digital do reto em todos os
homens com mais de 50 anos que procuram seu consultório, mesmo não apresentando sintomas de
obstrução urinária. Da literatura, ele sabe que a prevalência de câncer de próstata nesta faixa etária
é de 0,5%. Usando os valores para a sensibilidade e especificidade obtidos anteriormente, calcule a
proporção de homens com resultado positivo no exame digital que realmente tem a doença.
Exercı́cio 10.6. A detecção precoce do câncer cervical uterino é crucial para o tratamento e cura de pa-
cientes. O papanicolau é um dos testes utilizados no diagnóstico. Na tabela a seguir temos os resultados
dos testes para 600 mulheres. As mulheres foram classificadas como portadoras ou não da doença através de
biópsia cervical.
Tabela 10.17: Resultados da avaliação de câncer cervical uterino.

Resultado Papanicolau
da Biópsia Positivo Negativo
Presente 94 6
Ausente 250 250
1. Calcule a prevalência de câncer na amostra;
2. Calcule a sensibilidade e a especificidade do papanicolau;
3. Calcule o VPP e o VPN usando a prevalência obtida no item 1).

Exercı́cio 10.7. A hemorragia peri-intraventricular (HPIV) é uma das causas mais frequentes de agressão
ao sistema nervoso no perı́odo neonatal e a segunda causa mais frequente de morte em prematuros, precedida
apenas pela doença de membrana hialina. Atualmente, o método de escolha para diagnóstico consiste em
técnicas não invasivas (ultrassonografia e tomografia computadorizada). Tavares (1995) estudou a ocorrência
desta enfermidade em 120 dos 129 recém-nascidos com peso menor que 2000 g, nascidos no Hospital das
Clı́nicas da UFMG, no perı́odo de 18/01/94 a 17/05/95. O critério único para exclusão foi morte neota-
nal precoce, anterior à possibilidade de realização do exame ultrassonográfico. Para avaliar a eficácia do
exame clı́nico neurológico, as crianças (com exceção de uma) foram examinadas por um pediatra clı́nico com
formação em neonatalogia, sem o conhecimento prévio dos exames ultrassonográficos, que confirmam ou não
o diagnóstico fornecido pelo médico.
Tabela 10.18: Resultados da avaliação de HPIV.

HPIV Exame neurológico
Alterado Normal Total
Presente 25 13 38
Ausente 31 50 81
Total 56 63 119
1. Calcule a sensibilidade e a especificidade do exame clı́nico-neurológico e a prevalência dessa condição

na população em questão;
2. O baixo peso ao nascer é usado frequentemente para rastrear HPIV, sendo 1500 g o limite sugerido
para tal fim. Considerando essa informação e os dados mostrados a seguir do peso ao nascer (g) de
39 crianças com HPIV, qual seria a sensibilidade resultante do rastreamento? Abaixo de que peso
encontram-se 95% das crianças com HPIV? Quais as consequências de se alterar o valor de referência
para o novo valor encontrado?
1530 1520 1350 1260 1160 1120 1500 1020

1000 1020 1690 1140 1160 1290 1410 1850
1280 1410 1750 800 1020 830 1620 1430
1150 1230 1660 1430 1590 1280 1040 1810
1420 1760 1670 1520 1680 1650 1180
Exercı́cio 10.8. Suponha que a sensibilidade e a especificidade de dois testes (A e B) para o diagnóstico de
uma determinada doença sejam:
Teste Sensibilidade Especificidade

A 90% 70%
B 70% 90%
Assumindo que os testes sejam realizados de forma independente, qual a ordem que produz as melhores
caracterı́sticas gerais do teste conjunto em paralelo, isto é, o resultado é positivo se ambos são positivos?
Exercı́cio 10.9. Os dados seguintes são tomados de um estudo que investiga o uso de uma técnica chamada
ventriculografia radionuclı́dica como teste diagnóstico para se detectar doença da artéria coronária (Begg e
Mcneil, 1988).
Tabela 10.19: Teste de Ventriculografia Redionuclı́dica.

Doença
Teste Ausente Presente
Negativo 179 372
Positivo 102 75
1. Qual a sensibilidade e a especificidade da ventriculografia radionuclı́dica nesse estudo?
2. Para uma população cuja prevalência da doença da artéria coronária seja de 5%, calcule a probabili-
dade de que um indivı́duo NÃO tenha a doença, sendo que ele apresenta resultado positivo usando a
ventriculografia radionuclı́dica;
3. Qual o valor preditivo de um teste negativo? utilize a mesma prevalência populacional.
Exercı́cio 10.10. Um teste diagnóstico A relativamente barato utilizado para detecção de gravidez tem
sensibilidade e especificidade, respectivamente dados por: 67% e 80%. Um outro B, tem respectivamente:
91,3% e 77,2%. Uma mulher desconfiada de que estaria grávida resolve fazer os testes. Primeiro faz o teste
A e sendo o resultado positivo então procede ao segundo teste.
1. Determine a chace de o teste A dar resultado falso positivo considerando uma prevalência de 90% para
a gravidez;
2. Considerando que esta mulher realizou o segundo teste, determine a chance de um falso positivo
combinado. O que aconteceu? a chance de ela estar realmente grávida aumenta ou diminui?
3. Considerando uma prevalência de 95%, calcule o valor de Predição Falso Negativo de uma combinação
em paralelo;
4. Considere uma prevalência de 95%. Baseado nos cálculos de probabilidades condicionais, qual o teste
diagnóstico você escolheria, considerando independência nos testes combinados? Porque?
Exercı́cio 10.11. O Ministério da Saúde, através da Portaria no 488, de 17 de junho de 1998, estabeleceu
a obrigatoriedade de uma rotina para a execução de testes para detecção de anticorpos contra o vı́rus da
imunodeficiência humana (anti-HIV) em indivı́duos com idade acima de dois anos. O objetivo da porta-
ria é aumentar a acurácia do procedimento. Em uma primeira etapa, denominada triagem sorológica, a
mesma amostra deve ser submetida a dois testes sorológicos distintos, simultaneamente. Caso a amostra
apresente resultados reagentes nos dois exames, isto é, Positivo no ELISA1 e Positivo no ELISA2 , esta deve
ser submetida às etapas de confirmação sorológica, através da realização dos testes de Imunofluorescência
Indireta e/ou Western Blot. Supondo que você trabalhe em um hospital que disponha de dois testes ELISA
distintos para detecção de anti-HIV na primeira etapa do processo, isto é, realizar simultaneamente os testes,
e sabendo-se que os valores de sensibilidade e especificidade são, respectivamente,
ELISA1 : 99% e 99%.

ELISA2 : 99% e 98%.
e além disso se tenha conhecimento da prevalência de soropositividade para HIV de 0,3%, determine os
valores : VPP, VPN, PFP e PFN, para o teste combinado, proposto pelo Ministério da Saúde.
Exercı́cio 10.12. Um teste diagnóstico A relativamente barato utilizado para detecção de gravidez tem
sensibilidade e especificidade, respectivamente dados por: 87,5% e 88,8%. Um outro B, tem respectivamente:
91,3% e 67,4%. Uma mulher desconfiada de que estaria grávida resolve fazer os testes. Primeiro faz o teste
A e sendo o resultado positivo então procede ao segundo teste.
1. Determine a chace de o teste A dar resultado falso positivo considerando uma porcentagem de 80%
para a gravidez;
2. Considerando que esta mulher realizou o segundo teste, determine a chance de um falso positivo
combinado. O que aconteceu? a chance de ela estar realmente grávida aumenta ou diminui?
Exercı́cio 10.13. A tabela a seguir (incompleta) mostra a sensibilidade, especificidade, VPP e VPN de
testes individuais A e B e dos testes em série e em paralelo.
Teste s e VPP VPN

A 0,80 0,70
B 0,75 0,90
Paralelo
Série
1. complete a tabela acima, considerando uma prevalência de 15%;
2. baseado nos resultados, qual diagnóstico você escolheria, considerando independência nos testes com-
binados? Porque?
Capı́tulo 11
Análise de Regressão
11.1 Introdução
É freqüente o estudo da relação entre séries de variáveis.
Usualmente as companhias telefônicas não guardam o número de todas as chamadas interurbanas origina-
das em determinada localidade. É que, do ponto de vista do faturamento, existem chamadas interurbanas que
são cobradas pelo mesmo sistema usado para chamadas locais. Em estudos de tráfego telefônico é portanto,
necessário criar maneiras de estimar o número de chamadas interurbanas a partir de ı́ndices sócio-econômicos.
Isto é feito obtendo-se o número de chamadas interurbanas em algumas cidades, os correspondentes ı́ndices
sócio-econômicos e relacionando-se estas varáveis através de um modelo de regressão.
Situações como as descritas acima são estudadas pela técnica de análise de regressão, onde são relacio-
nadas por uma equação duas variáveis: uma, chamada variável resposta, ou dependente, e outra, chamada
variável explicativa, ou independente. Conhecido um conjunto de valores da variável explicativa e outro da
variável resposta determina-se os parâmetros da equação.
11.2 Ajustamento da reta

Sempre que desejamos estudar determinada variável em função de outra fazemos uma análise de regressão.
Podemos dizer que a análise de regressão tem por objetivo descrever, através de um modelo matemático,
a relação entre duas variáveis, partindo de n observações das mesmas.
A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra
de variável independente.
11.3 O Modelo de Regressão Linear Simples - MRLS

Supondo X a variável explicativa e Y a variável resposta, diremos que Y = f (X).
Dado um conjunto de valores observados X e Y , construir um modelo de regressão linear de Y sobre
X consiste em obter, a partir desses valores, uma equação que melhor represente a relação verdadeira entre
essas variáveis.
A determinação dos parâmetros dessa equação é denominada ajustamento. O processo de ajustamento
deve partir da escolha da equação através da qual os valores de X explicarão os de Y . Para isso recorre-se
ao diagrama de dispersão.
A equação escolhida será aquela que for sugerida pelo conjunto dos pontos dispostos no diagrama.
Supondo X a variável independente e Y a variável dependente, vamos procurar determinar o ajustamento
de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por:
yi = α + βxi + εi
εi ∼ N (0; σ 2 )
onde α (coeficiente linear) e β (coeficiente angular) são os parâmetros amostrais, xi dados e ε é o erro.
140
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 141
A obtenção dos valores dos parâmetros α e β, pode ser feita via método de Mı́nimos Quadrados (ver
Capı́tulo 2 de Charnet et al. (1999)):
∑
n 1∑ n ∑n
xi y − xi y
Sxy n i=1 i=1
β̂ = = i=1 ( n )2 (11.1)
Sxx ∑
n 1 ∑
xi −
2 xi
i=1 n i=1
e
α̂ = ȳ − β̂ x̄. (11.2)
Sejam ŷi = α̂ + β̂xi , para i = 1, 2, ..., n, os valores da reta de quadrados mı́nimo, ajustada ao conjunto
de n pontos (xi , yi ) para todo i. As quantidades εi = yi − ŷi , são denominadas resı́duos. São variáveis
aleatórias, porque são funções dos elementos da amostra.
Precisamos estimar mais um parâmetro - a variância do erro, σ 2ε - o qual representa a distorção à reta.
Nota-se a sua importância para o modelo - se for um valor relativamente alto, as variâncias de α̂ e de β̂
serão altas e neste caso estes estimadores têm pouca precisão. Intuitivamente, sua estimação deve basear-se
nos resı́duos. Um estimador não viciado para σ 2ε é dado por:
∑
n
2
∧ (yi − ŷi )
i=1
σ 2ε = .
n−2
Este estimador é não viciado e, sob o MRLS
∧
(n − 2)σ 2ε
∼ χ2(n−2) . (11.3)
σ 2ε
∧
Assim, a variância de σ 2ε é dada por
∧
2(σ 2ε )2
V ar[σ 2ε ] = .
n−2
11.3.1 Intervalos de confiança para os parâmetros

Podemos definir intervalos de confiança para os parâmetros, a partir da equação (11.3) e das seguintes
quantidades pivotais: ( [ ])
2 1 x̄2
α̂ ∼ N α; σ ε +
n Sxx
ou
α̂ − α
v   ∼ t(n−2) ,
u
u∧
u 21 
tσ ε + ∑ n
x̄2
n (xi −x̄i )2
i=1
e ( )
σ 2ε
β̂ ∼ N β;
Sxx
ou
β̂ − β
v  ∼ t(n−2) .
u
u ∧
u σ 2ε 
t ∑n
(xi −x̄)2
i=1
Os intervalos de confiança (1 − α)% para os parâmetros α, β são dados, respectivamente, por:

v  
u
u
u∧  
u 1 x̄2
α̂ ± t( α2 ;n−2) uσ 2ε 
 + ∑  (11.4)
t 2
n
n
(xi − x̄)
i=1
e v 
u
u ∧
u 
u σ 2ε
β̂ ± t( α2 ;n−2) u . (11.5)
t ∑
n
2
(xi − x̄)
i=1
O valor esperado de um valor Y , dado um valor x da variável regressora, é dada por:
E[Y |x] = E[α̂ + β̂x] = E[α̂] + E[β̂x] = α + βx
e variâcia é
V ar[α̂ + β̂x] = V ar[α̂] + V ar[β̂x] + 2xCov[α̂; β̂]

[ ]
2 1 x̄2 σ2 xx̄2 σ 2
= σ + + x2 −2
n Sxx Sxx Sxx
[ ]
1 (x − x̄) 2
= σ2 + .
n Sxx
Então ( [ ])
1 (x − x̄)2
α̂ + β̂x ∼ N α + βx; σ 2
+ .
n Sxx
Usando o estimador de σ 2 , dado por
∑
n
2
∧ (yi − ŷi )
i=1
σ = SY2 |x =
2
, (11.6)
n−2
podemos definir um intervalo de confiança para E[Y|x], através da seguinte quantidade pivotal:
α̂ + β̂x − (α + βx)
√( )
1 2
σ̂ + (x−x̄)
Sxx
n
a qual tem distribuição t de Student com (n-2) graus de liberdade. Portanto, o intervalo de confiança (1−α)%
para E[Y|x] é dado pela expressão:
v( )
u
u 1 (x − x̄)
2
α̂ + β̂x ± t( α2 ;n−2) σ̂ t + . (11.7)
n Sxx
Se calcularmos intervalos de confiança para alguns valores de x, podemos esboçar uma região em torno da
reta estimada, indicando os limites superiores e inferiores desses intervalos. Essa região é também chamada
de bandas de confiança.
11.3.2 Intervalos de predição

Suponha que estamos interessados em fazer uma predição para um valor futuro Y0 - não observado -
correspondente a X = x0 . Se usarmos o MRLS ajustado, dizemos que Ŷ0 = α̂ + β̂x0 é uma predição de Y0 .
Note que a predição de Y0 é igual ao estimador do valor esperado de Y, para X = x0 . O erro de predição é
definido por
Ŷ0 − Y0 ,
o qual será a base para construirmos um intervalo de predição.
Temos
Y0 ∼ N (α + βx; σ 2 ).
A variável Y0 não faz parte da amostra utilizada no ajuste do modelo, portanto é independente de Ŷ0 .
A variância do erro de predição pode ser escrita como a soma das variâncias das variáveis que a compõem,
dada a independência entre os termos. Os anteriores implicam:
E[Ŷ0 − Y0 ] = 0
V ar[Ŷ0 − Y0 ] = V ar(Ŷ0 ) + V ar(Y0 )
[ ]
2
2 2 1 (x0 − x̄)
= σ +σ +
n Sxx
( [ ])
2
1 (x0 − x̄)
⇒ Ŷ0 − Y0 ∼ N 2
0; σ + σ 2
+ .
n Sxx
∧
Substituindo σ 2 por σ 2 , o intervalo de predição será dado por:
v( )
u
u 1 (x − x̄)
2
Ŷ0 ± t( α2 ;n−2) σ̂ t 1 + +
0
. (11.8)
n Sxx
Pode-se encontrar na literatura outra forma para o intervalo de predição, como:

v( )
u
u 1 (x0 − x̄)
2
ȳ + β̂(x0 − x̄) ± t( α2 ;n−2) σ̂ t 1+ + (11.9)
n (n − 1)Sxx2
onde σ̂ é dado em (11.6) e

∑
n
2
(xi − x̄)
2 i=1
Sxx = .
n−1
Os intervalos de predição têm amplitudes maiores, para um mesmo nı́vel α e para o mesmo valor de X.
As bandas de confiança bem como as de predição têm um formato de hipérbole, o que enfatiza o risco
de se fazer extrapolações, ou seja, predições fora do intervalo observado da variável X. Portanto, os modelos
de regressão devem ser usados com cautela para se fazer previsões sobre a variável resposta.
Exemplo 11.1. Um estudo foi feito para investigar o efeito de um desinfetante. Foram preparadas soluções,
nas quais o desinfetante foi diluı́do em quantidades fixas de água, para concentrações do desinfetante de 1%
a 8%. Foi observado o número de bactérias que sobreviveram, após superfı́cies serem limpas com uma das
soluções.
Após alguns cálculos obtemos as seguintes quantidades:
∑
16 ∑
16
yi = 360 yi2 = 8524
i=1 i=1
∑
16 ∑
16 ∑
16
xi = 63 x2i = 313 yi xi = 1279
i=1 i=1 i=1
⇒ ȳ = 22, 5 e x̄ = 3, 9375
2 2
Sxx = 4, 3292 Syy = 28, 2667
α̂ = 30, 9 e β̂ = −2, 1328
Assim, ajustando-se o MRLS para explicar o número de bactérias (Y), em termos das concentrações do
desinfetante (X), temos:
ŷ = 30, 9 − 2, 13x.
Tabela 11.1: Número de bactérias em função de concentração do detergente.

Observação X: Concentração (%) Y: No de bactérias
1 1 29
2 1 31
3 2 26
4 2 25
5 3 21
6 3 24
7 3 26
8 3 28
9 4 21
10 4 22
11 5 14
12 5 24
13 6 23
14 6 15
15 7 18
16 8 13
Um cálculo simples, pode nos fornecer um indicativo de que os dados estão ou não bem ajustados, via
R2 (coeficiente de determinação)
2 Sxx SQReg (soma de quadrados devidos a regressão) 295, 39

R2 = β̂ = = = 0, 697. (11.10)
Syy SQT (soma de quadrados totais) 424
O coeficiente de determinação, R2 , é interpretado como a proporção da variabilidade dos Y’s observados,

explicada pelo modelo considerado. O valor de R2 está no intervalo [0;1] e quanto mais próximo de 1, melhor
o ajuste.
Uma ANOVA (Análise de Variância) é necessária para verificar se o ajuste é razoável ou não. A Tabela
11.2 apresenta estes resultados.
Tabela 11.2: Análise de variância para os dados do exemplo 11.1.

Regressão 1 295,39 295,39 32,14 0,000058
Erro 14 128,61 9,19
Total 15 424
{
H0 : β = 0
Ha : β ̸= 0
Notamos que H0 é rejeitada para um nı́vel de significância de 5%.
Dado que temos replicações para as concentrações 1, 2, 3, 4, 5, e 6, podemos testar a falta de ajuste do
MRLS.
A Tabela 11.3 apresenta a ANOVA
Tabela 11.3: Análise de variância para a falta de ajuste - dados do exemplo 11.1.
Regressão 1 295,39 295,39 32,14 0,000058
Erro 14 128,61 9,19
Falta de ajuste 6 16,777 2,7962 0,2 0,967333
Erro puro 8 111,823 13,978
Total 15 424
30
25
Nº de bactérias
20
15
1 2 3 4 5 6 7 8
Concentração de detergente (%)
Figura 11.1: Número de bactérias em função de concentração do detergente.
Sendo p-valor > 5%, não rejeitamos H0 , onde

{
H0 : O MRLS é adequado
Ha : O MRLS não é adequado.
Se usarmos a concentração do detergente como variável auxiliar, os números esperados de bactérias

dependem do valor da concentração e estão dispostos na linha reta: ŷ = 30, 9 − 2, 13x, com variância de 9,19
(σ̂ 2 ) em torno da reta. Para cada aumento de uma unidade do percentual de concentração do detergente, o
número de bactérias diminui em 2,13. Dizemos que a concentração do detergente explica 70% (R2 ) do valor
do número de bactérias. Além disso, σ̂ 2 , a variância em torno da reta está próxima da variação pura e,
portanto, o ajuste é bastante razoável.
Usando (11.7), um intervalo de 95% de confiança para o número esperado de bactérias que sobrevivem
após aplicação de solução 3, 5 do desinfetante é dado por:
√
2
1 (3, 5 − 3, 9375)
: 30, 9 − 2, 13(3, 5) ± 2, 145.3, 03 +
16 64, 9375
: 23, 45 ± 1, 66
: [21, 8 ; 25, 1].
Agora, usando (11.8), um intervalo de predição de 95% para o número de bactérias que sobrevivem após
aplicação de solução 3, 5 do desinfetante é dada por:
√
2
1 (3, 5 − 3, 9375)
: 30, 9 − 2, 13(3, 5) ± 2, 145.3, 03 1 + +
16 64, 9375
: 23, 45 ± 6, 71
: [16, 7 ; 30, 2].
Note a diferença entre os dois intervalos: estimamos que a esperança do número de bactérias que sobrevi-
vem à concentração 3, 5 esteja no intervalo [21, 8 ; 25, 1] e fazemos a predição de que uma observação futura
com a concentração 3, 5 esteja no intervalo [16, 7 ; 30, 2].
30
Reta estimada: Y = 30.9 − 2.13X
R² = 0,69
25
Nº de bactérias
20
15
1 2 3 4 5 6 7 8
Figura 11.2: Número de bactérias em função de concentração do detergente e reta de quadrados mı́nimos
ajustada.
35
Reta estimada: Y = 30.9 − 2.13X

Regressão
Confiança
Predição
30
25
Nº de bactérias
20
15
10
1 2 3 4 5 6 7 8
Figura 11.3: Bandas de confiança e de predição para o número de bactérias que sobrevivem à concentração
de detergente.
Exercı́cio 11.1. Um experimento foi conduzido para avaliar, em coelhos a disponibilidade relativa do Fósforo
existente. nos Fosfatos de rocha de Araxá e de Patos em relação ao Fósforo existente no Fosfoto Bicálcio.
Os animais foram alimentados com rações contendo nı́veis crescentes de cada Fosfato e foram anotados os
consumos de ração, o que permitiu calcular o consumo de Fósforo em cada unidade experimental. A variável
resposta observada foi a resistência do fêmur à quebra, mensurada com dinamômetro. A disponibilidade
relativa é estimada pela razão entre os coeficientes lineares de regressão (angular no caso da reta) obtido
para o Fosfato de interesse e para o Fosfato Bicálcio.
Araxá Patos Bicálcio

X Y X Y X Y
0,184 21,28 0,195 23,50 0,18 25
0,350 31,60 0,350 34,59 0,36 39
0,516 32,42 0,505 31,18 0,50 43
0,683 41,74 0,661 43,27 0,65 60
0,849 42,06 0,816 40,36 0,78 63
1,015 53,38 0,972 50,45 0,94 71
Os objetivos foram:
a) Estimar a disponibilidae relativa do Fósforo nos dois Fosfatos de rocha;
b) Testar o ajuste dos modelos (apresente os gráficos individuais e simultâneos);
c) Fazer uma seleção de modelos (via análise de resı́duos, por exemplo).
Capı́tulo 12
Regressão Logı́stica
12.1 Introdução
Dos modelos lineares tı́nhamos:
Y = β 0 + β 1 X1 + β 2 X2 + ... + β k Xk + ϵ
ϵ ∼ N (0, σ 2 )
sendo Y: variável dependente ou variável resposta contı́nua (de interesse);

X : variável independente ou covariável explicativa;
β : (β 0 , β 1 , β 2 , ..., β k )′ vetor de parâmetros a serem estimados.
Existem muitas situações, no entanto, em que a resposta, Y, é dicotômica ao em vez de contı́nua, por
exemplo, em estudos médicos onde o interesse é o de verificar a ”cura” ou ”não-cura” de um paciente em
um dado tratamento.
Exemplo 12.1. Representaremos
1: ”sucesso”; p = Pr(Y = 1)
0: ”fracasso”; q = 1 − p = Pr(Y = 1).
12.2 O modelo de Regressão Logı́stica

Consideremos inicialmente apenas uma única covariável X, e assumimos que
p = β 0 + β 1 X. (12.1)
Este é o modelo de regressão linear simples onde Y foi substituı́do por p. β 0 é o intercepto da reta e β 1
é a sua inclinação. Como p está restrito ao intervalo 0 e 1, e o termo β 0 + β 1 X assume qualquer valor real,
então o modelo em (12.1) não está adequado, logo faremos:
p = eβ 0 +β 1 X (12.2)
onde, agora p assume valores somente positivos, e ainda fazendo
eβ 0 +β 1 X
p = Pr(Y = 1) = (12.3)
1 + eβ 0 +β 1 X
e
Pr(Y = 0) = 1 − p
eβ 0 +β 1 X
= 1−
1 + eβ 0 +β 1 X
1 + eβ 0 +β 1 X − eβ 0 +β 1 X
=
1 + eβ 0 +β 1 X
148
12.2 O modelo de Regressão Logı́stica ROSSI, R. M. 149
1
Pr(Y = 0) = (12.4)
1 + eβ 0 +β 1 X
acomodamos os valores entre 0 e 1.
A função dada em (12.3) é conhecida como função logı́stica. Lembrando que p = Pr(Y = 1), um sucesso
ocorre com probabilidade p e a chance em favor de sucesso é
p
= eβ 0 +β 1 X . (12.5)
1−p
Tomando o ln em (12.5), temos: ( )

p
ln = β 0 + β 1 X. (12.6)
1−p
Desta forma, modelar a probabilidade p com uma função logı́stica, é equivalente a ajustar um modelo de
regressão linear o qual a resposta Y, que era contı́nua, foi substituı́da pelo logaritmo da chance do sucesso
de uma v.a. dicotômica, ou , Logito. Dá-se o nome a esta técnica de Regressão Logı́stica.
Exemplo 12.2. (Colosimo, 1997) Se a variável explicativa (X) é a dosagem de um tóxico, e a resposta de
interesse (Y=1) é a morte das cobaias, o modelo logı́stico especifica que:
eβ 0 +β 1 X
p = Pr(Y = 1|X = 1) =
1 + eβ 0 +β 1 X
e que
1
q = 1 − p = Pr(Y = 0|X = 1) = .
1 + eβ 0 +β 1 X
( )
p
O modelo pode ser escrito como ln = β 0 + β 1 X, mostrando que o logito depende linearmente da
1−p
β
dosagem do tóxico. Para a dosagem x = − 0 , temos que
β1
( )
β 1
p = Pr Y = 1|X = − 0 = ou 50%
β1 2
β0 β
ou seja, − é a dosagem do tóxico que mata 50% população. A razão − 0 é parâmetro de grande
β1 β1
importância em estudos toxicológicos.
A Figura 12.1 apresenta a caracterização gráfica da Função Logı́stica.
Figura 12.1: Curva Logı́stica.

12.3 Várias Variáveis Explicativas ROSSI, R. M. 150
12.3 Várias Variáveis Explicativas

Na presença de k variáveis explicativas o modelo logı́stico é dado por
′
eXi β i
pi = ′ (12.7)
1 + eXi β i
onde Xi : (xi1 , xi2 , ..., xik ) é o vetor dos valores das variáveis explicativas ou covariáveis para a observação i,
e β : (β 0 , β 1 , β 2 , ..., β k )′ é o vetor dos parâmetros a serem estimados.
O modelo logı́stico através do modelo linear será:
( )
pi
ln = β 0 + β 1 Xi1 + β 2 Xi2 + ... + β k Xik (12.8)
1 + pi
12.4 Método da Máxima Verossimilhança

Assumindo que as observações vem de pacientes diferentes e são portanto independentes, a verossimi-
lhança é simplesmente o produto das probabilidade de ocorrências de cada resposta observada:
n
L(β|Y, X) = Π Pr(Yi = yi |Xi = xi , β) (12.9)
i=1
( ′ )
Xi β i yi
n e
= Π( ′
)
i=1
1 + eXi β i
∑
p
β j tj
n e j=1
= Π( ′
)
i=1
1 + eXi β i
∑
n
onde ti é o valor observado de Tj = xij yi .
j=1
Aplicando o logaritmo em (12.9) obtém-se a função log-verossimilhança dada por:
∑
n
l(β|Y, X) = {yi log(pi ) + (1 − yi ) log(1 − pi )}
i=1
onde ( ′
)
Xi β i
e
pi =
′ .
1 + e(Xi β i )
O estimador de máxima verossimilhança do vetor β, é obtido igualando-se a zero a Função Escore de
Fisher (Derivada primeira da função log-verossimilhança) e resolvendo a mesma em β 0 , β 1 , β 2 , ..., β k , ou seja,
 ∂l(β|Y,X)

 =0


∂β 0
 ∂l(β|Y,X)
=0
∂β 1
 ..

 .

 ∂l(β|Y,X)
∂β k = 0.
Para construir um intervalo com (1 − α)% de confiança para os estimadores de máxima verossimilhança
de β 0 , β 1 , β 2 , ..., β k sabe-se que assintoticamente
β̂ ∼ NK (β, IF−1 (β)).
Entretanto, na prática ao invés de trabalhar com o inverso da Informação de Fisher, trabalha-se com o
inverso da informação observada.
12.4 Método da Máxima Verossimilhança ROSSI, R. M. 151
A matriz de informação observada pode ser escrita como:

 2 
∂ l(β|Y,X) ∂ 2 l(β|Y,X) β 1 =β̂ 1 ∂ 2 l(β|Y,X) β k =β̂ k
∂β 20
|β =β̂ ∂β 0 ∂β 1 |β 0 =β̂ 0 ··· ∂β 0 ∂β k |β 0 =β̂ 0
 2 0 0 
 ∂ l(β|Y,X) β 1 =β̂ 1 ∂ 2 l(β|Y,X) 2
∂ l(β|Y,X) β k =β̂ k 
 ∂β 0 ∂β 1 |β =β̂ |β =β̂ ··· ∂β 1 ∂β k |β 1 =β̂ 1 
I(β̂|Y, X) =  .
∂β 21 1 1
 
0 0
 .
.. .
.. .. .. 
 . . 
∂ 2 l(β|Y,X) β k =β̂ k ∂ 2 l(β|Y,X) β k =β̂ k ∂ 2 l(β|Y,X)
∂β 0 ∂β k |β 0 =β̂ 0 ∂β 1 ∂β k |β 1 =β̂ 1 ··· ∂β 2k
|β =β̂
k k
Logo, a matriz inversa da informação observada é definida como:

 
V ar(β̂ 0 ) Cov(β̂ 0 , β̂ 1 ) ··· Cov(β̂ 0 , β̂ k )
 Cov(β̂ 0 , β̂ 1 ) V ar(β̂ 1 ) ··· Cov(β̂ 1 , β̂ k ) 
 
I −1 (β̂) =  .. .. .. .. , (12.10)
 . . . . 
Cov(β̂ 0 , β̂ k ) Cov(β̂ 1 , β̂ k ) · · · V ar(β̂ k )
enfim, para n grande, ou seja, assintoticamente
β̂ ∼ NK (β, I −1 (β)). (12.11)
Onde β̂ é o vetor das estimativas de máxima verossimilhança, de dimensão K + 1 e I −1 (β̂) é a matriz de

variância e covariância de ordem k + 1.
Exemplo 12.3. Em alguns estudos de coorte apenas uma variável explicativa X precisa ser considerada.
Seja X = 1, se o paciente pertence ao grupo exposto ao fator de risco e X = 0 se o paciente pertence ao
grupo não-exposto. Assumindo um modelo logı́stico para o relacionamento entre X e a variável resposta Y,
que neste caso é o desenvolvimento da doença em estudo, temos que se X = 0 :
eβ 0
p0 = Pr (Y = 1|X = 0) =
1 + eβ 0
e se X = 1 :
eβ 0 +β 1
p1 = Pr (Y = 1|X = 1) = .
1 + eβ 0 +β 1
Os dados para um estudo de coorte como este, onde a variável resposta é dicotômica, reduzem-se a uma
tabela 2 × 2, como a mostrada a seguir.
Doença
Exposição Sim Não
Sim p1 q1
Não p0 q0
Ou seja, a análise consiste basicamente no cálculo da razão das chances (OR):
P (X = 1)[1 − P (X = 1)]
OR =
P (X = 0)[1 − P (X = 0)]
e(β 0 +β 1 )
1+e(β 0 +β 1 )
× 1+e1 β0
= β
e 0
1+e(β 0 +β 1 )
× 1+e(β10 +β1 )
e (β 0 +β 1 )
[1 + eβ 0 ] × [1 + e(β 0 +β 1 ) ]
= ×
[1 + e(β 0 +β 1 ) ] × [1 + eβ 0 ] eβ 0
= e(β 0 +β 1 −β 0 ) = eβ 1
ou simplesmente
p1 q0
OR = ,
p0 q1
assim
ln OR = β 1 .
Ou seja, dado um paciente qualquer, as chances dele desenvolver a doença dado que ele foi exposto ao
fator, é de eβ 1 vezes a chance de um paciente desenvolver a doença dado que ele foi não exposto ao fator.
Exemplo 12.4. Considerando o Exemplo 12.2 e supondo que apenas três observações foram feitas. Observou-
se uma sobrevivência quando a dosagem do tóxico (X) usada era X=1; uma segunda sobrevivência para X=3
e finalmente uma falha, ou morte da cobaia para X=7. A verossimilhança neste caso de (12.9) será dada
por:
L(β 0 , β 1 ) = Pr(Y1 = 1|X = 1) Pr(Y2 = 1|X = 3) Pr(Y3 = 0|X = 7)

eβ 0 +β 1 eβ 0 +3β 1 1
= .
1 + eβ 0 +β 1 1 + eβ 0 +3β 1 1 + eβ 0 +7β 1
A estimação de β 0 e β 1 será feita via técnicas de maximização de L.
Na generalização para k covariáveis, pode-se calcular a razão de chances entre dois nı́veis
diferentes de uma mesma covariável, fixando-se o valor das outras k − 1 variáveis.
Seja Xj , a j−ésima covariável de interesse, onde deseja-se saber a razão de chances entre um dado
paciente exposto (Xj = 1) e um dado paciente não exposto ao fator (Xj = 0).
Suponha ainda que se tenha k variáveis significativas no modelo logı́stico. Para determinar a razão de
chances na mudança do nı́vel da j−ésima variável tem-se:
[p(X1 = x1 , X2 = x2 , ..., Xj = 1, ..., Xk = xk )] × [1 − p(X1 = x1 , X2 = x2 , ..., Xj = 0, ..., Xk = xk )]

OR(Xj ) =
[p(X1 = x1 , X2 = x2 , ..., Xj = 0, ..., Xk = xk )] × [1 − p(X1 = x1 , X2 = x2 , ..., Xj = 1, ..., Xk = xk )]
ou [ ] [ ]
e(β 0 +β 1 x1 +...+β j +...+β k xk ) 1
1+e(β 0 +β 1 x1 +...+β j +...+β k xk ) 1+e(β 0 +β 1 x1 +...+β k xk )
ORxj = [ (β +β x +...+β x ) ] ×[ ]
e 0 1 1 k k 1
1+e(β 0 +β 1 x1 +...+β k xk ) 1+e(β 0 +β 1 x1 +...+β j +...+β k xk )
e com um pouco de álgebra tem-se:
e(β 0 +β 1 x1 +...+β j +...+β k xk )

ORxj = (12.12)
e(β 0 +β 1 x1 +...+β k xk )
= e(β 0 +β 1 x1 +...+β j +...+β k xk )−(β 0 +β 1 x1 +...+β k xk )
= eβ j .
Desta forma, a razão de chances na mudança do nı́vel da j−ésima covariável (Xj ) é dada pelo exponencial
do j−ésimo estimador de máxima verossimilhança (β̂ j ), sendo j ≥ 1.
O intervalo com (1 − α)% de confiança pode ser obtido exponenciando os limites inferior e superior,
respectivamente, do intervalo de confiança para β̂ j , já visto anteriormente.
12.5 Significância dos Efeitos das Variáveis ROSSI, R. M. 154
12.5 Significância dos Efeitos das Variáveis

Obtidas as estimativas dos parâmetros, faz-se necessário avaliar a adequação do modelo ajustado. O
princı́pio em regressão logı́stica é o mesmo usado em regressão linear, ou seja, comparar os valores observados
da variável resposta com os valores preditos pelos modelos com, e sem, a variável sob investigação. O teste
da razão de verossimilhanças pode ser utilizado:
[ ]
LS
T RV = −2 ln = 2 ln(LS ) − 2 ln(LC ) ∼ χ2(q) (12.13)
LC | {z }
| {z } diferença de Deviances
Deviance
LS : Função de verossimilhança do modelo sem as variáveis, LC : Função de verossimilhança do modelo com

as variáveis, q : diferença de parâmetros entre os dois modelos.
Observação1 : O logaritimo da razão das verossimilhanças é multiplicado por -2 para que se obtenha uma
quantidade cuja distribuição seja conhecida, no caso a Qui-quadrado.
Observação2 : Na presença de dados faltantes, o tamanho amostral nos modelos sequenciais dependerá
das variáveis Xk que os compõem e neste caso o TRV apresentará problemas.
Alternativa: Teste de Wald (Wald, 1943)

()2
β̂ j
W = ( ) ∼ χ2(1) (12.14)
Vd
ar β̂ j
sob a hipótese nula H0 : β j = 0, j : 0, 1, ..., k.
12.6 Qualidade e Diagnóstico do Modelo Ajustado

As estatı́sticas de teste utilizadas para avaliar o quão bem o modelo se ajusta aos dados, em geral, são
denominadas estatı́sticas de qualidade do ajuste.
Qui-quadrado de Pearson e razão de verossimilhança:

Duas tradicionalmente utilizadas são a Qui-quadrado de Pearson, QP , e a da razão de verossimilhança,
QL , respectivamente, dadas por:
∑ (nij − eij )2
QP = ∼ χ2(nl−k) (12.15)
ij
e ij
e
∑ ( )
nij
QL = 2 nij ln ∼ χ2(nl−k) , (12.16)
ij
e ij
sendo nij e eij , respectivamente, os valores observados e preditos eij = ni+ p̂i para j = 1 e eij = ni+ (1 − p̂i )
para j = 2. nl : número de subpopulações (linhas da tabela de dados) e k: o número de parâmetros no
modelo.
Também é importante que outras medidas sejam examinadas a fim de se averiguar se o ajuste é válido
sobre todo o conjunto de padrões (combinações das categorias) das variáveis explanatórias ou fatores. Pre-
gibon (1981) estendeu os métodos de diagnósticos de regressão linear para a regressão logı́stica e, para isso,
fez uso dos componentes individuais das estatı́sticas QP e QL .
Digamos que, se uma tabela de contingência s × 2 tem-se ni+ sujeitos em cada uma das s linhas, dos
quais ni1 apresentam a resposta de interesse predita pelo modelo para a i-ésima linha, define-se o i-ésimo
resı́duo (resı́duos de Pearson), i = 1, 2, .., s, por:
ni1 − ni+ p̂i

ci = √ . (12.17)
ni+ p̂i (1 − p̂i )
12.6 Qualidade e Diagnóstico do Modelo Ajustado ROSSI, R. M. 155
A soma dos quadrados dos componentes ci resulta em QP :

∑
s
2
QP = (ci ) . (12.18)
i=1
Similarmente, o resı́duo deviance, expresso por:

[ ( ) ( )] 21
ni1 ni+ − ni1
di = ± 2ni1 ln + 2 (ni+ − ni1 ) ln (12.19)
ei1 ni+ − ei1
em que ei1 = ni+ p̂i , resulta na soma dos quadrados dos componentes di em QL :
∑
s
2
QL = (di ) . (12.20)
i=1
Em geral, resı́duos excedendo os valores ±2, 5, indicam possı́vel falta de ajuste, presença de
outliers e padrões sistemáticos de variação, visto que tanto ci quanto di seguem distribuição
aproximadamente normal padrão.
Hosmer-Lemeshow:
Um teste de ajuste também bem conhecido e utilizado em regressão logı́stica é o teste de Hosmer-
Lemeshow. O teste avalia o modelo ajustado através das distâncias entre as probabilidades ajustadas e
as probabilidades observadas. Os valores ajustados são dispostos do menor para o maior, e em seguida,
separados em g grupos de tamanho aproximadamente igual. Hosmer e Lemeshow (1980) propõe que seja
utilizado g = 10. Na literatura há pouca orientação sobre como escolher o número de grupos. As simulações
mostradas em Hosmer e Lemeshow (1989) foram baseadas no uso de g > p + 1, em que p é o número de
covariáveis do modelo ajustado. Se as frequências esperadas em alguns dos grupos forem muito pequenas a
estatı́stica do teste de Hosmer-Lemeshow é calculada, entretanto pode não ser confiável. Neste caso, devemos
especificar um número menor de grupos, contudo não se pode utilizar menos de 3 grupos, pois com (g < 3)
a estatı́stica do teste é impossibilitada de ser calculada (Agresti, 2013).
A estatı́stica teste é dada por:
(∑ ∑ )2
∑
g
j y ij − j π̂ ij
HL = (∑ )[ (∑ ) ] ∼ χ2(g−2) . (12.21)
i=1 j π̂ ij 1− j π̂ ij /ni
12.7 Aplicações ROSSI, R. M. 156
12.7 Aplicações
12.7.1 Associação entre Tempo de experiência e Realização de uma tarefa
Um analista está estudando o efeito do tempo de experiência em programação computacional sobre a
habilidade para completar, dentro de um determinado tempo, um tarefa difı́cil. Vinte e cinco (25) progra-
madores foram selecionadas para o estudo. A variável preditora, X, corresponde ao meses de experiência. a
variável Resposta Y é tal que Y = 1 se a tarefa foi realizada e Y = 0 caso contrário.
Y 0 0 0 0 0 1 0 0 0 0 1 0 1
X 4 4 5 6 6 8 9 11 12 13 13 14 18
Y 0 0 1 1 1 0 1 1 0 1 1 1
X 18 19 20 22 22 24 25 28 29 30 30 32
O modelo ajustado foi: [ ]

p
ln = β0 + β1X
1−p
a equação da regressão logı́stica estimada será:
[ ]
p̂
ln = −3, 0597 + 0, 1615X.
1 − p̂
Para os dados da tarefa computacional, o valor da razão das chances é:
OR = e0,1615 = 1, 1715
Sua interpretação e que a chance de um indivı́duo aumenta em 17,5% para cada mês adicional de ex-
periência.
Observação: Em geral, a razão das chances estimada quando existe uma diferença de k unidades em X
será ekβ 1 .
Se desejarmos comparar indivı́duos com 10 meses e 25 meses de experiência, respectivamente, então
k = 15, e a razão das chances estimada será dada por:
ekβ̂ 1 = e15(0,1615) = 11, 3
portanto, a chance de um indivı́duo com experiência realizar a tarefa aumenta mais de 11 vezes quando
comparado com outro com pouca experiência.
p̂
Como a razão 1− p̂ é uma odds, então a Odds Ratio entre, por exemplo, os indivı́duos com 20 e 10 meses
de experiência pode ser estimada por
∧ odds(20) exp(0, 17)
OR = = ≃ 5, 027
odds(10) exp(−1, 4448)
já que ( )
xi p̂i 1 − p̂i ln p̂i
1−p̂i
10 0, 1908 0, 8092 −1, 4448
20 0, 5424 0, 4576 0, 1700
ou de forma direta:
∧ odds(20)
OR = = exp{β̂ 1 (20 − 10)} = exp{0, 1615(10)} ≃ 5, 027,
odds(10)
que nos permite concluir que a odds de realizar a tarefa entre indivı́duos com 20 meses de experiência é de
5 vezes a dos com 10 meses.
12.7.2 Diagnóstico de Displasia Bronco Pulmonar (BPD)

(Pagano e Gauvreau, 2004) Considere a população de bebês com baixo peso ao nascer - nesse caso,
definidos como os que pesam menos de 1.750g - que satisfazem ao seguinte critério: estão confinados em
uma unidade de tratamento intensivo neonatal, exigem entubação durante as primeiras 12 horas de vida e
sobrevivem por, no mı́nimo, 28 dias. Na amostra de 223 bebês extraı́da da população original, 76 foram
diagnosticados com displasia broncopulmonar (BPD: bonchopulmonary dysplasia), um tipo crônico de doença
dos pulmões. Os restantes 147 não tinham a doença. Seja Y uma variável aleatória dicotômica para a qual
o valor 1 representa a presença de BPD em uma criança e 0 a sua ausência. Estimamos a probabilidade de
76
que um bebê dessa população desenvolva BPD pela proporção da amostra p̂ = 223 = 0, 341. No total, 34,1%
dessas crianças com baixo peso ao nascer estão diagnosticadas com BPD.
Poderı́amos suspeitar que existem certos fatores - tanto maternais como neonatais - que afetam a pro-
babilidade de que um determinado bebê desenvolva BPD. Se pudermos classificar uma criança de acordo
com essas caracterı́sticas, é possı́vel que possamos estimar a probabilidade de que ela desenvolva a doença
do pulmão com maior precisão do que a proporcionada pelo valor simples e, subsequentemente, tomarmos
medidas para diminuir essa probabilidade.
Um fator de interesse poderia ser o peso de nascimento de um bebê. Se a resposta Y fosse contı́nua,
começarı́amos uma análise com a construção de um gráfico de dispersão bidimensional da resposta versus a
variável explicativa contı́nua, no caso BPD versus peso ao nascer. Talvez o gráfico indique uma tendência
de os bebês que desenvolveram BPD terem peso ao nascer um tanto mais baixo, na média. Em geral, por
ser um indicativo, não fica claro se isso realmente é significativo.
Alternativamente, podemos subdividir a população de bebês em três categorias: os que pesam 950g
ou menos, os que pesam entre 951 e 1.350g e os que pesam 1.351g ou mais. Podemos, então, estimar a
probabilidade de que uma criança desenvolva BPD em cada um desses subgrupos individualmente.
Tabela 12.1: Crianças com baixo peso ao nascer e desenvolvimento de BPD.

Peso ao nascer (g) Peso médio Grupo BP D = 0 BP D = 1 Total p̂
0 − 950 475 G1 19 49 68 0, 721
951 − 1.350 750 G2 62 18 80 0, 225
1.351 − 1.750 1550 G3 66 9 75 0, 120
Total - - 147 76 223 0, 341
A probabilidade estimada de um bebê ser diagnosticado com BPD diminui conforme o peso ao
nascer aumenta, de 72,1% para crianças que pesam 950g ou menos até 12% para os que pesam 1.351g
ou mais (Análise de associação na Tabela (12.1), χ2 = 64, 71; p < 0, 00001). Verificada a existência de
associação entre essas duas variáveis, podemos usar o peso ao nascer de uma criança para nos ajudar a
prever a probabilidade de que ela desenvolva BPD por meio de um modelo de regressão logı́stica.
Ajustando o modelo: [ ]
p
ln = β0 + β1X
1−p
onde X: peso ao nascer, considerando os pontos médios das classes agrupados (475, 1150 ou 1550g) a equação
da regressão logı́stica estimada é: [ ]
p̂
ln = 2, 245 − 0, 003X. (12.22)
1 − p̂
O coeficiente do peso implica que, para cada mudança de grupo de peso ao nascer, o logaritmo da chance
de que um bebê desenvolva BPD diminui de 0,003, em média. Quando o logaritmo da chance diminui,
a probabilidade p também diminui.
Para estimarmos a probabilidade de que uma criança com peso no grupo I desenvolva BPD, por exemplo,
substituı́mos o valor X = 475g para encontrar:
[ ]
p̂
ln = 2, 245 − 0, 003(475) ⇒ p̂ = 0, 71 ou 71%.
1 − p̂
Para uma criança com peso de X = 750g, tem-se:
[ ]
p̂
ln = 2, 245 − 0, 003(750) ⇒ p̂ = 0, 52 ou 52%,
1 − p̂
Entretanto, ao ajustar um novo modelo com todos as informações individuais (n = 223 crianças), podemos
estimar a probabilidade de que uma criança que pesa 750g no nascimento desenvolva BPD. Digamos que o
modelo ajustado tenha sido:
[ ]
p̂
ln = 4, 0343 − 0, 0042X (Pagano e Gauvreau, 2000) (12.23)
1 − p̂
então, [ ]
p̂
ln = 4, 0343 − 0, 0042(750) ⇒ p̂ = 0, 708 ou ≃ 71%.
1 − p̂
A Figura 12.2 apresenta a curva estimada de p versus Peso ao nascer, considerando o primeiro modelo
ajustado 12.22.
Figura 12.2: Regressão logı́stica de displasia broncopulmonar sobre o peso ao nascer.
Sendo o valor p̂ = 0, 52 uma estimativa, é importante apresentar seu intervalo com uma certa confiança,
digamos 95%. Para tal, é necessário o conhecimento da matriz de (co)variância dos parâmetros estimados:
[ ]
0, 176664 −0, 000155
V =
−0000155 0, 1615931
Sabe-se, da propriedade de variância, que:
V ar(p) = V ar(β 0 + β 1 X) = V ar(β 0 ) + X 2 V ar(β 1 ) + 2XCov(β 0 , β 1 ) (12.24)
assim,
∧
V ar(p̂) = 0, 176664 + 7502 (0, 1615931) + 2(750)(−0, 000155)
= 0, 03487.
Um intervalo assintótico para p, com (1 − α)% de confiança, é dado por:

√
∧
IC [p, (1 − α)%] : p̂ ± Z α2 V ar(p̂) (12.25)
então, considerando α = 5%, tem-se:

√
IC [p, 95%] = 0, 52 ± (1, 96) 0, 03487
= 0, 52 ± 0, 3660
= [0, 54; 0, 71].
Muitas vezes só dispomos dos dados na forma apresentada na Tabela 12.1, neste caso podemos analisar
como se X fosse uma variável categórica:
Observe a estrutura utilizada no programa utilizado, por exemplo, no R:

 
G1 : Baixo 0 0
 G2 : Média 1 0  : Matriz de planejamento do R (Dummy).
G3 : Alto 0 1
A equação logı́stica estimada para esse caso é dada por:

[ ]
p̂
ln = 0, 9474 − 2, 1841G2 − 2, 9398G3 . (12.26)
1 − p̂
Sendo assim, uma criança com baixo peso, por exemplo, terá 72% de probabilidade de desenvolver BPD:
[ ]
p̂
ln = 0, 9474 − 2, 1841(0) − 2, 9398(0) = 0, 9474 → p̂ = 0, 72,
1 − p̂
uma criança com médio peso, terá 23% de probabilidade de desenvolver BPD:
[ ]
p̂
ln = 0, 9474 − 2, 1841(1) − 2, 9398(0) = −1, 9906 → p̂ = 0, 23,
1 − p̂
e, uma criança com alto peso, terá 12% de probabilidade de desenvolver BPD:
[ ]
p̂
ln = 0, 9474 − 2, 1841(0) − 2, 9398(1) = −1, 2368, → p̂ = 0, 12.
1 − p̂
Desta forma, para obter as Odds correspondentes, primeiramente os cálculos auxiliares:
OR1 = log(p1 /(1 − p1 )) = 0, 9474

OR2 = log(p2 /(1 − p2 )) = −1, 2368
OR3 = log(p3 /(1 − p3 )) = −1, 9924
Por fim:
OR12 = exp(OR1 /OR2 ) = 8, 88

OR13 = exp(OR1 /OR3 ) = 18, 91
OR23 = exp(OR2 /OR3 ) = 2, 13
Verifica-se que crianças do grupo G1 tem, aproximadamente, 19 vezes mais chances de desenvolver a
BPD quando comparadas às do grupo G3 , por exemplo.
12.7.3 Doença na artéria coronariana

Os dados abaixo referem-se a um estudo sobre doença coronariana (koch, Imrey et al. 1985). A amostra
(estratificada) foi realizada de modo conveniente com pacientes que apresentavam caracterı́sticas clı́nicas de
interesse.
Tabela 12.2: Dados de doença na artéria coronariana.

Sexo ECG Doente Sadio Total
Feminino Depressão do Segmento ST < 0.1 4 11 15
Depressão do Segmento ST ≥ 0.1 8 10 18
Masculino Depressão do Segmento ST < 0.1 9 9 18
Depressão do Segmento ST ≥ 0.1 21 6 27
O objetivo é investigar a associação entre a doença e as variáveis descritas acima, utilizando os resultados
do ECG: Eletrocardiograma.
Observação: A análise desses dados será feita em sala de aula por meio de regressão logı́stica.
12.7.4 Estudo de fatores associados a vaso-constrição

No estudo do efeito do Volume (X1 ) e da Taxa (X2 ) de ar inspirado por indivı́duos humanos tem-se como
variável resposta (Y) a ocorrência ou não de vaso-constrição passageira na pele dos dedos. Foram obtidas
39 observações independentes (Banco de dados : vasoconstricao.txt).
Por meio de um programa computacional obtém-se os seguintes estimadores de máxima verossimilhança,
para β 0 , β 1 e β 2 :
Parâmetro Estimativa Erro-Padrão t = estimativa-0

Erro-padrão p-valor IC(β; 95%)
β0 -9,5536 3,2419 -2,95 0,0054 (-16,1109 ; -2,9963)
β1 3,8907 1,4319 2,72 0,0098 (0,9945 ; 6,7869)
β2 2,6561 0,9166 2,90 0,0061 (0,8021 ; 4,5101)
Através do p-valor, pode-se notar que todos os parâmetros são significantes ao nı́vel de 5%. A soma
dos quadrados dos resı́duos de Pearson dá um valor de 38,85, em 36 graus de liberdade, sugerindo um bom
ajuste do modelo aos dados.
Uma vez que obtidas as estimativas de β 0 , β 1 e β 2 , pode-se estimar pi e 1 − pi .
Observando as saı́das no SAS, nota-se que para nı́veis baixos de Volume (X1 ) e de Taxa (X2 ) de ar
inspirado, a probabilidade de ocorrência de vaso-constrição, é muito baixa (por exemplo a observação 10,
onde x1 = 0, 90 e x2 = 0, 45 têm-se p̂ = 0, 008), entretanto a medida que os nı́veis de Volume e de Taxa de
ar inspirado vai aumentando, a probabilidade de que um dado indivı́duo tenha vaso-constrição passageira
na pele dos tecidos dos dedos também aumenta (por exemplo a observação 2, onde x1 = 3, 5 e x2 = 1, 09
têm-se p̂ = 0, 999).
Porém, nota-se ainda que para nı́veis baixos de Volume e nı́veis altos de Taxa de ar inspirado, tem-se
uma probabilidade de ocorrência de vaso-constrição na pele dos dedos relativamente baixa (por exemplo a
observação 21, onde x1 = 0, 40 e x2 = 2, 00 têm-se p̂ = 0, 064), e para nı́veis altos de Volume e nı́veis
baixos de Taxa de ar inspirado, tem-se uma probabilidade de ocorrência de vaso-constrição intermediária
(por exemplo a observação 32, onde x1 = 2, 35 e x2 = 0, 03 têm-se p̂ = 0, 419) dando evidências de que a
covariável Volume de ar inspirado tem mais influência sobre o aumento da probabilidade de ocorrência de
vaso-constrição do que a covariável Taxa de ar inspirado.
Para uma análise mais refinada do problema, tem-se algumas estatı́sticas descritivas das covariáveis
Volume e Taxa de ar inspirado na tabela a seguir.
Covariáveis x̄ Md Q1 Q3 s
Volume (X1 ) 1,3603 1,10 0,80 1,7 0,8154
Taxa (X2 ) 1,6887 1,63 1,08 2,0 0,8804
Contudo, fixando-se a covariável Taxa de ar inspirado (X2 ) no seu nı́vel médio e utilizando o modelo
logı́stico, obtém-se
( )
p̂i
log = β̂ 0 + β̂ 1 Xi1 + β̂ 2 Xi2
1 − p̂i
= −9, 5536 + 3, 8907Xi1 + 2, 6561(1, 6887)
fazendo ( )
p̂i
ŷi = log
1 − p̂i
tem-se
ŷi = −5, 0682 + 3, 8907Xi1
ou seja, uma função do primeiro grau cujo gráfico é caracterizado por uma reta crescente com uma taxa de
crescimento (coeficiente angular) de 3,8907, como mostrado na Figura 12.3.
Log da chance de ocorrência de VC (Logito)
8
6
4
2
Y = −5.0682 + 3.8907.X1
0
−4 −2
0.5 1.0 1.5 2.0 2.5 3.0 3.5
Volume de ar inspirado
Figura 12.3: Logito versus Volume de ar inspirado.
Sendo assim, pode-se concluir que para um aumento de uma unidade (1) no Volume de ar inspirado,
tem-se um aumento de 3,8907 no logito (logaritmo da chance de sucesso), consequentemente ocorrendo um
aumento na probabilidade da ocorrência de vaso-constrição, uma vez que
( )
p̂i
ŷi = log
1 − p̂i
1
1 − p̂i = .
1 + eŷi
Quanto maior for ŷi menor será 1 − p̂i , e consequentemente tem-se um aumento em p̂i .
Fixando-se agora o nı́vel médio da covariável Volume de ar inspirado (X1 ) e utilizando o modelo logı́stico
obtém-se ( )
p̂i
log = −9, 5536 + 3, 8907(1, 3603) + 2, 6561Xi2
1 − p̂i
fazendo ( )
p̂i
ŷi = log
1 − p̂i
tem-se
ŷi = −4, 2610 + 2, 6561Xi2
ou seja, uma reta crescente com uma taxa de crescimento de 2,6561, como mostra a Figura 12.4.
Sendo assim pode-se concluir que para um aumento de uma unidade (1) na Taxa de ar inspirado tem-se
um aumento de 2,6561 no Logito, consequentemente ocorrendo um aumento na probabilidade da ocorrência
de vaso-constrição.
Plotando as duas retas no mesmo plano cartesiano, obtém-se a Figura 12.5.
6
4
2
0
Y = −4.2610 + 2.6561.X2
−2
−4
0 1 2 3
Taxa de ar inspirado
Figura 12.4: Logito versus Taxa de ar inspirado.

6
4
Y = −5.0682 + 3.8907.X1
2
0
Y = −4.2610 + 2.6561.X2
−2
−4
0 1 2 3
Taxa e Volume de ar inspirado
Figura 12.5: Logito versus Volume e Taxa de ar inspirado simultâneos.
Logo pode-se notar que a covariável Volume tem uma maior influência no aumento do Logito do que a
covariável Taxa, ou seja, a probabilidade de ocorrência de vaso-constrição na pele dos dedos aumenta mais
rapidamente para um acréscimo no Volume do que um acréscimo na Taxa de ar inspirado.
Supõe que deseja-se saber a razão de chances quando existe uma variação no nı́vel de Volume de ar
inspirado de 0,80 (1o Quartil) para 1,10 (Mediana), para a Taxa de ar inspirado fixado em um determinado
valor. Sendo assim sabe-se que:
Pr(X1 = 1, 10; X2 = x2 ) × [1 − Pr(X1 = 0, 80; X2 = x2 )]
OR =
Pr(X1 = 0, 80; X2 = x2 ) × [1 − Pr(X1 = 1, 10; X2 = x2 )]
onde
eβ̂ 0 +β̂ 1 X1 +β̂ 2 X2
Pr(X1 = x1 ; X2 = x2 ) = .
1 + eβ̂ 0 +β̂ 1 X1 +β̂ 2 X2
Logo após um pouco de álgebra, tem-se
eβ̂ 0 +β̂ 1 (1,10)+β̂ 2 x2
OR =
eβ̂ 0 +β̂ 1 (0,80)+β̂ 2 x2
= e0,30β̂ 1
OR = e0,30(3,8907) = e1,1672 = 3, 213
ou seja, para um mesmo nı́vel de Taxa de ar inspirado (X2 ), e houver um aumento de 0,30 no Volume de ar
inspirado (X1 ), as chances de ter vaso-constrição passageira na pele dos dedos aumenta em 3,21 vezes.
Através do SAS (Proc NlMixed) pode-se determinar um intervalo com 95% de confiança para a estimativa
anterior:
Estimativa IC(95%)
OR 3,213 (1,3476 ; 7,6606)
Como o valor “1” não pertence ao intervalo, pode-se concluir que existe uma diferença significativa, ao
nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um aumento de 0,30 no Volume de ar
inspirado.
Generalizando, tem-se que para cada unidade acrescida no Volume de ar inspirado, para um nı́vel fixo
de Taxa de ar inspirado, a razão de chances (OR) é dada por:
eβ̂ 0 +β̂ 1 (x1 +1)+β̂ 2 x2

OR =
eβ̂ 0 +β̂ 1 x1 +β̂ 2 x2
= e = e3,8907 = 48, 9451
β̂ 1
ou seja, para um mesmo nı́vel de Taxa de ar inspirado (X2 ), se houver um aumento de (“1”) uma unidade
no Volume de ar inspirado (X1 ), as chances de ter vaso-constrição passageira na pele dos dedos aumenta em
48,9 vezes, aproximadamente.
Através do SAS (Proc NlMixed) pode-se determinar um intervalo com 95% de confiança para a razão de
chances
Estimativa IC(95%)
OR 48,9451 (2,7036 ; 886,1662)
analogamente, como o valor 1 não pertence ao intervalo, pode-se concluir que existe uma diferença signifi-
cativa, ao nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um aumento de 1 unidade no
Volume de ar inspirado.
Quando se deseja saber qual a razão de chances quando existe uma variação no nı́vel da Taxa de ar
inspirado de 1,08 (1o Quartil) para 1,63 (Mediana), para o Volume de ar inspirado fixado em um determinado
valor, o procedimento é análogo:
Pr(X1 = x1 ; X2 = 1, 63) × [1 − Pr(X1 = x1 ; X2 = 1, 08)]

OR =
Pr(X1 = x1 ; X2 = 1, 08) × [1 − Pr(X1 = x1 ; X2 = 1, 63)]
..
.
eβ̂ 0 +β̂ 1 .x1 +β̂ 2 (1,63)
=
eβ̂ 0 +β̂ 1 .x1 +β̂ 2 (1,06)
= e0,55β̂ 2
= e0,55(2,6561)
= 4, 3674
e seu respectivo IC(95%) será (1,5796 ; 13,0762). Como o valor 1 não pertence ao intervalo, conclui-se que
existe uma diferença significativa, ao nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um
aumento de 0,57 na Taxa de ar inspirada.
Generalizando, obtém-se a razão de chances de 14,2406 (2,2302 ; 90,9309), isto é, para um mesmo nı́vel
de Volume de ar inspirado (X1 ), se houver um aumento de uma unidade na Taxa de ar inspirado (X2 ), as
chances de ter vaso-constrição passageira na pele dos dedos aumenta aproximadamente 14 vezes.
Entretanto, uma consideração importante deve ser feita em relação ao ajuste dos dados, já que o modelo
de regressão logı́stica não se mostrou ajustado por meio do testes de GOF (p = 0, 02041) e de Hosmer e
Lemeshow (p = 0, 0224). Desta forma, uma função alternativa é sugerida, como por exemplo, a probito:
Φ−1 (θ(x)) = β 0 + β 1 X1 + β 2 X2 (12.27)
sendo Φ(.) denota a função de distribuição da normal padrão, N (0, 1). Por exemplo, para valores X̄1 e X̄2 ,
a probabilidade de ocorrência do evento será de 57%.
Para o modelo probito, os testes de GOF (p = 0, 052) e de Hosmer e Lemeshow (p = 0, 05) não rejeitam
a hipótese de bom ajuste dos dados.
Odds entre valores medianos e do 1o quartil calculadas anteriormente, serão 1,89 e 2,27, respectivamente,
assim como, as OR individuais para cada unidade acrescida na variável Volume e Taxa de ar inspirado,
respectivamente por, 8,35 e 4,39.
As Figuras 12.6, 12.7 e 12.8, apresentam agora as equações de retas ajustadas à função probito.
5
4
3
θ(x)
2
1
Y1 = −2.7073+2.1223*X1
0
1.0 1.5 2.0 2.5 3.0 3.5
Volume (X1)
Figura 12.6: Probito versus Volume de ar inspirado.

−0.85
−0.90
−0.95
θ(x)
−1.00
−1.05
Y2 = −2.3199+1.4801*X2
−1.10
0.85 0.90 0.95 1.00
Taxa (X2)
Figura 12.7: Probito versus Taxa de ar inspirado.

8
6
4
θ(x)
2
0
Y1
Y2
−2
−4 1.0 1.5 2.0 2.5 3.0 3.5
Volume (X1) e Taxa (X2)
Figura 12.8: Probito versus Volume e Taxa de ar inspirado simultâneos.
Exercı́cio 12.1. Um estudo teve com interesse investigar o processo de cura de um determinado tipo de
câncer. Um diagnóstico inicial era realizado para classificar o câncer do paciente em: ”complicado” ou ”não-
complicado”. Dois grupos foram formados de acordo com o tipo de tratamento a ser realizado: ”Padrão”
ou ”Novo”, então após um determinado tempo de observação, o paciente era classificado como: ”curado”
ou ”não-curado”. Proceda uma análise de regressão logı́stica completa para um modelo baseado em p =
P r(cura), e após preencher a tabela abaixo, conclua a respeito do novo tratamento (Adote um critério de
5% de significância para verificar a significância das variáveis ”Diagnóstico” e ”Tratamento”).
Tabela 12.3: Diagnóstico, tratamento e cura de um determinado tipo de câncer.

Diagnóstico Tratamento Curado Não-curado p
Complicado Padrão 78 38
Complicado Novo 101 11
Não-complicado Padrão 68 5
Não-complicado Novo 75 12
Exercı́cio 12.2. Pine et al. (1983) estudaram pacientes com ”sepis intra-abdominal”, um tipo de inflamação
no intestino. Várias variáveis foram analisadas (Banco de dados: pine1983.txt.) Proceda uma análise
de regressão logı́stica completa e apresente a probabilidade de um indivı́duo ao 60 anos cujo status em todas
variáveis independentes é de risco,
 vir a óbito.
X1 : Shock 


X2 : Desnutrição 1: ”presente” (risco)
X3 : Alcoolismo 
 0: ”ausente”

X4 : Infecção Intestinal
X5 : Idade (em anos) {
1: ”morto”
Y: Variável resposta ;
0: ”vivo”
Exercı́cio 12.3. Faça uma análise de Regressão Logı́stica completa para os dados referentes a recém-nascidos
no Serviço da Maternidade do HE da Faculdade de Medicina de Itajubá, ano de 1996. Levantamento sequen-
cial, perı́odo aproximado de dois meses. Total de 96 casos, classificados em 9 variáveis, onde o objetivo do
trabalho é verificar qual ou quais variáveis são fatores de risco para o desenvolvimento de anomalia (Banco
de dados: Pediat.xls). Observação: Para a análise Exclua as variáveis Sangue e RH. Apresente a proba-
bilidade de uma Menina desenvolver a anomalia, sendo que o seu tempo gestacional foi de 270 dias, nasceu
com 2.900 gramas, apresentou estatura de 50 cm, perı́metro cefálico de 32cm e perı́metro torácico de 35cm.
Exercı́cio 12.4. Um estudo teve por objetivo verificar a associação das variáveis de risco e tipologia sócio-
ocupacionais na região metropolitana de maringá-PR, 2010 (Banco de dados: mortalidadeinfantil.txt).
Faça uma análise de Regressão Logı́stica completa para os dados. Utilize o arquivo mortalidadeinfantil-
info.txt para procedimentos de análise (Observação: Faça a análise sem distinção de localidade-TSO).
Exercı́cio 12.5. Um trabalho cientı́fico teve como objetivo determinar os fatores de risco para o desen-
volvimento de uma Dislipidemia (Perfil Lipı́dico) em indivı́duos da demanda laboratorial não-hospitalar de
Maringá (PR). O arquivo no Banco de dados: DSPlogistica.xls, reúne as informações a respeito de al-
gumas variáveis a serem investigadas para tal. Faça uma análise de Regressão Logı́stica completa para os
dados.
Exercı́cio 12.6. Um estudo na residência médica da UEM no ano de 2006 teve por objetivo verificar qual(is)
fator(res) de risco estão associação à Depressão Pós-Parto (DPP) (Banco de dados: DeprePosParto.xls).
Faça uma análise de Regressão Logı́stica completa para os dados. Para tal utilize as informações contidas
na planilha (info) e/ou no arquivo DeprePosParto-info.txt. Apresente a probabilidade de uma mulher cujo
status em todas variáveis independentes de risco, vir a desenvolver a DPP.
Exercı́cio 12.7. Um estudo teve por objetivo verificar qual(is) fator(res) de risco estão associação à Ansi-
edade e à Depressão(Banco de dados: Psilogist.xls). Faça uma análise de Regressão Logı́stica completa
para os dados quanto a Ansiedade e em seguinda a Depressão. Para tal utilize as informações contidas no
arquivo Psilogist-info.txt. Apresente a probabilidade de um homem branco, com 40 anos, católico, casado,
analfabeto com 100 meses de diálise, vir a desenvolver uma Ansiedade e uma Depressão.
Referências Bibliográficas
[1] AGRESTI, A. An Introduction to Categorical Data Analysis. 2a Ed. NY: Wiley, 2007.
[2] ARANGO, H. G. Bioestatı́stica: Teórica e computacional. Guanabara Koogan S.A. 3a Ed. RJ, 2009.
[3] BUSSAB, W. O e MORETTIN, P. A. Estatı́stica básica. Ed. Saraiva, 8a Ed. SP, 2013.
[4] CALLEGARI-JACQUES, S. M. Bioestatı́stica: Princı́pios e Aplicações. Ed. Artmed. RS, 2003.

[5] CAMPOS, H. Estatı́stica Experimetal Não-Paramétrica. 4a Ed. USP/ESALQ, 1983.
[6] CARVAJAR, S. S. R. Elementos de Estatı́stica (com aplicações às ciências médicas e biológicas). Rio
de Janeiro: UFRJ, 1970.
[7] CASELLA, G.; BERGER, R. L. Inferência Estatı́stica. Cengage Learning: São Paulo. 2010.
[8] CASTELLANOS, R. S.; MERINO, A. P.. Psicoestadistica-Contrastes Paramétricos y no Paramétricos.

Ediciones Piramide S.A., Madrid, 1989.
[9] CENTENO, A. J. Curso de Estatı́stica aplicada à Biologia. Goiânia: Ed. Universidade Federal de Goiás,
1981.
[10] DIAZ, F, R; LOPES, F. J. B. Bioestatı́stica. 1a Ed. Thomson Learning, 2007.

[11] DOWNING, D.; CLARK, J. Estatı́stica aplicada. 2a Ed. Saraiva. SP, 2002.
[12] FLEISS, J.L. Statistical Methods for rates and proportions. 2a Ed. NY, John Wily and Sons, 1981.
[13] FLETCHER, R. H. e FLETCHER, S. W. Epidemiologia Clı́nica: Elementos Essenciais. 4a . Edição. São
Paulo, ARTMED. 2006.
[14] GAUVREAU, K.; PAGANO. Principios de Bioestatı́stica. 2a Ed. Thonson, 2004.
[15] GUEDES, M. L. S.; GUEDES, J. S. Bioestatı́stica - Para profissionais de saúde. 1a Ed. Ao livro técnico
S.A. RJ, 1988.
[16] MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatı́stica. 6a Ed. EDUSP, 2008.
[17] MARTINEZ, E.Z. Bioestatı́stica para os Cursos de Graduação da Área da Saúde. 1a Ed. 1a Ed. Blucher,
2015.
[18] MONTGOMERY, DOUGLAS. Design and analysis of experiments. 3a Ed. NY, John Wiley & Sons,
1991.
[19] MORETTIN, L. G. Estatı́stica Básica. São Paulo: Makron Books, 2000, vol. I e II.
[20] PAGANO, M.; GAUVREAU, K. Princı́pios de Bioestatı́stica. Ed. Thomson, 2a Edição, SP, 2004.
[21] PEREIRA, M. G.. Epidemiologia: Teoria e Prática. Ed. Guanabara & Koogan, 1995.
[22] SOARES, J. F.; BARTMAN, F. C. Métodos estatı́sticos em medicina e biologia. 14o Colóquio Brasileiro
de Matemática. IMPA/CNPq. RJ, 1983.
167
[23] SOARES, J. F.; SIQUEIRA, A.L. Introdução à estatı́stica médica. Ed. UFMG. 1999.
[24] SOKAL, R. R. Biometry: The Principles and Practice of Statistics in Biological Research. New York:
W.F. Freeman, 1995.
[25] SIEGEL, S. Estatı́stica não-paramétrica. 1a Ed. RJ, Editora McGraw Hill do Brasil Ltda, 1981.
[26] SIQUEIRA, A. L. e TIBÚRCIO, J. D. Estatı́stica na Área da Saúde: conceitos, metodologia, aplicações

e prática computacional. Ed. Coopmed, 2011.
[27] SOUNIS, E. Bioestatı́stica. Princı́pios fundamentais, metodologia, estatı́stica, aplicação à ciências

biológicas. 2a Ed. Revisada, McGraw-Hill, 1975.
[28] STEEL, R. G. D. Principles and Procedures of Statistics a Biometrical Approach. 2. Ed. New York: Mc
Graw-Hill, 1980.
[29] VIEIRA, S. Introdução à Bioestatı́stica. 5a Edição. Rio de Janeiro: Elsevier, 2016.

[30] VIEIRA, S. Bioestatı́stica. Tópicos Avançados. 3a Edição. Rio de Janeiro: Elsevier, 2010.
[31] WAYNE, W. D. Biostatistics. A foundation for analysis in the health sciences. 10a Ed. J&S. NY, 2014.
FORMULÁRIOS
Formulário I - Estatı́stica Descritiva 1
√
AT = xmax − xmin k= n k = 1 + 3, 22 log n e h = AT
k
Linf + Lsup Fi Fac
xi = fi = fac =
2 n n
∑n ∑k
xi xi Fi
h(Fi − Fi−1 )
x̄ = i=1 x̄ = i=1 Mo = li +
n n (Fi − Fi−1 ) + (Fi − Fi+1 )
n+1 xp + xp+1 n h(p − Fac−1 ) n
Md = xp ; p = 2 Md = ;p= Md = li + ;p=
2 2 Fi 2
h(p − Fac−1 ) kn
Sk = li + p= w : 1, 4, 10 ou 100
Fi w
x̄ − Mo (Q3 − Q1 ) √
Ap = k= s = s2
s  90 − P10()
2(P
)2 
∑n ∑
k
(xi − x̄)
2
( ) k xi 
1 ∑ 2 
s2 = i=1 s2 =  xi −
i=1
 -
n−1 n − 1 i=1 n 
 ( )2 
∑
k ∑
k
2
(xi − x̄) Fi ( ) k xi Fi 
i=1 1 ∑ 2 i=1  s
s2 = s2 =  x Fi −  cv = 100
n−1 n − 1 i=1 i n  x̄
Formulário II - Probabilidade e Distribuições Probabilı́sticas
P (A) = #A
#S P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A ∩ B)
P (Ac ) = 1 − P (A) P (A|B) =
∑ P (B)
E(X) = xi p(xi ) V ar(X) = E[(X − E(X))2 ] = E(X 2 ) − [E(X)]2
E(aX ± b) = aE(X) ± b V ar(aX ± b) = a2 V ar(X)
( ) (n) n!
p(X = x) = nx px q n−x x = x!(n − x)!
e−λ λx
p(X = x) =
x!
X −µ
Z=
σ
p(X = x) = λe−λx P (X > x) = e−λx
1 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
Formulário III - Inferência Paramétrica * Supondo X ∼ N (µ; σ)2

Tamanho de Amostra ( )2
[ ]
Z α2 so 2 so ∗ N n0 ∗
N s2o Z α2
p/ µ : n= onde e = Z 2 √ ;
α n = ou n = ( )2
e n N + (n0 − 1) (N − 1)e2 + s2o Z α2
[ ] [ ]
Z α2 2 Z α2 2 N n0
p/ p : n= p0 q0 ou n= ; n∗ =
e 2e N + (n0 − 1)
Formulário IV - Inferência - IC e TH | Supondo X ∼ N (µ; σ)
Intervalos de Confiança (IC) Testes de Hipóteses (TH)

σ x̄ − µ0
p/ µ : x̄ ± e; e = Z α2 √ {σ ! Zc = σ ∼ N (0, 1)
n √
n
s x̄ − µ0
x̄ ± e; e = Z α2 √ {σ ?e n = 30 Zc = s ∼ N (0, 1)
n √
{ n
s σ ? e n < 30 x̄ − µ0
x̄ ± e; e = t α √ tc = s ∼ tn−1
2 ,ν
n g.l : ν = n − 1 √
√ n
p̂q̂ X p̂ − p0
p/ p : p̂ ± Z α p̂ = Zc = √ ∼ N (0, 1)
2
n n pq
√ n
p/ σ 21 σ2 { 2 x̄1 − x̄2
(x̄1 − x̄2 ) ± Z α2 + 2 σ 1 ! e σ 22 ! Zc = √ ∼ N (0, 1)
µ1 − µ2 : n1 n2 σ 21 σ 22
+
n1 n2
√ {
s21 s2 σ 21 ? e σ 22 ? x̄1 − x̄2
(x̄1 − x̄2 ) ± Z α2 + 2 Zc = √ ∼ N (0, 1)
n1 n2 n1 + n2 ≥ 30
s21 s22
+
 2 n1 n2
√  σ 1 = σ 22 = σ 2 ?
1 1 x̄ − x̄2
(x̄1 − x̄2 ) ± t α2 ,ν sp + n1 + n2 < 30 tc = √1 ∼ tν
n1 n2  1 1
ν = n1 + n2 − 2 sp +
√ n1 n2
(n1 − 1)s21 + (n2 − 1)s22
sp =
n1 + n2 − 2
√ {
s21 s2 σ 21 ̸= σ 22 ? x̄1 − x̄2
(x̄1 − x̄2 ) ± t α2 ,ϕ + 2 tc = √ ∼ tϕ
n1 n2 n1 + n2 < 30
s21 s22
+
n1 n2
s21
(ϖ1 + ϖ2 ) 2 ϖ1 =
ϕ= onde, n1
ϖ21 ϖ22 s2
+ ϖ2 = 2
n1 − 1 n2 − 1 n2 √
p/ µ : sd d¯ n
d ± t α2 ,n−1 √
¯ n < 30 tc = ∼ tn−1
dados pareados n√ sd
p/ p̂1 q̂1 p̂2 q̂2 p̂1 − p̂2
(p̂1 − p̂2 ) ± Z α2 + ni pi > 5; i = 1, 2. Zc = √ ∼ N (0, 1)
p1 − p2 : n1 n2 p̂1 q̂1 p̂2 q̂2
+
n1 n2
Formulário IV - Análise em Tabelas de Contingência 3
∑k (O − E )2
i i ∑k (|O − E | − 0.5)2
i i
χ2 = ∼ χ2(l−1)(c−1) χ2Y ates = ∼ χ2(l−1)(c−1)
i=1 Ei i=1 Ei
onde Ei = (Total Linha)(Total

Total Geral
Coluna)
Para Tabelas 2X2

( )2
n (ad − bc)
2
n |ad − bc| − n2 [|b − c| − 1]
2
χ2 = ∼ χ2(1) 2
χY ates = ∼ χ2(1) χ2M cN = ∼ χ2(1)
m 1 m 2 n1 n2 m 1 m 2 n1 n2 b+c
Análise de Resı́duos
O−E Rp
Rp = √ ; Raj = √( )( ) ˜ N (0, 1)
E 1− TC
1− TL
TG TG
Medidas do Efeito
Pr(Doente|Exposto) a/(a+c)
RR = =
Pr(Doente|Não − exposto) b/(b+d)
Zα
1± √ 2
IC(RR; 1 − α%) : RR χ2c
Pr(Exposto|Doente)/[1 − Pr(Exposto|Doente)] ac
OR = =
Pr(Exposto|Não − Doente)/[1 − Pr(Exposto|Não − Doente)] bd
Zα
1± √ 2
IC(OR; 1 − α%) : OR χc 2
Coeficiente de Kappa (replicabilidade)
po − pe a+d n1 m1 + n2 m2
Kappa = ; po = ; pe =
1 − pe n n2
Kappa Concordância
k=0 nenhuma
k < 0, 4 leve
0, 4 ≤ k < 0, 8 moderada
0, 8 ≤ k < 1 forte
k=1 perfeita
Formulário V - Inferência Não-Paramétrica 4

Teste Mann-Whitney para 2 amostras independentes
M -W = Uc = min{U1 ; U2 } ∼ Uα;n1 ;n2

n < 25 ni (ni + 1)
onde Ui = n1 n2 + − Ti
2
nmin (n1 + n2 + 1)
min{T1 ; T2 } −
n ≥ 25 Zc = √ 2 ∼ N (0, 1)
n1 n2 (n1 +n2 +1)
12
Teste Wilcoxon para 2 amostras pareadas
n < 20 Wc = min{ T(−) ; T(+) } ∼ Wα;n

n(n + 1)
Wc −
n ≥ 20 Zc = √ 4 ∼ N (0, 1)
n(n + 1)(2n + 1)
24
Teste Kruskal-Wallis para k amostras independentes
12 ∑k T2
HK−W = i
− 3(N + 1) tal que H ∼ χ2(k−1)
N (N + 1) i=1 ni
Teste Friedman para k amostras pareadas
12 ∑k
HF r = T 2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1 i
Teste Cochran para k amostras pareadas (Resposta dicotômica)
∑
k
2
k(k − 1) (Ti ) − (k − 1)N 2
i=1
Q= ∑
n ∼ χ2k−1
2
kN − (Sj )
j=1

Apostila Bioestatistica

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila Bioestatistica

Enviado por

Direitos autorais:

Formatos disponíveis

Fundação Universidade Estadual de Maringá - UEM

Centro de Ciências Exatas - CCE

Prof. Dr. Robson Marcelo Rossi

7 Análise em Tabelas 2x2 e LxC 80

8 Comparações Entre Grupos 92

10 Testes Diagnósticos 122

11 Análise de Regressão 140

12 Regressão Logı́stica 148

Referências Bibliográficas 167

1.3 Os Conceitos da Bioestatı́stica

Figura 1.1: Processo Cientı́ﬁco na Análise Estatı́stica.

2.2 O Raciocı́nio Indutivo da Biometria

2.3 Delineamentos Experimentais

2.3.1 Etapa de um levantamento estatı́stico

3. O quê?...(refere-se a pessoas, coisas ou fatos estudados)

4. Onde?...(refere-se ao local e ambiente)

6. Como?...(relativa aos métodos)

1. Quem? GOHAM et al.

(a) conhecer a distribuição do grau de instrução dos portadores de doenças cardı́acas.

(b) Conhecer a idade e o peso médio dos portadores de doenças cardı́acas.

(c) Conhecer os hábitos dos portadores de doenças cardı́acas.

Figura 2.1: Esquema 1.

Figura 2.2: Esquema 2.

2.4 Aspectos Estatı́sticos dos Estudos Etiológicos

2.4.1 Estudo de Caso-Controle

Exemplo 2.5. Fatores de risco em câncer de mama.

MENSURAÇÃO FORMAÇÃO DOS GRUPOS

Figura 2.3: Esquema de Estudo Caso-Controle.

Vantagens do Estudo de Caso-Controle

• Baixo custo relativo;

• Alto potencial analı́tico;

Desvantagens do Estudo de Caso-Controle

• Incapaz de estimar risco (reduzido poder descritivo);

2.4.2 Estudo de Coorte

Seleção das Coortes

Exemplo 2.7. Personalidade e desenvolvimento de doença coronariana.

a, b, c, d : os quatro possíveis resultados

Figura 2.4: Esquema de Estudo Coorte.

Vantagens do Estudo de Coorte

• Produz medidas diretas de risco;

• Alto poder analı́tico;

Desvantagens do Estudo de Coorte

2.4.3 Ensaios Clı́nicos Aleatorizados

Exemplo 2.8. Tamoxifeno e câncer de mama.

Figura 2.5: Esquema de um Ensaio Clı́nico Aleatorizado.

2.4.4 Estudos Descritivos

Exemplos de temas de estudos descritivos

• A incidência de infecção chagásica em habitantes rurais;

• A prevalência da hepatite B entre os voluntários à doação de sangue;

• As caracterı́sticas demográﬁcas e socioeconômicas dos pacientes que sofrem de artrite reumatóide ou

• As principais causas de óbito da população residente em um dado municı́pio;

• Os padrões de crescimento e desenvolvimento de crianças normais ou daquelas acometidas por uma

• A variação regional na utilização de serviços de saúde.

Vantagens do Estudo de Casos

• Em geral, o estudo de caso é relativamente fácil de ser realizado e de baixo custo.

• O estudo de casos constitui-se em um verdadeiro inventário do que acontece genericamente, à luz da

Desvantagens do Estudo de Casos

Vantagens do Estudo Seccional

• Simplicidade e baixo custo;

• Não há necessidade de seguimento das pessoas;

Desvantagens do Estudo Seccional

• Vulnerabilidade a biases ou vı́cios (especialmente de seleção);

EXPOSTOS EXPOSTOS NÃO-EXPOSTOS NÃO-EXPOSTOS