Escolar Documentos
Profissional Documentos
Cultura Documentos
Bioestatı́stica
1 Definições e Conceitos 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 BioEstatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Os Conceitos da Bioestatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Experimentação Biométrica 7
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 O Raciocı́nio Indutivo da Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Delineamentos Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.1 Etapa de um levantamento estatı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.1 Estudo de Caso-Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Estudo de Coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.3 Ensaios Clı́nicos Aleatorizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.4 Estudos Descritivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3 Estatı́stica Descritiva 20
3.1 Organização de Dados Estatı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Normas para a Apresentação Tabular de Dados . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Distribuição de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.1 Medidas de Tendência Central ou de Posição . . . . . . . . . . . . . . . . . . . . . . . 31
3.4.2 Medida de Variabilidade ou de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4.3 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4 Noções de Probabilidade 43
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Espaço Amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.3 Definição Axiomática de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Propriedades Fundamentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.6 Independência Estatı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7 Variável Aleatória Discreta e Contı́nua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.1 Esperança Matemática de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . 49
4.7.2 Variabilidade de uma Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5 Distribuições de Probabilidade 51
5.1 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.3 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.4 Distribuição Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
ii
6 Inferência Estatı́stica 55
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Noções de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.2.1 Plano de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.2.2 Amostragem Aleatória Simples (AAS) . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.2.3 Amostragem Aleatória Simples Sistemática (AASist) . . . . . . . . . . . . . . . . . . . 58
6.2.4 Amostragem Aleatória por Conglomerados (AAC) . . . . . . . . . . . . . . . . . . . . 58
6.2.5 Amostragem Aleatória Estratificada (AAE) . . . . . . . . . . . . . . . . . . . . . . . . 59
6.3 Distribuição Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3.1 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3.2 Distribuição Amostral da Diferença de Médias . . . . . . . . . . . . . . . . . . . . . . 64
6.3.3 Distribuição Amostral da Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.4 Intervalo de Confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4.1 Intervalo de Confiança para Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.4.2 Intervalo de Confiança para Diferença de Médias . . . . . . . . . . . . . . . . . . . . . 67
6.4.3 Intervalo de Confiança para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.5 Tamanho da Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5.1 Método Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5.2 Método Inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.6 Testes de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.6.1 Construção de um Teste de Hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.6.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.6.3 Teste de Hipótese para Média . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.6.4 Teste de Hipótese para Proporção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Formulários 169
Capı́tulo 1
Definições e Conceitos
1.1 Introdução
O objetivo deste capı́tulo é ilustrar o papel que conceitos e técnicas estatı́sticas têm na formação do
especialista na área biométrica, na sua prática profissional e de modo especial no avanço do conhecimento
nesta área especı́fica.
Este objetivo será alcançado principalmente através da apresentação e discussão dos resultados de es-
tudos relevantes. Através destes exemplos, argumenta-se que conceitos estatı́sticos têm importante papel a
desempenhar, tanto no estudo da saúde de populações, como nos tratamentos individuais.
1.2 BioEstatı́stica
A má utilização de dados nas áreas das ciências, com interpretações errôneas ou mal intencionadas, tem
produzido um grande ceticismo em relação à estatı́stica. Podemos encontrar muitos professores, clı́nicos ou
mesmo profissionais de ciências básicas, que acham que “bom senso” é suficiente para tratar desses dados,
que qualquer coisa que exija prova estatı́stica não pode ter valor prático ou que procurarão um matemático
se tiverem algum problema estatı́stico em seu trabalho.
É importante compreender, no entanto, que cada vez que se toma a média de duas leituras de pipeta,
por exemplo, ou o número médio de dias de internação no hospital de pacientes com determinada doença,
se está usando um método estatı́stico. Do mesmo modo, usamos métodos estatı́sticos para concluir que a
pressão arterial do paciente está normal ou que um tratamento cirúrgico é melhor que outro.
Convencionou-ser chamar de Bioestatı́stica o conjunto de conceitos e métodos cientı́ficos usados no trata-
mento da variabilidade nas ciências da saúde, biológicas e farmacêuticas. A Bioestatı́stica fornece métodos
para se tomar decisões ótimas na presença de incerteza, estabelecendo faixas de confiança para a eficácia dos
tratamentos e verificando a influência de fatores de risco no aparecimento de doenças.
A ênfase crescente do papel dos métodos quantitativos torna imperativo que o profissional tenha algum
conhecimento de estatı́stica.
O estudante aprende na escola o melhor método de diagnose e terapêutica; depois de formado dependerá
necessariamente de trabalhos apresentados em reuniões, jornais e revistas médicas, para aprender novos
métodos de terapia, assim como os progressos em diagnose e técnica cirúrgica. Portanto, deverá estar apto
a avaliar por si próprio os resultados de outros pesquisadores, deverá decidir quando uma nova técnica
ou método pode substituir os antigos. Deverá estar apto a responder à pergunta da mãe que o consulta
sobre a vacina mais recente e, com a mesma segurança, aconselhá-la em relação à vacina antipólio ou anti-
sarampo. Deverá estar apto a dar à famı́lia do paciente segurança quanto ao diagnóstico, o que pode depender
de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais, como também de seu
conhecimento sobre a relação da idade, sexo e outras condições do paciente a uma determinada doença. Os
novos conhecimentos virão através do trabalho de pesquisa realizado por ele próprio ou por outros. Deve,
portanto, ser capaz de selecionar, da massa de informações, aquelas que forem válidas e que resistirem a
testes cientı́ficos rı́gidos. Deve desenvolver um ceticismo sadio em relação a tudo que lê.
Uma noção básica em planejamentos experimentais referentes à pesquisa médica, é o reconhecimento de
que os indivı́duos diferem não apenas uns dos outros, mas também em relação a si próprios, de dia para
1
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 2
dia ou mesmo de hora para hora. Uma certa quantidade de variação é normal, mas a questão que desafia o
médico é determinar quando uma variação especı́fica se torna patológica (referente à doença). Para isso, o
estudante deve aprender como medir a variação em indivı́duos normais e definir qual é o limite de variação
normal. Deve aprender que há algum erro aleatório presente em cada medida ou contagem feita. É altamente
improvável que duas contagens sucessivas de glóbulos, feitas na mesma amostra de sangue, sejam idênticas.
Quando, porém, uma diferença se torna maior que o erro de mensuração? Para tratar seu paciente
do melhor modo possı́vel, o médico deve saber responder à questões como essa. Para cada medida ou
determinação fornecida pelo laboratório, o médico deve conhecer a variação que é parte do próprio método,
para saber quando uma dada variação representa uma mudança real no paciente.
Sempre que novos métodos de terapia são introduzidos, é necessário saber se são realmente superiores,
isto é, mais eficientes aos velhos métodos. Será necessário fazer-se a avaliação crı́tica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o fator
em prova foi o único fator de diferença entre o grupo experimental e o grupo controle, se a diferença entre os
resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribuı́da ao acaso. Apenas depois
da avaliação, através de técnicas estatı́sticas adequadas, da fidedignidade dos resultados, comparabilidade
dos grupos experiência e controle e, significância da diferença encontrada é que podemos tirar as conclusões
relativas ao novo método.
O número de falhas encontradas em publicações médicas enfatiza a necessidade de uma avaliação crı́tica
da literatura. Para ajudar o estudante a desenvolver tal atitude são necessários certos conceitos estatı́sticos
básicos e uma certa familiaridade com a terminologia mais usada.
Métodos estatı́sticos são essenciais no estudo de situações em que as variáveis de interesse estão sujeitas,
inerentemente, a flutuações aleatórias. Este é o caso da área da saúde. Mesmo tomando-se um grupo
de pacientes homogêneos, observa-se grande variabilidade, por exemplo, no tempo de sobrevida após um
tratamento adequado. Dosagens de caracterı́sticas hematológicas flutuam não só entre indivı́duos, como
também no mesmo indivı́duo em ocasiões diferentes. Na realidade, há variações entre diferentes pacientes
para qualquer variável de interesse clı́nico. Portanto, para se estudar problemas clı́nicos, é necessária uma
metodologia capaz de tratar a variabilidade de forma adequada.
Deve-se notar, entretanto, que ao tratar um paciente, o médico se vale da experiência de eventos ante-
riores, vivenciada pessoalmente ou transmitida por outros através de livros e artigos. Assim, a Estatı́stica
pode ser vista como ferramenta de organização e validação do conhecimento médico.
Nas áreas da saúde e biológica coletam-se dados de pessoas, de animais experimentais e de fenômenos
fı́sicos e quı́micos. Interessam aos pesquisadores dessas áreas dados sobre mortalidade infantil, eficiência de
medicamentos, incidência de doenças, causas de morte etc. Os dados referem-se a variáveis, classificadas
como qualitativas, ordinais e quantitativas.
O dado qualitativo está fortemente presente nas ciências da saúde. Caracterı́sticas de pessoas, raça,
doenças, etc, são frequentemente medidas como variáveis categóricas. No entanto, mercê de sua tradição
escolástica, as ciências da saúde ainda mostram preferência pelas medidas contı́nuas de alta precisão: medir
em miligramas, milı́metros etc. Engajado no conhecimento do biólogo, o cientista da saúde tende a isentar-se
de reflexão sobre a importância das estratégias de mensuração e análise providas por outras ciências, como
a estatı́stica.
E se houver dois grupos de pessoas? Para o grupo de voluntário dá-se o remédio a ser testado; para
o outro grupo, dá-se um remédio ”de mentirinha”, chamado placebo, mas não se conta a verdade para
ninguém. Será que há diferença nos resultados de um grupo para outro? Mas se o remédio foi testado só
com um grupo de pessoas, em geral voluntários, como é que depois pode-se afirmar que este remédio vai ser
bom para todo mundo? É certeza absoluta?
A estatı́stica pode ser utilizada simplesmente para descrever conjuntos de dados, mostrando sua distri-
buição, média, dispersões, etc. Mas, pode ir além, pode estar presente nas diversas etapas de uma pesquisa,
desde o seu planejamento, até na interpretação de seus resultados, podendo ainda, influenciar na condução
do processo da pesquisa.
Definição: Estatı́stica é um conjunto de conceitos e métodos cientı́ficos para a coleta, a organização, a
descrição, a análise e a interpretação de dados experimentais, que permitem conclusões válidas e tomadas
de decisões razoáveis.
Classificação: Usualmente, a estatı́stica é dividida em três grandes áreas que atuam em conjunto:
Planejamentos de Experimentos e Amostragem, Estatı́stica Descritiva e, Estatı́stica Inferencial.
Amostragem e Planejamento de Experimentos: É a parte que tem por objetivo planejar a pesquisa e se
preocupa com o mecanismo da coleta de dados.
Estatı́stica Descritiva: É a parte que tem por objetivo organizar, apresentar e sintetizar dados observados
de determinada população, sem pretenções de tirar conclusões de caráter extensivo.
Estatı́stica Inferencial ou Indutiva: É a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi
retirada. A estatı́stica inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades.
É, também definida como um conjunto de métodos para a tomada de decisões.
A Estatı́stica está presente em diversas áreas e em diversas abordagens. Podemos citar alguns exemplos
de suas aplicações:
1. Eleições: Anúncio prévio, em termos percentuais, de que o candidato A é o provável vencedor. (A
previsão pode ser feita após a contagem de 2% dos votos);
2. Marketing: Ajudar a decidir que tipo de modelo de carro deve ser lançado no mercado; ou perfume,
bolacha, sorvete, roupas, etc. Onde deve ser lançado; Avaliação de campanhas publicitárias, etc;
3. Indústria: Teste de lâmpadas ”flash” para máquinas fotográficas. O fabricante deve saber com ante-
cedência se o lote fabricado pode ser colocado no mercado ou não (Ele pode estar sujeito a riscos !
O Recall é um exemplo, onde ocorre a retirada ou troca de produtos devido a uma falha em algum
estágio de fabricação não detectado pelo controle de qualidade);
4. Meteorologia: Informa que a “chance” de chuva para hoje é de 30% (utilização de métodos estatı́sticos
de previsão);
5. Economia: Decisão na compra ou venda de ações – “Risco”; Desenvolver um produto bancário que dê
mais lucro para o banco; Prever a arrecadação de impostos municipais, etc;
6. Instituições bancárias/crédito: Análise de crédito; Desenvolvimento de modelos matemáticos para
seguro de Vida e/ou de automóveis; Mineração de dados e busca de potenciais clientes, etc;
7. IBGE/ı́ndices: Censo; Taxa de desemprego; Inflação; Custo de vida; Valor do salário mı́nimo, cesta
básica, ı́ndices de preços-INPC; Taxa de mortalidade/Natalidade; Índices de analfabetismo, desenvol-
vimento de modelos matemáticos para prever se uma população vai aumentar ou diminuir; fornecer
informações que ajudam no planejamento urbano;
8. Farmácia/Medicina/saúde pública: Analisar a entrada de um novo medicamento, verificando a sua
eficácia; Ajudando a estabelecer nı́veis e padrões para testes clı́nicos; planejar e realizar experimentos
com grupos de controle, para avaliação de tratamentos; desenvolvimento de estudos sobre a distribuição
e incidência de doenças; Analisar o comportamento de epidemias, doenças, cáries, seus tratamentos
e controles, desnutrição; Estabelecer padrões/curvas que servirão como parâmetros de comparação
(idade vs altura, por exemplo);
9. Pesquisas biológicas: Estudo sobre hábitos migratórios de certo animal; Estimação do tamanho popu-
lacional de certas espécies;
10. Experimentação agrı́cola: Estudos de uma nova variedade de semente (modificação genética) ou de
fertilizantes;
11. Telecomunicações: A utilização da Internet gera informações preciosas de clientes; Controle de tráfego
telefônico, chamadas e consumo, forçam a utilização de modelos estatı́sticos complexos; Analisar de-
sempenho de diversos programas de televisão, rádio, jornais, revistas, etc;
12. Esportes: Comparar o aproveitamento dos atletas, acompanhar o desempenho progressivo, etc;
13. Artes: Analisar estilos literários, de pintura, escultura; Atribuição de obra ao autor; Lexologia, etc;
14. Experimentação zootécnica: Estudo do desenvolvimento de um animal e análise de fatores que in-
fluenciam neste desenvolvimento tais como, alimentação, cativeiro e outros; Melhoramento genético;
Pesquisas com vacinas animais entre outros;
15. Universidades e Instituições de Pesquisas: O docente/pesquisador desenvolve novas metodologias de
análise estatı́stica para mais variados problemas práticos e teóricos; Assessoria em pesquisas de outras
áreas, dando suporte tecnocientı́fico para tomada de decisões dentro da variabilidade instrı́nseca de
cada problema auxiliando desde o planejamento até a publicação de resultados.
A revista SUPER INTERESSANTE, da Editora Abril, trouxe na edição 271 de novembro de 2009
(pg. 84) a reportagem 6 razões para Acreditar que Estatı́stica é a Profissão do Futuro,
classificando-a como a ”profissão dos sonhos”, com base na declaração do economista Chefe da
Google, Dr. Hal Varian, de que a estatı́stica será a profissão de destaque dos próximos 10
anos.
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 5
A amostragem é naturalmente usada na vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, pode-se provar (observar) uma pequena porção deste alimento. Desta forma, está
se fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito
de avaliar (inferir) sobre a qualidade de tempero de todo o alimento.
Nas pesquisas cientı́ficas em que se quer conhecer algumas caracterı́sticas de uma população, também é
muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra,
obter valores aproximados, ou estimativas, para as caracterı́sticas populacionais de interesse. Este tipo de
pesquisa é usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob
uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar
caracterı́sticas de toda a população.
A população pode ser formada por pessoas da famı́lia, indivı́duos de uma certa espécie, estabelecimentos
industriais, ou qualquer outro tipo de elementos, cujas variáveis que se pretende estudar sejam passı́veis de
serem mensuradas.
Os elementos de uma população diferem entre si com respeito a fatores tais como: sexo, idade, medidas
fı́sicas, cor, susceptibilidade a doença, agressividade, etc. Desta forma o padrão de comportamento no qual
o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por estas
razões, muitos trabalhos nas ciências em geral tendem a ser de natureza comparativa, procurando lidar com
as variações inerentes.
População
É qualquer conjunto de elementos, tendo pelo menos uma variável em comum (Pode ser finita ou infinita).
Censo
Pesquisas utilizando todos os elementos da população.
Obs. Desvantagem quando a população é muito grande Ex.: A população brasileira estimada em 2011:
196.655.014 (Fonte: IBGE - http://www.ibge.gov.br/paisesat).
Amostra
É qualquer subconjunto da população. Pesquisas utilizando amostras da população denominam-se pes-
quisas por amostragem.
Parâmetros
São certas caracterı́sticas populacionais especı́ficas que se deseja descrever.
Estimativas dos Parâmetros ou Estatı́stica
São os valores calculados a partir dos dados da amostra, com o objetivo de avaliar parâmetros desconhe-
cidos, por exemplo, média amostral.
Unidade de Amostragem
É a unidade a ser selecionada para se chegar aos elementos da população. Pode ser os próprios elementos
da população, ou, outras unidades fáceis de serem selecionadas e que, de alguma forma, estejam associadas
aos elementos da população.
Variáveis
São as caracterı́sticas medidas. As variáveis apresentam variabilidade dentro da população. Podem ser
qualitativas ou quantitativas.
Variáveis Qualitativas
Quando seus valores forem expressos por atributos (não-numéricos).
• Nominal quando tem nome (ex.: Cor dos olhos, sexo, raça, consumo de álcool (sim, não), gostar de
estudar ... etc).
• Ordinal quando tem ordem (ex.: classe social, grau de instrução, consumo de álcool (pouco, médio,
muito) ... etc).
Variáveis Quantitativas
Quando seus valores podem ser descritos numericamente.
• Discreta quando seus valores resultam de contagem (ex.: número de filhos, número de reprovações,
número de copos de álcool consumidos... etc).
• Contı́nua quando seus valores resultam de medições e podem assumir qualquer valor em um intervalo
da reta (ex.: estatura, nota na prova, imc, quantidade de álcool consumido ... etc)
1.3 Os Conceitos da Bioestatı́stica ROSSI, R. M. 6
Exemplo 1.1. Com o objetivo de levantar conhecimento sobre algumas caracterı́sticas de homens com
doenças cardı́acas de uma clı́nica especializada de Maringá, no Paraná, decidiu-se pesquisar os pacientes
com idade entre 40 e 70 anos. As caracterı́sticas de interesse eram:
1 – Nı́vel de instrução;
2 – Peso;
3 – Altura;
4 – Idade;
5 – Tabagismo;
6 – Atividade fı́sica;
7 – Taxa de glicose;
8 – Taxa de colesterol sérico;
9 – Pressão sanguı́nea diastólica/sistólica;
10 – Uso de medicamentos de controle.
Capı́tulo 2
Experimentação Biométrica
2.1 Introdução
Na medicina como em outros campos da ciência aplicada, o efeito geral da estatı́stica é tornar um
observador mais crı́tico e mais consciente quando, por falta de informação segura, ele tem de agir com base
em impressões ou opinião. Esta é a atitude cientı́fica, e o melhor modo de começar a adquirı́-la é procurar
evidências, e “provar”. Alguns princı́pios dessa procura de evidências serão estudadas neste capı́tulo.
7
2.3 Delineamentos Experimentais ROSSI, R. M. 8
da mesma raça, sexo e idade, entre diferentes amostras da mesma substância quı́mica “pura”. Todas essa
diferenças são coletivamente chamadas variação e a estatı́stica pode ser descrita como ciência de tratar a
variação.
Os seres humanos são tão infinitamente variáveis interna quanto o são externamente, mas algumas
matérias básicas do curso médico, como a Anatomia, parecem não reconhecer tal fato, deixando de des-
tacar esse profundo sentido da variação humana. A pseudoprecisão anatômica, criando um conceito artificial
do corpo humano no inı́cio da carreira do estudante, parece que largamente partilham essa responsabilidade;
e mesmo se todos os professores enfatizassem a importância da variação, não iria ajudar muito, a não ser
que o estudante adquirisse prática em enfrentar problemas que surgem da variação - especialmente, prática
na procura de evidências e uma atitude crı́tica em face dos assuntos que lê, ouve ou discute.
Mainland, D. (1952) em Elementary medical statistics - The principles of quantitative medicine, sugere
nove questões que constituem um roteiro valioso para desenvolvimento dessa atitude:
1. Quem?...(relativa ao pesquisador)
2. Para quê?...(relativa ao objetivo da pesquisa)
8. Quantos?...(relativa à enumeração)
9. Por quê?...(referente à interpretação causal)
Tomadas as devidas precauções, alguns aspectos estatı́sticos deverão ser analisados e o tipo de estudo
adequado deverá ser abordado.
Exemplo 2.1. Considere a seguinte hipótese: ”Associação entre incidência de luz solar e câncer de
mama”. Comparações regionais, na antiga União soviética, mostraram correlação negativa entre incidência
de luz solar e de câncer do seio: em locais de baixa luminosidade solar, foi encontrada alta incidência deste
tipo de neoplasia, e vice-versa. Em muitos paı́ses, semelhante associação também foi detectada. A evidência
sugere, segundo os autores, que a vitamina D possa ter papel de relevo na redução do risco de câncer de
mama, e estudos adicionais devem ser feitos para esclarecer a matéria. (GOHAM et al, 1990).
Os principais delineamentos experimentais para a realização destas pesquisas serão:
4. Onde? Regiões diferentes que apresentam também diferentes incidências de luminosidade na antiga
União Soviética.
5. Quando? 1990.
2.3 Delineamentos Experimentais ROSSI, R. M. 9
6. Como? (Metodologia): considerando que o câncer de mama é o que mais mata nas mulheres, porém
em relação à população de mulheres é uma doença pouco prevalente, como, por exemplo, Transtorno
Pré-Menstrual. Assim, um estudo de caso-controle em mulheres com câncer de mama já diagnosticado
exposto à luminosidade solar por um perı́odo de tempo predeterminado devendo ser razoavelmente
grande, mas não saberia dizer quanto sem revisão bibliográfica. Na entrevista retrospectiva perguntaria
as mulheres há quanto tempo residiam naquela região, e se tivessem dentro do tempo predeterminado
entrariam no estudo. Faria também um grupo controle de mulheres daquela região para comparação dos
dados. Repetindo este mesmo estudo em mulheres de diferentes regiões com diferentes luminosidades, e
comparando-se as taxas de fatores de riscos, poder-se-ia chegar a conclusão de associação e em seguida
calcular o Odds Ratio, isto é, a razão de chances.
7. Quanto? As medidas seriam o número de mulheres diagnosticadas com câncer de mama comparadas
a um número semelhantes de mulheres sem o câncer (controles) separadas após serem examinadas por
médicos. Já a luminosidade colheria as informações com as centrais de meteriológicas locais ou algum
centro de referência deste assunto para o estudo.
8. Quantos? A amostra tentaria ser a maior possı́vel para melhorar a confiabilidade dos resultados, já que
a doença é pouco prevalente. Procuraria os centros de saúdes locais (hospitais, clı́nicas especializadas,
etc) das respectivas regiões a serem estudadas. Se o número de centros for muito grande e for muito
difı́cil abordá-los, sortearia os centros para amostragem.
9. Por quê? Alguns cuidados têm que serem relevados como o vı́cio da seleção, de informação e con-
fundimento. Por exemplo, a ingestão de alimentos ricos em precursores e da própria vitamina D bem
como uso de suplementos alimentares com vitamina D (pı́lulas), poderia influenciar os resultados dos
estudos.
Observação: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa.
Avaliação de informações existentes. Inicialmente, deve-se realizar um levantamento bibliográfico sobre
o assunto para obter subsı́dios que podem representar valiosa colaboração para o estudo e, também, serem
aproveitados nas discussões posteriores.
B. Formulação de hipóteses. Com exceção das pesquisas meramente descritivas, todas as pesquisas
estatı́sticas comportam a formulação de hipóteses. Com base nos dados observados, a hipótese será
rejeitada ou não.
C. Verificação das hipóteses. A verificação das hipóteses será realizada no decorrer da pesquisa.
D. Delineamento da pesquisa. Compreende o estudo (planejamento) detalhado da coleta de dados, da
realização do trabalho e da análise dos dados.
Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por
outros indivı́duos.
Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observação direta, o
questionário ou interrogatório e a entrevista.
Observação: é a observação direta dos fenômenos em laboratórios ou na natureza.
Questionário: é uma seqüência de perguntas previamente preparadas. O questionário é aplicado por
meio de entrevista ou remetido pelo correio. Os valores observados podem ser complementados por ob-
servação.
Execução da pesquisa. Coleta dos dados e realização da análise estatı́stica.
Análise e apresentação dos resultados. Os dados coletados devem ser apresentados na forma de:
gráficos e/ou de tabelas. A análise dos dados deve ser realizada pelo pesquisador, com a ajuda de um
estatı́stico, aplicando os recursos estatı́sticos necessários para refutar ou não as hipóteses previamente for-
muladas.
Exemplo 2.2. Objetivo geral: conhecer o perfil dos homens portadores de doenças cardı́acas em Honolulu,
Havaı́. Para dar seqüência a esta pesquisa, é preciso especificar melhor o que se quer conhecer da população
de portadores de doenças cardı́acas, ou seja, os objetivos especı́ficos. Exemplos de alguns desses objetivos.
Exemplo 2.3. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das in-
formações contidas em uma amostra dos prontuários dos pacientes. Dados observados: resultados de diversos
atributos e medidas relativas aos pacientes selecionados para participarem da amostra. Esquematicamente:
População: Todos os
portadores de
doenças cardíacas de
Honolulu.
Levantamento Plano de
de dados. amostragem.
Amostra:
Parte dos
portadores
de doenças
cardíacas de
Honolulu.
Dados
observados.
Exemplo 2.4. Objetivo geral: Comparar a eficiência de dois métodos para detectar o bacilo causador de
tuberculose. Em outras palavras, quer-se avaliar se os meios utilizados são equivalentes ou se um é mais
eficiente que o outro. Delineamento da pesquisa: são formados dois grupos de pacientes com tuberculose e
amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). Dados observados: a detecção
ou não do bacilo foi registrada para cada amostra, resultando em dois conjuntos, relativos a cada método.
Esquematicamente:
Meio A. Meio B.
Grupo 1 de Grupo 1 de
pacientes. pacientes.
Amostra 1 de Amostra 2 de
respostas respostas
Sim ou Não. Sim ou Não.
Este é um delineamento de pesquisa experimental, onde o pesquisador exerce controle sobre o método
utilizado.
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 11
introduzido pelos pesquisadores que, já desconfiando da associação a ser constatada, são mais cuidadosos ao
levantar a história clı́nica dos casos que dos controles. Dizemos que houve Vı́cio de Confundimento se a
associação observada é produto não do fator considerado mas de outros fatores não controlados no estudo.
O grupo controle é usualmente constituı́do de pacientes de hospitais, onde estão sendo tratados os pa-
cientes do grupo de casos. Deve-se escolher para o grupo controle pacientes de uma grande variedade de
doenças. Isto protege os resultados de uma forma de vı́cio da seleção; o estudo não detecta uma associação
porque a doença dos pacientes-controle e a doença sendo estudada estão ambas associadas com o fator de
risco. Quando existe facilidade na coleta de dados o número de pacientes do grupo controle pode ser até 4
vezes maior que o número de pacientes do grupo de casos. O método de seleção dos indivı́duos do grupo
controle é quase que inteiramente dependente das circunstâncias especı́ficas do estudo. Aqui também é fun-
damental o conhecimento da literatura médica da área, já que é usual apresentar-se uma descrição detalhada
dos controles utilizados.
a
EXPOSTOS
DOENTES
(GRUPOS
DE
b CASOS)
NÃO-EXPOSTOS
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
AMOSTRA
ANÁLISE DE
DE CASOS
DADOS POPULAÇÃO
DE CASOS
E DE AMOSTRA
CONTROLES DE
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
xxxxxxxxxx
c CONTROLES
EXPOSTOS
NÃO-DOENTES
(GRUPO
DE
CONTROLES)
d NÃO-EXPOSTOS
• Complexidade analı́tica.
O clássico estudo de Doll & Hill (1964) sobre associação entre câncer no pulmão e fumo ilustra a escolha
da coorte pelo fato de o grupo possuir caracterı́sticas que facilitam a obtenção dos dados sobre a exposição
ao fator e o seguimento dos pacientes. Foram acompanhados médicos da Inglaterra desde o fim dos anos
20, um grupo fácil de contactar e no qual todas as mortes são rotineiramente bem documentadas. Estas
pesquisas iniciaram-se devido ao grande aumento da mortalidade causada por este câncer.
No primeiro estudo, publicado em 1950, compararam-se dois grupos de pacientes. O primeiro, constituı́do
de todos os casos de câncer de pulmão de um conjunto de hospitais londrinos. Assistentes sociais, especi-
almente treinadas para o estudo, entrevistaram todos os pacientes internados com diagnóstico de câncer de
pulmão, levantando sua história clı́nica e seus hábitos tabagistas. O segundo grupo, chamado de controle,
foi constituı́do por pacientes dos mesmos hospitais, sem diagnóstico de câncer, na mesma faixa etária, do
mesmo sexo e da mesma região de residência que os casos anteriores. A Tabela 2.1 mostra os resultados
obtidos. A associação é clara e forte.
Tabela 2.1: Número de fumantes e não fumantes entre pacientes do sexo masculino com diagnóstico de
câncer pulmonar e controles.
Grupo Fumantes Não-Fumantes Total
Câncer pulmonar 647 2 650
Controle 622 27 649
Total 1269 29 1299
A forma de organização deste estudo é chamada de Estudo Caso-Controle. À época, esta metodologia
era muito criticada, pois, com facilidade, podia produzir associações espúrias. Por isso, a evidência, embora
clara e forte, não foi convincente o suficiente.
Assim, os mesmos autores iniciaram um segundo estudo, cuja caracterı́stica básica é o fato de que o
acompanhamento dos pacientes foi prospectivo. Este tipo de planejamento é chamado de Estudo de Coorte.
Em outubro de 1951, os pesquisadores enviaram um questionário simples a todos os médicos da Inglaterra,
aproximadamente 60.000 indivı́duos. O questionário perguntava se o respondente já havia fumado ou não.
Em caso afirmativo, pedia informações sobre o que e quanto. Mais de dois terços dos médicos responderam
com detalhe suficiente para que seus dados pudessem ser incluı́dos no estudo.
As respostas possibilitaram aos pesquisadores classificar cada respondente como fumante ou não fumante.
A definição de não-fumante usada foi: um não fumante é uma pessoa que fumou até no máximo um cigarro
diário, em média, por um perı́odo inferior a um ano.
Através de complexo sistema de acompanhamento, observaram-se nos primeiros 10 anos, 136 mortes
associadas ao câncer pulmonar entre os médicos incluı́dos no estudo. Destas, apenas 3 eram de não-fumantes.
Para equalizar os perı́odos de acompanhamento nos vários grupos, trabalhou-se com a taxa de incidência
por 1.000 pessoas-ano de exposição. Os valores desta taxa estão na Tabela 2.2. O risco de morte por câncer
pulmonar das pessoas que fumam mais de 25 cigarros diários é quase 32 vezes maior do que o mesmo risco
para quem não fuma.
Tabela 2.2: Taxa de mortalidade por 1.000 pessoas-ano devida a câncer pulmonar (número de mortes entre
parênteses) para não fumantes e fumantes.
Não-Fumantes Cigarros diários (Fumantes)
1-14 5-24 25+
0,07(3)
0,57(22) 1,39(54) 2,27(57)
Estes dois planejamentos, estudo Caso-Controle e Estudo de Coorte, são as formas usuais de organização
da pesquisa etiológica. Muitos outros estudos como os descritos anteriormente foram feitos em populações
variadas para se verificar o possı́vel papel do fumo. Em todos, a evidência foi clara. Hoje, o papel de agente
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 15
causador do câncer de pulmão é amplamente reconhecido e justifica a militância cada vez mais organizada
contra o fumo.
Em muitos Estudos de Coorte os grupos de comparação são obtidos após o inı́cio do estudo, de acordo
com o nı́vel de exposição ao fator. As coortes do estudo de Framingham sobre doenças coranárias (Kannel
et al., 1972), foram construı́das dividindo-se o grupo acompanhado de acordo com hábitos de fumo, nı́veis
de colesterol, etc. Nestes casos não há necessidade de um grupo externo de comparação.
Tabela 2.3: Percentual de indivı́duos que desenvolveram doença coronariana segundo faixa etária e tipo de
personalidade.
Faixa etária Personalidade
A B
39-49 8,9 4,2
50-59 15,9 7,6
Finalmente, usa-se também como base de comparações outra coorte formada por pessoas não expostas,
parecidas nas caracterı́sticas demográficas com o grupo exposto. Por exemplo, considerando uma coorte
de radiologistas, Seltser e Sartwell (1965) usaram como padrão de comparação dados de oftalmologistas e
otorrinolaringologistas.
a
DOENTES
POPULAÇÃO
EXPOSTOS
ou
b
grupo-experimental NÃO-DOENTES
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxx
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS
c
DOENTES
NÃO-EXPOSTOS
ou
grupo-controle d
NÃO-DOENTES
FORMAÇÃO DOS GRUPOS
POR OBSERVAÇÃO MEDIÇÃO
DA EXPOSIÇÃO DOS EFEITOS
• Estudos de Coorte são grandes, longos e normalmente caros. Quanto mais rara a doença em questão,
maior o número de pacientes que precisam ser examinados. Portanto este estudo é inadequado para
doenças de baixa frequência;
• Vulnerável a perdas (biases).
Muitos avanços no tratamento do câncer de mama têm sido estabelecidos através de estudos realizados
pelo National Surgical Adjuvant Breast and Bowel Project (NSABP). Em 1985, discutia-se a necessidade de
se submeter à quimioterapia ou hormonioterapia, pacientes de bom prognóstico, logo após a cirurgia. Em
particular, havia evidências de várias origens de que o tamoxifeno poderia melhorar ainda mais o prognóstico
dessas pacientes. Naquela época, o tamoxifeno já era usado largamente no tratamento de pacientes com
câncer de mama. Diante disto, o NSABP iniciou o protocolo B-14 para determinar a eficácia do tamoxifeno
em pacientes consideradas de bom prognóstico, isto é, aquelas com tumores com receptor de estrógeno
positivo (>10 fmol ), idade inferior a 70 anos, com câncer de mama operável e linfonodos axilares negativos
ao exame histológico. Foram criados dois grupos de pacientes através de aleatorização feita dentro de estratos
definidos por idade e tamanho do tumor na análise clı́nica, tipo de cirurgia e concentração de receptor de
estrógeno. Um grupo recebeu tamoxifeno (10 mg por dia, via oral, duas vezes ao dia) e o outro, placebo,
indistinguı́vel do tamoxifeno na aparência e gosto. Além disto, o ensaio foi organizado na forma duplo-cego.
Após acompanhamento das pacientes por um perı́odo de até 4 anos, constatou-se uma diferença signifi-
cativa em termos de tempo livre de doença em favor das pacientes que receberam o tamoxifeno. No grupo
tratamento, 83% estavam livres da doença aos quatro anos após a cirurgia, enquanto que no grupo placebo
esta porcentagem era de 73%. Este estudo, publicado por Fisher et al. (1989), contribuiu decisivamente para
a adoção do tamoxifeno como quimioterapia adjuvante logo após a cirurgia em pacientes de bom prognóstico.
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, R. M. 17
a
EFEITO: PRESENTE
POPULAÇÃO
EXPOSTOS
À INTERVENÇÃO
ou b
grupo-experimental EFEITO: AUSENTE
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxx
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS
c
EFEITO: PRESENTE
NÃO-EXPOSTOS
À INTERVENÇÃO
ou
grupo-controle d
EFEITO: AUSENTE
FORMAÇÃO DOS GRUPOS
POR ALEATORIZAÇÃO E MEDIÇÃO
APLICAÇÃO DOS TRATAMENTOS DOS EFEITOS
a, b, c, d : os quatro possíveis resultados
Estudo de Caso
Trata-se de observar um ou poucos indivı́duos com uma mesma doença ou evento e, a partir de descrição
dos respectivos casos, traçar um perfil das suas principais caracterı́sticas.
Muitas revistas cientı́ficas apresentam uma seção de ”relato” ou ”apresentação de casos”, para difundir
os resultados destes estudos.
O estudo de casos é empregado para enfocar grupos especı́ficos da população ou um particular aspecto
de interesse, não devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de
suplementação de informações, com maior riqueza de detalhes.
• O relato pode restringir-se a uma simples descrição ou ir mais além, de modo a sugerir explicações
sobre elementos pouco conhecidos, tais como os fatores implicados na etiologia ou no curso de uma
doença, sob vigência ou não de terapêutica.
• Em clı́nica, é possı́vel acompanhar pacientes durante anos, e mesmo décadas, chegando-se a um quadro
repleto de detalhes sobre aspectos evolutivos de uma dada condição.
• Os indivı́duos observados costumam ser altamente selecionados. Às vezes, a observação restringe-se a
situações incomuns de enfermos graves, outras vezes, aos casos de evolução atı́pica, de reação inusitada
ou de resultado terapêutico inesperado; muito raramente, abrange pacientes em todas as faces de
manifestação da doença.
• A falta de indivı́duos-controle, para comparar resultados, pode fazer com que simples coincidências
sejam difı́ceis de interpretar: por exemplo, em investigação de um surto de diarréia, se os casos beberam
água de um certo poço a evidência é ainda frágil para incriminar a água do poço na etiologia da doença.
Seria conveniente saber se os sadios também beberam ou não água do mesmo poço.
Em sı́ntese, apesar das vantagens referentes à facilidade de realização e baixo custo, duas limitações
principais estão presentes no estudo de casos:
• a falta de controle - eles serviriam para contornar problemas de aferição e comparação acima mencio-
nados;
• o número pequeno de indivı́duos incluı́dos para observação - o que aponta para a prudência na in-
terpretação dos resultados de estudos de casos, especialmente, na generalização, como ele tem sido
atualmente empregado na área clı́nica, é útil para levantar problemas, muitos dos quais são comple-
mentarmente investigados com o auxı́lio de outros métodos.
Seccionais ou Transversais
Investigações que produzem ”instantâneos” da situação de saúde de uma população ou comunidade,
com base na avaliação individual do estado de saúde de cada um dos membros do grupo, e daı́ produzindo
indicadores globais de saúde para o grupo investigado, são chamadas de estudos seccionais ou de corte-
transversal-seccional.
O Estudo Seccional também é conhecido como Estudo Transversal ou da Prevalência.
• Boa opção para descrever as caracterı́sticas dos eventos na população, para identificar casos na comu-
nidade e para detectar grupos de alto risco, aos quais pode ser oferecida atenção especial.
POPULAÇÃO
AMOSTRA PARA
ESTUDO FORMAÇÃO DOS GRUPOS POR
OBSERVAÇÃO SIMULTÂNEA DE
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
EXPOSIÇÃO E DOENÇA
a b c d
Estatı́stica Descritiva
1. Elementos essenciais
a. Tı́tulo:
É a indicação da natureza do fato estatı́stico observado, fazendo referência ao local e ao tempo
em que foi observado.
b. Cabeçalho:
São as indicações que especificam o conteúdo das colunas.
c. Coluna indicadora:
São as indicações que especificam o conteúdo das linhas.
2. Elementos complementares
a. Fonte
É a entidade responsável pelos dados contidos na tabela.
b. Nota
São informações que esclarecem critérios usados na confecção da tabela.
c. Chamada
É a informação de natureza especı́fica, que serve para complementar determinado dado usado na
confecção da tabela.
20
3.2 Distribuição de Frequências ROSSI, R. M. 21
Quando a variável em estudo é do tipo contı́nua e assume muitos valores distintos, o agrupamento dos
dados em classes será sempre necessário na construção das tabelas de frequências.
Em publicações mais antigas sobre construção de tabelas de frequências, há fórmulas para determinação
do número de classes de acordo com o número de dados. Essas fórmulas eram úteis, pois a construção
dos gráficos era muito custosa sem o auxı́lio do computador. Esse procedimento é aconselhável como uma
primeira visualização da distribuição de frequências de uma variável. A seguir é apresentado um roteiro para
construção de distribuições de frequência.
Exemplo 3.1. Considere uma amostra de 25 criança, das quais foram obtidas medidas de intoxicação
alimentar por uma substância desconhecida ( g).
Dados brutos
0, 77 0, 75 0, 80 0, 78 0, 75 0, 65 1, 05 1, 10 0, 75 0, 75
0, 85 0, 61 0, 78 0, 58 0, 52 0, 78 1, 02 0, 99 0, 65 0, 55
0, 85 0, 90 0, 96 0, 79 0, 55
Fonte: Dados hipotéticos
Os dados, como apresentados acima, são chamados brutos, pois não foram ainda submetidos a nenhum
tipo de tratamento. Inicialmente, os dados devem ser colocados em ordem crescente:
Pode-se observar, agora, que das 25 observações o menor valor é xmı́n = 0, 55 e o maior é xmáx = 1, 10.
Amplitude (AT): é a diferença entre o maior e o menor valor do conjunto de dados observados.
AT = xmáx − xmı́n
3.2 Distribuição de Frequências ROSSI, R. M. 22
O número de classes (k), pode ser obtido de uma das fórmulas seguintes:
√
i) k = n ;
AT 0, 58 ∼
h= = = 0, 12
k 5
Obs.: quando os valores observados são números inteiros, os limites das classes também devem ser
AT
números inteiros. Para isso, aconselha-se escolher o número mais próximo de AT que resulte h = em
k
um número inteiro.
Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:
i) o limite inferior da primeira classe pode ser o menor valor da série, neste caso : 0,52.
ii) os demais limites serão obtidos somando aos limites inferiores o valor de h. Isto é,
0, 52 ⊢ (0, 52 + h = 0, 52 + 0, 12) = 0, 64
0, 64 ⊢ (0, 64 + h) = 0, 76
0, 76 ⊢ (0, 76 + h) = 0, 88
0, 88 ⊢ (0, 88 + h) = 1, 00
1, 00 ⊢ (1, 00 + h) = 1, 12.
Lembrando que a notação (⊢) significa que se esta incluindo os valores iguais ao limite inferior e excluindo
os valores iguais ou superiores ao limite superior. A partir da listagem ordenada das classes, pode-se construir
os chamados quadros (ou tabelas) de frequência ou distribuições de frequência, que permitem uma melhor
visualização dos dados.
i) xi é o ponto médio da i-ésima classe; representa a média dos pontos limites da classe;
li + Li
xi = ; li : limite inferior e Li : limite superior da classe i.
2
Fi
v) fi é a frequência relativa da i-ésima classe, fi = ;
n
vi) Faci é a frequência acumulada da i-ésima classe;
Faci
vii) faci é a frequência relativa acumulada da i-ésima classe, faci = .
n
Assim, no caso da amostra de 25 criança intoxicadas, a distribuição de frequência pode ser da seguinte
forma:
Outras informações:
Nenhuma cela ( casa ) deve ficar em branco;
Hı́fen ( - ), indica que o valor numérico é nulo;
Reticência ( ... ), indica que não se dispõe do dado;
Interrogação ( ? ), indica dúvida quanto a exatidão do valor numérico;
Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em relação a unidade utilizada.
3.3 Gráficos
Os gráficos são representações pictóricas, de grande valia na compreensão e visualização dos dados.
Os principais gráficos utilizados na representação estatı́stica são:
1. Diagramas;
2. Cartogramas;
3. Estereogramas.
3.3 Gráficos ROSSI, R. M. 24
3.3.1 Diagramas
São representações gráficas de séries estatı́sticas por intermédio de linhas e superfı́cies. As linhas utilizadas
são as poligonais e as curvas, e as superfı́cies são retângulos, cı́rculos e quadrados. Para suas construções
pode-se utilizar a proporcionalidade entre série de números ou do sistema retilı́nio ortogonal. Este sistema
estabelece uma correspondência biunı́voca entre os pares de números reais e os pontos de um plano. Assim,
de modo geral, num sistema retilı́neo ortogonal, um ponto P do plano está determinado pelos números reais
X e Y, tomados sobre dois eixos divididos em segmentos unitários.
O polı́gono de frequência é um gráfico que se obtém unindo por uma poligonal os pontos correspondentes
às frequências das diversas classes, centradas nos respectivos pontos médios. Para obter as intersecções do
polı́gono com o eixo, cria-se em cada extremo do histograma uma classe com frequência nula.
Obs.: Suavizando a linha poligonal que define o polı́gono obtém-se uma curva que visualiza a tendência
de variação dos dados.
0.3
Probabilidade
0.2
0.1
0.0
−4 −3 −2 −1 0 1 2 3
Amostra
Ogiva
A Ogiva ou Polı́gono de Frequência Acumulada, consiste de uma linha poligonal das Fac ou das fac .
Outros:
Há muitos outros tipos de gráficos em diferentes áreas do conhecimento.
Média
Representa o ponto de equilı́brio de um conjunto de dados. Seja (x1 , . . . , xn ) um conjunto de dados. A
média será dada por:
∑
N
xi
µ = i=1 ( dados populacionais ), para dados não-agrupados em tabelas de frequências.
N
∑
n
xi
i=1
x= ( dados amostrais ), para dados não-agrupados em tabelas de frequências.
n
∑
k
xi Fi
i=1
x= ( dados amostrais ), quando os dados agrupados em tabelas de frequências, com k classes.
n
Quando os dados são agrupados em intervalos de classes, xi corresponde ao ponto médio do intervalo.
Exemplo 3.2. Considere do Exemplo anterior, o conjunto de dados da amostra retirada da variável nı́vel
de intoxicação, dado no inı́cio desta parte. A média será dada por:
∑
25
xi
i=1 19, 53
xA = = = 0, 7812, para os dados brutos, ou
n 25
∑
5
xi Fi
i=1 19, 66
xB = = = 0, 7864, para os dados agrupados (Tabela 3.3).
n 25
Observe que x̄A ≃ x̄B .
3.4 Medidas Descritivas ROSSI, R. M. 32
Propriedades da Média:
1 - A soma algébrica dos desvios tomados em relação a média é nula. Isto é,
∑k ∑k
i=1 di = i=1 (xi − x) = 0 , i = 1, 2, . . . , n
X = {2, 3, 7} → x = 4,
∑k
pela propriedade: i=1 di = (2 − 4) + (3 − 4) + (7 − 4) = 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a média do conjunto
fica aumentada ou diminuı́da dessa constante.
yi = xi ± k ⇒ y =x±k
3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante k, a média do
conjunto fica multiplicada ou dividida por essa constante.
xi x
yi = k · xi ⇒ y =k·x e yi = ⇒ y= ; .k ̸= 0.
k k
1 - É uma medida que, pôr uniformizar os dados, não representa bem os conjuntos que revelam tendências
extremas, uma vez que a mesma será grandemente influenciada pelos valores discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno tenha as seguintes notas em uma disciplina:
30, 35, 25, 30, 25 35, 35, 95, 90, 100.
500
Um cálculo rápido nos mostra que sua média final foi x = = 50. Como a média deve traduzir o
10
aproveitamento do aluno durante o ano e a média 50 só foi conseguida à custa das três últimas notas,
concluı́mos que 50 é um valor falho para medir o aproveitamento do aluno.
2 - A média nem sempre tem existência real, isto é, ela nem sempre faz parte do conjunto de dados
(x ∈
/ X).
3 - É a medida de posição mais conhecida e de maior emprego.
4 - É facilmente calculada.
5 - Serve para compararmos conjuntos semelhantes.
6 - Depende de todos os valores do conjunto de dados.
7 - em geral não ocupa a posição central do conjunto (ocupa a posição do centro de equilı́brio).
Moda
A Moda (Mo ) é o valor que ocorre com maior frequência em uma série de dados. Existem séries de dados
em que nenhum valor aparece mais vezes que outros. Neste caso não apresenta moda. São séries amodais.
Em outros casos, pode aparecer dois ou mais valores de concentração. Diz-se então, que a série tem duas ou
mais modas (bimodal, trimodal ou multimodal).
X : {2, 2, 2, 2, 5, 5, 5, 6, 6, 7, 8} → Mo = 2 (unimodal).
3.4 Medidas Descritivas ROSSI, R. M. 33
h(Fi − Fi−1 )
“Czuber”: Mo = li + .
(Fi − Fi−1 ) + (Fi − Fi+1 )
Outras modas:
“Pearson”: Mo = 3.Md − 2.x
e
h.Fi+1
“King”: Mo = li + .
Fi−1 + Fi+1
Graficamente, A equeção de Czuber de dá quando, em um conjunto de dados qualquer, identifica-se a
classe modal como aquela que apresenta o retângulo de maior altura (frequência). A intersecção das retas
que unem os pontos AD e os pontos BC, determina o ponto P que, projetado perpendicularmente no eixo
da variável, corresponderá ao valor da moda M o.
Exemplo 3.3. Calcular a moda de Czuber, para os dados agrupados da amostra dada na Tabela 3.3.
i = 3 (Classe de maior frequência)
h = 0, 12
l3 = 0, 76
Fi = F3 = 8
Fi−1 = F2 = 6
Fi+1 = F4 = 3
0, 12(8 − 6)
Mo = 0, 76 + ≃ 0, 794
(8 − 6) + (8 − 3)
Isto significa que o nı́vel de toxicidade mais frequente é de 0,794 g.
3.4 Medidas Descritivas ROSSI, R. M. 34
Mediana
A mediana (Md ) de um conjunto de valores ordenados segundo uma ordem de grandeza, é o valor situado
de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos (é o valor
que está no meio !).
Quando o conjunto de observações tem um número ı́mpar de valores, não-agrupados em classes, então
n+1
a mediana é dada pela expressão: Md = xp , onde p = .
2
x1 x2 x3 x4 x5
→ Md = 5.
3 5 5 6 7
Quando o conjunto de observações tem um número par de valores, não-agrupados em classes, então a
xp + xp+1
mediana será, a média aritmética dos dois números que ocuparem o meio da série: Md = , onde
2
n
p= .
2
x1 x2 x3 x4 x5 x6 5+6
→ Md = = 5, 5.
3 5 5 6 7 7 2
Exemplo 3.4. Calcular a mediana para os dados agrupados da amostra da Tabela 3.3.
n = 25( )
n
i = 3 p = = 12, 5 está na terceira linha −→ olhar em Fac
2
h = 0, 12
Fi = 8
Fac−1 = 11 (frequência acumulada da classe anterior)
l3 = 0, 76
0, 12(12, 5 − 11)
Md = 0, 76 + ≃ 0, 783
8
Isto significa que o 50% das crianças apresenta nı́vel de toxicidade acima de 0,783 g.
Amplitude total
Amplitude total ou AT é a diferença entre o maior e o menor valor observado
AT = xmáx − xmı́n
3.4 Medidas Descritivas ROSSI, R. M. 35
Variância
Variância ou Var(X) é a medida que fornece o grau de dispersão, ou variabilidade dos valores do
conjunto de observações em torno da média. Ela é calculada somando os quadrados dos desvios em relação
à média:
Amostral Populacional
∑n
2
(xi − x̄) ∑
N
(xi −µ)2
D. Brutos s2 = i=1 2
σ = i=1
n−1 ( )2
N
∑k ∑
k
2
(xi − x̄) Fi ( ) k xi Fi ∑
k
Desvio-padrão
Desvio-padrão ou DP(X) - Como a variância calculada a partir do quadrados dos desvios, sua unidade
é quadrada em relação à variável estudada, o que, sob o ponto de vista prático é um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão,
definida como a raiz quadrada da variância e representada por:
Amostral
√ Populacional
√
s = s2 σ = σ2
1 - V ar(X) ≥ 0 =⇒ DP (X) ≥ 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a variância e o
desvio-padrão do novo conjunto permanecem inalterados:
Y =X ±k ⇒ V ar(Y ) = V ar(X) + 0
Y =X ±k ⇒ DP (Y ) = DP (X) + 0
Y = kX ⇒ V ar(Y ) = k 2 V ar(X)
Y = kX ⇒ DP (Y ) = |k|DP (X)
3.4 Medidas Descritivas ROSSI, R. M. 36
e para k ̸= 0,
X V ar(X)
Y = ⇒ V ar(Y ) =
k k2
X DP (X)
Y = ⇒ DP (Y ) =
k |k|
4 - Sejam X e W variáveis aleatórias independentes, a e b constantes reais, tal que Y = aX ± bW, tem-se:
Variância Relativa
A variância relativa de uma série X é indicada por VR(X) e definida por:
s2
V R(X) = 2 (amostral)
(x̄)
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro.
Portanto, pode ser expresso em percentual.
Coeficiente de variação
Coeficiente de variação ou CV é uma medida relativa da dispersão ou variabilidade dos dados:
s σ
CV(x) = (amostral) ou CV(x) = (populacional).
x̄ µ
Critérios para interpretação: Quanto menor for o coeficiente de variação (CV ≤ 25%), mais representa-
tiva dos dados será a média.
Exemplo 3.5. Calcular a variância, o desvio-padrão e o coeficiente de variação para o conjunto de dados
da amostra X: {2, 3, 5, 7}.
∑
3
xi Fi
i=1 1 × 2 + 3 × 4 + 5 × .2
sendo x = = = 3, temos
n 8
3.4 Medidas Descritivas ROSSI, R. M. 37
∑
k
2
(xi − x̄) Fi 2 2 2
i=1 (1 − 3) 2 + (3 − 3) 4 + (5 − 3) 2
s2 = = ≃ 2, 29, ou
n − 1 7
( k )2
∑
( ) k xi Fi
1 ∑ 2 i=1
s2 = x F i − = s2
n − 1 i=1 i n
( )[ 2
]
1 (24) 16
= 88 − = ≃ 2, 29
8−1 8 7
√
logo, s = 2, 29 ≃ 1, 51, assim:
1, 51
cv = ≃ 0, 50 (há indicativo de que a média não é representativa).
3
h(p − Fac−1 )
Sk = li +
Fi
onde
SK : é a medida de posição separatriz desejada (Md : M ediana, Qk : Quartil, Dk : Decil ou Pk :
P ercentil de ordem k);
k : é a ordem da medida;
w : é o divisor;
Sk k w
Md 1 2
Q 1, 2, 3 4
D 1, 2, ...,9 10
P 1, 2, ...,99 100
p : é a posição da observação, dado por:
n.k
p=
w
Exemplo 3.7. Calcule o Q1 , Q2 , Q3 , D7 , P10 e P90 para os dados da Tabela 3.3.
Solução:
Cálculo de Q1 : {k = 1; w = 4; }
25 × 1
p= = 6, 25 (i = 2 : olhar em Fac )
4
h = 0, 12
Fi = F2 = 6
li = 0, 64
Fac−1 = 5
0, 12(6, 25 − 5)
Q1 = 0, 64 + = 0, 64 + 0, 025 = 0, 665
6
Obs.: O valor Q1 = 0, 665 representa o nı́vel de intoxicação que deixa 25% dos demais valores abaixo dele.
Cálculo de Q2 : {k = 2; w = 4; }
25 × 2
p= = 12, 5 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(12, 5 − 11)
Q2 = 0, 76 + ≃ 0, 783 = Md
8
Obs.: O valor Q2 ≃ 0, 783 representa o o nı́vel de intoxicação que deixa 50% dos demais valores abaixo dele,
isto é, é o valor mediano.
Cálculo de Q3 : {k = 3; w = 4; }
25 × 3
p= = 18, 75 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(18, 75 − 11)
Q3 = 0, 76 + ≃ 0, 876
8
Obs.: O valor Q3 ≃ 0, 876 representa o nı́vel de intoxicação que deixa 75% dos demais valores abaixo dele.
Cálculo de D7 : {k = 7; w = 10; }
25 × 7
p= = 17, 5 (i = 3)
10
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(17, 5 − 11)
D7 = 0, 76 + ≃ 0, 858
8
Obs.: O valor D7 ≃ 0, 858 representa o o nı́vel de intoxicação que deixa 70% dos demais valores abaixo dele.
Cálculo de P10 : {k = 10; w = 100; }
25 × 10
p= = 2, 5 (i = 1)
100
h = 0, 12
Fi = 5
li = 0, 52
Fac−1 = 0
0, 12(2, 5 − 0)
P10 = 0, 52 + = 0, 58
5
Obs.: O valor P10 = 0, 58 representa o o nı́vel de intoxicação que deixa 10% dos demais valores abaixo dele.
Cálculo de P90 : {k = 90; w = 100; }
25 × 90
p= = 22, 5 (i = 1)
100
h = 0, 12
Fi = 3
3.4 Medidas Descritivas ROSSI, R. M. 39
li = 1, 00
Fac−1 = 22
0, 12(22, 5 − 22)
P90 = 1 + = 1, 02
3
Obs.: O valor P90 = 1, 02 representa o o nı́vel de intoxicação que deixa 90% dos demais valores abaixo dele
ou 10% acima dele.
Medidas de Assimetria
Tem por objetivo básico medir o quanto a distribuição de frequências do conjunto de valores observados
se afasta da condição de simetria.
(A) Distribuição Assimétrica negativa. Quando a média é menor que a mediana que é menor que a
moda.
(B) Distribuição Simétrica. Quando a média, moda e mediana são iguais, ou muito próximas.
(C) Distribuição Assimétrica positiva. Quando a média é maior que a mediana que é maior que a
moda.
3.4 Medidas Descritivas ROSSI, R. M. 40
Uma das medidas para quantificar a assimetria de uma distribuição pode ser dada pelo primeiro coe-
ficiente de assimetria de Pearson (Ap ) :
x̄ − Mo 3 (x̄ − Md )
Ap = ou Ap =
s s
Q3 + Q1 − 2Md
Ab =
Q3 − Q1
Em ambos temos:
Se A < 0 a distribuição é assimétrica negativa.
Se A = 0 a distribuição é distribuição simétrica.
Se A > 0 a distribuição é assimétrica positiva.
Obs.: 0, 15 < |A| < 1 a assimetria é considerada moderada e se |A| > 1, forte.
Medidas de Curtose
A curtose ou achatamento mede a concentração ou dispersão dos valores de um conjunto de valores
em relação às medidas de tendência central em uma distribuição de frequências conhecida (a distribuição
Normal).
(A) Distribuição Leptocúrtica. Quando a distribuição apresenta uma curva de frequência mais “fe-
chada” que a da distribuição Normal.
(B) Distribuição Mesocúrtica. Quando a distribuição apresenta uma curva de frequência “parecida”
a da distribuição Normal.
(C) Distribuição Platicúrtica. Quando a distribuição apresenta uma curva de frequência mais “aberta”
que a da distribuição Normal.
(Q3 − Q1 )
k=
2(P90 − P10 )
3.4 Medidas Descritivas ROSSI, R. M. 42
Noções de Probabilidade
4.1 Introdução
Uma das ferramentas fundamentais da Inferência Estatı́stica é a Probabilidade, a qual teve seu inı́cio
formal com jogos de azar no século XVII.
Muitas decisões precisam ser tomadas na presença da incerteza. Os preços e modelos de novos carros
devem ser selecionados com base na previsão instável do consumidor, na tendência da economia nacional
e nas ações competitivas. A locação e o quadro de funcionários de um hospital devem ser decididos com
informação limitada na quantidade de pacientes. O estoque de um produto deve ser feito em face da incerteza
sobre a demanda. Probabilidade é a linguagem da incerteza. Assim sendo, probabilidade será estudada como
o mecanismo de fazer inferências.
Independente de qual seja a aplicação em particular, a utilização da teoria de probabilidade indica que
existe um elemento de acaso, ou de incerteza, quanto a ocorrência ou não de um acontecimento futuro.
Assim é que, em muitos casos, pode ser virtualmente impossı́vel afirmar por antecipação o que ocorrerá;
mas é possı́vel dizer o que pode ocorrer. Por exemplo, se uma moeda for jogada para o ar, de modo
geral não se pode afirmar se vai dar cara ou coroa. Entretanto, é reconhecido que embora o resultado
seja incerto, existe um resultado previsı́vel a longo prazo. É sabido que se a moeda é ideal (balanceada,
simétrica) cerca de metade das provas resultarão em caras. Além disso, mediante determinada combinação
de julgamento, experiência passada e dados históricos, em geral é possı́vel dizer quão provável é a ocorrência
de determinado acontecimento futuro. Neste longo prazo, a regularidade previsı́vel possibilitam que as casas
de jogos se empenhem no negócio.
Exemplo 4.2. Selecionar ao acaso um habitante de Maringá e medir sua altura em metros. Quais os resul-
tados possı́veis deste experimento? Números reais entre 0 e ? Supondo que não exista uma altura máxima,
talvez seja razoável fazer Ω = (0, ∞). Mas é evidente que esse conjunto contém resultados impossı́veis.
Outros candidatos para Ω seriam, por exemplo, os intervalos limitados (0, 3) e [1/10, 3]. Os dois interva-
los contém, aparentemente, todos os resultados possı́veis do experimento. Esta propriedade já é suficiente
para os propósitos aqui estudados, e qualquer desses intervalos (incluindo (0, ∞)) pode ser escolhido para
ser espaço amostral. De fato, a própria reta R, embora contenha muitı́ssimos resultados impossı́veis, pode
representar uma escolha muito conveniente para Ω.
43
4.3 Definição Axiomática de Probabilidade ROSSI, R. M. 44
O importante, então, é que Ω contenha todo resultado possı́vel; por isso suponha que a todo resultado
possı́vel corresponda um, e somente um, ponto ω ∈ Ω; e resultados distintos correspondem a pontos distintos
em Ω, i. e., não pode representar mais de um resultado.
Para uma terminologia uniforme os resultados dos experimentos serão denominados eventos.
Quando se realiza um experimento há certos eventos que ocorrem ou não. Por exemplo, no primeiro
exemplo alguns eventos são:
A = “observa-se um número par”
B = “observa-se o número 2”
C = observa-se um número > 3”.
Note que cada um desses eventos pode ser identificado a um subconjunto de Ω, a saber: A = {2, 4, 6},
B = {2} e C = {4, 5, 6}. Esta identificação costuma ser realizável no caso de um experimento qualquer.
Definição: Seja Ω o espaço amostral do experimento. Todo subconjunto A ⊂ Ω será chamado evento.
Ω é o evento certo, ϕ o evento impossı́vel. Se ω ∈ Ω, o evento {ω} é dito evento elementar (ou
simples).
Notações de conjuntos e eventos:
A ∪ B é o evento “A ou B”;
A ∩ B é o evento “A e B”;
Ac é o evento “não A” ou Ω − A (isto é, ocorre o evento Ac se, e só se, não ocorre A);
A ⊂ B significa: a ocorrência do evento A implica a ocorrência do evento B;
A ∩ B = ϕ significa: A e B são eventos mutuamente exclusivos ou incompatı́veis.
Definição de Probabilidade
A esta altura pode-se perguntar: a que será atribuı́do probabilidade?
Seja A um evento, i. e., A ⊂ Ω. Desta forma pode-se atribuir probabilidade a A:
#A
P (A) =
#Ω
#A : número de resultados favoráveis a A;
#Ω : número de resultados possı́veis.
Outro método de definir probabilidade é o da frequência relativa: pode-se definir P (A) como o limite da
frequência relativa da ocorrência de A em n repetições independentes do experimento, com n tendendo ao
infinito, isto é:
#A
P (A) = lim
n→∞ n
em que #A é o número de ocorrências de A em n “ensaios” independentes do experimento.
Essa é a definição “frequentista” de probabilidade. Baseia-se na experiência, comum a todos, da estabili-
dade da frequência relativa de ocorrência de eventos, quando é realizado muitas repetições do experimento.
Essa definição foi utilizada por Von Mises na construção de uma teoria de probabilidade.
Observação: Embora nenhuma destas definições - clássica e frequêncial - seja completamente rigorosa,
sendo, portanto, ambas insatisfatórias do ponto de vista teórico, elas servem para que se avance bastante no
conhecimento das principais idéias da Teoria das Probabilidades.
Prova. Pelo diagrama de Venn podemos notar que A ∪ B = B ∪ (A − B). Uma vez que, B e A − B são
mutuamente exclusivos, segue que:
P (A ∪ B) = P (B ∪ (A − B)) → P (A ∪ B) = P (B) + P (A − B) → P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
Exemplo 4.3. Se A e B são eventos de A mutuamente exclusivos, e é conhecido que P(A)=0,20 enquanto
P(B)=0,30, pode-se avaliar varias probabilidades:
a. P (Ac ) = 1 − P (A) = 0, 80
b. P (B c ) = 1 − P (B) = 0, 70
c. P (A ∪ B) = P (A) + P (B) = 0, 2 + 0, 3 = 0, 5
d. P (B ∩ A) = 0
e. P (Ac ∩ B c ) = P ((A ∪ B)c ), pela Lei de Morgan = 1 − P (A ∪ B) = 1 − (P (A) + P (B)) = 0, 5
Exercı́cio 4.1. Suponha que os eventos A e B não sejam mutuamente exclusivos e que P (A) = 0, 20,
P (B) = 0, 30 e P (B ∩ A) = 0, 10. Então, calcule as mesmas probabilidades do exemplo anterior.
Exercı́cio 4.2. Entre os 1.820 indivı́duos em um estudo, 30 sofriam de tuberculose e 1.790 não. Raios X
do tórax foram administrados para todos; 73 tiveram raio X positivo – o que implica evidência significante
de doença inflamatória – enquanto os resultados dos outros 1.747 foram negativos. Os dados pra esse estudo
são apresentados a seguir:
Raio X Tuberculose Total
Não Sim
Negativo 1.739 8 1.747
Positivo 51 22 73
Total 1.790 30 1.820
Escolhido um individuo ao acaso, qual a probabilidade:
a) de ter raio X negativo? b) de ter tuberculose e o raio X positivo?
4.5 Probabilidade Condicional ROSSI, R. M. 46
P (A ∩ B)
P (A|B) = .
P (B)
Do diagrama de Venn se A e B são desenhados de modo que áreas de A, B e A ∩ B sejam proporcionais
às suas probabilidades, então P (A|B) é a proporção do evento B ocupada pelo evento A.
Exercı́cio 4.3. Para os dados do exercı́cio anterior, escolhido um indivı́duo ao acaso, qual a probabilidade:
a) de ter raio X negativo e ser tubérculo?
b) de ter tuberculose, dado que o resultado do raio X foi negativo?
c) de ter raio X positivo, dado que não é tuberculoso?
Teorema da Probabilidade Total: Se a sequência (finita ou enumerável) de eventos aleatórios B e A1 ,
A2 , ... formar uma partição de Ω, i.é., se são eventos aleatórios mutuamente exclusivos e exaustivos,
os Ai são disjuntos (2 a 2) então ∪Ai = Ω, então:
∑
P (B) = P (Ai )P (B|Ai ).
i
4.5 Probabilidade Condicional ROSSI, R. M. 47
Teorema de Bayes:
Exemplo 4.4. Uma caixa contém 5 bolas brancas e 3 bolas pretas. Duas bolas são retiradas simultaneamente
ao acaso e substituı́das por 3 bolas azuis. Em seguida, duas novas bolas são retiradas ao acaso da caixa.
a) calcular a probabilidade de que essas duas últimas bolas sejam da mesma cor;
b) se as duas ultimas bolas retiradas forem uma branca e uma preta, calcular a probabilidade de que, na
primeira extração, tenham sido duas bolas brancas.
Solução:
b) A solução desta parte é dada pelo teorema de Bayes. Seja G : as duas últimas bolas retiradas serem
uma preta e uma branca, temos que:
4.6 Independência Estatı́stica ROSSI, R. M. 48
3 3 3 3 9
P (G|E1 ) = P (P B|E1 ) + P (BP |E1 ) = × + × =
9 8 9 8 36
4 2 4 2 8
P (G|E2 ) = P (P B|E2 ) + P (BP |E2 ) = × + × =
9 8 9 8 36
5 1 5 1 5
P (G|E3 ) = P (BP |E3 ) + P (P B|E3 ) = × + × =
9 8 9 8 36
O denominador da formula de Bayes é a probabilidade do evento que ocorreu dado pelo teorema da
probabilidade total. No caso
∑3 10 9 15 8 3 5 225
P (G) = P (Ei )P (G|Ei ) = × + × + × =
i=1 28 36 28 36 28 36 1008
Logo pela formula de Bayes
10 9
P (E ∩ G) P (Ei )P (G|Ei ) × 90
P (E1 |G) = = = 2822536 = = 0, 4.
P (G) P (G) 225
1008
∑3
Exercı́cio 4.4. Encontrar P (E2 |G), P (E3 |G) e somas P (Ei |G).
i=1
Exemplo 4.5. Experimento de duas etapas (experimento composto). Supor que uma caixa contenha três
moedas: duas honestas e uma de duas caras. Retirar uma moeda ao acaso e jogá-la. Pergunta: qual a
probabilidade condicional da moeda ter sido a de duas caras, dado que o resultado final foi cara?
Solução: Nesse experimento, deseja-se calcular a probabilidade de um evento determinado pela primeira
etapa dado um evento determinado pela segunda etapa. Sejam, então A1 = “moeda retirada é honesta”,
A2 = “moeda retirada é a de duas caras” e B = “resultado final é cara”.
Aplicando a fórmula de Bayes, tem-se:
1
P (B|A2 )P (A2 ) 1× 1
P (A2 |B) = = 3 = .
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) 1 1 2 2
1× + ×
3 3 3
Esse resultado pode ser interpretado em termos de freqüência relativa: se o experimento fosse repetido
independentemente um grande número de vezes, então a moeda de duas caras seria a escolhida na primeira
etapa de aproximadamente metade dos experimentos em que o resultado final fosse cara.
da variável aleatória (v.a.), que é uma regra de associação de um valor numérico a cada ponto do espaço
amostral.
As variáveis aleatórias podem ser discretas, contı́nuas ou mistas. No caso discreto, a distribuição de pro-
babilidade pode ser caracterizada por uma função de probabilidade, que indica diretamente as probabilidades
associadas a cada valor.
O passo fundamental para se entender uma v.a. é associar a cada valor a sua probabilidade, obtendo
o que se chama uma distribuição de probabilidades, que fica caracterizada pelos valores da v.a. X e pela
função que associa a cada valor uma probabilidade. Esta função é chamada função de probabilidade.
No caso discreto, a função p(xi ) que associa a cada valor xi (de uma variável aleatória discreta X) sua
probabilidade de ocorrência, isto é:
p(xi) = P (Xi = xi ) = p.
Para que uma função p(x) seja uma distribuição de probabilidade, é necessário que:
1. p(x) ≥ 0;
∑
2. p(x) = 1 (somatório para todos os valores de x do domı́nio de X);
3. P (X = x) = p(x).
1. f (x) ≥ 0;
∫b
2. f (x)dx = P (a ≤ x ≤ b) (área sobre a curva f (x) entre os pontos a e b é a probabilidade entre a e b);
a
∫
∞
3. f (x)dx = 1.
−∞
Para melhor entender a abrangência do conceito de v.a., é necessário proceder a algumas etapas assim
como estudar caracterı́sticas gerais das distribuições das v.a. para as distribuições mais importantes, que
descrevem um grande número de fenômenos aleatórios. Neste texto será apresentado apenas conceitos
básicos.
Propriedades da Média:
O Desvio-padrão de uma Variável Aleatória é a raiz quadrada positiva da variância. Tem a vantagem
de ser expresso na mesma unidade da variável. Suas propriedades decorrem da variância. É denotado por σ
ou σ(X).
σ
O Coeficiente de Variação de uma Variável Aleatória é definido como: CV = .
µ(X)
É uma medida adimensional da dispersão. É utilizado para comparar conjuntos de dados quanto a
dispersão.
Capı́tulo 5
Distribuições de Probabilidade
O objetivo da Inferência Estatı́stica é obter afirmações sobre uma dada caracterı́stica da população, na
qual se tem interesse, a partir de informações colhidas de uma amostra.
Essa caracterı́stica de interesse pode ser representada por uma variável aleatória.
Se informações completa sobre a distribuição de probabilidade da variável em estudo, fosse conhecida
não haveria necessidade de colher uma amostra. Então, toda afirmação desejada seria obtida através desta
distribuição.
Mas isso raramente acontece. A informação que se tem a respeito da variável é parcial ou nada se conhece.
Exemplos:
• a altura dos brasileiros adultos, apresenta uma distribuição Normal?
• a prevalência (proporção) de uma determinada doença infecciosa segue uma distribuição Binomial?
• o número de filhos de um casal humano segue uma distribuição de Poisson ?
• o tempo de vida de pacientes soropositivos segue uma distribuição Exponencial?
Se não há informações nem sobre os parâmetros, nem sobre a forma da curva, então, o uso de uma
amostra nos dá uma idéia sobre o comportamento da variável na população. Através de suas carac-
terı́sticas e através de testes de aderência, podemos verificar qual o modelo probabilı́stico (conhecido)
será mais adequado aos dados.
Muitas vezes isto não acontece. Nestes casos um novo modelo deverá ser produzido, ou a distribuição
é produzida através de simulação computacional.
51
5.2 Distribuição de Poisson ROSSI, R. M. 52
Média : E(X) = np
e
Variância : V ar(X) = npq.
X ∼ P o(λ).
O modelo Poisson é um modelo discreto muito utilizado em experimentos biológicos e, nesses casos, λ é
a frequência média ou esperada de ocorrências num determinado intervalo de tempo.
Exemplo 5.2. Chegada de pacientes em um pronto socorro. Suponha que o número de pacientes que chegam
a um pronto socorro de uma pequena cidade durante a madrugada tenha distribuição de Poisson com média
3 (λ = 3). Calcular as probabilidades de chegadas desses pacientes:
3e−3
Solução: Para X valendo 0 temos P (X = 0) = = 0, 05. Para os demais (x = 1, 2, ...) o cálculo é
0!
análogo e os resultados estão na Tabela 5.1.
X ∼ N (µ, σ)
Lê-se: O conjunto de dados X, têm distribuição Normal com média : µ e desvio-padrão : σ.
Devido a complexidade da função de probabilidade, fazemos uso da Tabela Normal-Padrão ou Normal-
Reduzida, construı́da através da transformação na variável X:
X −µ
Z= ∼ N (0, 1)
σ
Caracterı́sticas:
1. é contı́nua;
2. a curva em forma de sino, que engloba o total de frequências ou 100%;
3. é simétrica: a média (µ) = a moda (Mo ) = a mediana (Md );
4. é unimodal;
5. o desvio-padrão é σ;
6. a curva de inflexão ocorre nos pontos x = µ ± σ;
Como já dissemos, a área subordinada à curva normal representa 100% das frequências. Em torno da
média determinamos intervalos com utilização do desvio-padrão, conforme abaixo:
µ±σ = 68, 26%
µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%
Exemplo 5.3. Pressão sistólica em jovens saudáveis.
Suponha que a pressão arterial sistólica em pessoas jovens gozando de boa saúde tenha distribuição
N (120, 10) mmHg.
Qual é a probabilidade de se encontrar uma pessoa com pressão sistólica acima de 140 mmHg ?
Solução:
X −µ 140 − 120
Z= = =2
σ 10
P (X ≥ 140) = P (Z ≥ 2) = P (Z ≤ −2) = 0, 0228 ou 2, 28%.
Isto é, 2, 28% das pessoas jovens e sadias têm pressão sistólica acima de 140 mmHg.
5.4 Distribuição Exponencial ROSSI, R. M. 54
Exemplo 5.4. O peso ( mg) de um determinado medicamento é denotada por X e é distribuı́da como N(800,
12). Um técnico em farmácia ao testá-lo requer que ele tenha peso de pelo menos 772 mg. Uma amostra do
medicamento é selecionada aleatoriamente e testada.
Inferência Estatı́stica
6.1 Introdução
Inferência Estatı́stica ou Estatı́stica indutiva é a parte da estatı́stica que utiliza métodos cientı́ficos para
fazer afirmações e tirar conclusões sobre caracterı́sticas ou parâmetros de uma população, baseando-se em
resultados de uma amostra. O próprio termo “indutiva” decorre da existência de um processo de indução, isto
é, um processo de raciocı́nio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões
sobre a realidade no todo. O uso de informações da amostra para concluir sobre o todo faz parte da atividade
diária da maioria das pessoas. Basta observar como uma cozinheira verifica se o prato que ela está preparando
tem ou não a quantidade adequada de sal. Ou ainda, quando uma dona de casa, após experimentar um
pedaço de uma laranja numa banca de feira, decide se as compra ou não. Essas são decisões baseadas em
procedimentos amostrais.
O objetivo é procurar a conceituação formal desses princı́pios intuitivos do dia-a-dia para que possam ser
utilizados cientificamente em situações mais complexas.
É fácil perceber que um processo de inferência ou indução ( em estatı́stica) não pode ser exato. A
Inferência Estatı́stica, entretanto, irá dizer até que ponto pode-se estar errando nas inferências, e com que
probabilidade. Esse fato é fundamental para que uma inferência possa ser considerada estatı́stica, e faz parte
dos objetivos da Inferência Estatı́stica.
Em suma, a Inferência Estatı́stica busca obter resultados sobre as populações a partir das amostras,
dizendo também, qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões
obtidas. Evidentemente, a forma como as inferências serão realizadas irá depender de cada tipo de problema,
conforme será estudado posteriormente.
Segue-se que a teoria da Inferência Estatı́stica recorre intensamente a conceitos e resultados do Cálculo
de Probabilidades.
O objetivo da Inferência Estatı́stica é obter afirmações sobre uma dada caracterı́stica da população, na
qual se tem interesse, a partir de informações colhidas de uma amostra.
Essa caracterı́stica de interesse pode ser representada por uma variável aleatória. Se informações completa
sobre a distribuição de probabilidade da variável em estudo, fosse conhecida não haveria necessidade de
colher uma amostra. Toda afirmação desejada seria obtida através da distribuição da variável, usando-se as
propriedades estudadas anteriormente. Mas isso raramente acontece. A informação que se tem a respeito
da variável é parcial ou nada se conhece. Por exemplo, a altura dos brasileiros adultos, apresenta uma
distribuição normal, mas os parâmetros que a caracterizam (média e variância) são desconhecidos. Em
outros casos, pode-se ter uma idéia da média e variância, mas se desconhece a forma da curva. Ou ainda,
não há informações nem sobre os parâmetros, nem sobre a forma da curva. Então, o uso de uma amostra
permite ter uma idéia sobre o comportamento da variável na população.
55
6.2 Noções de Amostragem ROSSI, R. M. 56
População pequena. Sob o enfoque de amostragem aleatórias que será estudado no próximo item,
se a população for pequena (digamos de 50 elementos ou menos) para se ter uma amostra capaz de gerar
resultados precisos para os parâmetros da população, será necessário uma amostra relativamente grande (em
torno de 80% da população).
Caracterı́stica de fácil mensuração. Mesmo que a população não seja tão pequena, mas a variável
que se quer observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por
exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de
trabalho, pode-se entrevistar toda a população no próprio local de trabalho.
Necessidade de alta precisão. A cada dez anos o IBGE realiza um censo demográfico para estudar
diversas caracterı́sticas da população brasileira. Dentre estas caracterı́sticas têm-se o parâmetro número de
habitantes residentes no paı́s, que é fundamental para o planejamento do paı́s. Desta forma este parâmetro
precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.
• Amostragem intencional ou por conveniência (o pesquisador escolhe certos elementos para a amostra);
• Amostragem com desigualdade de acesso aos elementos da população (há elementos com mais facilidade
de figurarem na amostra);
• Outras.
6.2 Noções de Amostragem ROSSI, R. M. 57
Figura 6.1: Esquema de uma Amostragem Aleatória Simples e uma Tabela de Números Aleatórios.
Procedimento:
4. Despreze quaisquer números que não correspondam a números da lista. No caso de amostragem sem
reposição, despreze também os números que sejam repetições de números lidos anteriormente. Continue
o processo até obter o número desejado de observações;
5. Use os números assim escolhidos para identificar os ı́tens da lista a serem incluı́dos na amostra.
6.2 Noções de Amostragem ROSSI, R. M. 58
Exemplo 6.2. A população de N=1.200 indivı́duos de uma escola é composta por 20% de professores, 20%
de servidores e 60% de alunos. Separam-se os grupos e sorteia-se uma amostra de tamanho 10% de N, com
24 professores, 24 servidores e 72 alunos.
Figura 6.5: Ilustração de uma amostragem estratificada proporcional dos indivı́duos de uma escola.
FONTES DE ERROS
O erro amostral, definido como a diferença entre uma estatı́stica (calculada a partir de uma amostra de
n elementos) e o verdadeiro valor do parâmetro (caracterı́stica de uma população de N elementos), parte do
princı́pio de que as n observações que compõem a amostra são obtidas sem erro. Na prática, isso geralmente
não acontece.
Havendo erros ou desvios nos dados da própria amostra, a diferença entre a estatı́stica e o parâmetro
pode ser maior que o limite tolerável, que será usado para o cálculo do tamanho da amostra. Por isso, o
planejamento e a execução da pesquisa devem ser feitos com muita cautela, para evitar ou reduzir, os erros
nos próprios dados da amostra, conhecidos como erros não amostrais. Alguns dos erros são:
• Falta de resposta;
Exemplo: Geralmente em questionários em que não há orientação ao indivı́duo selecionado, ou então
quando a pergunta cria dúvida ou constrangimento em sua resposta.
• Erros de mensuração;
Exemplo: Aparelhos desajustados e/ou cansaço do experimentador (ou inexperiência).
• Efeito placebo;
Exemplo: O indivı́duo ”acredita” realmente que tomou o medicamento com o princı́pio ativo, certo
que obteve melhoras significativas (efeito psicológico).
• Efeito experimentador;
Exemplo: Quando o pesquisador (dono de uma empresa, por exemplo) influencia involuntariamente
nas respostas ao questionar se o seu funcionário está satisfeito com salário.
6.3 Distribuição Amostral ROSSI, R. M. 61
4. Os valores da estatı́stica formam uma nova população, cuja distribuição recebe o nome de distribuição
amostral da estatı́stica.
Para a obtenção das distribuições amostrais em sua forma matemática, precisamos entender o Teorema
do Limite Central.
Teorema. Para amostras aleatórias simples (X1 , X2 , ..., Xn ), retiradas de uma população com média
µ e variância σ 2 , a distribuição amostral da média aproxima-se de uma distribuição Normal com média µ e
σ2
variância , quando n → ∞, isto é
n ( )
σ2
X̄ ∼ N µ; .
n
∑
n x1 + x2 + ... + xn σ2
Prova: X̄ = 1
n xi = → E(X̄) = µ e V ar(X̄) = .
i=1 n ( ) n
( ) σ2
Portanto se X ∼ N µ; σ 2 , então X̄ ∼ N µ; ou
n
X̄ − µ
Z= σ ˜N (0; 1) .
√
n
6.3 Distribuição Amostral ROSSI, R. M. 62
Grandes discrepâncias entre as frequências relativas observadas e as probabilidades teóricas acima citadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.
Outros critérios:
• Testes de aderência: Kolmogorov-Smirnov (K-S) [µ e σ conhecidos], Shapiro Wilks (W) e/ou Lilliefors
(L) [µ e σ desconhecidos e estimados pelos dados através de x̄ e s, respectivamente].
Faixas de Referência
Toda medida laboratorial é analisada confrontando-se seu valor com uma faixa padrão.
Isto é tão comum que, na própria apresentação do resultado, muitos laboratórios já indicam os limites
inferiores e superiores para o valor da medida que devem servir de base ao raciocı́nio clı́nico.
Q-QPlot
40
0.08
35
Freqüências
0.06
amostra
30
0.04
25
0.02
0.0
20
20 25 30 35 40 -2 -1 0 +1 +2
Observe através da Figura 6.8 o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição Normal.
Para a Amostra 1, foram realizados alguns testes de normalidade com uso de um software estatı́stico e
indicaram ajuste dos dados já (mais detalhes serão apresentados no capı́tulo referente a Testes de Hipóteses).
Observe através da Figura 6.9 uma assimetria do histograma comparado à normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
normal. Testes confirmam isto para a Amostra 2.
Neste caso duas metodologias distintas deverão ser utilizadas para construir faixas de referência:
6.3 Distribuição Amostral ROSSI, R. M. 64
0.05
Q-=Q Plot
70
0.04
60
0.03
Freqüências
amostra2
50
0.02
40
30
0.01
20
0.00
20 40 60 80 -2 -1 0 1 2
Observe que devido a normalidade temos praticamente a mesma faixa, utilizando o método dos per-
centis:
[21; 41] colônias - “Adequado”
Sendo assim, considerando esse método, um indivı́duo será considerado ”doente” se tiver com o número
de colônias acima de 41 unidades.
• e Método dos Percentis para a Amostra 2, isto é, obter uma faixa de inclua, por exemplo, 95% dos
elementos, excluindo os 2,5% valores menores e os 2,5 % maiores valores
Considerando esse método, um indivı́duo na amostra 2 será considerado ”doente” se tiver com o número
de colônias acima de 68 unidades.
Observe que, se optássemos pelo método de gauss para a amostra 2 terı́amos:
De cada uma dessas populações, extraem-se, mediante amostragem aleatória simples, amostras que não
têm por que serem necessariamente do mesmo tamanho (respectivamente, n1 e n2 ): X̄1 e X̄2 , então: consi-
derando que σ 21 = σ 22 = σ 2 , tem-se que:
( )
X̄1 − X̄2 − (µ1 − µ2 )
Z= √ ∼ N (0; 1) .
σ n11 + n2
1
6.3 Distribuição Amostral ROSSI, R. M. 65
Quando as variâncias das populações são desconhecidas, mas podemos assumir que, pelo menos, são
iguais, a seguinte estatı́stica distribui-se como uma t de Student com n1 + n2 − 2 graus de liberdade, isto é:
( )
X̄1 − X̄2 − (µ1 − µ2 )
T = √ ∼ tn1 +n2 −2
Ŝ n11 + n2
1
assim, para n suficientemente grande, pelo Teorema Limite Central, a variável aleatória X que conta o
número de sucessos na amostra terá a distribuição Normal com média np e variância np(1 − p), ou seja,
ˆ
X ∼ N (np; np(1 − p)). Assim, para n → ∞, pode-se considerar a distribuição amostral de p como:
( )
ˆ p(1 − p)
p ∼ N p; .
n
X
em que a proporção de indivı́duos portadores da caracterı́stica na amostra é dada por: p̂ = .
n
6.4 Intervalo de Confiança ROSSI, R. M. 66
já que
X̄ − µ
Z= σ ∼ N (0; 1) .
√
n
Exemplo 6.4. Sabe-se que o peso dos recém-nascidos segue uma distribuição normal com um desvio padrão
de 0,75 kg. Se em uma amostra aleatória simples de 100 deles, se obtém uma média amostral de 3 kg e um
desvio padrão de 0,5 kg, o IC(µ) com uma confiança de 95% é dado por:
σ 0, 75
IC(µ) : X̄ ± Z α2 √ = 3 ± 1, 96 √ = 3 ± 0, 147 : [2, 853; 3, 147]kg.
n 100
No caso de amostras pequenas ou no desconhecimento da dispersão populacional, usa-se uma aproximação
através da distribuição t de Student, substituindo σ por s, desvio-padrão amostral.
s
IC(µ) : X̄ ± t(n−1; α2 ) √ .
n
Exemplo 6.5. Suponha o exemplo anterior em que não se conheça a dispersão populacional, assim o IC(µ)
com uma confiança de 95% é dado por:
s 0, 5
IC(µ) : X̄ ± t(n−1; α2 ) √ = 3 ± t(99;2,5%) √ = 3 ± 1, 98(0, 05) : [2, 901; 3, 099]kg.
n 100
6.4 Intervalo de Confiança ROSSI, R. M. 67
Exemplo 6.8. Com objetivo de conhecer algumas caracterı́sticas dos pacientes de uma clı́nica com 35
pacientes. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas
caracterı́sticas da população de pacientes. Qual deve ser o tamanho mı́nimo da amostra aleatória simples,
tal que se possa admitir, com alta confiança, que os erros amostrais não ultrapassem 4% (E0 = 0,04)?
35(625)
n= ≃ 34.
35 + 624
Exemplo 6.9. Suponha que na clinica do Exemplo anterior a população fosse de N = 200 pacientes. Qual
deve ser o tamanho mı́nimo da amostra aleatória simples, tal que se possa admitir, com alta confiança, que
os erros amostrais não ultrapassem 4% (E0 = 0, 04)?
Solução: O valor de n0 continua sendo o mesmo do exemplo anterior, pois não depende de N . Fazendo
a correção em termos do novo valor de N , tem-se:
200(625)
n= ≃ 152.
200 + 624
Exemplo 6.10. Suponha agora que a população fosse de N = 200.000 pacientes.
6.5 Tamanho da Amostra ROSSI, R. M. 69
Solução: Da mesma forma, o valor de n0 continua sendo o mesmo dos exemplos anteriores. E a correção
em termos do novo valor de N , é:
200.000(625)
n= ≃ 623 pacientes.
200.000 + 624
Observe que para manter o mesmo erro amostral, no Exemplo ?? foi necessária uma amostra abrangendo
quase 100% da população; enquanto no Exemplo 6.9 a amostra abrange 76%; e no Exemplo 6.10 abrange
0,3% da população. É, portanto, errônea a idéia de que para uma amostra ser representativa
deva abranger uma percentagem fixa da população.
Tamanho da amostra em subgrupos da população
É muito comum termos interesse em estudar separadamente certos subgrupos da população. Nesta
situação, é preciso calcular o tamanho da amostra para cada uma destas partes. O tamanho total da
amostra vai corresponder à soma dos tamanhos das amostras de cada parte.
O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos
subgrupos da população, por isso, é comum o pesquisador não ser muito exigente na precisão das estimativas
nos subgrupos, tolerando erros amostrais maiores.
H0
Decisão Verdadeira Falsa
Correto
Não Rejeitar Erro tipo II: β
Probabilidade: (1 − α)
Correto
Rejeitar Erro tipo I: α
Probabilidade: (1 − β)
onde p̂0 e so são estimativas da proporção e da dispersão, respectivamente, obtidos através de uma amostra
piloto, ou de informações populacionais.
Exemplo 6.12. Suponha que, em uma amostra de 500 famı́lias que possuem aparelho de televisão em certa
cidade, haja 340 com televisor em cores. Se o objetivo é estimar o número de famı́lias que possuem televisor
em cores, qual o tamanho da amostra necessário para que tenhamos 95% de confiança em que o erro da
estimativa não seja superior a 0,02 ?
Solução: Trate as 500 famı́lias como uma mostra preliminar que fornece a estimativa p̂0 = 0, 68. Então:
[ ]2
Z α2
n = p̂0 (1 − p̂0 )
e
[ ]2
1, 96
= 0, 68(0, 32)
0, 02
≃ 2.090.
Para o caso em que a população é finita (N conhecido), onde a amostragem é sem reposição, temos as
fórmulas para o cálculo do tamanho amostral, respectivamente, para a média e para a proporção:
( )2
N Z α2 so
Média: n= ( )2 ;
(N − 1)e2 + Z α2 so
( )2 ( )2
N p̂0 q̂0 Z α2 N Z α2
Proporção: n= ( )2 ou n ≤ ( )2 se p̂0 for desconhecido.
p̂0 q̂0 Z α2 + (N − 1)e2 Z α2 + 4(N − 1)e2
Alternativamente, temos tanto para o caso em que estudamos variáveis quantitativas discretas, quanto
contı́nuas, utilizamos as fórmula descritas anteriormente, e tomamos n = n0 , e conhecendo N , o cálculo de
n, tamanho amostral poderá ser obtido através de:
N n0
n= .
N + (n0 − 1)
6.5 Tamanho da Amostra ROSSI, R. M. 71
Exemplo 6.13. Determinado trabalho, realizado para investigar a prevalência de hansenı́ase em trabalha-
dores rurais, apresentou um valor igual a 22%. Para estimar o tamanho da amostra para novo projeto sobre
hansenı́ase, desejamos um nı́vel de confiança de 95% e erro de amostragem de 5%. Determine n, o tamanho
da amostra necessária para uma população de tamanho N = 100.000.
Solução:
[ ]2
Z α2
n0 = p̂0 (1 − p̂0 )
e
[ ]2
1, 96
n0 = 0, 22(0, 78)
0, 05
n0 ≃ 264,
100.000(264)
n =
1 + 263
n ≃ 253.
Por definição o Poder do teste é: 1 − β e na prática, utilizam-se valores entre 80% a 90% no cálculo
dos tamanhos amostrais para a Média e para a Proporção, agora podem ser dados, respectivamente por:
[( ) ]2
Z α2 + Zβ s0
Média: n0 = ;
e
[ √ √ ]2
Z α2 p0 (1 − p0 ) + Zβ p1 (1 − p1 )
Proporção: n0 =
e
e = p1 − p0 ;
p0 : proporção presumida da população (referente a H0 );
p1 : é a alternativa ou proporção esperada na população.
Exemplo 6.14. Suponha que desejemos testar a hipótese nula H0 : µ = 180 mg/100 ml ao nı́vel de
significância α = 1%. Neste contexto µ é o nı́vel médio sérico de colesterol da população de homens de 20 a
74 anos. O desvio-padrão é σ = 46 mg/100 ml. Se uma amostra piloto indica que o nı́vel médio sérico de
colesterol é de 201 mg/100 ml (e = 201 − 180 = 21), queremos adotar um poder do teste de 95%. Qual o
tamanho da amostra para inferir em uma população de 1.500 indivı́duos?
[( ) ]2 [ ]2
Z α2 + Zβ s0 (2, 58 + 1, 65) 46
n0 = = n0 = ≃ 85,
e 201 − 180
Exemplo 6.15. A proporção de pacientes com câncer nos pulmões abaixo dos 40 anos no diagnóstico, que
sobrevivem pelo menos 5 anos é conhecida e igual a p0 = 8, 2%. Deseja-se testar essa hipótese baseado em
dados de uma amostra que acusou uma proporção de p1 = 20%. Qual o tamanho desta amostra, considerando
um nı́vel de confiança de 99% e um poder do teste com 95%?
[ √ √ ]2
Z α2 p0 (1 − p0 ) + Zβ p1 (1 − p1 )
n0 =
e
[ √ √ ]2
2, 57 0, 082(0, 918) + 1, 65 0, 2(0, 8)
n0 = ≃ 134.
0, 2 − 0, 082
Exemplo 6.17. Um ensaio clı́nico aleatório será realizado e para a determinação do tamanho das amostras,
n2
as seguintes informações foram utilizadas: α = 0, 05; β = 0, 10, ou seja, Zβ = 1, 28; r= = 2; p0 = 0, 40 e
n1
p1 = 0, 60; e = 0, 20, assim tem-se:
2
(1, 96 + 1, 28) (2 + 1)
n= ≃ 98.
(0, 2)2 2
Portanto, o grupo tratado deverá ter 98 indivı́duos, enquanto o grupo controle, o dobro : 196.
6.6 Testes de Hipóteses ROSSI, R. M. 73
Ao se testar uma hipótese, o que se deseja verificar é, através de uma estatı́stica obtida de uma amostra,
se a hipótese pode ou não rejeitada com o nı́vel de significância pré-fixado, α. Esta conclusão é tomada com
base na Região Crı́tica (RC: cuja área corresponde a α) que é construı́da de modo que:
1-alfa
alfa/2 alfa/2
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
-Zalfa/2 +Zalfa/2
2. Passo 2: Use a teoria estatı́stica e as informações para decidir qual a distribuição da estatı́stica
(estimador) que será utilizada no julgamento de H0 ;
Exemplos:
• para µ (n ≥ 30) • para µ (n < 30 ou σ desconhecido)
x̄ − µ x̄ − µ
Zc = √ ∼ N (0, 1) Tc = √ ∼ tn−1
σ/ n s/ n
• para p (supondo normalidade)
p̂ − p0
Zc = √ ∼ N (0, 1)
p0 (1 − p0 )
n
3. Passo 3: Escolher o nı́vel de significância α (erro tipo I) e utilizando as informações fornecidas pela
amostra para encontrar o valor do estimador do parâmetro (estatı́stica) que está sendo testado;
Dois tipos de erros podem ser cometidos em um TH:
H0
Decisão Verdadeira Falsa
Correto
Não Rejeitar Erro tipo II: β
Probabilidade: (1 − α)
Correto
Rejeitar Erro tipo I: α
Probabilidade: (1 − β)
6.6.2 O p-valor
O procedimento de teste de hipótese descrito acima fornece informação sobre a força da evidência contra
H0 obtida a partir dos dados. Isto é, é informado se o valor observado para a estatı́stica de teste que levou
à rejeição de H0 está próxima da fronteira da RC-região crı́tica ou RR-região de rejeição (baixa evidência
contra H0 ) ou se está muito afastada da fronteira (alta evidência contra H0 ).
O p-valor é a probabilidade de ocorrência do valor particular observado para a estatı́stica de teste ou de
valores mais extremos, na direção da região crı́tica, quando a hipótese nula H0 é verdadeira. Quanto maior
for a força da evidência contra H0 , menor será o p-valor.
6.6 Testes de Hipóteses ROSSI, R. M. 75
Desvio-padrão conhecido
• Caso 1. σ conhecido (σ!). Nessa situação a estatı́stica teste é a Z, isto é:
x̄ − µ
Zc = √ ∼ N (0, 1).
σ/ n
Exemplo 6.18. Deseja-se investigar se uma certa moléstia que ataca o rim altera o consumo de oxigênio
desse órgão. Para indivı́duos sadios, admite-se que esse consumo tem distribuição Normal com média 12
cm3 /min. Os valores medidos em cinco pacientes com a moléstia foram:
H0 : µ = 12
Ha : µ ̸= 12,
Desvio-padrão desconhecido e n ≥ 30
• Caso 2. σ desconhecido (σ?, n ≥ 30). Nessa situação a estatı́stica teste continua sendo a Z, porém
σ = s, isto é:
x̄ − µ
Zc = √ ∼ N (0, 1).
s/ n
Exemplo 6.19. Considere o Exemplo 6.18, e que não há conhecimento de σ, além disso o tamanho amostral
tivesse sido 50, refaça o teste ao nı́vel de 5%.
Solução: Sendo σ desconhecido e n = 50, usaremos s como seu estimador e a estatı́stica teste será:
x̄ − µ
Zc = √ ∼ N (0, 1)
s/ n
13, 9 − 12
= √
0, 82/ 50
( )
p-valor
= +16, 4 =0 .
2
Exemplo 6.20. Considere o Exemplo 6.18, e que não há conhecimento de σ, refaça o teste ao nı́vel de 5%.
Solução: Sendo σ desconhecido e n = 5, usaremos s como seu estimador e a estatı́stica teste será:
x̄ − µ
Tc = √ ∼ t(4)
s/ n
13, 9 − 12
= √
0, 82/ 5
= +5, 21 (p-valor = 0, 0066).
α 10% 5% 1%
Zα −1, 28 −1, 65 −2, 33
Neste tópico estudaremos a relação entre duas variáveis categóricas (ou qualitativas), onde as observações
podem ser classificadas em uma das várias categorias (nı́veis ou células) mutuamente exclusivas.
O problema de mensuração do grau de associação entre dois conjuntos de escores é de caráter bem
diferente do teste da simples existência de uma associação em determinada população. Naturalmente, há
interesse em avaliar o grau de associação entre dois conjuntos de escores referentes a um grupo de indivı́duos.
Mas é talvez de muito maior interesse podermos afirmar que determinada associação observada em uma
amostra de escores indica, ou não, probabilidade de associação entre as variáveis na população da qual se
extraiu a amostra (Siegel, 1956).
80
7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 81
Caso 1. Selecionar uma amostra de crianças aleatoriamente e examinar em que célula cada uma está
alocada, logo o único valor fixo será o total geral que será de 300. Mas os totais de colunas e de linhas
serão frutos da pesquisa, portanto, aleatórios, neste caso estamos frente a um teste de independência
de variáveis.
Porém ela pode fixar o número de alunos de acordo com seu desempenho.
Caso 2. Pegar uma amostra aleatória de tamanho 100 de cada grupo de alunos, logo os totais das
colunas serão fixos, mas os totais das linhas serão aleatórios e assim estaremos frente a um teste de
homogeneidade:
Os valores totais, das colunas e das linhas, são chamados de “totais marginais”. Quando os totais
marginais variam livremente, o teste de associação é chamado de independência, e quando
um dos conjuntos, linha ou coluna é fixado pelo pesquisador então é chamado de teste de
homogeneidade. Isso vai depender do pesquisador. No exemplo da educadora, observemos que para ela é
muito mais fácil fixar o número de alunos segundo seu desempenho, do que fixar pela participação dos pais,
que, apriori será quase impossı́vel.
Teste de Independência
Apresentaremos a lógica do teste com um exemplo bastante simples.
Exemplo 7.1. Suponha que 125 crianças foram expostas a três tipos de comerciais de TV, sobre cereais
para café da manhã. Após a exposição foi solicitado a cada criança para indicar qual dos comerciais ela
gostou mais. O que se deseja saber é se a escolha do comercial está relacionado ao gênero da criança: pois
suspeita-se de que o gênero pode estar influenciando na escolha do comercial. Os dados podem ser apreciados
na Tabela 7.3.
Contudo, essa análise fica prejudicada pela composição da amostra, que tem mais meninos do que me-
ninas. Portanto, a primeira coisa a fazer é analisar as estruturas percentuais, mostradas na Tabela 4.3, ou
seja retirar a influência da amostragem.
Tabela 7.4: Porcentagem para os valores absolutos de crianças por tipo de comercial escolhido e gênero
apresentados na tabela anterior.
Tipo de comercial
Gênero A B C Total
Meninos 71% 47% 76% 60%
Meninas 29% 53% 24% 40%
Total 100% 100% 100% -
Observe cuidadosamente a Tabela 7.4, onde 60% da amostra é composta por meninos. Se a preferência das
crianças pelos comerciais independe do gênero, esperarı́amos que a estrutura percentual para cada comercial
ficasse em torno de 60% para os meninos e 40% para as meninas, desvios grandes destes percentuais estariam
mostrando evidências de que existe alguma relação entre essas variáveis. Essa inspeção intuitiva, também,
pode ser feita analisando a estrutura dentro de cada gênero como mostra a Tabela 7.5.
Analisando a Tabela 7.5 observamos que as meninas tem uma forte preferência pelo comercial B, enquanto
que os meninos se dividem entre o comercial A e B.
Assim, intuitivamente percebemos que existe interferência do gênero na preferência, agora precisamos
saber até que ponto essas diferenças se devem ao acaso, ou a existência de associação entre as duas variáveis:
Ho : independência de variáveis
H1 : dependência de variáveis
Como deveriam ser os valores a serem observados se as variáveis fossem independentes?, ou dito de outra
forma, sob a hipótese de nulidade, de independência de variáveis, como deveriam ser os valores a serem
observados? A lógica nos diz que esses valores devem estar muito próximos da estrutura percentual global.
Esses valores são chamados de valores esperados.
Cada valor esperado será calculado supondo que a estrutura percentual global se mantenha em cada
coluna:
Tabela 7.6:
Valores percentuais Valores absolutos
Tipo de comercial Valores esperados
Gênero A B C Total Gênero A B C Total
e
Meninos 60% 60% 60% 60% Meninos 25 37 13 75
Meninas 40% 40% 40% 40% Meninas 17 25 8 50
Total 42 62 21 125 Total 42 62 21 125
Tabela 7.7:
Tipo de comercial
Gênero A B C Total
Oi = 30 Ei = 25,2 29 37,2 16 12,6
Meninos 75
di = +4,8 -8,2 +3,4
12 16,8 33 24,8 5 8,4
Meninas 50
-4,8 +8,2 -3,4
Total 42 62 21 125
Dentro de cada célula, no canto superior esquerdo colocamos o valor observado, no canto superior direito
o valor esperado (sob a hipótese de independência) e, na parte inferior, a distância entre o observado e o
esperado. Logo, se as variáveis fossem independentes, as distâncias entre os valores observados e esperados
deveriam ser muito pequenas, caso contrário haverá indı́cios de dependência. A pergunta agora é: quando a
distância é pequena ou grande? Para isto devemos calcular o valor (χ2 ) qui-quadrado da amostra:
∑k (observado − esperado)2 ∑k (O − E )2
i i
χ2amostra = =
i=1 esperado i=1 Ei
que terá uma distribuição chi-quadrado com graus de liberdade igual ao produto do número de linhas menos
um vezes o número de colunas menos um, isto é:
ν : graus de liberdade
χ2amostra ∼ χ2ν ⇒
ν : (no colunas - 1)×(no linhas - 1)
Para testar as hipóteses, temos a estatı́stica teste qui-quadrado com correção de continuidade de Yates:
( )2
∑
k |O − E | − 1
i i
2
χcY = 2
∼ χ2[L−1×C−1;(1−α)%] (Tabelas L × C)
i=1 Ei
7.2 Teste de Independência e de Homogeneidade ROSSI, R. M. 84
onde v = (2 − 1) × (3 − 1) = 1 × 2 = 2
Para aceitar ou rejeitar a hipótese devemos conhecero valor de χ2calculado na tabela qui-quadrado, com
dois graus de liberdade. Para α = 5%, o valor crı́tico é 5, 991, como o valor da amostra é maior que o valor
crı́tico, logo rejeitamos a hipótese nula, concluindo que o gênero interfere na preferência pelos comerciais.
No caso de dispormos de um pacote estatı́stico, este, via de regra, calcula o p-valor, nesse caso é só
comparar esse valor com o nı́vel de significância desejado. No nosso caso o p − valor = 0, 01058, ou seja,
rejeitamos ao nı́vel de 5% mas não ao nı́vel de 1%.
Obs.: Quando as variáveis são independentes (H0 ), as freqüências observadas tendem a ficar perto das
esperadas. Neste caso, o valor de χ2 deve ser pequeno.
Limitações do teste χ2 :
1. Infelizmente, o teste qui-quadrado não permite concluir como se dá a relação, uma vêz que ele testa
apenas a hipótese geral de que as duas variáveis são independentes. Examinando a distância entre
valor observado e esperado, por exemplo, observamos que as meninas tem uma maior preferência pelo
comercial B, porém não podemos concluir nada.
2. Uma outra limitação do teste qui-quadrado é que o valor esperado das células não deve ser menor ou
igual a 5 e devido a isso torna vulnerável a estatı́stica. Nesse caso usamos outra estratégia: o teste
exato de Fisher.
Teste de Homogeneidade
Quando testamos independência de variáveis, o pesquisador só controla o tamanho total da amostra, mas
os totais para cada coluna e linha são aleatórios.
Exemplo 7.2. No caso do exemplo anterior, os pesquisadores selecionaram aleatoriamente 125 crianças,
das quais 75 eram meninos e 50 meninas. Ele não fixou o numero de meninos e o número de meninas.
Vejamos um exemplo de teste de homogeneidade. Retomemos o exemplo inicial e suponhamos que a
professora fixou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes:
Tabela 7.8: Número de alunos segundo seu desempenho em Matemática e participação dos pais nas atividades
extra-escolares.
Desempenho em Matem.
Participação
Baixo Médio Alto Total
dos pais
Ativa 5 25 70 100
Fraca 95 75 30 200
Total 100 100 100 300
O Coeficiente de Contingência.
O coeficiente de contingência é uma medida do alcance da associação ou relação entre dois conjuntos de
atributos. Ele é calculado em função do valor calculado na tabela de contingência e independe de ordenação
das categorias das variáveis:
√
χ2
C= 2
, onde n é o tamanho da amostra.
χ +n
H0 : C=0
H1 : C ̸= 0
Se o p-valor associado for menor que alfa rejeitamos H0 e concluı́mos de que existe associação entre as
variáveis, caso contrário não.
Para facilitar a interpretação, usaremos uma modificação deste coeficiente. Chamaremos de k o menor
entre l (no de linhas da tabela) e c (no de colunas da tabela), isto é:
k = min{l; c}.
O valor C ∗ sempre estará no intervalo de 0 a 1. Será 0, somente quando houver completa independência e
será 1 quando houver associação perfeita. Valores de C ∗ próximos de 1 descrevem associação forte, enquanto
que valores de C ∗ próximos de 0 indicam associação fraca. Os valores de C ∗ em torno de 50% podem ser
interpretados como associação moderada.
Exemplo 7.4. Cálculo do coeficiente de contingência para os dados do exemplo anterior.
k = min{2; 3} = 2
√
k.χ2
C∗ =
(k − 1)(χ2 + n)
√
2.(9, 09818)
=
(2 − 1)(9, 09818 + 125)
= 0, 3684 ou 36, 84%.
Este resultado indica uma fraca associação entre X: preferência pelo comercial e Y: gênero.
Tabela 7.9: Presença de eosinófilos no escarro e tipo de doença pulmonar em 384 pacientes porto-alegrenses.
Grupo quanto a pneumopatia
Eosinófilos no escarro Grupo 1 Grupo 2 Grupo 3 Grupo 4 Total
Sim 142 26 32 28 228
Não 55 19 41 41 156
Total 197 45 73 69 384
{
H0 : Não existe associação entre Eosinófilos no escarro e pneumopatia;
Hipóteses :
Ha : Existe associação entre Eosinófilos no escarro e pneumopatia.
O teste χ2 de associação indica haver associação entre o tipo de pneumopotia e a ocorrência de eosinófilos
no escarro (χ2c = 30, 6465; p < 0, 001) ao nı́vel de 1%.
Uma conclusão simples de existência de associação é em geral insatisfatória para os pesquisadores, que
gostariam de entender melhor o tipo de associação observada. Para responder a esta indagação, existem
várias técnicas estatı́sticas; a análise de resı́duos é uma das mais interessantes.
A análise de resı́duos é usada como auxiliar na interpretação de dados organizados em tabelas L x C.
Por seu intermédio, é possı́vel avaliar como as diferentes caselas contribuem para o valor do χ2c .
Calcula-se inicialmente o resı́duo padronizado (R p ) para cada casela:
O−E
Rp = √ .
E
A seguir, cada resı́duo deve sofrer uma correção, passando a denominar-se resı́duo ajustado (Raj ) :
Rp
Raj = √( )( ).
1− TC
TG 1− TL
TG
Finalmente, os valores de Raj são comparados com valores crı́ticos da distribuição normal, por exemplo,
zα = 1,96, para um nı́vel de 5% de significância. Se Raj for maior do que zα , conclui-se que o valor
observado na casela (O) desvia-se significativamente (para mais ou para menos, conforme o sinal de Raj ) do
valor esperado (E).
Os resı́duos ajustados obtidos para os dados da Tabela 7.9, estão apresentados na Tabela 7.10. Na
primeira casela, o resı́duo ajustado foi obtido do seguinte modo:
O−E 142 − 117
Rp (Sim; G1) = √ = √ = +2, 311
E 117
Rp +2, 311
Raj (Sim; G1) = √( )( ) = √( )( ) = +5, 20.
1− TC
TG 1 − TT G
L
1− 197
384 1− 228
384
Como Raj = |+5, 20| > Z5% = 1, 96, conclui-se que o número de asmáticos que apresentam eosinófilos
no escarro foi significantemente maior (pois Raj é positivo) do que o esperado se as variáveis fossem inde-
pendentes. Portanto, existe associação positiva entre asma e presença de eosinófilos no escarro.
A interpretação dos demais resı́duos ajustados é feita do mesmo modo, após compará-los com Zα . Por
exemplo, no Grupo 3 a freqüência de indivı́duos com eosinófilos no escarro é significantemente menor do que
o esperado ao acaso (Raj = |+3, 00| > 1, 96).
Na Tabela 7.10 há seis resı́duos significativos. Cambinando este resultado com as percentagens observadas
na Tabela 7.9, a conclusão geral é a de que indivı́duos com eosinófilos no escarro são mais freqüentes entre os
asmáticos (142/197 = 72%) e menos comuns em pacientes dos Grupos 3 (44%) e 4 (41%). Em pacientes do
Grupo 2, a percentagem de pessoas com eosinófilos no escarro (58%) não diferem significativamente daquela
observada para o total da amostra (59%).
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 87
Tabela 7.10: Resı́duos ajustados (Raj) obtidos para os dados da tabela anterior. Os valores com (*) são
significativos ao nı́vel de 5%.
Grupo quanto a pneumopatia
Eosinófilos no escarro Grupo 1* Grupo 2 Grupo 3* Grupo 4*
Sim 5,20 -0,23 -3,00 -3,51
Não -5,20 0,23 3,00 3,51
RA = IE − IN E
Risco Atribuı́vel na População (RAP%): expresso em porcentagem, é uma medida de associação que
depende da ocorrência do fator de risco na população (é o excesso de risco na população devido ao fator de
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 88
risco)
IN − IN E (RR − 1)p
RAP % = =
IN (RR − 1)p + 1
onde IN : é a incidência global nos expostos e não expostos e p: prevalência do fator de risco.
No estudo de coorte é bastante natural pensar na razão entre a proporção dos que desenvolveram a
doença dentre os pacientes expostos e a proporção análoga entre os pacientes não-expostos. Observando a
disposição dos grupos na Tabela 7.11 a seguir,
Tabela 7.12: Resultados de casos de diagnóstico pré-natal segundo a idade da gestante e a presença ou
ausência de aberração cromossômica.
Doença Fator (Idade em anos) Total
(Exposto) (Não-exposto)
(Aberração)
≥ 40 35 − 40
Presente 18 10 28
Ausente 510 447 957
Total 528 457 985
1. o risco de um nascituro ter aberração cromossômica, dado que a gestante tem 40 anos ou mais (IE ):
18
IE = = 0, 0341 ou 3, 41%.
528
2. o risco de um nascituro ter aberração cromossômica, dado que a gestante está na faixa etária de 35
até 40 anos (IN E ):
10
IN E = = 0, 0219 ou 2, 19%.
457
3. a incidência global (I N ) :
10 + 18
IN = = 0, 0284 ou 2, 84%.
985
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 89
6. o Risco Relativo (RR) é a razão entre duas probabilidades condicionais (ou dois riscos condicionais).
Com base na Tabela 7.12, tem-se o risco relativo
3, 41
RR = = 1, 56.
2, 19
Este resultado mostra que o risco de um nascituro apresentar aberração cromossômica é 1,56 maior se a
gestante tiver 40 anos ou mais do que se a gestante estiver na faixa etária de 35 até 40 anos.
onde χ2c é o valor da estatı́stica teste calculada através dos dados na tabela de contingência formada.
Exemplo 7.7. Dos dados da Tabela 7.12, para RR = 1,56, podemos obter seu respectivo IC(RR), já que
χ2c = 1, 32 e para um nı́vel de significância de 5%, o valor de Z5% = 1, 96 :
1, 96
1± √
IC(RR) = 1, 56 1, 32
= 1, 561±1,71
IC(RR) : [0, 73; 3, 34]
Observação: Este intervalo não incluindo a unidade, isto é, (o no 1) possibilita-nos rejeitar H0 : ”Não
existe associação entre as variáveis”.
Para o exemplo portanto, concluimos que existe associação entre idade e aberração cromossômica, isto
é, a idade é realmente um fator de risco para a doença em estudo.
Também pode ser definida como a chance de exposição entre indivı́duos doentes dividia pela chance de
exposição entre os não-doentes, isto é:
P (exposto|doente)
1−P (exposto|doentes)
OR = P (exposto|não-doente)
.
1−P (exposto|não-doentes)
Método B: Alternativamente podemos por razões teóricas obter o IC(OR), já que muitas vezes a variação
de ψ é mais facilmente calculada na escala logarı́tmica. Vale o seguinte resultado:
1 1 1 1
V ar(ln ψ̂) = + + + .
a b c d
Como lnψ tem aproximadamente distribuição gaussiana, construı́mos intervalos de confiança para lnψ̂:
[ √ ]
ln[IC(OR)] = [Li ; Ls ] = ln ψ̂ ± Zα V ar(ln ψ̂) .
Obs.: Se este intervalo contém o número 0 (zero) (correspondente ao valor 1 para o RR) então a associação
entre a doença e o fator pode ser verificada.
Para obter o intervalo de confiança para ψ basta exponenciar os limites do intervalo acima, isto é:
[ ]
IC(OR) = eLi ; eLs .
Exemplo 7.8. Amamentação na infância e câncer de mama.
Para verificar se o fato de ter sido amamentado pela mãe é um fator de proteção para o câncer de mama,
Freudenheim et al. (1994) realizaram estudo do tipo caso-controle nos condados de Erie e Niágara situados
na parte oeste do estado de New York (EUA).
As pacientes tomadas como controle foram escolhidas na população da região, não existindo portanto o
emparelhamento. Os dados obtidos estão apresentados na Tabela 7.13.
O risco de desenvolver câncer de mama entre mulheres amamentadas pela mãe, aproximado pela razão
de chances (odds-ratio), é estimado por
353 × 153
OR : ψ̂ = = 0, 69
175 × 449
ou seja, nominalmente, o risco do grupo amamentado é apenas 69% do risco do grupo não-amamentado.
Para obtermos um intervalo com 95% de confiança para ψ temos os métodos A e B:
Método A:
1, 96
1± √
IC(OR) = 0, 69 8, 16
= 1, 561±0,69
IC(OR) : [0, 53; 0, 89]
7.4 Medidas do Efeito em Tabelas 2×2 ROSSI, R. M. 91
Método B:
ln ψ̂ = ln(0, 69) = −0, 37
1 1 1 1
V ar(ln ψ̂) = + + + = 0, 02
353 175 449 153
√
ou seja, a estimativa do desvio-padrão de ln ψ̂ é 0, 02 = 0, 14. Um intervalo de 95% de confiança para ln ψ
é portanto
−0, 37 ± 1, 96.(0, 14)
ou
ln[IC(OR)] = [−0, 64; −0, 10] .
Observe que o número 0 (zero) não pertence ao intervalo, onde concluı́mos na existência de associação
entre as variáveis (Rejeitamos H0 ).
O intervalo para ψ é então obtido tomando-se o exponencial dos limites inferior e superior deste intervalo,
ou seja:
IC(OR) = [0, 53; 0, 89]
indicando uma associação significativa entre ter sido amamentada e câncer de mama (1 ∈ / IC).
Esse resultado deve ser interpretado com cuidado, uma vez que não foram considerados fatores impor-
tantes, como história familiar e idade na primeira gestação. De fato, ao ajustar o modelo incorporando essas
variáveis, a associação deixou de ser significativa.
Capı́tulo 8
8.1 Introdução
Às vezes, é preciso comparar duas populações. Por exemplo, imagine que um pesquisador obteve, para
um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos
e meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Outras vezes, é preciso comparar condições experimentais. Por exemplo, para saber se um tratamento
tem efeito positivo, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (é o
grupo tratado), enquanto o outro não recebe o tratamento (é o grupo controle).
O efeito do tratamento é dado pela comparação dos dois grupos.
Freqüentemente, para comparação de dois tratamentos observam-se caracterı́sticas ou mede-se o valor da
variável resposta de interesse que as caracterı́sticas importantes dos indivı́duos que integram o mesmo par
sejam tão semelhantes quanto possı́vel. O tratamento é administrado a um dos elementos do par e o outro é
mantido como controle. A vantagem do procedimento é clara. Os indivı́duos no par são semelhantes, exceto
no que se refere ao tratamento recebido. Em algumas situações o par é constituı́do do mesmo indivı́duo em
duas ocasiões diferentes (amostras dependentes).
A suposição de Normalidade é necessária em alguns testes estatı́sticos. Nesta seção apresentaremos alguns
testes de normalidade assim como algumas técnicas gráficas, afim de que possamos verificar a normalidade
dos dados (No caso afirmativo optamos por testes paramétricos).
Grandes discrepâncias entre as freqüências relativas observadas e as probabilidades teóricas acima citadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.
• Testes de aderência
92
8.2 Normalidade dos Dados ROSSI, R. M. 93
Este último, tem sido muito utilizado para dados amostrais devido a sua capacidade de adaptação a uma
variada gama de problemas sobre avaliação de normalidade.
{
H0 : Os dados são normalmente distribuı́dos;
T.H.
Ha Os dados não são normalmente distribuı́dos.
Outros critérios:
• Técnicas Gráficas
1. Normal-plot
2. Q-Q-plot
3. P-P-plot
1-alfa
alfa/2 alfa/2
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
xxxxxx
-Zalfa/2 +Zalfa/2
Observação: Como em geral se trabalha com amostras, então o uso dos Intervalos de Confiança, con-
siderando a DISTRIBUIÇÃO AMOSTRAL DA MÉDIA, é mais adequada para obtenção dessas Faixas de
Referências.
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 94
Exemplo 8.1. Faixa de referência para identificar o Pseudomonas sp (continuação do Exemplo 6.3).
Observe através da Figura 6.8o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição normal.
Para a Amostra 1, foram realizados os testes de normalidade e indicaram ajuste dos dados já que p −
Lillief ors > 0, 20 e p − W ilks = 0, 8892. (Software Statistica).
Observe através da Figura 6.9 uma assimetria do Histograma comparado à normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
normal.
Os testes confirmam isto: Para a Amostra 2 obtemos p − Lillief ors < 0, 01 e p − W ilks < 0, 000013.
• n < 40 ou Ei ≤ 5
Para testar as hipóteses acima citadas temos a estatı́stica teste qui-quadrado com correção de continuidade
de Yates, temos
( )2
n |ad − bc| − n2
2
χcY = ∼ χ21;(1−α)% (Tabelas 2 × 2)
n1 n2 m 1 m 2
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 95
Exemplo 8.2. Estudo sobre a associação entre o uso corrente de contraceptivos e o infarto de miocárdio.
Shapiro et al. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes são
mostrados na Tabela 8.3.
Tabela 8.3: Distribuição de uso de contraceptivo oral segundo grupo que sofreu ou não infarto do miocárdio.
Grupo Uso recente Total
Sim Não
Casos 9 12 21
Controles 33 390 423
Total 42 402 444
Entre os casos, ou seja, entre as pacientes que tiveram um infarto do miocárdio, a proporção de uso recente
9 33
de contraceptivos é = 0, 43 e entre os controles, = 0, 08. A diferença entre estas duas proporções
21 423
(0,35) parece indicar que o uso de contraceptivos orais é mais freqüente entre os casos (infartos). Mas será
que este resultado não ocorreu por mero acaso?
A expressão χ2c = 24, 76 > 3, 84 = χ21;95% , nos indica, com alto grau de confiança (95%) afirmar que existe
associação entre o uso de contraceptivos orais e infarto do miocárdio para pacientes entre 30 e 34 anos.
∑
1
Sendo p = pi , temos
i=0
12!10!8!14!
p1 = = 0, 024.
7!5!1!9!22!
e
assim
12!10!8!14!
p0 = = 0, 0015.
8!4!0!10!22!
O valor de p será 0, 024 + 0, 0015 = 0, 0255 (p-valor : 0,0263).
Como este p é menor que o nı́vel de significância, para α = 0, 05 a decisão correta será rejeitar H0 , isto
é, pode-se concluir que há diferença quanto à mortalidade em relação ao tipo de tratamento, sendo B mais
eficáz.
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 96
Exemplo 8.4. Suponha um grupo de dezesseis ratos, divididos em dois grupos, experimental e normal. O
grupo experimental é formado por 9 animais geneticamente modificados, por apresentarem uma disfunção
pancreática com diminuição da capacidade de produção de insulina. Imagine que, após um ano e meio em
ambiente controlado, o número de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela
8.6):
Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos, enquanto a so-
brevida para o grupo experimental é de apenas 11%.
O teste exato de Fisher consiste em elaborar, com base nos totais marginais do fator discriminante da
tabela original, duas outras tabelas, que serão denominadas tabelas ou matrizes extremas, X1 e X2 . A matriz
extrema 1 é a matriz em que todos os animais mortos pertencem ao grupo normal (são 10 mortos, mas o
grupo normal tem 7 ratos, logo, os outros 3 que morreram pertencem ao grupo experimental) e todos que
sobraram do grupo experimental estão vivos (todos os vivos, pois sobraram 9-3 = 6 ratos). Desta forma,
resulta na Matriz X1 (Tabela 8.7):
A matriz extrema 2, X2 , corresponde a uma tabela com os mesmos totais marginais, mas com todos os
animais vivos no grupo normal. Então, pela matriz X2 (Tabela 8.8):
Observe que existe um óbito no grupo normal, pois o número de ratos do grupo normal é maior que o de
ratos que sobreviveram. Obviamente, os 9 mortos que restaram pertencem ao grupo experimental. Nenhum
rato do grupo experimental sobreviveu.
Finalmente, o valor de significância para o teste é calculado segundo a fórmula apresentada anteriormente:
Para a matriz original:
7!.9!.10!.6!
F0 : = 0, 02360
2!.5!.8!.1!.16!
Para a matriz X 1 :
7!.9!.10!.6!
FX1 : = 0, 0105
0!.7!.6!.3!.16!
Para a matriz X 2 :
7!.9!.10!.6!
FX2 : = 0, 0009
6!.1!.0!.9!.16!
8.3 Resposta Dicotômica: Amostras Independentes ROSSI, R. M. 97
Finalmente,
Ou seja, a afirmação de que a sobrevida dos ratos geneticamente alterados é menor que a dos ratos
normais envolve uma probabilidade de erro de 3,5%. Portanto, ao nı́vel de 5% de significância, rejeita-se a
hipótese de nulidade (ou seja, de que as vidas dos ratos normais e dos transgênicos são iguais).
H0 : p1 = p2
Ha ̸ p2
: p1 =
0, 76 − 0, 66
Z=√ = 2, 22 (p-valor : 0,0281).
0,76(1−0,76) 0,66(1−0,66)
200 + 200
Fixando-se o nı́vel de significância em 5%, rejeita-se H0 . Portanto, pode-se concluir que as duas pı́lulas
não são igualmente efetivas. Há indicação de que a pı́lula A oferece maior proteção contra náusea comparada
à pı́lula B.
8.4 Resposta Dicotômica: Amostras Pareadas ROSSI, R. M. 98
É importante observar que a unidade de análise aqui é o tumor, avaliado por dois patologistas. Embora
tenham sido feitas 200 análises, o total de tumores é, na realidade, apenas 100.
Além disto, alguns tumores serão claramente mais malignos do que outros e, portanto, a hipótese funda-
mental na construção do teste de probabilidade constante de malignidade não é razoável aqui. Isto explica
a necessidade de desenvolvimento de teste especı́fico, isto é, para dados pareados.
Os dados a serem analisados no processo de comparação podem ser resumidos no formato da Tabela 8.10.
H0 : Os patologistas tem o mesmo diagnóstico.
Johnson & Johnson (1972), ao analisarem retrospectivamente a história clı́nica de pacientes de doença de
Hodgkin, um tipo de câncer no tecido linfóide, não encontraram evidências que sustentassem a hipótese de
que a amigdalectomia aumenta a suscetibilidade à doença, pela remoção da ”barreira linfática” representada
pela amı́gdala. Neste estudo, usaram um planejamento do tipo caso-controle pareado. A conclusão relatada
no artigo foi feita, entretanto, com uma análise apropriada para dados provenientes de grupos independentes.
Logo após a publicação, vários autores observaram a impropriedade da análise e, utilizando as informações
do artigo, fizeram a análise correta, que é baseada nos dados da Tabela 8.11.
Tabela 8.11: Distribuição de pacientes com e sem doença de Hodgkin em um estudo caso-controle pareado
segundo à amigdalectomia.
Doença de Controle Total
Hodgkin Operados Não operados
Operados 26 15 41
Não operados 7 37 44
Total 33 52 85
8.5.1 Teste t
Se a variável em análise tem distribuição normal ou aproximadamente normal, aplica-se o teste t para
comparar duas médias. Mas primeiro é preciso estabelecer o nı́vel de significância, α. Depois, dados os dois
grupos, 1 e 2, calculam-se:
a) as médias de cada grupo:
x̄1 : média do grupo 1
x̄2 : média do grupo 2
b) as variâncias ou os desvios-padrões de cada grupo:
s1 : desvio-padrão do grupo 1
s2 : desvio-padrão do grupo 2
c) a variância ponderada:
concluir que, em média, as perdas de peso de pacientes submetidos aos dois tipos de dieta são diferentes.
Em termos práticos, a perda de peso é maior quando os pacientes são submetidos à dieta 2.
8.5.2 Teste z
Um pressuposto importante para aplicar o teste t visto anteriormente é que os dois grupos comparados
tenham a mesma variabilidade, o que nem sempre acontece na prática. No caso de amostras grandes (n1 e
n2 ≥ 30) dispomos de um teste em que não é necessário qualquer suposição adicional sobre σ 21 e σ 22 , ou seja,
as varâncias podem ser iguais ou diferentes.
A estatı́stica teste usada será:
x̄1 − x̄2
Zc = √ ∼ N (0, 1).
s21 s22
+
n1 n2
Tabela 8.13: Média e desvio-padrão da pressão sangüı́nea (mmHg) segundo o tipo de anestesia.
Informações Anestesia
sobre a amostra Halotano Morfina
Média 66,9 73,2
Desvio-Padrão 12,2 14,4
n 61 61
isto é, devemos testar a diferença entre as pressões sangüı́neas médias de indivı́duos anestesiados com halotano
ou morfina.
8.6 Resposta Contı́nua - Teste de Médias para Amostras Pareadas ROSSI, R. M. 102
Como as amostras são grandes, podemos usar o teste Z, cujo valor da estatı́stica do teste é:
66, 9 − 73, 2 6, 30
Zc = √ = −√ = −2, 61 (p-valor : 0,0103).
2
12, 2 14, 4 2 5, 84
+
61 61
Adotando um nı́vel de siginificância de 5%, o resultado é estatisticamente significativo, já que | − 2, 61| >
1, 96, indicando que os dois anestésicos não são equivalentes.
Exemplo 8.10. São dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento.
Para fazer o teste, é preciso primeiro estabelecer o nı́vel de significância. Seja α = 1%,
30
d¯ = − = −3, 33
9
s2 = 25
logo
−3, 33
tc = √ = −2, 0 (p-valor : 0,080516).
25
9
Ao nı́vel de siginificância de 1% com g.l. = 8, o valor de t tabelado para t8;1% .é de 3,36. Como o valor
absoluto de tc (2,0) é menor do que o valor da tabela, concui-se que o tratamento não tem efeito significativo.
Em termos práticos, o experimento não provou que a dieta emagrece.
8.7 Testes Não-Paramétricos ROSSI, R. M. 104
Uc = mı́n{U1 ; U2 }
Obtemos uma estatı́stica tabelada : UT = Uα,n1 ,n2 e concluı́mos para a rejeição de H0 se UT ≥ Uc .
ni (n1 + n2 + 1)
µ∗ = , sendo ni = min{n1 ; n2 }
√ 2
n1 n2 (n1 + n2 + 1)
e σ∗ = ,
12
considerando w = min{T1 ; T2 } tem-se a expressão:
w − µ∗
Z= ∼ N (0, 1).
σ∗
8.7 Testes Não-Paramétricos ROSSI, R. M. 105
Exemplo 8.11. Verificar se os dados das duas amostras apresentam diferença significativa.
Procede-se à ordenação dos valores para obtenção dos seus postos e posteriormente seu somatório.
Temos então n1 = 8, n2 = 7, T1 = 85 e T2 = 35.
O valor de U1 e de U2 , respectivamente serão:
8(8 + 1)
U1 = 8(7) + − 85 = 7
2
7(7 + 1)
U2 = 8(7) + − 35 = 49.
2
Assim
Uc = mı́n{7;49} = 7
O valor da estatı́stica tabelada (Anexo) será de:
Como o valor de |Z| é maior do que Zα , quando α = 5%, ou seja, o valor 1,96, rejeitamos H0 . Considera-se
que as amostras diferem entre si ao nı́vel de 5% de significância.
Os valores obtidos nas diversas amostras diferem entre si e portanto, será uma maneira de verificar se
estas diferenças são devidas ao acaso ou se as amostras provém de populações diferentes.
Da mesma forma que nos outros testes, serão consideradas as hipóteses nula (H0 ) e alternativa (Ha ), isto
é:
Questões: Há diferença sifnificativa entre os tempos de sobrevivência? Qual o tratamento recomendado
baseado no tempo de sobrevida?
Independentemente do número de observações em cada grupo e utilizando os números naturais, procede-
mos à ordenação dos valores. Assim os valores acima receberiam a seguinte numeração, conforme os valores
já entre parênteses.
Então:
12 ∑k T2
HK−W = i
− 3(N + 1)
N (N + 1) i=1 ni
12 ∑3 T2
= i
− 3(23 + 1)
23(23 + 1) i=1 ni
[ ]
1 572 69, 52 149, 52
= + + − 72
46 7 8 8
1
= (3861, 7) − 72
46
= 11, 95 (p-valor : 0,0025).
Como HK−W ∼ χ2(k−1) , então H ∼ χ2(3−1) ⇒ χ22;5% = 5, 99 e χ22;1% = 9, 21, portanto, considerando que
o valor encontrado de HK−W = 11, 95 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 e conseqüentemente, pela indicação de que o tratamento cirúrgico
se destaca dos demais, pois apresenta maiores valores aos tempos de sobrevida.
8.7 Testes Não-Paramétricos ROSSI, R. M. 107
Tc = min{|T− |; |T+ |}
Tα;n
Tem-se:
assim
Tc = min{9, 5; 26, 5} = 9, 5
consultando-se a Tabela de Wilcoxon, verifica-se que Tα;n = T5%;5 = 5 < 9, 5 (no Statistica o p-valor :
0,234).
Assim, não rejeitamos H0 , ou seja, que os valores comparados, referentes às drogas A e B, não apresentam-
se com diferença siginificativa. Conclui-se, então, que os valores de nı́veis de anticorpos em relação aos dois
tipos de drogas se comportam de forma semelhante.
Tc = min{99; 6} = 6
Tα;n = T5%;14 = 21
14(14 + 1)
6−
∗
W =√ 4 = −2, 92 (p-valor : 0,003).
14(14 + 1)(2.14 + 1)
24
Considerando que o valor de W ∗ = −2, 92 está na área de rejeição de H0 , para o valor de Z5% = ±1, 96,
rejeitamos H0 , ou seja, os valores dos dois conjuntos apresentam diferenças significativas.
12 ∑k
HF r = T 2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1 i
Exemplo 8.15. São prescritos quatro procedimentos técnicos para determinação de certa variável. Foram
formados cinco blocos e obtidos os seguintes valores:
12 ∑4
HF r = . Ti2 − 3.5(4 + 1)
5.4(4 + 1) i=1
12
= . [121 + 196 + 400] − 75
100
= 14, 04 (p-valor : 0,00285).
Como HF r ∼ χ2(k−1) , então HF r ∼ χ2(4−1) ⇒ χ23;5% = 7, 82 e χ23;1% = 11, 34, portanto, considerando que
o valor encontrado de HF r = 14, 04 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 , logo verifica-se que há diferença significativa entre as medidas dos
tratamentos. O tratamento C apresentou melhores resultados em relação aos demais grupos.
8.7 Testes Não-Paramétricos ROSSI, R. M. 110
Cálculos auxiliares:
Tabela 8.21: Teste Kappa para a concordância entre patologistas quanto ao grau de lesão do tecido hepático.
Cobaia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Patologista 1 + + + + + + - + + + + + + - - + - + + -
Patologista 2 + + - + + + - - + + - + + - - - - - + -
Teste de Cochran
O teste de Cochran é utilizado quando se deseja comparar tratamentos distintos aplicados a uma mesma
amostra (medidas repetidas), o que caracteriza a dependência ou o pareamento das unidades amostrais em
que a resposta é da forma 0 ou 1, isto é, sucesso ou fracasso. O teste de Cochran é uma extensão do teste
de McNemar.
A hipótese a ser testada será:
H0 : Os tratamentos não diferem entre si;
Ha : Pelo menos um par de tratamentos diferem entre si.
Estatı́stica teste:
∑k
2
k(k − 1) (Ti ) − (k − 1)N 2
i=1
Q= ∑n ∼ χ2k−1 .
2
kN − (Sj )
j=1
Tabela 8.23: Teste de Cochran: Dez indivı́duos submetidos a quatro tratamentos supostamente homogêneos.
Tratamentos
2
Indivı́duos T1 T2 T3 T4 Sj (Sj )
1 1 1 1 1 4 16
2 1 0 0 1 2 4
3 1 0 1 0 2 4
4 1 1 1 0 3 9
5 0 0 0 0 0 0
6 0 1 1 1 3 9
7 1 0 1 1 3 9
8 0 0 1 0 1 1
9 1 1 1 0 3 9
10 0 1 0 0 1 1
Ti 6 5 7 4 22 62
2
(Ti ) 36 25 49 16 126 -
Assim tem-se:
∑
4
2
4(4 − 1) (Ti ) − (4 − 1)(222 )
i=1
Q =
∑
10
2
4(22) − (Sj )
j=1
logo não se rejeita H0 .Concluı́-se que os tratamentos não diferem entre si ao nı́vel de 5% de significância.
Observação: Em caso de rejeição da hipótese nula, um procedimento de comparações múltiplas deve
ser realizado (ver CASTELLANOS e MERINO, 1989).
Capı́tulo 9
Análise de Variância
Às vezes é preciso comparar médias de mais de duas populações. Por exemplo, para verificar se pessoas
com diferentes nı́veis de renda, isto é, alto, médio e baixo têm, em média, o mesmo peso corporal, é preciso
comparar médias de três populações.
Outras vezes, é preciso comparar várias situações experimentais. Por exemplo, se um pesquisador separa,
ao acaso, um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo, terá que
comparar médias de quatro “populações”.
Para comparar médias de mais de duas populações normais ou aproximadamente normais, aplica-se o
teste F. Neste caso convém verificar antecipadamente a normalidade dos dados.
Por exemplo, imagine que 4 amostras casuais simples, todas com cinco elementos mas cada uma prove-
niente de uma população, conduziram aos dados apresentados na Tabela 9.1.
Será que as diferenças das médias das amostras são suficientemente grandes para que se possa afirmar
que as médias das populações são diferentes? Para responder a esta pergunta, é preciso um teste estatı́stico.
113
9.1 ANOVA para Experimentos ao Acaso ROSSI, R. M. 114
1. os graus de liberdade:
(a) de tratamento: k − 1
(b) de total: n − 1
(c) de resı́duo: (n − 1) − (k − 1) = n − k
2. o valor C, dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O valor C é
chamado correção. ∑
( x)2
C=
n
3. a soma de quadrados total: ∑
SQT = x2 − C
1. os graus de liberdade:
(a) de tratamento: k − 1 = 4 − 1 = 3
(b) de total: n − 1 = 20 − 1 = 19
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 20 − 4 = 16
2. o valor C: ∑
( x)2 (11 + 8 + ... + 0)2
C= = = 500
n 20
3. a soma de quadrados total:
∑
SQT = x2 − C = 112 + 82 + ... + 02 − 500 = 658 − 500 = 158
Exemplo 9.2. Com base nos dados apresentados na Tabela 9.5 abaixo, verifique se existe diferença estatı́stica
entre os grupos. Note que são três grupos em comparação. No grupo operado foi feita a remoção das glândulas
salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cirúrgicos, mas nenhuma
glândula foi removida (Banco de dados: Tukey1 ex.stw).
Sol.: A tabela de análise de variância resume os cálculos:
Para aplicar o teste de Tukey ao nı́vel de significância de 5%, tem-se:
q3;21 ≃ 3, 57
e √
53, 247
dms = 3, 57 = 9, 21.
8
Os valores absolutos das diferenças de médias são:
A taxa de glicose é, em média, maior nos operados do que nos pseudo-operados, ao nı́vel de significância
de 5%.
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 117
Tabela 9.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias,
segundo o grupo.
Grupo
Operado Pseudo-operado Normal
96 90 86
95 93 85
100 89 105
108 88 105
120 87 90
110,5 92,5 100
97 87,5 95
92,5 85 95
Teste Dunnett
Em muitos experimentos, é comum a necessidade de se realizar múltiplas comparações, todas em relação
a um único grupo denominado “Controle”. Neste caso, o test Dunnett (1964) é apropriado.
Teremos (k − 1) comparações a serem realizadas em relação ao controle e queremos testas as seguintes
hipóteses:
H0 : µi = µc i = 1, 2, ..., k − 1
Ha ̸ µc c: controle
: µi =
onde:
dα,(k−1),f está tabelado (Tabela Dunnett) para k − 1 comarações e f : no de observações dos tratamentos
(exceto o controle);
QM R : proveniente da ANOVA (Quadrado Médio dos Resı́duos);
ni : no de observações do tratamento i;
nc : no de observações do controle;
x̄i e x̄c : médias, do tratamento e controle, respectivamente.
Exemplo 9.3. Deseja-se comparar o efeito de cinco drogas na diminuição da pressão arterial. Para isto
utilizou-se cinco grupos distintos e foram comparadas suas médias em relação a média de um grupo controle,
que recebeu placebo. Ao todo, 30 indivı́duos participaram no experimento. A Tabela abaixo apresenta os
valores referentes a diferença entre a pressão arterial no inı́cio e no fim do experimento (mmHg).
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 118
T12 T2 T2
SQT r = + 2 + ... + k − C
r1 r2 rk
onde C é a correção já definida anteriormente.
É mais fácil entender a aplicação de fórmulas através de um exemplo.
Exemplo 9.4. Análise de variância para os dados da Tabela 9.12.
1. os graus de liberdade:
(a) de tratamento: k − 1 = 3 − 1 = 2
(b) de total: n − 1 = 15 − 1 = 14
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 15 − 3 = 12
2. o valor C: ∑
( x)2 (15 + 10 + ... + 16)2
C= = = 4001, 67
n 15
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 119
Tabela 9.9: ANOVA para os dados de pressão arterial, em milı́metros de mercúrio, segundo o tratamento.
Causas da variação GL SQ QM F p
Grupos 5 2354,17 470,83 13,08 0,000003
Resı́duo 24 864 36
Total 29 3218,17
Teste Tukey
Para comparar as médias de tratamentos duas a duas, pode-se aplicar o teste de Tukey que, neste caso, é
aproximado, porque os tratamentos têm números diferentes de repetições. A diferença mı́nima significativa
(dms) é dada pela fórmula: √( )
1 1 QM R
dms = q +
ri rj 2
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 120
Os valores absolutos das diferenças entre as médias estão são apresentados a seguir. Como o valor
absoluto da diferença entre A e B é maior do que a respectiva d.m.s., conclui-se que, em média, A difere de
B, ao nı́vel de significância de 5%.
Existem diferentes testes de comparações múltiplas. Dentre eles destacam-se:
Teste t
A diferença mı́nima significativa é dada pela fórmula:
√ ( )
1 1
dms = t + QM R
ri rj
9.2 Teste de Comparações Múltiplas ROSSI, R. M. 121
Teste Dunnett
A diferença mı́nima significativa é dada pela fórmula:
√( )
1 1
dms = d + QM R
ri rj
Considerações
A escolha apropriada de um teste é muito flexı́vel. Se o pesquisador quer ter alta chance de rejeitar
H0 : de que as médias são iguais, pode optar pelo teste t ou pelo teste Duncan (Não apresentado neste
material-Ver Vieira, 1999). Estes dois testes têm caracterı́sticas similares, mas o teste t é mais antigo e,
talvez por isso, mais conhecido. Também é de aplicação mais fácil. Entretanto, o pesquisador também pode
optar por aplicar o teste de Tukey ou de Dunnett, com nı́vel de significância mais elevado. Estes testes
teriam, então, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder do que o teste de Tukey
a 5%.
Um pesquisador que pretende somente rejeitar a hipótese de que as médias são iguais com muita confiança,
deve optar pelo teste de Tukey ou de Dunnett, com baixo nı́vel de significância. Esta situação pode ocorrer
quando se comparam novas drogas terapêuticas com uma droga conhecida. Toda droga tem efeitos colaterais.
Então, muitas vezes só é razoável indicar uma nova droga - de efeitos colaterais desconhecidos - quando
existem indicações seguras de que essa nova droga é melhor do que a convencional.
De qualquer forma, fica aqui um alerta: todos os procedimentos para a comparações de médias têm
vantagens e desvantagens. Ainda não existe um teste definitivamente “melhor” que todos os outros.
Capı́tulo 10
Testes Diagnósticos
10.1 Introdução
Uma das experiências mais rotineiras da prática médica é a solicitação de um teste diagnóstico. Os objeti-
vos são vários, incluindo a triagem de paciente, o diagnóstico de doenças e o
acompanhamento ou prognóstico da evolução de um paciente. Para chegar ao diagnóstico, o médico considera
várias possibilidades, com nı́veis de certeza que variam de acordo com as informações disponı́veis.
Um dos objetivo deste capı́tulo é mostrar como se mede o nı́vel de certeza da ocorrência de um evento,
por exemplo: a presença de uma doença após a observação de um teste positivo. Consideraremos o teste
positivo quando indicar a presença da doença e negativo quando indicar a ausência.
Não existe teste perfeito, aquele que com certeza absoluta determina a presença ou ausência da doença.
Estudaremos os ı́ndices nos quais o conceito de qualidade de um teste diagnóstico é usualmente desmenbrado.
Frequentemente, um único teste não é suficiente, e portanto deve-se combinar dois ou mais testes. O
ideal seria que, para cada patologia, fossem determinados os testes a serem incluı́dos no processo diagnóstico
e a melhor forma de combiná-los. Apresentaremos as formas mais comuns de combinações de testes e como
medir a qualidade do teste conjunto.
O bom uso de um teste diagnóstico requer, além de considerações clı́nicas, o conhecimento de medidas
que caracterizam a sua qualidade intrı́nseca: a sensibilidade, a especificidade e os parâmetros que refletem
a sua capacidade de produzir decisões clı́nicas corretas: Valor da Predição Positiva e o Valor da Predição
Negativa.
Na análise da qualidade de testes diagnósticos, interessa conhecer duas probabilidades condicionais, que
por suas importâncias, recebem nomes especiais:
122
10.2 Sensibilidade e Especificidade ROSSI, R. M. 123
Tabela 10.2: Resultados da avaliação da aplicação do teste ergométrico de tolerância a exercı́cios em 1465
pacientes.
Doença Teste ergométrico Total
Coronariana Positivo (T+ ) Negativo (T− )
Presente (D+ ) 815 208 1.023
Ausente (D− ) 115 327 442
Total 930 535 1.465
A proporção bruta de concordância (poder preditivo ou acurácia) do exame pode ser calculada por
a+d
n = 815+327
1.465 ≃ 0, 7795 (77,95%). Dos 930 resultados positivos apresentados pelo exame, 815 estavam
corretos, ou seja, o poder preditivo positivo do exame foi 815 930 ≃ 0, 8763 (87,63%). Por outro lado,
dos 535 resultados negativos apresentados pelo exame, 327 estavam corretos fornecendo, assim, um poder
preditivo negativo de 327535 ≃ 0, 6112 (61,12%).
Tabela 10.3: Probabilidade necessárias para o cálculo dos ı́ndices VPP e VPN.
População Proporção Proporção com resultado
Positivo Negativo
Doente p ps p(1 − s)
Sadia 1−p (1 − p)(1 − e) (1 − p)e
Total p + (1 − p) ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e
Seja p = Pr(D+ ) a prevalência da doença na população de interesse, isto é, a proporção de pessoas
doentes, ou a probabilidade de doença pré-teste.
O valor de predição positiva é obtido dividindo-se a freqüência dos ”verdadeiros-positivos” (oriundos de
pacientes doentes), pelo total de positivos
ps
V PP = .
ps + (1 − p)(1 − e)
(1 − p)e
V PN = .
p(1 − s) + (1 − p)e
e
(1 − 0, 02) × 0, 74
V PN = = 99, 29%.
0, 02 × (1 − 0, 797) + (1 − 0, 02) × 0, 74
Portanto, o valor de predição positiva é baixo enquanto que o valor de predição negativa é bastante alto.
Se o resultado da ergometria for negativo, a chance de não haver uma doença coronária é de 99,29%.
Se, antes de qualquer informação, o paciente tinha uma chance de 2% de apresentar a doença, após o
resultado do teste negativo esta chance é de apenas 0,66% (1-0,9929).
Tabela 10.4: Valores da VPP, VPN, PFP e PFN para o teste ELISA para a detecção do HIV.
Prevalência VPP(%) VPN(%) PFP(%) PFN(%)
1/100.000 0,47 100,00 99,53 0,00
1/10.000 4,54 100,00 95,46 0,00
1/1.000 32,21 99,99 67,77 0,01
1/500 48,77 99,99 51,23 0,01
1/200 70,47 99,99 29,53 0,03
1/100 82,75 99,99 17,25 0,05
1/50 90,65 99,89 9,35 0,10
Tabela 10.5: Resultado do teste em paralelo dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em paralelo
- - -
- + +
+ - +
+ + +
sp = sA + sB − sA × sB .
Admitindo-se que os resultados dos dois testes são independentes, pode-se calcular a especificidade de
um teste em paralelo da seguinte forma:
ep = eA × eB .
10.5 Combinação de Testes Diagnósticos ROSSI, R. M. 127
Tabela 10.6: Resultado do teste em série dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em série
- desnecessário -
+ - -
+ + +
Como só serão aplicados dos testes se o primeiro for positivo, o custo desse tipo de combinação é menor.
Uma discussão sobre a ordem mais indicada para a aplicação dos testes a serem combinados em série pode
ser encontrada em Soares & Parenti (1995).
Se os dois testes A e B são independentes, a sensibilidade (ss ) e a especificidade (es ) par o teste combinado
em série são obtidos sa seguinte forma:
Portanto,
ss = sA × sB
e
es = eA + eB − eA × eB .
Para os cálculos da sensibilidade e especificidade da associação em série e em paralelo, a independência
dos dois testes é crucial. Entretanto, não se pode garantir que isto ocorra sempre. Quando os testes não
forem independentes, não há uma forma analı́tica simples para se obter tais ı́ndices para um teste composto.
Exemplo 10.4. Diagnóstico de câncer pancreático.
Imagine um paciente idoso com dores persistentes nas costas e no abdômen e perda de peso. Na ausência
de uma explicação para estes sintomas, a possibilidade de câncer do pâncreas é freqüentemente levantada.
É comum para se verificar esta possibilidade diagnóstica, que ambos os testes de ultrassom (A) e tomografia
computadorizada (B) do pâncreas sejam solicitados. A Tabela 10.7 apresenta dados hipotéticos sobre os
ı́ndices s e e dos testes, quando utilizados separadamente e em conjunto (Griner et al., 1981).
Tabela 10.7: Sensibilidade e especificidade dos testes de ultra-som e tomografia computadorizada no di-
agnóstico do câncer de pâncreas individualmente e em conjunto.
Teste Sensibilidade (%) Especificidade (%)
A: Ultra-Som 80 60
B: Tomografia 90 90
C: A ou B positivo 98 54
D: A e B positivo 72 96
10.5 Combinação de Testes Diagnósticos ROSSI, R. M. 128
Consideremos dois testes A e B com sensibilidade e especificidade apresentados na Tabela 10.7, supondo
uma prevalência de 1%, então teremos os seguintes valores: s, e, VPP e VPN.
Tabela 10.8: Sensibilidade, especificidade e valores de predição de testes individuais A e B e dos testes em
série e em paralelo considerando-se uma prevalência de 1%.
Teste s e VPP VPN
A 0,8000 0,6000 0,0198 0,9966
B 0,9000 0,9000 0,0833 0,9989
Paralelo 0,9800 0,5400 0,0211 0,9996
Série 0,7200 0,9600 0,1538 0,9971
A combinação em paralelo apresenta alta sensibilidade (0,98) mas sua especificidade é menor que a dos
testes isolados. Já a combinação em série apresenta alta especificidade (0,96) enquanto que a sensibilidade
é relativamente baixa comparada com testes isolados.
Como esperado, os valores de predição negativa são altos, tanto para os testes isolados como para as
duas formas combinadas dos testes. Entretanto, os valores de predição positiva não são altos, sendo que a
combinação em série proporcionou o melhor resultado (V P P = 0, 1538).
É importante lembrar que, na maioria das vezes, os testes usados na combinação são dependentes entre
si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ı́ndices dos testes combinados.
Nesse caso, não é possı́vel determinar os valores dos parâmetros de qualidade conhecendo-se apenas os valores
de cada teste em separado. Torna-se necessário um trabalho de pesquisa realizado em um grupo de pacientes
nos quais são utilizados o teste padrão (gold test) e teste combinado (DiMagno et al., 1977).
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 129
Tabela 10.9: Valores de predição (VPP e VPN) do teste Gonosticon Dri-Drot para quatro prevalências (p).
População p VPP VPN
A 0,500 0,940 0,830
B 0,100 0,640 0,980
C 0,020 0,250 0,990
D 0,001 0,020 1,00
Embora o teste tenha parâmetros de qualidades razoáveis, o VPP é baixı́ssimo para populações de baixa
prevalência, tornando o exame sem utilidade nessas condições.
Para simplificar o raciocı́nio sobre a escolha de testes diagnósticos, vamos inicialmente considerar duas
situações extremas, obviamente sem interesse prático, e depois vamos estender para situações mais gerais.
Suponhamos que p = 0, isto é, ninguém tem a doença, ou que p = 1, isto é, toda a população tem a doença
em questão. Facilmente chagamos nos valores apresentados na Tabela 10.10, para quaisquer valores de s e
e.
Tabela 10.10: Valores de predição (VPP e VPN) e proporção de resultados falsos (PFP e PFN) para casos
extremos de prevalências.
p VPP PFP VPN PFN
0 0 1 1 0
1 1 0 0 1
A extensão para o caso mais geral de p pequeno (doença rara) e p grande (doença comum) pode ser
feita pela análise das expressões já estudadas variando-se as quantidades envolvidas (s, e e p), mas nos
restringimos a apresentarmos uma análise numérica. A Tabela 10.11 mostra os valores de predição para
prevalências de 1% e 90%.
Quando a prevalência é baixa, o valor de predição positiva (VPP) é mais influenciado pela especificidade.
O valor de predição negativa (VPN) é pouco influenciado tanto pela sensibilidade quanto pela especificidade
e é alto, como era de se esperar.
Para a prevalência alta, o VPP é próximo de 1, independente dos valores da sensibilidade e da especifi-
cidade. Além disso, o VPN é influenciado mais pela sensibilidade do que pela especificidade.
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 130
Tabela 10.11: Valores de predição (VPP e VPN) para alguns valores de sensibilidade e especificidade para
prevalências de 1% e 90%.
Prevalência de 1% Prevalência de 90%
s e VPP VPN VPP VPN
0,99 0,99 0,5000 0,9999 0,9989 0,9167
0,99 0,90 0,0909 0,9999 0,9889 0,9091
0,99 0,80 0,0476 0,9999 0,9780 0,8989
0,90 0,99 0,4762 0,9990 0,9988 0,5238
0,90 0,90 0,0833 0,9989 0,9878 0,5000
0,90 0,80 0,0435 0,9987 0,9759 0,4706
0,80 0,99 0,4469 0,9980 0,9986 0,3548
0,80 0,90 0,0748 0,9978 0,9863 0,3333
0,80 0,80 0,0388 0,9975 0,9730 0,3077
Embora este não seja um estudo exaustivo, existem evidências para as seguintes conclusões:
1. Um teste com alta especificidade deve ser usado quando a prevalência da doença é relativamente baixa
(doença rara), mesmo que o teste tenha relativamente baixa sensibilidade.
2. Um teste com alta sensibilidade deve ser usado quando a prevalência da doença é alta (doença comum),
mesmo que o teste tenha relativamente baixa especificidade.
É comum a idéia de que se a doença é rara, um teste com alta sensibilidade dever ser usado para achar
os casos e para uma doença de alta prevalência, um teste com alta especificidade deve ser escolhido.
Esse raciocı́nio não coincide com os argumentos apresentados.
Outro tipo de simulação é apresentado nas Figuras 10.1 e 10.2 para algumas situações especı́ficas:
Inicialmente percebe-se na 10.1 que, para qualquer situação, quanto maior a prevalência da doença,
maior o valor preditivo positivo. Para um teste com sensibilidade e especificidade elevadas (s = 99% e e =
99%) o seu valor preditivo positivo será muito alto mesmo em situações de prevalência não muito elevada.
Entretanto, esta situação sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e
especificidade do teste (s = 95% e e = 95%).
10.6 Escolha entre Testes Diagnósticos ROSSI, R. M. 131
Uma outra situação ocorrerá ao se modificar apenas uma das caracterı́sticas do teste. Por exemplo, ao
se diminuir a sensibilidade mantendo-se a especificidade elevada (s = 70% e e = 90%), percebe-se que prati-
camente não houve impacto nos valores preditivos positivos em função da prevalência. Entretanto, quando
essa mesma diminuição ocorre na especificidade, o impacto é bastante grande, diminuindo-se muito o valor
preditivo positivo do resultado mesmo para prevalências mais elevadas. Dessa forma, pode-se afirmar que o
valor preditivo positivo de um teste é função da prevalência da doença, da sensibilidade e fundamentalmente
da especificidade, conforme já fora observado na fórmula anterior.
Note na Figura 10.2 que, ao reduzir apenas a sensibilidade (s = 70% e e = 99%), ocorre uma drástica
redução no VPN, mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir apenas a
especificidade (s = 99% e e = 70%), o impacto no VPN é muito pequeno, menor do que quando se reduz
apenas um pouco a sensibilidade e a especificidade conjuntamente (s = 95 e e = 95%).
Note também que, para um mesmo teste diagnóstico (exceção apenas para s = 70% e e = 99%), o impacto
do aumento da prevalência na redução do VPN é muito pequeno. Esse impacto se acentua nas prevalências
muitos elevadas. Como na prática clı́nica, as doenças estudadas comumente possuem prevalências relati-
vamente baixas, o VPN irá sofrer apenas pequena variação ao se modificar a especificidade de um teste
diagnóstico e mesmo ao se modificar pouco a sensibilidade.
10.7 Relação entre Sensibilidade e Especificidade ROSSI, R. M. 132
Tabela 10.12: Trade-off entre Sensibilidade e Especificidade no tratamento de Diabetes (Glicemia pós-
prandial 2(h) mg/100 ml).
Glicemia pós-prandial Sensibilidade (%) Especificidade (%) 1 - Especificidade (%)
(2h) mg/100 ml
70 98,6 8,8 91,2
80 97,1 25,5 74,5
90 94,3 47,6 52,4
100 88,6 69,8 30,2
110 85,7 84,1 15,9
120 71,4 92,5 7,5
130 64,3 96,9 3,1
140 57,1 99,4 0,6
150 50,0 99,6 0,4
160 47,1 99,8 0,2
170 42,9 100,0 0
180 38,6 100,0 0
190 34,3 100,0 0
200 27,1 100,0 0
Note que quanto mais próxima a curva estiver do canto superior esquerdo do gráfico, melhor será o poder
discriminatório do teste diagnóstico e quanto mais distante, até o limite da diagonal do gráfico, pior será o
10.8 Curva ROC ROSSI, R. M. 134
seu poder de discriminar doentes e não doentes. A curva ROC pode servir como orientação para a escolha
do melhor ponto de corte de um teste diagnóstico que, em geral, se localiza no extremo da curva próximo
ao canto superior esquerdo do gráfico. *Observe que o ponto de corte adequado está entre 110 e 120 mg/100
ml.
As curvas ROC, além de auxiliarem na identificação do melhor ponto de corte, são muito utilizadas para
comparar dois (ou mais) testes diagnósticos para a mesma doença. Nesse caso, o poder discriminatório do
teste, ou seja, a acurácia global, pode se mensurado através do cálculo da área sob a curva ROC; quanto
maior for a área tanto melhor será o teste diagnóstico.
Um teste diagnóstico ideal, com 100% de sensibilidade e 100% de especificidade, a área total seria igual
a 1 (um), ou seja, a “curva” seria coincidente com o lado esquerdo e o topo do gráfico. Neste caso, o teste
não possuiria erro, identificando perfeitamente todos os indivı́duos sadios e doentes (gold test).
Para um teste sem nenhuma utilidade, a “curva” seria uma linha reta em diagonal, partindo do canto
inferior esquerdo até o canto superior direito. Neste caso, o teste diagnóstico não possuiria nenhum poder
para discriminar doentes de não-doentes.
Exemplo 10.7. Os dados da Tabela 10.13 foram obtidos na UEM/HU - Hospital Universitário da Univer-
sidade Estadual de Maringá, em um estudo para avaliação de equipamentos para dosagem glicêmica capilar
O objetivo do trabalho foi o de escolher o melhor equipamento entre três analisados: Glucotrend, Precision
e Advantage. Os testes foram realizados em 21 indivı́duos. O teste Colorimétrico foi ser utilizado como
Gold Standard (Teste Ouro), que classifica sem erro doentes e não-doentes.
Obs.: Valores de referência: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hipogli-
cemia) e acima de 120 (hiperglicemia)).
Obs.:
1. *1 foram utilizadas duas fitas por falha na leitura do equipamento;
2. *2 foram utilizadas quatro fitas por falha na leitura do equipamento;
3. *3 equipamento apresentou erro.
10.8 Curva ROC ROSSI, R. M. 135
2. Determine a sensibilidade e especificidade de cada testes acima . Baseado nestes resultados qual (quais)
o(s) melhor(es) teste(s) ?
3. Determine os valores de predição positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para
cada um dos testes, usando a prevalência da doença obtida através da Tabela Cruzada. Interprete-os.
4. Considerando que a prevalência para a doença em questão é de 1%, recalcule os itens anteriores.
5. Combine os testes: G x P, G x A e P x A de forma paralela e em série, considerando uma prevalência
de 1%. Qual a melhor combinação ? porque?
6. Refazer o exercı́cio, considerando a referência 70 ≤ N ormal ≤ 110 e p = 1%.
a
Exercı́cio 10.2. Em que condições o valor de predição positiva (VPP) é igual a a+c ?
Exercı́cio 10.3. Foram examinadas radiografias do tórax de 1.820 indivı́duos, dos quais 30 estavam com
tuberculose e 1.790 não apresentavam a doença, por diagnóstico feito de forma independente da leitura dos
raios X e com uma margem de erro desprezı́vel. Pelo modo como estes 1.820 pacientes foram selecionados,
Exercı́cio 10.4. Pesquisadores que tratam de doenças hepáticas em uma clı́nica especializada sugeriram
um novo teste para detectar câncer no fı́gado. Os resultados do experimento, para uma amostra de 2.225
pacientes atendidos nessa clı́nica, foram: Pelo modo como os dados foram obtidos, a prevalência de câncer
2. Calcule a probabilidade de um paciente, atendido nessa clı́nica e que não tem câncer no fı́gado, tenha
tenha um resultado positivo no teste.
Exercı́cio 10.5. Foi feita avaliação para câncer de próstata em 300 homens hospitalizados devido a sintomas
de obstrução urinária. Um dos testes realizados foi o exame digital do reto. O resultado foi classificado como
”Positivo” segundo o critério padrão (biópsia).
Exercı́cio 10.6. A detecção precoce do câncer cervical uterino é crucial para o tratamento e cura de pa-
cientes. O papanicolau é um dos testes utilizados no diagnóstico. Na tabela a seguir temos os resultados
dos testes para 600 mulheres. As mulheres foram classificadas como portadoras ou não da doença através de
biópsia cervical.
Exercı́cio 10.7. A hemorragia peri-intraventricular (HPIV) é uma das causas mais frequentes de agressão
ao sistema nervoso no perı́odo neonatal e a segunda causa mais frequente de morte em prematuros, precedida
apenas pela doença de membrana hialina. Atualmente, o método de escolha para diagnóstico consiste em
técnicas não invasivas (ultrassonografia e tomografia computadorizada). Tavares (1995) estudou a ocorrência
desta enfermidade em 120 dos 129 recém-nascidos com peso menor que 2000 g, nascidos no Hospital das
Clı́nicas da UFMG, no perı́odo de 18/01/94 a 17/05/95. O critério único para exclusão foi morte neota-
nal precoce, anterior à possibilidade de realização do exame ultrassonográfico. Para avaliar a eficácia do
exame clı́nico neurológico, as crianças (com exceção de uma) foram examinadas por um pediatra clı́nico com
formação em neonatalogia, sem o conhecimento prévio dos exames ultrassonográficos, que confirmam ou não
o diagnóstico fornecido pelo médico.
2. O baixo peso ao nascer é usado frequentemente para rastrear HPIV, sendo 1500 g o limite sugerido
para tal fim. Considerando essa informação e os dados mostrados a seguir do peso ao nascer (g) de
39 crianças com HPIV, qual seria a sensibilidade resultante do rastreamento? Abaixo de que peso
encontram-se 95% das crianças com HPIV? Quais as consequências de se alterar o valor de referência
para o novo valor encontrado?
Exercı́cio 10.8. Suponha que a sensibilidade e a especificidade de dois testes (A e B) para o diagnóstico de
uma determinada doença sejam:
Assumindo que os testes sejam realizados de forma independente, qual a ordem que produz as melhores
caracterı́sticas gerais do teste conjunto em paralelo, isto é, o resultado é positivo se ambos são positivos?
10.8 Curva ROC ROSSI, R. M. 138
Exercı́cio 10.9. Os dados seguintes são tomados de um estudo que investiga o uso de uma técnica chamada
ventriculografia radionuclı́dica como teste diagnóstico para se detectar doença da artéria coronária (Begg e
Mcneil, 1988).
2. Para uma população cuja prevalência da doença da artéria coronária seja de 5%, calcule a probabili-
dade de que um indivı́duo NÃO tenha a doença, sendo que ele apresenta resultado positivo usando a
ventriculografia radionuclı́dica;
3. Qual o valor preditivo de um teste negativo? utilize a mesma prevalência populacional.
10.8 Curva ROC ROSSI, R. M. 139
Exercı́cio 10.10. Um teste diagnóstico A relativamente barato utilizado para detecção de gravidez tem
sensibilidade e especificidade, respectivamente dados por: 67% e 80%. Um outro B, tem respectivamente:
91,3% e 77,2%. Uma mulher desconfiada de que estaria grávida resolve fazer os testes. Primeiro faz o teste
A e sendo o resultado positivo então procede ao segundo teste.
1. Determine a chace de o teste A dar resultado falso positivo considerando uma prevalência de 90% para
a gravidez;
2. Considerando que esta mulher realizou o segundo teste, determine a chance de um falso positivo
combinado. O que aconteceu? a chance de ela estar realmente grávida aumenta ou diminui?
3. Considerando uma prevalência de 95%, calcule o valor de Predição Falso Negativo de uma combinação
em paralelo;
4. Considere uma prevalência de 95%. Baseado nos cálculos de probabilidades condicionais, qual o teste
diagnóstico você escolheria, considerando independência nos testes combinados? Porque?
Exercı́cio 10.11. O Ministério da Saúde, através da Portaria no 488, de 17 de junho de 1998, estabeleceu
a obrigatoriedade de uma rotina para a execução de testes para detecção de anticorpos contra o vı́rus da
imunodeficiência humana (anti-HIV) em indivı́duos com idade acima de dois anos. O objetivo da porta-
ria é aumentar a acurácia do procedimento. Em uma primeira etapa, denominada triagem sorológica, a
mesma amostra deve ser submetida a dois testes sorológicos distintos, simultaneamente. Caso a amostra
apresente resultados reagentes nos dois exames, isto é, Positivo no ELISA1 e Positivo no ELISA2 , esta deve
ser submetida às etapas de confirmação sorológica, através da realização dos testes de Imunofluorescência
Indireta e/ou Western Blot. Supondo que você trabalhe em um hospital que disponha de dois testes ELISA
distintos para detecção de anti-HIV na primeira etapa do processo, isto é, realizar simultaneamente os testes,
e sabendo-se que os valores de sensibilidade e especificidade são, respectivamente,
e além disso se tenha conhecimento da prevalência de soropositividade para HIV de 0,3%, determine os
valores : VPP, VPN, PFP e PFN, para o teste combinado, proposto pelo Ministério da Saúde.
Exercı́cio 10.12. Um teste diagnóstico A relativamente barato utilizado para detecção de gravidez tem
sensibilidade e especificidade, respectivamente dados por: 87,5% e 88,8%. Um outro B, tem respectivamente:
91,3% e 67,4%. Uma mulher desconfiada de que estaria grávida resolve fazer os testes. Primeiro faz o teste
A e sendo o resultado positivo então procede ao segundo teste.
1. Determine a chace de o teste A dar resultado falso positivo considerando uma porcentagem de 80%
para a gravidez;
2. Considerando que esta mulher realizou o segundo teste, determine a chance de um falso positivo
combinado. O que aconteceu? a chance de ela estar realmente grávida aumenta ou diminui?
Exercı́cio 10.13. A tabela a seguir (incompleta) mostra a sensibilidade, especificidade, VPP e VPN de
testes individuais A e B e dos testes em série e em paralelo.
2. baseado nos resultados, qual diagnóstico você escolheria, considerando independência nos testes com-
binados? Porque?
Capı́tulo 11
Análise de Regressão
11.1 Introdução
É freqüente o estudo da relação entre séries de variáveis.
Usualmente as companhias telefônicas não guardam o número de todas as chamadas interurbanas origina-
das em determinada localidade. É que, do ponto de vista do faturamento, existem chamadas interurbanas que
são cobradas pelo mesmo sistema usado para chamadas locais. Em estudos de tráfego telefônico é portanto,
necessário criar maneiras de estimar o número de chamadas interurbanas a partir de ı́ndices sócio-econômicos.
Isto é feito obtendo-se o número de chamadas interurbanas em algumas cidades, os correspondentes ı́ndices
sócio-econômicos e relacionando-se estas varáveis através de um modelo de regressão.
Situações como as descritas acima são estudadas pela técnica de análise de regressão, onde são relacio-
nadas por uma equação duas variáveis: uma, chamada variável resposta, ou dependente, e outra, chamada
variável explicativa, ou independente. Conhecido um conjunto de valores da variável explicativa e outro da
variável resposta determina-se os parâmetros da equação.
yi = α + βxi + εi
εi ∼ N (0; σ 2 )
onde α (coeficiente linear) e β (coeficiente angular) são os parâmetros amostrais, xi dados e ε é o erro.
140
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 141
A obtenção dos valores dos parâmetros α e β, pode ser feita via método de Mı́nimos Quadrados (ver
Capı́tulo 2 de Charnet et al. (1999)):
∑
n 1∑ n ∑n
xi y − xi y
Sxy n i=1 i=1
β̂ = = i=1 ( n )2 (11.1)
Sxx ∑
n 1 ∑
xi −
2 xi
i=1 n i=1
e
α̂ = ȳ − β̂ x̄. (11.2)
Sejam ŷi = α̂ + β̂xi , para i = 1, 2, ..., n, os valores da reta de quadrados mı́nimo, ajustada ao conjunto
de n pontos (xi , yi ) para todo i. As quantidades εi = yi − ŷi , são denominadas resı́duos. São variáveis
aleatórias, porque são funções dos elementos da amostra.
Precisamos estimar mais um parâmetro - a variância do erro, σ 2ε - o qual representa a distorção à reta.
Nota-se a sua importância para o modelo - se for um valor relativamente alto, as variâncias de α̂ e de β̂
serão altas e neste caso estes estimadores têm pouca precisão. Intuitivamente, sua estimação deve basear-se
nos resı́duos. Um estimador não viciado para σ 2ε é dado por:
∑
n
2
∧ (yi − ŷi )
i=1
σ 2ε = .
n−2
Este estimador é não viciado e, sob o MRLS
∧
(n − 2)σ 2ε
∼ χ2(n−2) . (11.3)
σ 2ε
∧
Assim, a variância de σ 2ε é dada por
∧
2(σ 2ε )2
V ar[σ 2ε ] = .
n−2
e ( )
σ 2ε
β̂ ∼ N β;
Sxx
ou
β̂ − β
v ∼ t(n−2) .
u
u ∧
u σ 2ε
t ∑n
(xi −x̄)2
i=1
e v
u
u ∧
u
u σ 2ε
β̂ ± t( α2 ;n−2) u . (11.5)
t ∑
n
2
(xi − x̄)
i=1
e variâcia é
Então ( [ ])
1 (x − x̄)2
α̂ + β̂x ∼ N α + βx; σ 2
+ .
n Sxx
Usando o estimador de σ 2 , dado por
∑
n
2
∧ (yi − ŷi )
i=1
σ = SY2 |x =
2
, (11.6)
n−2
podemos definir um intervalo de confiança para E[Y|x], através da seguinte quantidade pivotal:
α̂ + β̂x − (α + βx)
√( )
1 2
σ̂ + (x−x̄)
Sxx
n
a qual tem distribuição t de Student com (n-2) graus de liberdade. Portanto, o intervalo de confiança (1−α)%
para E[Y|x] é dado pela expressão:
v( )
u
u 1 (x − x̄)
2
α̂ + β̂x ± t( α2 ;n−2) σ̂ t + . (11.7)
n Sxx
Se calcularmos intervalos de confiança para alguns valores de x, podemos esboçar uma região em torno da
reta estimada, indicando os limites superiores e inferiores desses intervalos. Essa região é também chamada
de bandas de confiança.
A variável Y0 não faz parte da amostra utilizada no ajuste do modelo, portanto é independente de Ŷ0 .
A variância do erro de predição pode ser escrita como a soma das variâncias das variáveis que a compõem,
dada a independência entre os termos. Os anteriores implicam:
E[Ŷ0 − Y0 ] = 0
V ar[Ŷ0 − Y0 ] = V ar(Ŷ0 ) + V ar(Y0 )
[ ]
2
2 2 1 (x0 − x̄)
= σ +σ +
n Sxx
( [ ])
2
1 (x0 − x̄)
⇒ Ŷ0 − Y0 ∼ N 2
0; σ + σ 2
+ .
n Sxx
∧
Substituindo σ 2 por σ 2 , o intervalo de predição será dado por:
v( )
u
u 1 (x − x̄)
2
Ŷ0 ± t( α2 ;n−2) σ̂ t 1 + +
0
. (11.8)
n Sxx
Exemplo 11.1. Um estudo foi feito para investigar o efeito de um desinfetante. Foram preparadas soluções,
nas quais o desinfetante foi diluı́do em quantidades fixas de água, para concentrações do desinfetante de 1%
a 8%. Foi observado o número de bactérias que sobreviveram, após superfı́cies serem limpas com uma das
soluções.
∑
16 ∑
16
yi = 360 yi2 = 8524
i=1 i=1
∑
16 ∑
16 ∑
16
xi = 63 x2i = 313 yi xi = 1279
i=1 i=1 i=1
⇒ ȳ = 22, 5 e x̄ = 3, 9375
2 2
Sxx = 4, 3292 Syy = 28, 2667
α̂ = 30, 9 e β̂ = −2, 1328
Assim, ajustando-se o MRLS para explicar o número de bactérias (Y), em termos das concentrações do
desinfetante (X), temos:
ŷ = 30, 9 − 2, 13x.
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 144
Um cálculo simples, pode nos fornecer um indicativo de que os dados estão ou não bem ajustados, via
R2 (coeficiente de determinação)
Tabela 11.3: Análise de variância para a falta de ajuste - dados do exemplo 11.1.
Causas da variação GL SQ QM F p
Regressão 1 295,39 295,39 32,14 0,000058
Erro 14 128,61 9,19
Falta de ajuste 6 16,777 2,7962 0,2 0,967333
Erro puro 8 111,823 13,978
Total 15 424
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 145
30
25
Nº de bactérias
20
15
1 2 3 4 5 6 7 8
Agora, usando (11.8), um intervalo de predição de 95% para o número de bactérias que sobrevivem após
aplicação de solução 3, 5 do desinfetante é dada por:
√
2
1 (3, 5 − 3, 9375)
: 30, 9 − 2, 13(3, 5) ± 2, 145.3, 03 1 + +
16 64, 9375
: 23, 45 ± 6, 71
: [16, 7 ; 30, 2].
Note a diferença entre os dois intervalos: estimamos que a esperança do número de bactérias que sobrevi-
vem à concentração 3, 5 esteja no intervalo [21, 8 ; 25, 1] e fazemos a predição de que uma observação futura
com a concentração 3, 5 esteja no intervalo [16, 7 ; 30, 2].
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 146
30
Reta estimada: Y = 30.9 − 2.13X
R² = 0,69
25
Nº de bactérias
20
15
1 2 3 4 5 6 7 8
Figura 11.2: Número de bactérias em função de concentração do detergente e reta de quadrados mı́nimos
ajustada.
35
20
15
10
1 2 3 4 5 6 7 8
Figura 11.3: Bandas de confiança e de predição para o número de bactérias que sobrevivem à concentração
de detergente.
11.3 O Modelo de Regressão Linear Simples - MRLS ROSSI, R. M. 147
Exercı́cio 11.1. Um experimento foi conduzido para avaliar, em coelhos a disponibilidade relativa do Fósforo
existente. nos Fosfatos de rocha de Araxá e de Patos em relação ao Fósforo existente no Fosfoto Bicálcio.
Os animais foram alimentados com rações contendo nı́veis crescentes de cada Fosfato e foram anotados os
consumos de ração, o que permitiu calcular o consumo de Fósforo em cada unidade experimental. A variável
resposta observada foi a resistência do fêmur à quebra, mensurada com dinamômetro. A disponibilidade
relativa é estimada pela razão entre os coeficientes lineares de regressão (angular no caso da reta) obtido
para o Fosfato de interesse e para o Fosfato Bicálcio.
Os objetivos foram:
a) Estimar a disponibilidae relativa do Fósforo nos dois Fosfatos de rocha;
b) Testar o ajuste dos modelos (apresente os gráficos individuais e simultâneos);
c) Fazer uma seleção de modelos (via análise de resı́duos, por exemplo).
Capı́tulo 12
Regressão Logı́stica
12.1 Introdução
Dos modelos lineares tı́nhamos:
Y = β 0 + β 1 X1 + β 2 X2 + ... + β k Xk + ϵ
ϵ ∼ N (0, σ 2 )
1: ”sucesso”; p = Pr(Y = 1)
0: ”fracasso”; q = 1 − p = Pr(Y = 1).
p = β 0 + β 1 X. (12.1)
Este é o modelo de regressão linear simples onde Y foi substituı́do por p. β 0 é o intercepto da reta e β 1
é a sua inclinação. Como p está restrito ao intervalo 0 e 1, e o termo β 0 + β 1 X assume qualquer valor real,
então o modelo em (12.1) não está adequado, logo faremos:
p = eβ 0 +β 1 X (12.2)
eβ 0 +β 1 X
p = Pr(Y = 1) = (12.3)
1 + eβ 0 +β 1 X
e
Pr(Y = 0) = 1 − p
eβ 0 +β 1 X
= 1−
1 + eβ 0 +β 1 X
1 + eβ 0 +β 1 X − eβ 0 +β 1 X
=
1 + eβ 0 +β 1 X
148
12.2 O modelo de Regressão Logı́stica ROSSI, R. M. 149
1
Pr(Y = 0) = (12.4)
1 + eβ 0 +β 1 X
acomodamos os valores entre 0 e 1.
A função dada em (12.3) é conhecida como função logı́stica. Lembrando que p = Pr(Y = 1), um sucesso
ocorre com probabilidade p e a chance em favor de sucesso é
p
= eβ 0 +β 1 X . (12.5)
1−p
eβ 0 +β 1 X
p = Pr(Y = 1|X = 1) =
1 + eβ 0 +β 1 X
e que
1
q = 1 − p = Pr(Y = 0|X = 1) = .
1 + eβ 0 +β 1 X
( )
p
O modelo pode ser escrito como ln = β 0 + β 1 X, mostrando que o logito depende linearmente da
1−p
β
dosagem do tóxico. Para a dosagem x = − 0 , temos que
β1
( )
β 1
p = Pr Y = 1|X = − 0 = ou 50%
β1 2
β0 β
ou seja, − é a dosagem do tóxico que mata 50% população. A razão − 0 é parâmetro de grande
β1 β1
importância em estudos toxicológicos.
A Figura 12.1 apresenta a caracterização gráfica da Função Logı́stica.
∑
n
onde ti é o valor observado de Tj = xij yi .
j=1
Aplicando o logaritmo em (12.9) obtém-se a função log-verossimilhança dada por:
∑
n
l(β|Y, X) = {yi log(pi ) + (1 − yi ) log(1 − pi )}
i=1
onde ( ′
)
Xi β i
e
pi =
′ .
1 + e(Xi β i )
O estimador de máxima verossimilhança do vetor β, é obtido igualando-se a zero a Função Escore de
Fisher (Derivada primeira da função log-verossimilhança) e resolvendo a mesma em β 0 , β 1 , β 2 , ..., β k , ou seja,
∂l(β|Y,X)
=0
∂β 0
∂l(β|Y,X)
=0
∂β 1
..
.
∂l(β|Y,X)
∂β k = 0.
Para construir um intervalo com (1 − α)% de confiança para os estimadores de máxima verossimilhança
de β 0 , β 1 , β 2 , ..., β k sabe-se que assintoticamente
Entretanto, na prática ao invés de trabalhar com o inverso da Informação de Fisher, trabalha-se com o
inverso da informação observada.
12.4 Método da Máxima Verossimilhança ROSSI, R. M. 151
.
.. .
.. .. ..
. .
∂ 2 l(β|Y,X) β k =β̂ k ∂ 2 l(β|Y,X) β k =β̂ k ∂ 2 l(β|Y,X)
∂β 0 ∂β k |β 0 =β̂ 0 ∂β 1 ∂β k |β 1 =β̂ 1 ··· ∂β 2k
|β =β̂
k k
Exemplo 12.3. Em alguns estudos de coorte apenas uma variável explicativa X precisa ser considerada.
Seja X = 1, se o paciente pertence ao grupo exposto ao fator de risco e X = 0 se o paciente pertence ao
grupo não-exposto. Assumindo um modelo logı́stico para o relacionamento entre X e a variável resposta Y,
que neste caso é o desenvolvimento da doença em estudo, temos que se X = 0 :
eβ 0
p0 = Pr (Y = 1|X = 0) =
1 + eβ 0
e se X = 1 :
eβ 0 +β 1
p1 = Pr (Y = 1|X = 1) = .
1 + eβ 0 +β 1
Os dados para um estudo de coorte como este, onde a variável resposta é dicotômica, reduzem-se a uma
tabela 2 × 2, como a mostrada a seguir.
Doença
Exposição Sim Não
Sim p1 q1
Não p0 q0
P (X = 1)[1 − P (X = 1)]
OR =
P (X = 0)[1 − P (X = 0)]
e(β 0 +β 1 )
1+e(β 0 +β 1 )
× 1+e1 β0
= β
e 0
1+e(β 0 +β 1 )
× 1+e(β10 +β1 )
e (β 0 +β 1 )
[1 + eβ 0 ] × [1 + e(β 0 +β 1 ) ]
= ×
[1 + e(β 0 +β 1 ) ] × [1 + eβ 0 ] eβ 0
= e(β 0 +β 1 −β 0 ) = eβ 1
ou simplesmente
p1 q0
OR = ,
p0 q1
assim
ln OR = β 1 .
Ou seja, dado um paciente qualquer, as chances dele desenvolver a doença dado que ele foi exposto ao
fator, é de eβ 1 vezes a chance de um paciente desenvolver a doença dado que ele foi não exposto ao fator.
12.4 Método da Máxima Verossimilhança ROSSI, R. M. 153
Exemplo 12.4. Considerando o Exemplo 12.2 e supondo que apenas três observações foram feitas. Observou-
se uma sobrevivência quando a dosagem do tóxico (X) usada era X=1; uma segunda sobrevivência para X=3
e finalmente uma falha, ou morte da cobaia para X=7. A verossimilhança neste caso de (12.9) será dada
por:
Na generalização para k covariáveis, pode-se calcular a razão de chances entre dois nı́veis
diferentes de uma mesma covariável, fixando-se o valor das outras k − 1 variáveis.
Seja Xj , a j−ésima covariável de interesse, onde deseja-se saber a razão de chances entre um dado
paciente exposto (Xj = 1) e um dado paciente não exposto ao fator (Xj = 0).
Suponha ainda que se tenha k variáveis significativas no modelo logı́stico. Para determinar a razão de
chances na mudança do nı́vel da j−ésima variável tem-se:
Desta forma, a razão de chances na mudança do nı́vel da j−ésima covariável (Xj ) é dada pelo exponencial
do j−ésimo estimador de máxima verossimilhança (β̂ j ), sendo j ≥ 1.
O intervalo com (1 − α)% de confiança pode ser obtido exponenciando os limites inferior e superior,
respectivamente, do intervalo de confiança para β̂ j , já visto anteriormente.
12.5 Significância dos Efeitos das Variáveis ROSSI, R. M. 154
Observação1 : O logaritimo da razão das verossimilhanças é multiplicado por -2 para que se obtenha uma
quantidade cuja distribuição seja conhecida, no caso a Qui-quadrado.
Observação2 : Na presença de dados faltantes, o tamanho amostral nos modelos sequenciais dependerá
das variáveis Xk que os compõem e neste caso o TRV apresentará problemas.
e
∑ ( )
nij
QL = 2 nij ln ∼ χ2(nl−k) , (12.16)
ij
e ij
sendo nij e eij , respectivamente, os valores observados e preditos eij = ni+ p̂i para j = 1 e eij = ni+ (1 − p̂i )
para j = 2. nl : número de subpopulações (linhas da tabela de dados) e k: o número de parâmetros no
modelo.
Também é importante que outras medidas sejam examinadas a fim de se averiguar se o ajuste é válido
sobre todo o conjunto de padrões (combinações das categorias) das variáveis explanatórias ou fatores. Pre-
gibon (1981) estendeu os métodos de diagnósticos de regressão linear para a regressão logı́stica e, para isso,
fez uso dos componentes individuais das estatı́sticas QP e QL .
Digamos que, se uma tabela de contingência s × 2 tem-se ni+ sujeitos em cada uma das s linhas, dos
quais ni1 apresentam a resposta de interesse predita pelo modelo para a i-ésima linha, define-se o i-ésimo
resı́duo (resı́duos de Pearson), i = 1, 2, .., s, por:
em que ei1 = ni+ p̂i , resulta na soma dos quadrados dos componentes di em QL :
∑
s
2
QL = (di ) . (12.20)
i=1
Em geral, resı́duos excedendo os valores ±2, 5, indicam possı́vel falta de ajuste, presença de
outliers e padrões sistemáticos de variação, visto que tanto ci quanto di seguem distribuição
aproximadamente normal padrão.
Hosmer-Lemeshow:
Um teste de ajuste também bem conhecido e utilizado em regressão logı́stica é o teste de Hosmer-
Lemeshow. O teste avalia o modelo ajustado através das distâncias entre as probabilidades ajustadas e
as probabilidades observadas. Os valores ajustados são dispostos do menor para o maior, e em seguida,
separados em g grupos de tamanho aproximadamente igual. Hosmer e Lemeshow (1980) propõe que seja
utilizado g = 10. Na literatura há pouca orientação sobre como escolher o número de grupos. As simulações
mostradas em Hosmer e Lemeshow (1989) foram baseadas no uso de g > p + 1, em que p é o número de
covariáveis do modelo ajustado. Se as frequências esperadas em alguns dos grupos forem muito pequenas a
estatı́stica do teste de Hosmer-Lemeshow é calculada, entretanto pode não ser confiável. Neste caso, devemos
especificar um número menor de grupos, contudo não se pode utilizar menos de 3 grupos, pois com (g < 3)
a estatı́stica do teste é impossibilitada de ser calculada (Agresti, 2013).
A estatı́stica teste é dada por:
(∑ ∑ )2
∑
g
j y ij − j π̂ ij
HL = (∑ )[ (∑ ) ] ∼ χ2(g−2) . (12.21)
i=1 j π̂ ij 1− j π̂ ij /ni
12.7 Aplicações ROSSI, R. M. 156
12.7 Aplicações
12.7.1 Associação entre Tempo de experiência e Realização de uma tarefa
Um analista está estudando o efeito do tempo de experiência em programação computacional sobre a
habilidade para completar, dentro de um determinado tempo, um tarefa difı́cil. Vinte e cinco (25) progra-
madores foram selecionadas para o estudo. A variável preditora, X, corresponde ao meses de experiência. a
variável Resposta Y é tal que Y = 1 se a tarefa foi realizada e Y = 0 caso contrário.
Y 0 0 0 0 0 1 0 0 0 0 1 0 1
X 4 4 5 6 6 8 9 11 12 13 13 14 18
Y 0 0 1 1 1 0 1 1 0 1 1 1
X 18 19 20 22 22 24 25 28 29 30 30 32
OR = e0,1615 = 1, 1715
Sua interpretação e que a chance de um indivı́duo aumenta em 17,5% para cada mês adicional de ex-
periência.
Observação: Em geral, a razão das chances estimada quando existe uma diferença de k unidades em X
será ekβ 1 .
Se desejarmos comparar indivı́duos com 10 meses e 25 meses de experiência, respectivamente, então
k = 15, e a razão das chances estimada será dada por:
portanto, a chance de um indivı́duo com experiência realizar a tarefa aumenta mais de 11 vezes quando
comparado com outro com pouca experiência.
p̂
Como a razão 1− p̂ é uma odds, então a Odds Ratio entre, por exemplo, os indivı́duos com 20 e 10 meses
de experiência pode ser estimada por
∧ odds(20) exp(0, 17)
OR = = ≃ 5, 027
odds(10) exp(−1, 4448)
já que ( )
xi p̂i 1 − p̂i ln p̂i
1−p̂i
10 0, 1908 0, 8092 −1, 4448
20 0, 5424 0, 4576 0, 1700
ou de forma direta:
∧ odds(20)
OR = = exp{β̂ 1 (20 − 10)} = exp{0, 1615(10)} ≃ 5, 027,
odds(10)
que nos permite concluir que a odds de realizar a tarefa entre indivı́duos com 20 meses de experiência é de
5 vezes a dos com 10 meses.
12.7 Aplicações ROSSI, R. M. 157
A probabilidade estimada de um bebê ser diagnosticado com BPD diminui conforme o peso ao
nascer aumenta, de 72,1% para crianças que pesam 950g ou menos até 12% para os que pesam 1.351g
ou mais (Análise de associação na Tabela (12.1), χ2 = 64, 71; p < 0, 00001). Verificada a existência de
associação entre essas duas variáveis, podemos usar o peso ao nascer de uma criança para nos ajudar a
prever a probabilidade de que ela desenvolva BPD por meio de um modelo de regressão logı́stica.
Ajustando o modelo: [ ]
p
ln = β0 + β1X
1−p
onde X: peso ao nascer, considerando os pontos médios das classes agrupados (475, 1150 ou 1550g) a equação
da regressão logı́stica estimada é: [ ]
p̂
ln = 2, 245 − 0, 003X. (12.22)
1 − p̂
O coeficiente do peso implica que, para cada mudança de grupo de peso ao nascer, o logaritmo da chance
de que um bebê desenvolva BPD diminui de 0,003, em média. Quando o logaritmo da chance diminui,
a probabilidade p também diminui.
Para estimarmos a probabilidade de que uma criança com peso no grupo I desenvolva BPD, por exemplo,
substituı́mos o valor X = 475g para encontrar:
[ ]
p̂
ln = 2, 245 − 0, 003(475) ⇒ p̂ = 0, 71 ou 71%.
1 − p̂
Para uma criança com peso de X = 750g, tem-se:
[ ]
p̂
ln = 2, 245 − 0, 003(750) ⇒ p̂ = 0, 52 ou 52%,
1 − p̂
12.7 Aplicações ROSSI, R. M. 158
Entretanto, ao ajustar um novo modelo com todos as informações individuais (n = 223 crianças), podemos
estimar a probabilidade de que uma criança que pesa 750g no nascimento desenvolva BPD. Digamos que o
modelo ajustado tenha sido:
[ ]
p̂
ln = 4, 0343 − 0, 0042X (Pagano e Gauvreau, 2000) (12.23)
1 − p̂
então, [ ]
p̂
ln = 4, 0343 − 0, 0042(750) ⇒ p̂ = 0, 708 ou ≃ 71%.
1 − p̂
A Figura 12.2 apresenta a curva estimada de p versus Peso ao nascer, considerando o primeiro modelo
ajustado 12.22.
Sendo o valor p̂ = 0, 52 uma estimativa, é importante apresentar seu intervalo com uma certa confiança,
digamos 95%. Para tal, é necessário o conhecimento da matriz de (co)variância dos parâmetros estimados:
[ ]
0, 176664 −0, 000155
V =
−0000155 0, 1615931
Sabe-se, da propriedade de variância, que:
assim,
∧
V ar(p̂) = 0, 176664 + 7502 (0, 1615931) + 2(750)(−0, 000155)
= 0, 03487.
Muitas vezes só dispomos dos dados na forma apresentada na Tabela 12.1, neste caso podemos analisar
como se X fosse uma variável categórica:
12.7 Aplicações ROSSI, R. M. 159
Sendo assim, uma criança com baixo peso, por exemplo, terá 72% de probabilidade de desenvolver BPD:
[ ]
p̂
ln = 0, 9474 − 2, 1841(0) − 2, 9398(0) = 0, 9474 → p̂ = 0, 72,
1 − p̂
uma criança com médio peso, terá 23% de probabilidade de desenvolver BPD:
[ ]
p̂
ln = 0, 9474 − 2, 1841(1) − 2, 9398(0) = −1, 9906 → p̂ = 0, 23,
1 − p̂
e, uma criança com alto peso, terá 12% de probabilidade de desenvolver BPD:
[ ]
p̂
ln = 0, 9474 − 2, 1841(0) − 2, 9398(1) = −1, 2368, → p̂ = 0, 12.
1 − p̂
Por fim:
Verifica-se que crianças do grupo G1 tem, aproximadamente, 19 vezes mais chances de desenvolver a
BPD quando comparadas às do grupo G3 , por exemplo.
12.7 Aplicações ROSSI, R. M. 160
O objetivo é investigar a associação entre a doença e as variáveis descritas acima, utilizando os resultados
do ECG: Eletrocardiograma.
Observação: A análise desses dados será feita em sala de aula por meio de regressão logı́stica.
Através do p-valor, pode-se notar que todos os parâmetros são significantes ao nı́vel de 5%. A soma
dos quadrados dos resı́duos de Pearson dá um valor de 38,85, em 36 graus de liberdade, sugerindo um bom
ajuste do modelo aos dados.
Uma vez que obtidas as estimativas de β 0 , β 1 e β 2 , pode-se estimar pi e 1 − pi .
Observando as saı́das no SAS, nota-se que para nı́veis baixos de Volume (X1 ) e de Taxa (X2 ) de ar
inspirado, a probabilidade de ocorrência de vaso-constrição, é muito baixa (por exemplo a observação 10,
onde x1 = 0, 90 e x2 = 0, 45 têm-se p̂ = 0, 008), entretanto a medida que os nı́veis de Volume e de Taxa de
ar inspirado vai aumentando, a probabilidade de que um dado indivı́duo tenha vaso-constrição passageira
na pele dos tecidos dos dedos também aumenta (por exemplo a observação 2, onde x1 = 3, 5 e x2 = 1, 09
têm-se p̂ = 0, 999).
Porém, nota-se ainda que para nı́veis baixos de Volume e nı́veis altos de Taxa de ar inspirado, tem-se
uma probabilidade de ocorrência de vaso-constrição na pele dos dedos relativamente baixa (por exemplo a
observação 21, onde x1 = 0, 40 e x2 = 2, 00 têm-se p̂ = 0, 064), e para nı́veis altos de Volume e nı́veis
baixos de Taxa de ar inspirado, tem-se uma probabilidade de ocorrência de vaso-constrição intermediária
(por exemplo a observação 32, onde x1 = 2, 35 e x2 = 0, 03 têm-se p̂ = 0, 419) dando evidências de que a
covariável Volume de ar inspirado tem mais influência sobre o aumento da probabilidade de ocorrência de
vaso-constrição do que a covariável Taxa de ar inspirado.
Para uma análise mais refinada do problema, tem-se algumas estatı́sticas descritivas das covariáveis
Volume e Taxa de ar inspirado na tabela a seguir.
Covariáveis x̄ Md Q1 Q3 s
Volume (X1 ) 1,3603 1,10 0,80 1,7 0,8154
Taxa (X2 ) 1,6887 1,63 1,08 2,0 0,8804
Contudo, fixando-se a covariável Taxa de ar inspirado (X2 ) no seu nı́vel médio e utilizando o modelo
12.7 Aplicações ROSSI, R. M. 161
logı́stico, obtém-se
( )
p̂i
log = β̂ 0 + β̂ 1 Xi1 + β̂ 2 Xi2
1 − p̂i
= −9, 5536 + 3, 8907Xi1 + 2, 6561(1, 6887)
fazendo ( )
p̂i
ŷi = log
1 − p̂i
tem-se
ŷi = −5, 0682 + 3, 8907Xi1
ou seja, uma função do primeiro grau cujo gráfico é caracterizado por uma reta crescente com uma taxa de
crescimento (coeficiente angular) de 3,8907, como mostrado na Figura 12.3.
Log da chance de ocorrência de VC (Logito)
8
6
4
2
Y = −5.0682 + 3.8907.X1
0
−4 −2
Volume de ar inspirado
Sendo assim, pode-se concluir que para um aumento de uma unidade (1) no Volume de ar inspirado,
tem-se um aumento de 3,8907 no logito (logaritmo da chance de sucesso), consequentemente ocorrendo um
aumento na probabilidade da ocorrência de vaso-constrição, uma vez que
( )
p̂i
ŷi = log
1 − p̂i
1
1 − p̂i = .
1 + eŷi
Quanto maior for ŷi menor será 1 − p̂i , e consequentemente tem-se um aumento em p̂i .
Fixando-se agora o nı́vel médio da covariável Volume de ar inspirado (X1 ) e utilizando o modelo logı́stico
obtém-se ( )
p̂i
log = −9, 5536 + 3, 8907(1, 3603) + 2, 6561Xi2
1 − p̂i
fazendo ( )
p̂i
ŷi = log
1 − p̂i
tem-se
ŷi = −4, 2610 + 2, 6561Xi2
ou seja, uma reta crescente com uma taxa de crescimento de 2,6561, como mostra a Figura 12.4.
Sendo assim pode-se concluir que para um aumento de uma unidade (1) na Taxa de ar inspirado tem-se
um aumento de 2,6561 no Logito, consequentemente ocorrendo um aumento na probabilidade da ocorrência
de vaso-constrição.
Plotando as duas retas no mesmo plano cartesiano, obtém-se a Figura 12.5.
12.7 Aplicações ROSSI, R. M. 162
6
4
2
0
Y = −4.2610 + 2.6561.X2
−2
−4
0 1 2 3
Taxa de ar inspirado
6
4
Y = −5.0682 + 3.8907.X1
2
0
Y = −4.2610 + 2.6561.X2
−2
−4
0 1 2 3
Logo pode-se notar que a covariável Volume tem uma maior influência no aumento do Logito do que a
covariável Taxa, ou seja, a probabilidade de ocorrência de vaso-constrição na pele dos dedos aumenta mais
rapidamente para um acréscimo no Volume do que um acréscimo na Taxa de ar inspirado.
Supõe que deseja-se saber a razão de chances quando existe uma variação no nı́vel de Volume de ar
inspirado de 0,80 (1o Quartil) para 1,10 (Mediana), para a Taxa de ar inspirado fixado em um determinado
valor. Sendo assim sabe-se que:
Pr(X1 = 1, 10; X2 = x2 ) × [1 − Pr(X1 = 0, 80; X2 = x2 )]
OR =
Pr(X1 = 0, 80; X2 = x2 ) × [1 − Pr(X1 = 1, 10; X2 = x2 )]
onde
eβ̂ 0 +β̂ 1 X1 +β̂ 2 X2
Pr(X1 = x1 ; X2 = x2 ) = .
1 + eβ̂ 0 +β̂ 1 X1 +β̂ 2 X2
Logo após um pouco de álgebra, tem-se
eβ̂ 0 +β̂ 1 (1,10)+β̂ 2 x2
OR =
eβ̂ 0 +β̂ 1 (0,80)+β̂ 2 x2
= e0,30β̂ 1
OR = e0,30(3,8907) = e1,1672 = 3, 213
ou seja, para um mesmo nı́vel de Taxa de ar inspirado (X2 ), e houver um aumento de 0,30 no Volume de ar
inspirado (X1 ), as chances de ter vaso-constrição passageira na pele dos dedos aumenta em 3,21 vezes.
12.7 Aplicações ROSSI, R. M. 163
Através do SAS (Proc NlMixed) pode-se determinar um intervalo com 95% de confiança para a estimativa
anterior:
Estimativa IC(95%)
OR 3,213 (1,3476 ; 7,6606)
Como o valor “1” não pertence ao intervalo, pode-se concluir que existe uma diferença significativa, ao
nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um aumento de 0,30 no Volume de ar
inspirado.
Generalizando, tem-se que para cada unidade acrescida no Volume de ar inspirado, para um nı́vel fixo
de Taxa de ar inspirado, a razão de chances (OR) é dada por:
ou seja, para um mesmo nı́vel de Taxa de ar inspirado (X2 ), se houver um aumento de (“1”) uma unidade
no Volume de ar inspirado (X1 ), as chances de ter vaso-constrição passageira na pele dos dedos aumenta em
48,9 vezes, aproximadamente.
Através do SAS (Proc NlMixed) pode-se determinar um intervalo com 95% de confiança para a razão de
chances
Estimativa IC(95%)
OR 48,9451 (2,7036 ; 886,1662)
analogamente, como o valor 1 não pertence ao intervalo, pode-se concluir que existe uma diferença signifi-
cativa, ao nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um aumento de 1 unidade no
Volume de ar inspirado.
Quando se deseja saber qual a razão de chances quando existe uma variação no nı́vel da Taxa de ar
inspirado de 1,08 (1o Quartil) para 1,63 (Mediana), para o Volume de ar inspirado fixado em um determinado
valor, o procedimento é análogo:
e seu respectivo IC(95%) será (1,5796 ; 13,0762). Como o valor 1 não pertence ao intervalo, conclui-se que
existe uma diferença significativa, ao nı́vel de 5%, no desenvolvimento da vaso-constrição quando existe um
aumento de 0,57 na Taxa de ar inspirada.
Generalizando, obtém-se a razão de chances de 14,2406 (2,2302 ; 90,9309), isto é, para um mesmo nı́vel
de Volume de ar inspirado (X1 ), se houver um aumento de uma unidade na Taxa de ar inspirado (X2 ), as
chances de ter vaso-constrição passageira na pele dos dedos aumenta aproximadamente 14 vezes.
Entretanto, uma consideração importante deve ser feita em relação ao ajuste dos dados, já que o modelo
de regressão logı́stica não se mostrou ajustado por meio do testes de GOF (p = 0, 02041) e de Hosmer e
Lemeshow (p = 0, 0224). Desta forma, uma função alternativa é sugerida, como por exemplo, a probito:
sendo Φ(.) denota a função de distribuição da normal padrão, N (0, 1). Por exemplo, para valores X̄1 e X̄2 ,
a probabilidade de ocorrência do evento será de 57%.
Para o modelo probito, os testes de GOF (p = 0, 052) e de Hosmer e Lemeshow (p = 0, 05) não rejeitam
a hipótese de bom ajuste dos dados.
12.7 Aplicações ROSSI, R. M. 164
Odds entre valores medianos e do 1o quartil calculadas anteriormente, serão 1,89 e 2,27, respectivamente,
assim como, as OR individuais para cada unidade acrescida na variável Volume e Taxa de ar inspirado,
respectivamente por, 8,35 e 4,39.
As Figuras 12.6, 12.7 e 12.8, apresentam agora as equações de retas ajustadas à função probito.
5
4
3
θ(x)
2
1
Y1 = −2.7073+2.1223*X1
0
Volume (X1)
−1.00
−1.05
Y2 = −2.3199+1.4801*X2
−1.10
Taxa (X2)
8
6
4
θ(x)
2
0
Y1
Y2
−2
−4 1.0 1.5 2.0 2.5 3.0 3.5
Exercı́cio 12.1. Um estudo teve com interesse investigar o processo de cura de um determinado tipo de
câncer. Um diagnóstico inicial era realizado para classificar o câncer do paciente em: ”complicado” ou ”não-
complicado”. Dois grupos foram formados de acordo com o tipo de tratamento a ser realizado: ”Padrão”
ou ”Novo”, então após um determinado tempo de observação, o paciente era classificado como: ”curado”
ou ”não-curado”. Proceda uma análise de regressão logı́stica completa para um modelo baseado em p =
P r(cura), e após preencher a tabela abaixo, conclua a respeito do novo tratamento (Adote um critério de
5% de significância para verificar a significância das variáveis ”Diagnóstico” e ”Tratamento”).
Exercı́cio 12.2. Pine et al. (1983) estudaram pacientes com ”sepis intra-abdominal”, um tipo de inflamação
no intestino. Várias variáveis foram analisadas (Banco de dados: pine1983.txt.) Proceda uma análise
de regressão logı́stica completa e apresente a probabilidade de um indivı́duo ao 60 anos cujo status em todas
variáveis independentes é de risco,
vir a óbito.
X1 : Shock
X2 : Desnutrição 1: ”presente” (risco)
X3 : Alcoolismo
0: ”ausente”
X4 : Infecção Intestinal
X5 : Idade (em anos) {
1: ”morto”
Y: Variável resposta ;
0: ”vivo”
12.7 Aplicações ROSSI, R. M. 166
Exercı́cio 12.3. Faça uma análise de Regressão Logı́stica completa para os dados referentes a recém-nascidos
no Serviço da Maternidade do HE da Faculdade de Medicina de Itajubá, ano de 1996. Levantamento sequen-
cial, perı́odo aproximado de dois meses. Total de 96 casos, classificados em 9 variáveis, onde o objetivo do
trabalho é verificar qual ou quais variáveis são fatores de risco para o desenvolvimento de anomalia (Banco
de dados: Pediat.xls). Observação: Para a análise Exclua as variáveis Sangue e RH. Apresente a proba-
bilidade de uma Menina desenvolver a anomalia, sendo que o seu tempo gestacional foi de 270 dias, nasceu
com 2.900 gramas, apresentou estatura de 50 cm, perı́metro cefálico de 32cm e perı́metro torácico de 35cm.
Exercı́cio 12.4. Um estudo teve por objetivo verificar a associação das variáveis de risco e tipologia sócio-
ocupacionais na região metropolitana de maringá-PR, 2010 (Banco de dados: mortalidadeinfantil.txt).
Faça uma análise de Regressão Logı́stica completa para os dados. Utilize o arquivo mortalidadeinfantil-
info.txt para procedimentos de análise (Observação: Faça a análise sem distinção de localidade-TSO).
Exercı́cio 12.5. Um trabalho cientı́fico teve como objetivo determinar os fatores de risco para o desen-
volvimento de uma Dislipidemia (Perfil Lipı́dico) em indivı́duos da demanda laboratorial não-hospitalar de
Maringá (PR). O arquivo no Banco de dados: DSPlogistica.xls, reúne as informações a respeito de al-
gumas variáveis a serem investigadas para tal. Faça uma análise de Regressão Logı́stica completa para os
dados.
Exercı́cio 12.6. Um estudo na residência médica da UEM no ano de 2006 teve por objetivo verificar qual(is)
fator(res) de risco estão associação à Depressão Pós-Parto (DPP) (Banco de dados: DeprePosParto.xls).
Faça uma análise de Regressão Logı́stica completa para os dados. Para tal utilize as informações contidas
na planilha (info) e/ou no arquivo DeprePosParto-info.txt. Apresente a probabilidade de uma mulher cujo
status em todas variáveis independentes de risco, vir a desenvolver a DPP.
Exercı́cio 12.7. Um estudo teve por objetivo verificar qual(is) fator(res) de risco estão associação à Ansi-
edade e à Depressão(Banco de dados: Psilogist.xls). Faça uma análise de Regressão Logı́stica completa
para os dados quanto a Ansiedade e em seguinda a Depressão. Para tal utilize as informações contidas no
arquivo Psilogist-info.txt. Apresente a probabilidade de um homem branco, com 40 anos, católico, casado,
analfabeto com 100 meses de diálise, vir a desenvolver uma Ansiedade e uma Depressão.
Referências Bibliográficas
[1] AGRESTI, A. An Introduction to Categorical Data Analysis. 2a Ed. NY: Wiley, 2007.
[2] ARANGO, H. G. Bioestatı́stica: Teórica e computacional. Guanabara Koogan S.A. 3a Ed. RJ, 2009.
[3] BUSSAB, W. O e MORETTIN, P. A. Estatı́stica básica. Ed. Saraiva, 8a Ed. SP, 2013.
[6] CARVAJAR, S. S. R. Elementos de Estatı́stica (com aplicações às ciências médicas e biológicas). Rio
de Janeiro: UFRJ, 1970.
[7] CASELLA, G.; BERGER, R. L. Inferência Estatı́stica. Cengage Learning: São Paulo. 2010.
[9] CENTENO, A. J. Curso de Estatı́stica aplicada à Biologia. Goiânia: Ed. Universidade Federal de Goiás,
1981.
[12] FLEISS, J.L. Statistical Methods for rates and proportions. 2a Ed. NY, John Wily and Sons, 1981.
[13] FLETCHER, R. H. e FLETCHER, S. W. Epidemiologia Clı́nica: Elementos Essenciais. 4a . Edição. São
Paulo, ARTMED. 2006.
[14] GAUVREAU, K.; PAGANO. Principios de Bioestatı́stica. 2a Ed. Thonson, 2004.
[15] GUEDES, M. L. S.; GUEDES, J. S. Bioestatı́stica - Para profissionais de saúde. 1a Ed. Ao livro técnico
S.A. RJ, 1988.
[16] MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatı́stica. 6a Ed. EDUSP, 2008.
[17] MARTINEZ, E.Z. Bioestatı́stica para os Cursos de Graduação da Área da Saúde. 1a Ed. 1a Ed. Blucher,
2015.
[18] MONTGOMERY, DOUGLAS. Design and analysis of experiments. 3a Ed. NY, John Wiley & Sons,
1991.
[19] MORETTIN, L. G. Estatı́stica Básica. São Paulo: Makron Books, 2000, vol. I e II.
[20] PAGANO, M.; GAUVREAU, K. Princı́pios de Bioestatı́stica. Ed. Thomson, 2a Edição, SP, 2004.
[21] PEREIRA, M. G.. Epidemiologia: Teoria e Prática. Ed. Guanabara & Koogan, 1995.
[22] SOARES, J. F.; BARTMAN, F. C. Métodos estatı́sticos em medicina e biologia. 14o Colóquio Brasileiro
de Matemática. IMPA/CNPq. RJ, 1983.
167
12.7 Aplicações ROSSI, R. M. 168
[23] SOARES, J. F.; SIQUEIRA, A.L. Introdução à estatı́stica médica. Ed. UFMG. 1999.
[24] SOKAL, R. R. Biometry: The Principles and Practice of Statistics in Biological Research. New York:
W.F. Freeman, 1995.
[25] SIEGEL, S. Estatı́stica não-paramétrica. 1a Ed. RJ, Editora McGraw Hill do Brasil Ltda, 1981.
[28] STEEL, R. G. D. Principles and Procedures of Statistics a Biometrical Approach. 2. Ed. New York: Mc
Graw-Hill, 1980.
[31] WAYNE, W. D. Biostatistics. A foundation for analysis in the health sciences. 10a Ed. J&S. NY, 2014.
12.7 Aplicações ROSSI, R. M. 169
FORMULÁRIOS
Formulário I - Estatı́stica Descritiva 1
√
AT = xmax − xmin k= n k = 1 + 3, 22 log n e h = AT
k
Linf + Lsup Fi Fac
xi = fi = fac =
2 n n
∑n ∑k
xi xi Fi
h(Fi − Fi−1 )
x̄ = i=1 x̄ = i=1 Mo = li +
n n (Fi − Fi−1 ) + (Fi − Fi+1 )
n+1 xp + xp+1 n h(p − Fac−1 ) n
Md = xp ; p = 2 Md = ;p= Md = li + ;p=
2 2 Fi 2
h(p − Fac−1 ) kn
Sk = li + p= w : 1, 4, 10 ou 100
Fi w
x̄ − Mo (Q3 − Q1 ) √
Ap = k= s = s2
s 90 − P10()
2(P
)2
∑n ∑
k
(xi − x̄)
2
( ) k xi
1 ∑ 2
s2 = i=1 s2 = xi −
i=1
-
n−1 n − 1 i=1 n
( )2
∑
k ∑
k
2
(xi − x̄) Fi ( ) k xi Fi
i=1 1 ∑ 2 i=1 s
s2 = s2 = x Fi − cv = 100
n−1 n − 1 i=1 i n x̄
P (A) = #A
#S P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
P (A ∩ B)
P (Ac ) = 1 − P (A) P (A|B) =
∑ P (B)
E(X) = xi p(xi ) V ar(X) = E[(X − E(X))2 ] = E(X 2 ) − [E(X)]2
E(aX ± b) = aE(X) ± b V ar(aX ± b) = a2 V ar(X)
( ) (n) n!
p(X = x) = nx px q n−x x = x!(n − x)!
e−λ λx
p(X = x) =
x!
X −µ
Z=
σ
p(X = x) = λe−λx P (X > x) = e−λx
1 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
12.7 Aplicações ROSSI, R. M. 170
2 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
12.7 Aplicações ROSSI, R. M. 171
∑k (O − E )2
i i ∑k (|O − E | − 0.5)2
i i
χ2 = ∼ χ2(l−1)(c−1) χ2Y ates = ∼ χ2(l−1)(c−1)
i=1 Ei i=1 Ei
Medidas do Efeito
Pr(Doente|Exposto) a/(a+c)
RR = =
Pr(Doente|Não − exposto) b/(b+d)
Zα
1± √ 2
IC(RR; 1 − α%) : RR χ2c
Pr(Exposto|Doente)/[1 − Pr(Exposto|Doente)] ac
OR = =
Pr(Exposto|Não − Doente)/[1 − Pr(Exposto|Não − Doente)] bd
Zα
1± √ 2
IC(OR; 1 − α%) : OR χc 2
po − pe a+d n1 m1 + n2 m2
Kappa = ; po = ; pe =
1 − pe n n2
Kappa Concordância
k=0 nenhuma
k < 0, 4 leve
0, 4 ≤ k < 0, 8 moderada
0, 8 ≤ k < 1 forte
k=1 perfeita
3 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.
12.7 Aplicações ROSSI, R. M. 172
12 ∑k T2
HK−W = i
− 3(N + 1) tal que H ∼ χ2(k−1)
N (N + 1) i=1 ni
12 ∑k
HF r = T 2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1 i
∑
k
2
k(k − 1) (Ti ) − (k − 1)N 2
i=1
Q= ∑
n ∼ χ2k−1
2
kN − (Sj )
j=1
4 Para fazer uso deste formulário nas avaliações, não faça nenhum tipo de anotação.