Escolar Documentos
Profissional Documentos
Cultura Documentos
2 Experimentação Biométrica 7
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 O Raciocı́nio Indutivo da Biometria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Delineamentos Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.1 Etapa de um levantamento estatı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4.1 Estudo de Caso-Controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Estudo de Coorte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.3 Ensaios Clı́nicos Aleatorizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.4 Estudos Descritivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.5 Seccionais ou Transversais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Estatı́stica Descritiva 20
3.1 Organização de Dados Estatı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Normas para a Apresentação Tabular de Dados . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Distribuição de Freqüências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3.2 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4.1 Medidas de Tendência Central ou de Posição . . . . . . . . . . . . . . . . . . . . . . . 27
3.4.2 Medida de Variabilidade ou de dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.5 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5.1 Quartis, Decis e Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5.2 Medidas de Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5.3 Medidas de Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1
4 Inferência Estatı́stica 38
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2 Problemas de Inferência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3 Distribuição Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4 Distribuições de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.1 Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4.2 Distribuição de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4.3 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.5 Verificação da Adequação do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.6 Faixas de Referência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.7 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.8 Tamanho da Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.8.1 Método simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.8.2 Método inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.9 Testes de Hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.9.1 Construção de um Teste de Hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.9.2 O p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7 Análise de Variância 83
7.1 Análise de Variância para Experimentos ao Acaso . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.2 Teste Paramétrico para Comparações Múltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.2.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.2.2 Teste Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.3 Teste Não-Paramétrico para Comparações Múltiplas . . . . . . . . . . . . . . . . . . . . . . . 89
7.3.1 Teste Dunn-Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.4 Análise de Variância com Número Diferente de Repetições . . . . . . . . . . . . . . . . . . . . 91
7.4.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.4.2 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.4.3 Teste Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
2
8 Testes Clı́nicos 95
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.2 Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.2.1 Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
8.2.2 Valor das Predições: VPP e VPN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.2.3 Decisões Incorretas: PFP e PFN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.2.4 Combinação de Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.2.5 Escolha entre Testes Diagnósticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
8.2.6 Relação entre Sensibilidade e Especificidade . . . . . . . . . . . . . . . . . . . . . . . . 104
8.2.7 Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
3
Capı́tulo 1
Definições e Conceitos em
Bioestatı́stica Aplicada
1.1 Introdução
O objetivo deste capı́tulo é ilustrar o papel que conceitos e técnicas estatı́sticas têm na formação do
estatı́stico especializado na área biométrica, na sua prática profissional e de modo especial no avanço do
conhecimento nesta área especı́fica.
Este objetivo será alcançado principalmente através da apresentação e discussão dos resultados de es-
tudos relevantes. Através destes exemplos, argumenta-se que conceitos estatı́sticos têm importante papel a
desempenhar, tanto no estudo da saúde de populações, como nos tratamentos individuais.
1
1.3 Dados Biométricos ROSSI, Robson M. 2
sobre a vacina mais recente e, com a mesma segurança, aconselhá-la em relação à vacina antipólio ou anti-
sarampo. Deverá estar apto a dar à famı́lia do paciente segurança quanto ao diagnóstico, o que pode depender
de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais, como também de seu
conhecimento sobre a relação da idade, sexo e outras condições do paciente a uma determinada doença. Os
novos conhecimentos virão através do trabalho de pesquisa realizado por ele próprio ou por outros. Deve,
portanto, ser capaz de selecionar, da massa de informações, aquelas que forem válidas e que resistirem a
testes cientı́ficos rı́gidos. Deve desenvolver um ceticismo sadio em relação a tudo que lê.
Uma noção básica em planejamentos experimentais referentes à pesquisa médica, é o reconhecimento de
que os indivı́duos diferem não apenas uns dos outros, mas também em relação a si próprios, de dia para
dia ou mesmo de hora para hora. Uma certa quantidade de variação é normal, mas a questão que desafia o
médico é determinar quando uma variação especı́fica se torna patológica (referente à doença). Para isso, o
estudante deve aprender como medir a variação em indivı́duos normais e definir qual é o limite de variação
normal. Deve aprender que há algum erro aleatório presente em cada medida ou contagem feita. É altamente
improvável que duas contagens sucessivas de glóbulos, feitas na mesma amostra de sangue, sejam idênticas.
Quando, porém, uma diferença se torna maior que o erro de mensuração? Para tratar seu paciente
do melhor modo possı́vel, o médico deve saber responder à questões como essa. Para cada medida ou
determinação fornecida pelo laboratório, o médico deve conhecer a variação que é parte do próprio método,
para saber quando uma dada variação representa uma mudança real no paciente.
Sempre que novos métodos de terapia são introduzidos, é necessário saber se são realmente superiores,
isto é, mais eficientes aos velhos métodos. Será nacessário fazer-se a avaliação crı́tica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o fator
em prova foi o único fator de diferença entre o grupo experimental e o grupo controle, se a diferença entre os
resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribuı́da ao acaso. Apenas depois
da avaliação, através de técnicas estatı́sticas adequadas, da fidedignidade dos resultados, comparabilidade
dos grupos experiência e controle e, significância da diferença encontrada é que podemos tirar as conclusões
relativas ao novo método.
O número de falhas encontradas em publicações médicas enfatiza a necessidade de uma avaliação crı́tica
da literatura. Para ajudar o estudante a desenvolver tal atitude são necessários certos conceitos estatı́sticos
básicos e uma certa familiaridade com a terminologia mais usada.
Métodos estatı́sticos são essenciais no estudo de situações em que as variáveis de interesse estão sujeitas,
inerentemente, a flutuações aleatórias. Este é o caso da área da saúde principalmente na Medicina. Mesmo
tomando-se um grupo de pacientes homogêneos, observa-se grande variabilidade, por exemplo, no tempo de
sobrevida após um tratamento adequado. Dosagens de caracterı́sticas hematológicas flutuam não só entre
indivı́duos, como também no mesmo indivı́duo em ocasiões diferentes. Na realidade, há variações entre
diferentes pacientes para qualquer variável de interesse clı́nico. Portanto, para se estudar problemas clı́nicos,
é necessária uma metodologia capaz de tratar a variabilidade de forma adequada.
Deve-se notar, entretanto, que ao tratar um paciente, o médico se vale da experiência de eventos ante-
riores, vivenciada pessoalmente ou transmitida por outros através de livros e artigos. Assim, a Estatı́stica
pode ser vista como ferramenta de organização e validação do conhecimento médico.
1 – Nı́vel de instrução
2 – Peso
3 – Altura
4 - Idade
5 – Fumante
6 – Atividade fı́sica
7 – Taxa de glicose
8 – Taxa de colesterol sérico
9 – Pressão sangüı́nea sistólica.
Amostragem e Planejamento de Experimentos: É a parte que tem por objetivo planejar a pesquisa e se
preocupa com o mecanismo da coleta de dados.
Estatı́stica Descritiva: É a parte que tem por objetivo organizar, apresentar e sintetizar dados observados
de determinada população, sem pretenções de tirar conclusões de caráter extensivo.
Estatı́stica Inferencial ou Indutiva: É a parte que, baseando-se em estudos realizados sobre os dados de
uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi
retirada. A estatı́stica inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades.
É, também definida como um conjunto de métodos para a tomada de decisões.
1.4 Os Conceitos da Bioestatı́stica ROSSI, Robson M. 4
A Estatı́stica está presente em diversas áreas e em diversas abordagens. Podemos citar alguns exemplos
de suas aplicações:
8. Pesquisas: Estudo sobre hábitos migratórios de certo animal; Estimação do tamanho populacional de
certas espécies;
A amostragem é naturalmente usada na vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, pode-se provar (observar) uma pequena porção deste alimento. Desta forma, está
se fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito
de avaliar (inferir) sobre a qualidade de tempero de todo o alimento.
Nas pesquisas cientı́ficas em que se quer conhecer algumas caracterı́sticas de uma população, também é
muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra,
obter valores aproximados, ou estimativas, para as caracterı́sticas populacionais de interesse. Este tipo de
pesquisa é usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob
uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar
caracterı́sticas de toda a população.
A população pode ser formada por pessoas da famı́lia, indivı́duos de uma certa espécie, estabelecimentos
industriais, ou qualquer outro tipo de elementos, cujas variáveis que se pretende estudar sejam passı́veis de
serem mensuradas.
Os elementos de uma população diferem entre si com respeito a fatores tais como: sexo, idade, medidas
fı́sicas, cor, susceptibilidade a doença, agressividade, etc. Desta forma o padrão de comportamento no qual
o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por estas
razões, muitos trabalhos nas ciências em geral tendem a ser de natureza comparativa, procurando lidar com
as variações inerentes.
1.4 Os Conceitos da Bioestatı́stica ROSSI, Robson M. 5
1.4.1 População
É qualquer conjunto de elementos, tendo pelo menos uma variável em comum (Pode ser finita ou infinita).
1.4.2 Censo
Pesquisas utilizando todos os elementos da população.
Obs. Desvantagem quando a população é muito grande Ex.: A população brasileira estimada em novem-
bro/2004: 182.405.960 (Fonte: IBGE - http://www.ibge.gov.br/).
1.4.3 Amostra
É qualquer subconjunto da população. Pesquisas utilizando amostras da população denominam-se
pesquisas por amostragem.
1.4.4 Parâmetros
São certas caracterı́sticas populacionais especı́ficas que se deseja descrever.
1.4.7 Variáveis
São as caracterı́sticas medidas. As variáveis apresentam variabilidade dentro da população. Podem ser
qualitativas ou quantitativas.
Variáveis Qualitativas
Quando seus valores forem expressos por atributos (não-numéricos).
• Nominal quando tem nome (ex.: Cor dos olhos, sexo, raça, consumo de álcool (sim, não), gostar de
estudar ... etc).
• Ordinal quando tem ordem (ex.: classe social, grau de instrução, consumo de álcool (pouco, médio,
muito) ... etc).
Variáveis Quantitativas
Quando seus valores podem ser descritos numericamente.
• Discreta quando seus valores resultam de contagem (ex.: número de filhos, número de reprovações,
número de copos de álcool consumidos... etc).
• Contı́nua quando seus valores resultam de medições e podem assumir qualquer valor em um intervalo
da reta (ex.: estatura, nota na prova, imc, quantidade de álcool consumido ... etc).
1.4 Os Conceitos da Bioestatı́stica ROSSI, Robson M. 6
Exemplo 1.2. Em um experimento de lançar uma moeda e observar a sua face, existem duas possibil-
idades:“Cara ou Coroa“. Considerando uma v.a. discreta X: “número de caras em dois lançamentos“,
temos: ½
Cara: c
possibilidades {cc,ck,kc,kk}: → X : {0, 1, 2}.
Coroa: k
Capı́tulo 2
Experimentação Biométrica
2.1 Introdução
Na medicina como em outros campos da ciência aplicada, o efeito geral da estatı́stica é tornar um
observador mais crı́tico e mais consciente quando, por falta de informação segura, ele tem de agir com base
em impressões ou opinião. Esta é a atitude cientı́fica, e o melhor modo de começar a adquirı́-la é procurar
evidências, e “provar”. Alguns princı́pios dessa procura de evidências serão estudadas neste capı́tulo.
7
2.3 Delineamentos Experimentais ROSSI, Robson M. 8
da mesma raça, sexo e idade, entre diferentes amostras da mesma substância quı́mica “pura”. Todas essa
diferenças são coletivamente chamadas variação e a estatı́stica pode ser descrita como ciência de tratar a
variação.
Os seres humanos são tão infinitamente variáveis interna quanto o são externamente, mas algumas
matérias básicas do curso médico, como a Anatomia, parecem não reconhecer tal fato, deixando de destacar
esse profundo sentido da variação humana. A pseudoprecisão anatômica, criando um conceito artificial do
corpo humano no inı́cio da carreira do estudante, parece que largamente partilham essa responsabilidade; e
mesmo se todos os professores enfatizassem a importância da variação, não iria ajudar muito, a não ser que
o estudante adquirisse prática em enfrentar problemas que surgem da variação - especialmente, prática na
procura de evidências e uma atitude crı́tica em face dos assuntos que lê, ouve ou discute.
Mainland, D. (1952) em Elementary medical statistics - The principles of quantitative medicine, sugere
nove questões que constituem um roteiro valioso para desenvolvimento dessa atitude:
1. Quem?...(relativa ao pesquisador)
2. Para quê?...(relativa ao objetivo da pesquisa)
3. O quê?...(refere-se a pessoas, coisas ou fatos estudados)
4. Onde?...(refere-se ao local e ambiente)
5. Quando?...(refere-se ao tempo)
6. Como?...(relativa aos métodos)
7. Quanto?...(relativa às medidas)
8. Quantos?...(relativa à enumeração)
Tomadas as devidas precauções, alguns aspectos estatı́sticos deverão ser analisados e o tipo de estudo
adequado deverá ser abordado.
Exemplo 2.1. Considere a seguinte hipótese: ”Associação entre incidência de luz solar e câncer de
mama”. Comparações regionais, na antiga União soviética, mostraram correlação negativa entre incidência
de luz solar e de câncer do seio: em locais de baixa luminosidade solar, foi encontrada alta incidência deste
tipo de neoplasia, e vice-versa. Em muitos paı́ses, semelhante associação também foi detectada. A evidência
sugere, segundo os autores, que a vitamina D possa ter papel de relevo na redução do risco de câncer de
mama, e estudos adicionais devem ser feitos para esclarecer a matéria. (GOHAM et al, 1990).
6. Como? (Metodologia): considerando que o câncer de mama é o que mais mata nas mulheres, porém
em relação à população de mulheres é uma doença pouco prevalente, como, por exemplo, Transtorno
Pré-Menstrual. Assim, um estudo de caso-controle em mulheres com câncer de mama já diagnosticado
exposto à luminosidade solar por um perı́odo de tempo predeterminado devendo ser razoavelmente
grande, mas não saberia dizer quanto sem revisão bibliográfica. Na entrevista retrospectiva perguntaria
as mulheres há quanto tempo residiam naquela região, e se tivessem dentro do tempo predeterminado
entrariam no estudo. Faria também um grupo controle de mulheres daquela região para comparação dos
dados. Repetindo este mesmo estudo em mulheres de diferentes regiões com diferentes luminosidades, e
comparando-se as taxas de fatores de riscos, poder-se-ia chegar a conclusão de associação e em seguida
calcular o Odds Ratio, isto é, a razão de chances.
7. Quanto? As medidas seriam o número de mulheres diagnosticadas com câncer de mama comparadas
a um número semelhantes de mulheres sem o câncer (controles) separadas após serem examinadas por
médicos. Já a luminosidade colheria as informações com as centrais de meteriológicas locais ou algum
centro de referência deste assunto para o estudo.
8. Quantos? A amostra tentaria ser a maior possı́vel para melhorar a confiabilidade dos resultados, já que
a doença é pouco prevalente. Procuraria os centros de saúdes locais (hospitais, clı́nicas especializadas,
etc) das respectivas regiões a serem estudadas. Se o número de centros for muito grande e for muito
difı́cil abordá-los, sortearia os centros para amostragem.
9. Por quê? Alguns cuidados têm que serem relevados como o vı́cio da seleção, de informação e con-
fundimento. Por exemplo, a ingestão de alimentos ricos em precursores e da própria vitamina D bem
como uso de suplementos alimentares com vitamina D (pı́lulas), poderia influenciar os resultados dos
estudos.
Observação: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa.
Avaliação de informações existentes. Inicialmente, deve-se realizar um levantamento bibliográfico sobre
o assunto para obter subsı́dios que podem representar valiosa colaboração para o estudo e, também, serem
aproveitados nas discussões posteriores.
B. Formulação de hipóteses. Com exceção das pesquisas meramente descritivas, todas as pesquisas
estatı́sticas comportam a formulação de hipóteses. Com base nos dados observados, a hipótese será
rejeitada ou não.
C. Verificação das hipóteses. A verificação das hipóteses será realizada no decorrer da pesquisa.
D. Delineamento da pesquisa. Compreende o estudo (planejamento) detalhado da coleta de dados, da
realização do trabalho e da análise dos dados.
Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por
outros indivı́duos.
Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observação direta, o
questionário ou interrogatório e a entrevista.
Observação: é a observação direta dos fenômenos em laboratórios ou na natureza.
Questionário: é uma seqüência de perguntas previamente preparadas. O questionário é aplicado por
meio de entrevista ou remetido pelo correio. Os valores observados podem ser complementados por ob-
servação.
Execução da pesquisa. Coleta dos dados e realização da análise estatı́stica.
Análise e apresentação dos resultados. Os dados coletados devem ser apresentados na forma de:
gráficos e/ou de tabelas. A análise dos dados deve ser realizada pelo pesquisador, com a ajuda de um
estatı́stico, aplicando os recursos estatı́sticos necessários para refutar ou não as hipóteses previamente for-
muladas.
Exemplo 2.2. Objetivo geral: conhecer o perfil dos homens portadores de doenças cardı́acas em Honolulu,
Havaı́. Para dar seqüência a esta pesquisa, é preciso especificar melhor o que se quer conhecer da população
de portadores de doenças cardı́acas, ou seja, os objetivos especı́ficos. Exemplos de alguns desses objetivos.
Exemplo 2.3. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das in-
formações contidas em uma amostra dos prontuários dos pacientes. Dados observados: resultados de diversos
atributos e medidas relativas aos pacientes selecionados para participarem da amostra. Esquematicamente:
População: Todos os
portadores de
doenças cardíacas de
Honolulu.
Levantamento Plano de
de dados. amostragem.
Amostra:
Parte dos
portadores
de doenças
cardíacas de
Honolulu.
Dados
observados.
Exemplo 2.4. Objetivo geral: Comparar a eficiência de dois métodos para detectar o bacilo causador de
tuberculose. Em outras palavras, quer-se avaliar se os meios utilizados são equivalentes ou se um é mais
eficiente que o outro. Delineamento da pesquisa: são formados dois grupos de pacientes com tuberculose e
amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). Dados observados: a detecção
ou não do bacilo foi registrada para cada amostra, resultando em dois conjuntos, relativos a cada método.
Esquematicamente:
Meio A. Meio B.
Grupo 1 de Grupo 1 de
pacientes. pacientes.
Amostra 1 de Amostra 2 de
respostas respostas
Sim ou Não. Sim ou Não.
Este é um delineamento de pesquisa experimental, onde o pesquisador exerce controle sobre o método
utilizado.
pela qual passou. Discutiremos maneiras de se organizar um estudo etiológico, métodos estatı́sticos para se
determinar quais fatores estão associados com o contrair da doença e meios de se quantificar esta associação.
A pesquisa etiológica é baseada em dados coletados em pacientes convenientemente escolhidos. O
pesquisador não controla quem será exposto ou não ao fator em questão, mas tem liberdade de deter-
minar quem entrará ou não no estudo. Para que os resultados tenham validade, a pesquisa tem de ser
planejada segundo modelos bem definidos. Os principais tipos de planejamento para estudos etiológicos
receberam os nomes de estudos tipo Caso-Controle, estudos tipo Coorte, Ensaios Clı́nicos Aleatorizados,
Estudos Descritivos e Seccionais ou Tranversais.
doenças. Isto protege os resultados de uma forma de vı́cio da seleção; o estudo não detecta uma associação
porque a doença dos pacientes-controle e a doença sendo estudada estão ambas associadas com o fator de
risco. Quando existe facilidade na coleta de dados o número de pacientes do grupo controle pode ser até 4
vezes maior que o número de pacientes do grupo de casos. O método de seleção dos indivı́duos do grupo
controle é quase que inteiramente dependente das circunstâncias especı́ficas do estudo. Aqui também é fun-
damental o conhecimento da literatura médica da área, já que é usual apresentar-se uma descrição detalhada
dos controles utilizados.
a
EXPOSTOS
DOENTES
(GRUPOS
DE
b CASOS)
NÃO-EXPOSTOS
AMOSTRA
ANÁLISE DE
DE CASOS
DADOS POPULAÇÃO
DE CASOS
E DE AMOSTRA
CONTROLES DE
c CONTROLES
EXPOSTOS
NÃO-DOENTES
(GRUPO
DE
CONTROLES)
d NÃO-EXPOSTOS
Tabela 2.1: Número de fumantes e não fumantes entre pacientes do sexo masculino com diagnóstico de
câncer pulmonar e controles.
Grupo Fumantes Não-Fumantes Total
Câncer pulmonar 647 2 650
Controle 622 27 649
Total 1269 29 1299
A forma de organização deste estudo é chamada de Estudo Caso-Controle. À época, esta metodologia
era muito criticada, pois, com facilidade, podia produzir associações espúrias. Por isso, a evidência, embora
clara e forte, não foi convincente o suficiente.
Assim, os mesmos autores iniciaram um segundo estudo, cuja caracterı́stica básica é o fato de que o
acompanhamento dos pacientes foi prospectivo. Este tipo de planejamento é chamado de Estudo de Coorte.
Em outubro de 1951, os pesquisadores enviaram um questionário simples a todos os médicos da Inglaterra,
aproximadamente 60.000 indivı́duos. O questionário perguntava se o respondente já havia fumado ou não.
Em caso afirmativo, pedia informações sobre o que e quanto. Mais de dois terços dos médicos responderam
com detalhe suficiente para que seus dados pudessem ser incluı́dos no estudo.
As respostas possibilitaram aos pesquisadores classificar cada respondente como fumante ou não fumante.
A definição de não-fumante usada foi: um não fumante é uma pessoa que fumou até no máximo um cigarro
diário, em média, por um perı́odo inferior a um ano.
Através de complexo sistema de acompanhamento, observaram-se nos primeiros 10 anos, 136 mortes
associadas ao câncer pulmonar entre os médicos incluı́dos no estudo. Destas, apenas 3 eram de não-fumantes.
Para equalizar os perı́odos de acompanhamento nos vários grupos, trabalhou-se com a taxa de incidência
por 1.000 pessoas-ano de exposição. Os valores desta taxa estão na Tabela 2.2. O risco de morte por câncer
pulmonar das pessoas que fumam mais de 25 cigarros diários é quase 32 vezes maior do que o mesmo risco
para quem não fuma.
Tabela 2.2: Taxa de mortalidade por 1.000 pessoas-ano devida a câncer pulmonar (número de mortes entre
parênteses) para não fumantes e fumantes.
Não-Fumantes Cigarros diários (Fumantes)
1-14 5-24 25+
0,07(3)
0,57(22) 1,39(54) 2,27(57)
Estes dois planejamentos, estudo Caso-Controle e Estudo de Coorte, são as formas usuais de organização
da pesquisa etiológica. Muitos outros estudos como os descritos anteriormente foram feitos em populações
variadas para se verificar o possı́vel papel do fumo. Em todos, a evidência foi clara. Hoje, o papel de agente
2.4 Aspectos Estatı́sticos dos Estudos Etiológicos ROSSI, Robson M. 15
causador do câncer de pulmão é amplamente reconhecido e justifica a militância cada vez mais organizada
contra o fumo.
Em muitos Estudos de Coorte os grupos de comparação são obtidos após o inı́cio do estudo, de acordo
com o nı́vel de exposição ao fator. As coortes do estudo de Framingham sobre doenças coranárias (Kannel
et al., 1972), foram construı́das dividindo-se o grupo acompanhado de acordo com hábitos de fumo, nı́veis
de colesterol, etc. Nestes casos não há necessidade de um grupo externo de comparação.
Exemplo 2.7. Personalidade e desenvolvimento de doença coronariana.
Um Estudo de Coorte com o objetivo de avaliar o possı́vel efeito da personalidade no risco de desenvolvi-
mento de doença coronariana foi conduzido entre 3.154 trabalhadores do sexo masculino com idade de 30 a
59 anos (Brand et al., 1976). Os indivı́duos entraram no estudo entre 1960-61 e foram acompanhados por
um perı́odo médio de 8 anos e meio. Através de entrevista no inı́cio do estudo, foram classificados em dois
tipos de personalidade, A e B, sendo os primeiros mais agressivos, competitivos e ansiosos.
Os resultados da Tabela 2.3 indicam que nas duas faixas etárias consideradas os percentuais de indivı́duos
do tipo A que desenvolveram doença coronariana são aproximadamente o dobro dos encontrados no outro
grupo.
Em outras situações, particularmente quando um grupo submetido a uma exposição pouco comum é
estudado, é importante comparar o resultado observado com aquele esperado, caso os indivı́duos não tivessem
sido submetidos ao fator de risco. Usa-se a experiência da população em geral, ao tempo em que a coorte é
formada, como padrão de comparação.
Tabela 2.3: Percentual de indivı́duos que desenvolveram doença coronariana segundo faixa etária e tipo de
personalidade.
Faixa etária Personalidade
A B
39-49 8,9 4,2
50-59 15,9 7,6
Finalmente, usa-se também como base de comparações outra coorte formada por pessoas não expostas,
parecidas nas caracterı́sticas demográficas com o grupo exposto. Por exemplo, considerando uma coorte
de radiologistas, Seltser e Sartwell (1965) usaram como padrão de comparação dados de oftalmologistas e
otorrinolaringologistas.
a
DOENTES
POPULAÇÃO
EXPOSTOS
ou
b
grupo-experimental NÃO-DOENTES
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS
c
DOENTES
NÃO-EXPOSTOS
ou
grupo-controle d
NÃO-DOENTES
FORMAÇÃO DOS GRUPOS
POR OBSERVAÇÃO MEDIÇÃO
DA EXPOSIÇÃO DOS EFEITOS
• Facilidade de análise.
• Estudos de Coorte são grandes, longos e normalmente caros. Quanto mais rara a doença em questão,
maior o número de pacientes que precisam ser examinados. Portanto este estudo é inadequado para
doenças de baixa freqüência;
• Vulnerável a perdas (biases).
a
EFEITO: PRESENTE
POPULAÇÃO
EXPOSTOS
À INTERVENÇÃO
ou b
grupo-experimental EFEITO: AUSENTE
AMOSTRA
PARA ANÁLISE
ESTUDO DE
DADOS
c
EFEITO: PRESENTE
NÃO-EXPOSTOS
À INTERVENÇÃO
ou
grupo-controle d
EFEITO: AUSENTE
FORMAÇÃO DOS GRUPOS
POR ALEATORIZAÇÃO E MEDIÇÃO
APLICAÇÃO DOS TRATAMENTOS DOS EFEITOS
a, b, c, d : os quatro possíveis resultados
Estudo de Caso
Trata-se de observar um ou poucos indivı́duos com uma mesma doença ou evento e, a partir de descrição
dos respectivos casos, traçar um perfil das suas principais caracterı́sticas.
Muitas revistas cientı́ficas apresentam uma seção de ”relato” ou ”apresentação de casos”, para difundir
os resultados destes estudos.
O estudo de casos é empregado para enfocar grupos especı́ficos da população ou um particular aspecto
de interesse, não devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de
suplementação de informações, com maior riqueza de detalhes.
• O relato pode restringir-se a uma simples descrição ou ir mais além, de modo a sugerir explicações
sobre elementos pouco conhecidos, tais como os fatores implicados na etiologia ou no curso de uma
doença, sob vigência ou não de terapêutica.
• Em clı́nica, é possı́vel acompanhar pacientes durante anos, e mesmo décadas, chegando-se a um quadro
repleto de detalhes sobre aspectos evolutivos de uma dada condição.
• O estudo de casos constitui-se em um verdadeiro inventário do que acontece genericamente, à luz da
observação de poucos indivı́duos.
• É um enfoque qualitativo e exploratório, embora muitas facetas possam ser quantificadas. Um aspecto
positivo, convém realçar, é a possibilidade de observação intensiva de cada caso.
• Os indivı́duos observados costumam ser altamente selecionados. Às vezes, a observação restringe-se a
situações incomuns de enfermos graves, outras vezes, aos casos de evolução atı́pica, de reação inusitada
ou de resultado terapêutico inesperado; muito raramente, abrange pacientes em todas as faces de
manifestação da doença.
• A falta de indivı́duos-controle, para comparar resultados, pode fazer com que simples coincidências
sejam difı́ceis de interpretar: por exemplo, em investigação de um surto de diarréia, se os casos beberam
água de um certo poço a evidência é ainda frágil para incriminar a água do poço na etiologia da doença.
Seria conveniente saber se os sadios também beberam ou não água do mesmo poço.
Em sı́ntese, apesar das vantagens referentes à facilidade de realização e baixo custo, duas limitações
principais estão presentes no estudo de casos:
• a falta de controle - eles serviriam para contornar problemas de aferição e comparação acima men-
cionados;
• o número pequeno de indivı́duos incluı́dos para observação - o que aponta para a prudência na in-
terpretação dos resultados de estudos de casos, especialmente, na generalização, como ele tem sido
atualmente empregado na área clı́nica, é útil para levantar problemas, muitos dos quais são comple-
mentarmente investigados com o auxı́lio de outros métodos.
• Boa opção para descrever as caracterı́sticas dos eventos na população, para identificar casos na comu-
nidade e para detectar grupos de alto risco, aos quais pode ser oferecida atenção especial.
POPULAÇÃO
AMOSTRA PARA
ESTUDO FORMAÇÃO DOS GRUPOS POR
OBSERVAÇÃO SIMULTÂNEA DE
EXPOSIÇÃO E DOENÇA
a b c d
Exercı́cio 2.1. Indique qual forma de pesquisa foi utilizada nos seguintes problemas:
1. (a) ”Viagra para os diabéticos” (Revista isto é, no 1535 de 03/03/1999) - A famosa pı́lula azul pode
também ser eficaz para diabéticos que tem a função erétil comprometida. Estudos preliminares
haviam descartados a eficiência do Viagra nesses casos. Mas uma pesquisa realizada com 268
homens pela Universidade de Creighton, nos Estados Unidos, mostrou que 56 % dos pacientes
que tomaram Viagra tiveram melhoras contra 10 % dos que ingeriram placebo.
(b) Um estudo foi conduzido em um grupo de gêmeos monozigotos e dizigotos do mesmo sexo, sendo
que um gêmeo do par tinha câncer no cólon e o outro não. Todos foram de universidades do
sudoeste dos Estados Unidos durante um perı́odo de 5 anos. Informações sobre o teor de fibras
da dieta foram coletadas para cada um dos indivı́duos afim de estimar seu efeito na ocorrência do
câncer no cólon.
(c) Durante o ano de 1982, identificou-se cada criança nascida na cidade de Pelotas e procedeu-se
à revisão dos registros de nascimento com o objetivo de conhecer, entre outras variáveis, o peso
ao nascimento. As crianças eram classificadas em dois grupos (peso normal 2.300g e baixo peso
<2.300g) sendo seguidas por um ano. Ao final deste perı́odo comparou-se a mortalidade infantil
nos dois grupos.
(d) Com o objetivo de avaliar uma possı́vel associação entre uso de reserpina e câncer de mama, forma
identificadas 100 pacientes internadas por câncer de mama (casos novos) em um hospital geral
durante um perı́odo de dois anos. Estas pacientes foram entrevistadas sendo colhida a informação
quanto ao uso prévio de reserpina. Para cada caso eram entrevistados quatro controles, seleciona-
dos aleatoriamente dentro do grupo de mulheres internadas por outros diagnósticos durante o
mesmo perı́odo do caso.
(e) 300 pacientes portadores de diabetes mellitus foram alocados aleatoriamente em dois grupos, cada
um com 150. O primeiro grupo recebeu uma droga hipoglicemiante nova, enquanto os demais
permaneceram em uso de clorpropamida. Os pacientes foram acompanhados por seis meses e o
grau de controle metabólico dos pacientes nos dois grupos foi comparado através das determinações
de glicemia capilar (diárias) e da hemoglobina glicosilada (aferida a cada dois meses).
Capı́tulo 3
Estatı́stica Descritiva
1. Elementos essenciais
a. Tı́tulo:
É a indicação da natureza do fato estatı́stico observado, fazendo referência ao local e ao tempo
em que foi observado.
b. Cabeçalho:
São as indicações que especificam o conteúdo das colunas.
c. Coluna indicadora:
São as indicações que especificam o conteúdo das linhas.
2. Elementos complementares
a. Fonte
É a entidade responsável pelos dados contidos na tabela.
b. Nota
São informações que esclarecem critérios usados na confecção da tabela.
c. Chamada
É a informação de natureza especı́fica, que serve para complementar determinado dado usado na
confecção da tabela.
20
3.2 Distribuição de Freqüências ROSSI, Robson M. 21
Quando a variável em estudo é do tipo contı́nua e assume muitos valores distintos, o agrupamento dos
dados em classes será sempre necessário na construção das tabelas de freqüências.
Em publicações mais antigas sobre construção de tabelas de freqüências, há fórmulas para determinação
do número de classes de acordo com o número de dados. Essas fórmulas eram úteis, pois a construção
dos gráficos era muito custosa sem o auxı́lio do computador. Esse procedimento é aconselhável como uma
primeira visualização da distribuição de freqüências de uma variável. A seguir é apresentado um roteiro para
construção de distribuições de freqüência.
Exemplo 3.1. Considere uma amostra de 25 criança, das quais foram obtidas medidas de intoxicação
alimentar por uma substância desconhecida (g).
Dados brutos
0,77 0,75 0,80 0,78 0,75 0,65 1,05 1,10 0,75 0,75
0,85 0,61 0,78 0,58 0,52 0,78 1,02 0,99 0,65 0,55
0,85 0,90 0,96 0,79 0,55
Fonte: Dados hipotéticos
Os dados, como apresentados acima, são chamados brutos, pois não foram ainda submetidos a nenhum
tipo de tratamento. Inicialmente, os dados devem ser colocados em ordem crescente:
Pode-se observar, agora, que das 25 observações o menor valor é xmı́n = 0, 55 e o maior é xmáx = 1, 10.
Amplitude (AT): é a diferença entre o maior e o menor valor do conjunto de dados observados.
AT = xmáx − xmı́n
3.2 Distribuição de Freqüências ROSSI, Robson M. 22
O número de classes (k), pode ser obtido de uma das fórmulas seguintes:
√
i) k = n ;
AT 0, 58 ∼
h= = = 0, 12
k 5
Obs.: quando os valores observados são números inteiros, os limites das classes também devem ser
AT
números inteiros. Para isso, aconselha-se escolher o número mais próximo de AT que resulte h = em
k
um número inteiro.
Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:
i) o limite inferior da primeira classe pode ser o menor valor da série, neste caso : 0,52.
ii) os demais limites serão obtidos somando aos limites inferiores o valor de h. Isto é,
0, 52 ` (0, 52 + h = 0, 52 + 0, 12) = 0, 64
0, 64 ` (0, 64 + h) = 0, 76
0, 76 ` (0, 76 + h) = 0, 88
0, 88 ` (0, 88 + h) = 1, 00
1, 00 ` (1, 00 + h) = 1, 12.
Lembrando que a notação (`) significa que se esta incluindo os valores iguais ao limite inferior e excluindo
os valores iguais ou superiores ao limite superior. A partir da listagem ordenada das classes, pode-se construir
os chamados quadros (ou tabelas) de freqüência ou distribuições de freqüência, que permitem uma melhor
visualização dos dados.
i) xi é o ponto médio da i-ésima classe; representa a média dos pontos limites da classe;
li + Li
xi = ; li : limite inferior e Li : limite superior da classe i.
2
Fi
v) fi é a freqüência relativa da i-ésima classe, fi = ;
n
vi) Faci é a freqüência acumulada da i-ésima classe;
Faci
vii) faci é a freqüência relativa acumulada da i-ésima classe, faci = .
n
Assim, no caso da amostra de 25 criança intoxicadas, a distribuição de freqüência pode ser da seguinte
forma:
Outras informações:
Nenhuma cela ( casa ) deve ficar em branco .
Hı́fen ( - ) , indica que o valor numérico é nulo.
Reticência ( ... ) , indica que não se dispõe do dado.
Interrogação ( ? ) , indica dúvida quanto a exatidão do valor numérico.
Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em relação a unidade utilizada.
3.3 Gráficos
Os gráficos são representações pictóricas, de grande valia na compreensão e visualização dos dados.
Os principais gráficos utilizados na representação estatı́stica são:
1. Diagramas;
2. Cartogramas;
3. Estereogramas.
3.3 Gráficos ROSSI, Robson M. 24
3.3.1 Diagramas
São representações gráficas de séries estatı́sticas por intermédio de linhas e superfı́cies. As linhas utilizadas
são as poligonais e as curvas, e as superfı́cies são retângulos, cı́rculos e quadrados. Para suas contruções
pode-se utilizar a proporcionalidade entre série de números ou do sistema retilı́nio ortogonal. Este sistema
estabelece uma correspondência biunı́voca entre os pares de números reais e os pontos de um plano. Assim,
de modo geral, num sistema retilı́neo ortogonal, um ponto P do plano está determinado pelos números reais
X e Y, tomados sobre dois eixos divididos em segmentos unitários.
4
2
0
0 2 4 6 8
4.5
4.0
3.5
Jan
Feb
Mar
Apr
May
Jun
Jul
Aug
Sep
Oct
Nov
Dec
O polı́gono de freqüência é um gráfico que se obtém unindo por uma poligonal os pontos correspondentes
às freqüências das diversas classes, centradas nos respectivos pontos médios. Para obter as interseções do
polı́gono com o eixo, cria-se em cada extremo do histograma uma classe com freqüência nula.
Obs.: Suavizando a linha poligonal que define o polı́gono obtém-se uma curva que visualiza a tendência
de variação dos dados.
0.3
Probabilidade
0.2
0.1
0.0
−4 −3 −2 −1 0 1 2 3
Amostra
Ogiva
A Ogiva ou Polı́gono de Freqüência Acumulada, consiste de uma linha poligonal das Fac ou das fac .
40
20
0
−2 0 2 4 6
Os valores da variável dependente, dados pela série estatı́stica ou suas diferenças, devem ser proporcionais
às áreas dos retângulos a serem traçados. Para tanto pode-se utilizar o sitema retilı́nio ortogonal marcando-
se os pontos de forma já indicada, e a partir do eixo dos x, construir retêngulos de bases iguais e que tenham
respectivamente, por meio de cada base, os valores da variável independente e os pontos marcados.
25
20
15
10
5
0
0 1 2 3 4 5 6
3.3.2 Histograma
Diagrama por Superfı́cie em Histogramas:
O Histograma é um conjunto de retângulos com bases sobre um eixo dividido de acordo com os tamanhos
de classe, centrados nos pontos médios das classes e áreas proporcionais às freqüências.
20
15
Freqüência
10
5
0
−3 −2 −1 0 1 2
amostra
B
A
Média
Representa o ponto de equilı́brio de um conjunto de dados. Seja (x1 , . . . , xn ) um conjunto de dados. A
média será dada por:
P
N
xi
i=1
µ= ( dados populacionais ), para dados não-agrupados em tabelas de freqüências.
N
P
n
xi
x = i=1 ( dados amostrais ), para dados não-agrupados em tabelas de freqüências.
n
P
k
xi Fi
i=1
x= ( dados amostrais ), quando os dados agrupados em tabelas de freqüências, com k classes.
n
Quando os dados são agrupados em intervalos de classes, xi corresponde ao ponto médio do intervalo.
Exemplo 3.2. Considere do Exemplo anterior, o conjunto de dados da amostra retirada da variável nı́vel
de intoxação, dado no inı́cio desta parte. A média será dada por:
P
25
xi
i=1 19, 53
xA = = = 0, 7812, para os dados brutos, ou
n 25
P
5
xi Fi
i=1 19, 66
xB = = = 0, 7864, para os dados agrupados (Tabela 3.3).
n 25
Observe que x̄A ' x̄B .
3.4 Medidas Descritivas ROSSI, Robson M. 28
Propriedades da Média:
1 - A soma algébrica dos desvios tomados em relação a média é nula. Isto é,
Pk Pk
i=1 di = i=1 (xi − x) = 0 , i = 1, 2, . . . , n
X = {2, 3, 7} → x = 4,
Pk
pela propriedade: i=1 di = (2 − 4) + (3 − 4) + (7 − 4) = 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a média do conjunto
fica aumentada ou diminuı́da dessa constante.
yi = xi ± k ⇒ y =x±k
3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante k, a média do
conjunto fica multiplicada ou dividida por essa constante.
xi x
yi = k · xi ⇒ y =k·x e yi = ⇒ y= ; .k 6= 0.
k k
1 - É uma medida que, pôr uniformizar os dados, não representa bem os conjuntos que revelam tendências
extremas, uma vez que a mesma será grandemente influenciada pelos valores discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno tenha as seguintes notas em uma disciplina:
30, 35, 25, 30, 25 35, 35, 95, 90, 100.
500
Um cálculo rápido nos mostra que sua média final foi x = = 50. Como a média deve traduzir o
10
aproveitamento do aluno durante o ano e a média 50 só foi conseguida à custa das três últimas notas,
concluı́mos que 50 é um valor falho para medir o aproveitamento do aluno.
2 - A média nem sempre tem existência real, isto é, ela nem sempre faz parte do conjunto de dados
(x ∈
/ X).
3 - É a medida de posição mais conhecida e de maior emprego.
4 - É facilmente calculada.
5 - Serve para compararmos conjuntos semelhantes.
6 - Depende de todos os valores do conjunto de dados.
7 - em geral não ocupa a posição central do conjunto (ocupa a posição do centro de equilı́brio).
Moda
A Moda (Mo ) é o valor que ocorre com maior freqüência em uma série de dados. Existem séries de dados
em que nenhum valor aparece mais vezes que outros. Neste caso não apresenta moda. São séries amodais.
Em outros casos, pode aparecer dois ou mais valores de concentração. Diz-se então, que a série tem duas ou
mais modas (bimodal, trimodal ou multimodal).
X : {2, 2, 2, 2, 5, 5, 5, 6, 6, 7, 8} → Mo = 2 (unimodal).
3.4 Medidas Descritivas ROSSI, Robson M. 29
h(Fi − Fi−1 )
“Czuber”: Mo = li + .
(Fi − Fi−1 ) + (Fi − Fi+1 )
Outras modas:
“Pearson”: Mo = 3.Md − 2.x
e
h.Fi+1
“King”: Mo = li + .
Fi−1 + Fi+1
Exemplo 3.3. Calcular a moda de Czuber, para os dados agrupados da amostra dada na Tabela 3.3.
i = 3 (Classe de maior freqüência)
h = 0, 12
l3 = 0, 76
Fi = F3 = 8
Fi−1 = F2 = 6
Fi+1 = F4 = 3
0, 12(8 − 6)
Mo = 0, 76 + ' 0, 794
(8 − 6) + (8 − 3)
Isto significa que o nı́vel de toxicidade mais freqüênte é de 0,794 g.
Mediana
A mediana (Md ) de um conjunto de valores ordenados segundo uma ordem de grandeza, é o valor situado
de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos (é o valor
que está no meio !).
Quando o conjunto de observações tem um número ı́mpar de valores, não-agrupados em classes, então
n+1
a mediana é dada pela expressão: Md = xp , onde p = .
2
x1 x2 x3 x4 x5
→ Md = 5.
3 5 5 6 7
Quando o conjunto de observações tem um número par de valores, não-agrupados em classes, então a
xp + xp+1
mediana será, a média aritmética dos dois números que ocuparem o meio da série: Md = , onde
2
n
p= .
2
x1 x2 x3 x4 x5 x6 5+6
→ Md = = 5, 5.
3 5 5 6 7 7 2
Exemplo 3.4. Calcular a mediana para os dados agrupados da amostra da Tabela 3.3.
3.4 Medidas Descritivas ROSSI, Robson M. 30
n = 25³ ´
n
i = 3 p = = 12, 5 está na terceira linha −→ olhar em Fac
2
h = 0, 12
Fi = 8
Fac−1 = 11 (freqüência acumulada da classe anterior)
l3 = 0, 76
0, 12(12, 5 − 11)
Md = 0, 76 + ' 0, 783
8
Isto significa que o 50% das crianças apresenta nı́vel de toxicidade acima de 0,783 g.
Amplitude total
Amplitude total (AT): É a diferença entre o maior e o menor valor observado
AT = xmáx − xmı́n
Variância
Variância [Var(X)]. É a medida que fornece o grau de dispersão, ou variabilidade dos valores do
conjunto de observações em torno da média. Ela é calculada somando os quadrados dos desvios em relação
à média:
Amostral Populacional
Pn
2
(xi − x̄) P
N
(xi −µ)2
2 i=1 2
D. Brutos s = σ = i=1
N
n−1 µ ¶2
Pk
2 P
k
(xi − x̄) Fi µ ¶ k xi Fi P
k
(xi −µ)2 Fi
1 P 2
D. Agrupados s2 = i=1 2
ou s = xi Fi −
i=1
2
σ = i=1
N
n−1 n−1 i=1 n
3.4 Medidas Descritivas ROSSI, Robson M. 31
Desvio-padrão
Desvio-padrão [DP(X)]. Como a variância calculada a partir do quadrados dos desvios, sua unidade
é quadrada em relação à variável estudada, o que, sob o ponto de vista prático é um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio padrão,
definida como a raiz quadrada da variância e representada por:
Amostral
√ Populacional
√
s = s2 σ = σ2
Propriedades da Variância e do Desvio-Padrão
1 - V ar(X) ≥ 0 =⇒ DP (X) ≥ 0.
2 - Somando-se ou subtraindo-se uma constante k, a todos os valores de uma variável, a variância e o
desvio-padrão do novo conjunto permanecem inalterados:
Y =X ±k ⇒ V ar(Y ) = V ar(X) + 0
Y =X ±k ⇒ DP (Y ) = DP (X) + 0
e para k 6= 0,
X V ar(X)
Y = ⇒ V ar(Y ) =
k k2
X DP (X)
Y = ⇒ DP (Y ) =
k |k|
4 - Sejam X e W variáveis aleatórias independentes, a e b constantes reais, tal que Y = aX ± bW, tem-se:
Variância Relativa
A variância relativa de uma série X é indicada por VR(X) e definida por:
s2
V R(X) = 2 (amostral)
(x̄)
Note que o coeficiente de variação, como é uma divisão de elementos de mesma unidade, é um número puro.
Portanto, pode ser expresso em percentual.
Coeficiente de variação
Coeficiente de variação (CV). É uma medida relativa da dispersão ou variabilidade dos dados:
s σ
CV(x) = (amostral) ou CV(x) = (populacional).
x̄ µ
Critérios para interpretação: Quanto menor for o coeficiente de variação (CV ≤ 25%), mais representa-
tiva dos dados será a média.
3.5 Medidas Separatrizes ROSSI, Robson M. 32
Exemplo 3.5. Calcular a variância, o desvio-padrão e o coeficiente de variação para o conjunto de dados
da amostra X: {2, 3, 5, 7}.
P
3
xi Fi
i=1 1.2 + 3.4 + 5.2
sendo x = = = 3, temos
n 8
P
k
2
(xi − x̄) Fi 2 2 2
i=1 (1 − 3) .2 + (3 − 3) .4 + (5 − 3) .2
s2 = = ' 2, 29, ou
n − 1 7
µ k ¶2
P
µ ¶ k x i Fi
1 P i=1
s2 = x2i Fi − = s2
n − 1 i=1 n
µ ¶" 2
#
1 (24) 16
= 88 − = ' 2, 29
8−1 8 7
√
logo, s = 2, 29 ' 1, 51, assim:
1, 51
cv = ' 0, 50 (há indicativo de que a média não é representativa).
3
h(p − Fac−1 )
Sk = li +
Fi
onde
SK : é a medida de posição separatriz desejada (Md : M ediana, Qk : Quartil, Dk : Decil ou Pk :
P ercentil de ordem k);
k : é a ordem da medida;
w : é o divisor;
3.5 Medidas Separatrizes ROSSI, Robson M. 33
Sk k w
Md 1 2
Q 1, 2, 3 4
D 1, 2, ...,9 10
P 1, 2, ...,99 100
p : é a posição da observação, dado por:
n.k
p=
w
Exemplo 3.7. Calcule o Q1 , Q2 , Q3 , D7 , P10 e P90 para os dados da Tabela 3.3.
Solução:
Cálculo de Q1 : {k = 1; w = 4; }
25.1
p= = 6, 25 (i = 2 : olhar em Fac )
4
h = 0, 12
Fi = F2 = 6
li = 0, 64
Fac−1 = 5
0, 12(6, 25 − 5)
Q1 = 0, 64 + = 0, 64 + 0, 025 = 0, 665
6
Obs.: O valor Q1 = 0, 665 representa o nı́vel de intoxicação que deixa 25% dos demais valores abaixo dele.
Cálculo de Q2 : {k = 2; w = 4; }
25.2
p= = 12, 5 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(12, 5 − 11)
Q2 = 0, 76 + ' 0, 783 = Md
8
Obs.: O valor Q2 ' 0, 783 representa o o nı́vel de intoxicação que deixa 50% dos demais valores abaixo dele,
isto é, é o valor mediano.
Cálculo de Q3 : {k = 3; w = 4; }
25.3
p= = 18, 75 (i = 3)
4
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(18, 75 − 11)
Q3 = 0, 76 + ' 0, 876
8
3.5 Medidas Separatrizes ROSSI, Robson M. 34
Obs.: O valor Q3 ' 0, 876 representa o nı́vel de intoxicação que deixa 75% dos demais valores abaixo dele.
Cálculo de D7 : {k = 7; w = 10; }
25.7
p= = 17, 5 (i = 3)
10
h = 0, 12
Fi = 8
li = 0, 76
Fac−1 = 11
0, 12(17, 5 − 11)
D7 = 0, 76 + ' 0, 858
8
Obs.: O valor D7 ' 0, 858 representa o o nı́vel de intoxicação que deixa 70% dos demais valores abaixo dele.
Cálculo de P10 : {k = 10; w = 100; }
25.10
p= = 2, 5 (i = 1)
100
h = 0, 12
Fi = 5
li = 0, 52
Fac−1 = 0
0, 12(2, 5 − 0)
P10 = 0, 52 + = 0, 58
5
Obs.: O valor P10 = 0, 58 representa o o nı́vel de intoxicação que deixa 10% dos demais valores abaixo dele.
Cálculo de P90 : {k = 90; w = 100; }
25.90
p= = 22, 5 (i = 1)
100
h = 0, 12
Fi = 3
li = 1, 00
Fac−1 = 22
0, 12(22, 5 − 22)
P90 = 1 + = 1, 02
3
Obs.: O valor P90 = 1, 02 representa o o nı́vel de intoxicação que deixa 90% dos demais valores abaixo dele
ou 10% acima dele.
(A) Distribuição Assimétrica negativa. Quando a média é menor que a mediana que é menor que a
moda.
(B) Distribuição Simétrica. Quando a média, moda e mediana são iguais, ou muito próximas.
(C) Distribuição Assimétrica positiva. Quando a média é maior que a mediana que é maior que a
moda.
3.5 Medidas Separatrizes ROSSI, Robson M. 35
Uma das medidas para quantificar a assimetria de uma distribuição pode ser dada pelo primeiro coe-
ficiente de assimetria de Pearson (Ap ) :
x̄ − Mo 3 (x̄ − Md )
Ap = ou Ap =
s s
Q3 + Q1 − 2Md
Ab =
Q3 − Q1
Em ambos temos:
Se A < 0 a distribuição é assimétrica negativa.
Se A = 0 a distribuição é distribuição simétrica.
Se A > 0 a distribuição é assimétrica positiva.
Exemplo 3.8. Considerando o conjunto de dados da Tabela 3.3, obter Ap .
sabemos que: x = 0, 7864; s = 0, 153 e Mo ' 0, 794, assim:
x̄ − Mo 0, 786 − 0, 794
Ap = = ' −0, 04967 (Ap < 0 : assimétrica negativa ).
s 0, 153
3.5 Medidas Separatrizes ROSSI, Robson M. 36
(A) Distribuição Leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais “fechada”
que a da distribuição Normal.
(B) Distribuição Mesocúrtica. Quando a distribuição apresenta uma curva de freqüência “idêntica” a
da distribuição Normal.
(C) Distribuição Platicúrtica. Quando a distribuição apresenta uma curva de freqüência mais “aberta”
que a da distribuição Normal.
(Q3 − Q1 )
k=
2(P90 − P10 )
Obs1 : k : coeficiente de curtose
3.5 Medidas Separatrizes ROSSI, Robson M. 37
Inferência Estatı́stica
4.1 Introdução
Inferência Estatı́stica ou Estatı́stica indutiva é a parte da estatı́stica que utiliza métodos cientı́ficos para
fazer afirmações e tirar conclusões sobre caracterı́sticas ou parâmetros de uma população, baseando-se em
resultados de uma amostra. O próprio termo “indutiva” decorre da existência de um processo de indução, isto
é, um processo de raciocı́nio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões
sobre a realidade no todo. O uso de informações da amostra para concluir sobre o todo faz parte da atividade
diária da maioria das pessoas. Basta observar como uma cozinheira verifica se o prato que ela está preparando
tem ou não a quantidade adequada de sal. Ou ainda, quando uma dona de casa, após experimentar um
pedaço de uma laranja numa banca de feira, decide se as compra ou não. Essas são decisões baseadas em
procedimentos amostrais.
O objetivo é procurar a conceituação formal desses princı́pios intuitivos do dia-a-dia para que possam ser
utilizados cientificamente em situações mais complexas.
É fácil perceber que um processo de inferência ou indução ( em estatı́stica) não pode ser exato. A
Inferência Estatı́stica, entretanto, irá dizer até que ponto pode-se estar errando nas inferências, e com que
probabilidade. Esse fato é fundamental para que uma inferência possa ser considerada estatı́stica, e faz parte
dos objetivos da Inferência Estatı́stica.
Em suma, a Inferência Estatı́stica busca obter resultados sobre as populações a partir das amostras,
dizendo também, qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões
obtidas. Evidentemente, a forma como as inferências serão realizadas irá depender de cada tipo de problema,
conforme será estudado posteriormente.
Segue-se que a teoria da Inferência Estatı́stica recorre intensamente a conceitos e resultados do Cálculo
de Probabilidades.
38
4.3 Distribuição Amostral ROSSI, Robson M. 39
Exemplo 4.1. Uma certa doença pode ser curada através de procedimentos cirúrgicos em 80% dos casos.
Dentre os que têm essa doença, sorteamos 15 pacientes que serão submetidos à cirurgia.
Fazendo alguma suposição adicional que julgar necessária. Qual a probabilidade de todos serem curados?
X ∼ Bin(15; 0, 8)
µ ¶
15
P (X = 15) = 0, 815 0, 215−15
15
' 0, 0352 ou 3, 52%.
média : E(X) = np
variância : V ar(X) = npq
X ∼ P o(λ).
O modelo Poisson é um modelo discreto muito utilizado em experimentos biológicos e, nesses casos, λ é
a freqüência média ou esperada de ocorrências num determinado intervalo de tempo.
Exemplo 4.2. Chegada de pacientes em um pronto socorro.
Suponha que o número de pacientes que chegam a um pronto socorro de uma pequena cidade durante a
madrugada tenha distribuição de Poisson com média 3 (λ = 3).
Calcular as probabilidades de chegadas desses pacientes:
0.3
Probabilidade
0.2
0.1
0.0
−4 −3 −2 −1 0 1 2 3
Amostra
X ∼ N (µ, σ)
Lê-se: O conjunto de dados X, têm distribuição Normal com média : µ e desvio-padrão : σ.
Devido a complexidade da função de probabilidade, fazemos uso da Tabela Normal-Padrão ou Normal-
Reduzida, construı́da através da transformação na variável X:
X −µ
Z= ∼ N (0, 1)
σ
Caracterı́sticas:
1. é contı́nua;
2. a curva em forma de sino, que engloba o total de freqüências ou 100%;
3. é simétrica: a média (µ) = a moda (Mo ) = a mediana (Md );
4. é unimodal;
5. o desvio-padrão é σ;
6. a curva de inflexão ocorre nos pontos x = µ ± σ;
Como já dissemos, a área subordinada à curva normal representa 100% das freqüências. Em torno da
média determinamos intervalos com utilização do desvio-padrão, conforme abaixo:
µ±σ = 68, 26%
µ ± 2σ = 95, 45%
µ ± 3σ = 99, 73%
Exemplo 4.3. Pressão sistólica em jovens saudáveis.
Suponha que a pressão arterial sistólica em pessoas jovens gozando de boa saúde tenha distribuição
N (120, 10) mmHg.
Qual é a probabilidade de se encontrar uma pessoa com pressão sistólica acima de 140 mmHg ?
X −µ 140 − 120
= Z= =2
σ 10
P (X ≥ 140) = P (Z ≥ 2) = P (Z ≤ −2) = 0, 0228 ou 2, 28%.
Isto é, 2, 28% das pessoas jovens e sadias têm pressão sistólica acima de 140 mmHg.
4.5 Verificação da Adequação do Modelo ROSSI, Robson M. 42
Grandes discrepâncias entre as freqüências relativas observadas e as probabilidades teóricas acima sitadas,
indicam uma possı́vel falta de adequação ao modelo gaussiano.
Outros critérios:
Por exemplo, para um nı́vel de significância de 5%, se p-valor < 5% então rejeitamos H0 , conseqüente-
mente os dados não são normalmente distribuı́dos.
Na prática, se for verificado que pelo menos o p-valor de um teste é significante (p < α%), a hipótese de
normalidade da distribuição deve ser rejeitada; e caso contrário se houver concordância dos testes W e L,
isto é, os dados são normalmente distribuı́dos.
1-alfa
alfa/2 alfa/2
-Zalfa/2 +Zalfa/2
Observe através da Figura 4.3 o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a
distribuição Normal.
Para a Amostra 1, foram realizados os testes de normalidade e indicaram ajuste dos dados já que p-
Lilliefors >.20 e p-W = 0,8892. (Software Statistica versão 6.0).
Observe através da Figura 4.4 uma assimetria do Histograma comparado à Normal assim como a não
aderência ou desajuste dos dados (pontos) sob a reta, indicando que os dados não seguem uma distribuição
Normal.
Os testes confirmam isto: Para a Amostra 2 obtemos p-Lilliefors <0,01 e p-W < 0,000013.
Neste caso duas metodologias distintas deverão ser utilizadas para construir faixas de referência:
• Metódo de Gauss para a Amostra 1:
[x̄ ± 1, 96.s] : [30, 7 ± 1, 96.4, 9]
[21; 40] colônias. ”Adequado”
Observe que devido a normalidade temos praticamente a mesma faixa, utilizando o método dos per-
centis:
[21; 41] colônias. ”Adequado”
4.7 Teorema do Limite Central ROSSI, Robson M. 44
0.10
Q-QPlot
40
0.08
35
Freqüências
0.06
amostra
30
0.04
25
0.02
0.0
20
20 25 30 35 40 -2 -1 0 +1 +2
Q-=Q Plot
70
0.04
60
0.03
Freqüências
amostra2
50
0.02
40
30
0.01
20
0.00
20 40 60 80 -2 -1 0 1 2
• e Metódo dos Percentis para a Amostra 2, isto é, obter uma faixa de inclua, por exemplo, 95% dos
elementos, excluindo os 2,5% valores menores e os 2,5 % maiores valores
Um teste estatı́stico a ser usado depende do tipo de variável e do tipo de planejamento. A seguir serão
apresentados os testes mais comuns para quatro situações: variável dicotômica (amostras independentes e
pareadas) e variável contı́nua (amostras independentes e pareadas).
Utilizando-se deste teorema, podemos construir um Intervalo de Confiança de (1 − α)% para µ, para um
nı́vel de significância, α, fixo:
σ
IC(µ) : X̄ ± Z α2 . √ .
n
Se a população original é próxima da normal, sua convergência é rápida; já, se a distribuição da população
tem outra distribuição, essa convergência é mais demorada. Como regra prática, aceita-se que para amostras
com mais de 30 elementos a aproximação já pode ser considerada muito boa.
No caso de amostras pequenas, usa-se uma aproximação através da distribuição t − student :
s
IC(µ) : X̄ ± t(n−1; α2 ) . √ ,
n
assim, para n suficientemente grande, pode-se considerar a distribuição amostral de p̂ do seguinte modo:
µ ¶
p.(1 − p)
p̂ ∼ N p;
n
onde
1
n0 = .
E0
Conhecendo N o tamanho da população, pode-se corrigir o cálculo:
N.n0
n= .
N + n0
Exemplo 4.5. Com objetivo de conhecer algumas caracterı́sticas dos pacientes de uma clı́nica com 35
pacientes. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas
caracterı́sticas da população de pacientes. Qual deve ser o tamanho mı́nimo da amostra aleatória simples,
tal que se possa admitir, com alta confiança, que os erros amostrais não ultrapassem 4% (E0 = 0,04)?
Solução: Uma primeira aproximação é dada por:
1
n0 = = 625 pacientes.
0, 042
Corrigindo, em função do tamanho N da população, tem-se:
35.625
n= ' 34.
35 + 625
Exemplo 4.6. Suponha que na clinica do Exemplo anterior a população fosse de N = 200 pacientes. Qual
deve ser o tamanho mı́nimo da amostra aleatória simples, tal que se possa admitir, com alta confiança, que
os erros amostrais não ultrapassem 4% (E0 = 0,04)?
Solução: O valor de n0 continua sendo o mesmo do exemplo anterior, pois não depende de N. Fazendo a
correção em termos do novo valor de N, tem-se:
200.625
n= ' 152.
200 + 625
Exemplo 4.7. Suponha agora que a população fosse de N = 200.000 pacientes.
Solução: Da mesma forma, o valor de n0 continua sendo o mesmo dos exemplos anteriores. E a correção
em termos do novo valor de N, é:
200.000.625
n= ' 623 pacientes.
200.000 + 625
Observe que: Para manter o mesmo erro amostral, no Exemplo ?? foi necessária uma amostra abrangendo
quase 100% da população; enquanto no Exemplo 4.6 a amostra abrange 76%; e no Exemplo 4.7 abrange
0,3% da população. É, portanto, errônea a idéia de que para uma amostra ser representativa
deva abranger uma percentagem fixa da população.
Tamanho da amostra em subgrupos da população
É muito comum termos interesse em estudar separadamente certos subgrupos da população. Nesta
situação, é preciso calcular o tamanho da amostra para cada uma destas partes. O tamanho total da
amostra vai corresponder à soma dos tamanhos das amostras de cada parte.
O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos
subgrupos da população, por isso, é comum o pesquisador não ser muito exigente na precisão das estimativas
nos subgrupos, tolerando erros amostrais maiores.
Sendo o tamanho máximo do erro aceitável : e (fixo), com probabilidade (1 − α) (fixo), o intervalo de
confiança de nı́vel 100(1 − α)% serão, respectivamente, para a média e para a proporção, considerando a
população infinita, tem-se:
· ¸
Z α2 .so 2 so
n= onde e = Z α2 √
e n
· ¸ · ¸
Z α2 . 2 Z α2 . 2
n= .p̂0 .(1 − p̂0 ) ou n≤
e 2e
onde p̂0 e so são estimativas da proporção e da dispersão, respectivamente, obtidos através de uma amostra
piloto.
Exemplo 4.8. Numa amostra de classificação de veteranos de um colégio com. x̄ = 2, 6 e so = 0, 3, qual
deve ser o tamanho da amostra para que tenhamos 95% de confiança em que erro da estimativa de µ não
supere 0,05?
Sol.:
· ¸2
Z α2 .so
n =
e
· ¸2
1, 96.0, 3
=
0, 05
' 139.
Exemplo 4.9. Suponha que, em uma amostra de 500 famı́lias que possuem aparelho de televisão em certa
cidade, haja 340 com televisor em cores. Se o objetivo é estimar o número de famı́lias que possuem televisor
em cores, qual o tamanho da amostra necessário para que tenhamos 95% de confiança em que o erro da
estimativa não seja superior a 0,02 ?
Sol.: Trate as 500 famı́lias como uma mostra preliminar que fornece a estimativa p̂0 = 0, 68. Então:
· ¸
Z α2 . 2
n = .p̂0 .(1 − p̂0 )
e
· ¸2
1, 96
= .0, 68.(0, 32)
0, 02
= 2.090
Sol.:
· ¸2
Z α2 .
n0 = .p̂0 .(1 − p̂0 )
e
· ¸2
1, 96
n0 = .0, 22.(0, 78)
0, 05
n0 ' 264
Os processos que nos permitem decidir por rejeitar ou não rejeitar uma hipótese, ou determinar se
amostras observadas diferem significativamente dos resultados esperados são chamados Testes de Hipóteses.
O objetivo é fornecer ferramentas que nos permitam validar ou refutar uma hipótese, através de resultados
da amostra. Os Testes de Hipóteses podem ser de dois tipos:
(a) Não Paramétricos: quando formulamos hipóteses com respeito à natureza da distribuição da população.
Estes testes não dependem dos parâmetros populacionais, nem de suas respectivas estimativas. Veja o
item (3.) acima.
(b) Paramétricos: quando formulamos hipóteses com respeito ao valor de um parâmetro populacional.
Veja itens (1.) e (2.) acima.
(a) Hipótese Nula (H0 ): é uma afirmação que diz que o parâmetro populacional é tal como especificado.
(b) Hipótese alternativa (Ha ): é uma afirmação que oferece uma alegação alternativa (isto é, o parâmetro
é diferente do valor alegado).
1. Teste Bilateral: quando utilizamos ambas as “caudas” da distribuição. Teste Unilateral à Direita:
quando utilizamos a “cauda” direita da distribuição.
H0 : θ = θ0
Ha : θ 6= θ0
4.9 Testes de Hipóteses ROSSI, Robson M. 49
H0 : θ = θ0
Ha : θ > θ0
H0 : θ = θ0
Ha : θ < θ0
Ao se testar uma hipótese, o que se deseja verificar é, através de uma estatı́stica obtida de uma amostra,
se a hipótese pode ou não rejeitada com o nı́vel de significância pré-fixado, α. Esta conclusão é tomada com
base na Região Crı́tica (RC: cuja área corresponde a α) que é construı́da de modo que:
1-alfa
alfa/2 alfa/2
-Zalfa/2 +Zalfa/2
A seqüência abaixo pode ser usada sistematicamente para qualquer teste de hipótese:
2. Passo 2: Use a teoria estatı́stica e as informações para decidir qual a distribuição da estatı́stica
(estimador) que será utilizada no julgamento de H0 ;
3. Passo 3: Escolher o nı́vel de significância a e utilizando as informações fornecidas pela amostra para
encontrar o valor do estimador do parâmetro (estatı́stica) que está sendo testado;
4. Passo 4: Com o valor da estatı́stica observada na amostra encontrar a probabilidade (probabilidade
de significância p-valor) de ocorrer amostras com valores mais extremos do que o valor obtido.
5. Passo 5: Conclusão. Compare a probabilidade obtida, p-valor, com o valor de a. A hipótese nula será
rejeitada para aqueles nı́veis de significância cujos valores sejam maiores que a probabilidade calculada.
4.9 Testes de Hipóteses ROSSI, Robson M. 50
4.9.2 O p-valor
O procedimento de teste de hipótese descrito acima fornece informação sobre a força da evidência contra
H0 obtida a partir dos dados. Isto é, é informado se o valor observado para a estatı́stica de teste que levou à
rejeição de H0 está próxima da fronteira da RC região crı́tica (baixa evidência contra H0 ) ou se está muito
afastada da fronteira (alta evidência contra H0 ).
O p-valor é a probabilidade de ocorrência do valor particular observado para a estatı́stica de teste ou de
valores mais extremos, na direção da região crı́tica, quando a hipótese nula H0 é verdadeira. Quanto maior
for a força da evidência contra H0 , menor será o p-valor.
Capı́tulo 5
Neste tópico estudaremos a relação entre duas variáveis categóricas (ou qualitativas), onde as observações
podem ser classificadas em uma das várias categorias (nı́veis ou células) mutuamente exclusivas.
O problema de mensuração do grau de associação entre dois conjuntos de escores é de caráter bem
diferente do teste da simples existência de uma associação em determinada população. Naturalmente, há
interesse em avaliar o grau de associação entre dois conjuntos de escores referentes a um grupo de indivı́duos.
Mas é talvez de muito maior interesse podermos afirmar que determinada associação observada em uma
amostra de escores indica, ou não, probabilidade de associação entre as variáveis na população da qual se
extraiu a amostra (Siegel, 1956).
51
5.2 Teste de Independência e de Homogeneidade ROSSI, Robson M. 52
Caso 1. Selecionar uma amostra de crianças aleatoriamente e examinar em que célula cada uma está
alocada, logo o único valor fixo será o total geral que será de 300. Mas os totais de colunas e de linhas
serão frutos da pesquisa, portanto, aleatórios, neste caso estamos frente a um teste de independência
de variáveis.
Porém ela pode fixar o número de alunos de acordo com seu desempenho.
Caso 2. Pegar uma amostra aleatória de tamanho 100 de cada grupo de alunos, logo os totais das
colunas serão fixos, mas os totais das linhas serão aleatórios e assim estaremos frente a um teste de
homogeneidade:
Os valores totais, das colunas e das linhas, são chamados de “totais marginais”. Quando os totais
marginais variam livremente, o teste de associação é chamado de independência, e quando
um dos conjuntos, linha ou coluna é fixado pelo pesquisador então é chamado de teste de
homogeneidade. Isso vai depender do pesquisador. No exemplo da educadora, observemos que para ela é
muito mais fácil fixar o número de alunos segundo seu desempenho, do que fixar pela participação dos pais,
que, apriori será quase impossı́vel.
Teste de Independência
Apresentaremos a lógica do teste com um exemplo bastante simples.
Exemplo 5.1. Suponha que 125 crianças foram expostas a três tipos de comerciais de TV, sobre cereais
para café da manhã. Após a exposição foi solicitado a cada criança para indicar qual dos comerciais ela
gostou mais. O que se deseja saber é se a escolha do comercial está relacionado ao gênero da criança: pois
suspeita-se de que o gênero pode estar influenciando na escolha do comercial. Os dados podem ser apreciados
na Tabela 5.3.
Contudo, essa análise fica prejudicada pela composição da amostra, que tem mais meninos do que meni-
nas. Portanto, a primeira coisa a fazer é analisar as estruturas percentuais, mostradas na Tabela 4.3, ou seja
retirar a influência da amostragem.
Tabela 5.4: Porcentagem para os valores absolutos de crianças por tipo de comercial escolhido e gênero
apresentados na tabela anterior.
Tipo de comercial
Gênero A B C Total
Meninos 71% 47% 76% 60%
Meninas 29% 53% 24% 40%
Total 100% 100% 100% -
Observe cuidadosamente a Tabela 5.4, onde 60% da amostra é composta por meninos. Se a preferência das
crianças pelos comerciais independe do gênero, esperarı́amos que a estrutura percentual para cada comercial
ficasse em torno de 60% para os meninos e 40% para as meninas, desvios grandes destes percentuais estariam
mostrando evidências de que existe alguma relação entre essas variáveis. Essa inspeção intuitiva, também,
pode ser feita analisando a estrutura dentro de cada gênero como mostra a Tabela 5.5.
Analisando a Tabela 5.5 observamos que as meninas tem uma forte preferência pelo comercial B, enquanto
que os meninos se dividem entre o comercial A e B.
Assim, intuitivamente percebemos que existe interferência do gênero na preferência, agora precisamos
saber até que ponto essas diferenças se devem ao acaso, ou a existência de associação entre as duas variáveis:
Ho : independência de variáveis
H1 : dependência de variáveis
Como deveriam ser os valores a serem observados se as variáveis fossem independentes?, ou dito de outra
forma, sob a hipótese de nulidade, de independência de variáveis, como deveriam ser os valores a serem
observados? A lógica nos diz que esses valores devem estar muito próximos da estrutura percentual global.
Esses valores são chamados de valores esperados.
Cada valor esperado será calculado supondo que a estrutura percentual global se mantenha em cada
coluna:
Tabela 5.6:
Valores percentuais Valores absolutos
Tipo de comercial Valores esperados
Gênero A B C Total Gênero A B C Total
e
Meninos 60% 60% 60% 60% Meninos 25 37 13 75
Meninas 40% 40% 40% 40% Meninas 17 25 8 50
Total 42 62 21 125 Total 42 62 21 125
Tabela 5.7:
Tipo de comercial
Gênero A B C Total
Oi = 30 Ei = 25,2 29 37,2 16 12,6
Meninos 75
di = +4,8 -8,2 +3,4
12 16,8 33 24,8 5 8,4
Meninas 50
-4,8 +8,2 -3,4
Total 42 62 21 125
Dentro de cada célula, no canto superior esquerdo colocamos o valor observado, no canto superior direito
o valor esperado (sob a hipótese de independência) e, na parte inferior, a distância entre o observado e o
esperado. Logo, se as variáveis fossem independentes, as distâncias entre os valores observados e esperados
deveriam ser muito pequenas, caso contrário haverá indı́cios de dependência. A pergunta agora é: quando a
distância é pequena ou grande? Para isto devemos calcular o valor (χ2 ) qui-quadrado da amostra:
Pk (observado − esperado)2 Pk (O − E )2
i i
χ2amostra = =
i=1 esperado i=1 E i
que terá uma distribuição chi-quadrado com graus de liberdade igual ao produto do número de linhas menos
um vezes o número de colunas menos um, isto é:
ν : graus de liberdade
χ2amostra ∼ χ2ν ⇒
ν : (no colunas - 1)×(no linhas - 1)
Para testar as hipóteses, temos a estatı́stica teste qui-quadrado com correção de continuidade de Yates:
¡ ¢2
k |O − E | − 1
P
2 i i
χcY = 2
∼ χ2[L−1×C−1;(1−α)%] (Tabelas L × C)
i=1 Ei
5.2 Teste de Independência e de Homogeneidade ROSSI, Robson M. 55
onde v = (2 − 1) × (3 − 1) = 1 × 2 = 2
Para aceitar ou rejeitar a hipótese devemos conhecero valor de χ2calculado na tabela qui-quadrado, com
dois graus de liberdade. Para α = 5%, o valor crı́tico é 5, 991, como o valor da amostra é maior que o valor
crı́tico, logo rejeitamos a hipótese nula, concluindo que o gênero interfere na preferência pelos comerciais.
No caso de dispormos de um pacote estatı́stico, este, via de regra, calcula o p-valor, nesse caso é só
comparar esse valor com o nı́vel de significância desejado. No nosso caso o p − valor = 0, 01058, ou seja,
rejeitamos ao nı́vel de 5% mas não ao nı́vel de 1%.
Obs.: Quando as variáveis são independentes (H0 ), as freqüências observadas tendem a ficar perto das
esperadas. Neste caso, o valor de χ2 deve ser pequeno.
Limitações do teste χ2 :
1. Infelizmente, o teste qui-quadrado não permite concluir como se dá a relação, uma vêz que ele testa
apenas a hipótese geral de que as duas variáveis são independentes. Examinando a distância entre
valor observado e esperado, por exemplo, observamos que as meninas tem uma maior preferência pelo
comercial B, porém não podemos concluir nada.
2. Uma outra limitação do teste qui-quadrado é que o valor esperado das células não deve ser menor ou
igual a 5 e devido a isso torna vulnerável a estatı́stica. Nesse caso usamos outra estratégia: o teste
exato de Fisher.
Teste de Homogeneidade
Quando testamos independência de variáveis, o pesquisador só controla o tamanho total da amostra, mas
os totais para cada coluna e linha são aleatórios.
Exemplo 5.2. No caso do exemplo anterior, os pesquisadores selecionaram aleatoriamente 125 crianças,
das quais 75 eram meninos e 50 meninas. Ele não fixou o numero de meninos e o número de meninas.
Vejamos um exemplo de teste de homogeneidade. Retomemos o exemplo inicial e suponhamos que a
professora fixou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes:
Tabela 5.8: Número de alunos segundo seu desempenho em Matemática e participação dos pais nas atividades
extra-escolares.
Desempenho em Matem.
Participação
Baixo Médio Alto Total
dos pais
Ativa 5 25 70 100
Fraca 95 75 30 200
Total 100 100 100 300
O Coeficiente de Contingência.
O coeficiente de contingência é uma medida do alcance da associação ou relação entre dois conjuntos de
atributos. Ele é calculado em função do valor calculado na tabela de contingência e independe de ordenação
das categorias das variáveis:
s
χ2
C= , onde n é o tamanho da amostra.
χ2 + n
O valor C ∗ sempre estará no intervalo de 0 a 1. Será 0, somente quando houver completa independência e
será 1 quando houver associação perfeita. Valores de C ∗ próximos de 1 descrevem associação forte, enquanto
que valores de C ∗ próximos de 0 indicam associação fraca. Os valores de C ∗ em torno de 50% podem ser
interpretados como associação moderada.
Exemplo 5.4. Cálculo do coeficiente de contingência para os dados do exemplo anterior.
k = min{2; 3} = 2
s
k.χ2
C∗ =
(k − 1)(χ2 + n)
s
2.(9, 09818)
=
(2 − 1)(9, 09818 + 125)
= 0, 3684 ou 36, 84%.
Este resultado indica uma fraca associação entre X: preferência pelo comercial e Y: gênero.
Exercı́cio 5.1. A freqüência da inversão F do cromossomo IIL foi estudada em populações urbanas de
Drosophila willistoni. Os exemplares foram coletados em zonas considerada de alta, média e baixa urban-
ização, na cidade de Porto Alegre ( Valente et al, 1993). Os dados foram comparados entre si e com um
grupo-controle não-urbano. Verifique ao nı́vel de 1% de significância se existem evidências de associação
entre a inversão F e a Urbanização.
Exercı́cio 5.2. Crianças hospitalizadas e alimentadas por nutrição endovenosa às vezes apresentam colestase,um
bloqueio do fluxo da bile que pode produzir cálculos biliares e outros problemas. Suponha que foi realizado um
estudo do tipo caso-controle para avaliar o efeito (α = 5%) de uma infecção grave sobre o risco de colestase
em crianças com nutrição parenteral. A Tabela abaixo mostra o resultado de um estudo feito em 113 crianças
hospitalizadas. Como o desfecho, isto é, a colestase, é uma caracterı́stica rara na população, o risco relativo
foi estimado através do Odds Ratio (Fonte: Carvalho, 1993).
5.2 Teste de Independência e de Homogeneidade ROSSI, Robson M. 57
Tabela 5.10: Presença de colestase em crianças com nutrição endovenosa, som e sem infecção grave.
Colestase
Infecção grave Sim Não
Sim 19 61
Não 1 32
Exercı́cio 5.3. Com o objetivo de avaliar fatores de risco para o câncer intra-epitelial da cérvice uterina,
Soares (1998) estudou 43 casos com essa doença e 63 mulheres controles da população de Porto Alegre. A
Tabela 2 apresenta dados relativos à presença do alelo DQB1*03, do sistema HLA. Teste a associação entre
a doença e o fator ao nı́vel de 5%. Em caso afirmativo determine o risco de desenvolver a neoplasia e seu
respectivo IC.
Tabela 5.11: Associação entre câncer intra-epitelialda cérvice uterina e presença do alelo DQB1*03.
Presença do alelo
Câncer DQB1*03 Outro
Casos 33 10
Controles 24 39
5.2 Teste de Independência e de Homogeneidade ROSSI, Robson M. 58
Exercı́cio 5.4. Verificar se a freqüência dos dois tipos de cromossomos Y está relacionado com o grau de
mistura racial aparente e com a idade do touro ao nı́vel de 5%.
Exercı́cio 5.5. Em um estudo genético realizado em macacos amazônicos da subespécie ”Saimiri sciureus
ustus”, Silva et al. (1993) encontraram variação nas freqüências de dois tipos de enzimas glioxalase (GLO)
em animais que vivem nas margens do rio Jamari, em Rondônia. Na Tabela 4, estão os números observados
de animais com diferentes tipos de enzimáticos, coletados nas margens esquerda e direita desse rio. Verifique
se existem evidências de associação entre as variáveis ao nı́vel de 1%.
Exercı́cio 5.6. Vieira e Prolla (1979) estudaram uma amostra de 384 pacientes com problemas pulmonares,
classificando-os segundo a presença ou não de eosinófilos no escarro e o tipo de pneumopatia diagnosticada.
Existem evidências de associação entre as variáveis ao nı́vel de 5%? e a 1%? G1: asmas; G2: broncoespasmo;
G3: enfisema; G4: outras doenças.
Tabela 5.15: Presença de eosinófilos no escarro e tipo de doença pulmonar em 384 pacientes porto-alegrenses.
Grupo quanto a pneumopatia
Eosinófilos no escarro G1 G2 G3 G4
Sim 142 26 32 28
Não 55 19 41 41
Exercı́cio 5.7. O coleóptero chauliognathus flavipes pode apresentar 10 diferentes padrões para as manchas
pretas que ocorrem sobre os élitros (asas), que são amarelos. Machado e Araújo (1994) coletaram insetos
dessa espécie em várias localidades do Rio Grande do Sul, nos anos de 1989 e 1990, como mostra a Tabela
6. Teste a hipótese de igualdade de proporções entre as localidades ao nı́vel de 5% e a 1%.
Tabela 5.16: Número de indivı́duos da espécie Chauliognathus com diferentes padrões de manchas nos élitros,
coletados em três localidades do Rio Grande do Sul.
Padrão do élitros
Localidade Claro Intermediário Escuro
Porto Alegre 67 20 4
São Leopoldo 68 29 19
Caxias do Sul 26 3 6
Exercı́cio 5.8. Verifique se as localidades a seguir diferem quanto a freqüência dos diferentes grupos
sangüı́neos do sistema ABO, ao nı́vel de 5%.
Tabela 5.17: Número de indivı́duos da espécie Chauliognathus com diferentes padrões de manchas nos élitros,
coletados em três localidades do Rio Grande do Sul.
Tipo sangüı́neo
Localidade A B AB O
Cidade I 43 9 1 47
Cidade II 29 17 9 45
5.2 Teste de Independência e de Homogeneidade ROSSI, Robson M. 60
Exercı́cio 5.9. Um estudo foi conduzido para investigar se existe uma associação entre doença cardı́aca e
apnéia (ronco). Teste esta hipótese ao nı́vel de 5%.
Exercı́cio 5.10. Reestruture os dados para uma tabela 2x2 considerando apenas sim ou não para a apnéia,
em seguida teste a mesma hipótese ao nı́vel de 5%, determine o OR e seu respectivo IC.
Capı́tulo 6
6.1 Introdução
Às vezes, é preciso comparar duas populações. Por exemplo, imagine que um pesquisador obteve, para
um grande número de crianças, a idade em que cada uma delas começou a falar. Para verificar se meninos
e meninas aprendem a falar na mesma idade, o pesquisador terá que comparar os dados dos dois sexos.
Outras vezes, é preciso comparar condições experimentais. Por exemplo, para saber se um tratamento
tem efeito positivo, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (é o
grupo tratado), enquanto o outro não recebe o tratamento (é o grupo controle).
O efeito do tratamento é dado pela comparação dos dois grupos.
Freqüentemente, para comparação de dois tratamentos observam-se caracterı́sticas ou mede-se o valor da
variável resposta de interesse que as caracterı́sticas importantes dos indivı́duos que integram o mesmo par
sejam tão semelhantes quanto possı́vel. O tratamento é administrado a um dos elementos do par e o outro é
mantido como controle. A vantagem do procedimento é clara. Os indivı́duos no par são semelhantes, exceto
no que se refere ao tratamento recebido. Em algumas situações o par é constituı́do do mesmo indivı́duo em
duas ocasiões diferentes (amostras dependentes).
61
6.2 Resposta Dicotômica: Amostras Independentes ROSSI, Robson M. 62
• n < 40;
• 20 < n < 40 e Ei ≤ 5 para algum i;
• n > 40 e Ei ≤ 5 para algum i;
Para testar as hipóteses acima citadas temos a estatı́stica teste qui-quadrado com correção de continuidade
de Yates, temos
¡ ¢2
2 n |ad − bc| − n2
χcY = ∼ χ21;(1−α)% (Tabelas 2 × 2)
n1 n2 m 1 m 2
Exemplo 6.1. Estudo sobre a associação entre o uso corrente de contraceptivos e o infarto de miocárdio.
Shapiro et al. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes são
mostrados na Tabela 6.2.
Tabela 6.2: Distribuição de uso de contraceptivo oral segundo grupo que sofreu ou não infarto do miocárdio.
Grupo Uso recente Total
Sim Não
Casos 9 12 21
Controles 33 390 423
Total 42 402 444
Entre os casos, ou seja, entre as pacientes que tiveram um infarto do miocárdio, a proporção de uso recente
9 33
de contraceptivos é = 0, 43 e entre os controles, = 0, 08. A diferença entre estas duas proporções
21 423
(0,35) parece indicar que o uso de contraceptivos orais é mais freqüente entre os casos (infartos). Mas será
que este resultado não ocorreu por mero acaso?
A expressão χ2c = 24, 76 > 3, 84 = χ21;95% , nos indica, com alto grau de confiança (95%) afirmar que existe
associação entre o uso de contraceptivos orais e infarto do miocárdio para pacientes entre 30 e 34 anos.
6.2 Resposta Dicotômica: Amostras Independentes ROSSI, Robson M. 63
P
1
Sendo p = pi , temos
i=0
12!10!8!14!
p1 = = 0, 024.
7!5!1!9!22!
e
assim
12!10!8!14!
p0 = = 0, 0015.
8!4!0!10!22!
O valor de p será 0, 024 + 0, 0015 = 0, 0255 (p-valor : 0,0263).
Como este p é menor que o nı́vel de significância, para α = 0, 05 a decisão correta será rejeitar H0 , isto
é, pode-se concluir que há diferença quanto à mortalidade em relação ao tipo de tratamento, sendo B mais
eficáz.
Exemplo 6.3. Suponha um grupo de dezesseis ratos, divididos em dois grupos, experimental e normal. O
grupo experimental é formado por 9 animais geneticamente modificados, por apresentarem uma disfunção
pancreática com diminuição da capacidade de produção de insulina. Imagine que, após um ano e meio em
ambiente controlado, o número de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela
6.5):
Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos, enquanto a so-
brevida para o grupo experimental é de apenas 11%.
O teste exato de Fisher consiste em elaborar, com base nos totais marginais do fator discriminante da
tabela original, duas outras tabelas, que serão denominadas tabelas ou matrizes extremas, X1 e X2 . A matriz
6.2 Resposta Dicotômica: Amostras Independentes ROSSI, Robson M. 64
extrema 1 é a matriz em que todos os animais mortos pertencem ao grupo normal (são 10 mortos, mas o
grupo normal tem 7 ratos, logo, os outros 3 que morreram pertencem ao grupo experimental) e todos que
sobraram do grupo experimental estão vivos (todos os vivos, pois sobraram 9-3 = 6 ratos). Desta forma,
resulta na Matriz X1 (Tabela 6.6):
A matriz extrema 2, X2 , corresponde a uma tabela com os mesmos totais marginais, mas com todos os
animais vivos no grupo normal. Então, pela matriz X2 (Tabela 6.7):
Observe que existe um óbito no grupo normal, pois o número de ratos do grupo normal é maior que o de
ratos que sobreviveram. Obviamente, os 9 mortos que restaram pertencem ao grupo experimental. Nenhum
rato do grupo experimental sobreviveu.
Finalmente, o valor de significância para o teste é calculado segundo a fórmula apresentada anteriormente:
Para a matriz original:
7!.9!.10!.6!
F0 : = 0, 02360
2!.5!.8!.1!.16!
Para a matriz X 1 :
7!.9!.10!.6!
FX1 : = 0, 0105
0!.7!.6!.3!.16!
Para a matriz X 2 :
7!.9!.10!.6!
FX2 : = 0, 0009
6!.1!.0!.9!.16!
Finalmente,
Ou seja, a afirmação de que a sobrevida dos ratos geneticamente alterados é menor que a dos ratos
normais envolve uma probabilidade de erro de 3,5%. Portanto, ao nı́vel de 5% de significância, rejeita-se a
hipótese de nulidade (ou seja, de que as vidas dos ratos normais e dos transgênicos são iguais).
6.3 Resposta Dicotômica: Amostras Pareadas ROSSI, Robson M. 65
H0 : p1 = p2
Ha : p1 =
6 p2
Com o objetivo de comparar a eficácia de dois preventivos contra náusea, dividiu-se aleatoriamente uma
amostra de 400 marinheiros em dois grupos de 200. Um grupo recebeu a pı́lula A e o outro a pı́lula B,
sendo que no primeiro grupo 152 não enjoaram durante uma tempestade e no outro grupo apenas 132. Há
indicações de que a eficácia da pı́lula A e B é a mesma?
Sol.: Sejam pA e pB as proporções de marinheiros que não enjoam, respectivamente para as pı́lulas A e
152 132
B. Temos que nA = 200, nB = 200, p̂A = 200 = 0, 76, p̂B = 200 = 0, 66, logo tem-se:
0, 76 − 0, 66
Z=q = 2, 22 (p-valor : 0,0281).
0,76(1−0,76) 0,66(1−0,66)
200 + 200
Fixando-se o nı́vel de significância em 5%, rejeita-se H0 . Portanto, pode-se concluir que as duas pı́lulas
não são igualmente efetivas. Há indicação de que a pı́lula A oferece maior proteção contra náusea comparada
à pı́lula B.
É importante observar que a unidade de análise aqui é o tumor, avaliado por dois patologistas. Embora
tenham sido feitas 200 análises, o total de tumores é, na realidade, apenas 100.
Além disto, alguns tumores serão claramente mais malignos do que outros e, portanto, a hipótese funda-
mental na construção do teste de probabilidade constante de malignidade não é razoável aqui. Isto explica
a necessidade de desenvolvimento de teste especı́fico, isto é, para dados pareados.
Os dados a serem analisados no processo de comparação podem ser resumidos no formato da Tabela 6.9.
H0 : p1 = p2
Ha : p1 =
6 p2
Tabela 6.10: Distribuição de pacientes com e sem doença de Hodgkin em um estudo caso-controle pareado
segundo à amigdalectomia.
Doença de Controle Total
Hodgkin Operados Não operados
Operados 26 15 41
Não operados 7 37 44
Total 33 52 85
H0 : µ1 = µ2
Ha : µ1 =
6 µ2
6.4.1 Teste t
Se a variável em análise tem distribuição normal ou aproximadamente normal, aplica-se o teste t para
comparar duas médias. Mas primeiro é preciso estabelecer o nı́vel de significância, α. Depois, dados os dois
grupos, 1 e 2, calculam-se:
a) as médias de cada grupo:
s1 : desvio-padrão do grupo 1
s2 : desvio-padrão do grupo 2
6.4 Resposta Contı́nua - Teste de Médias para Amostras Independentes ROSSI, Robson M. 68
c) a variância ponderada:
Após alguns cálculos preliminares, temos: x̄1 = 12; x̄2 = 15; s21 = 4; s22 = 5; s2p = 4, 4, desta forma, para
α = 5%, temos t15;5% = ±2, 13, assim:
12 − 15
tc = s µ ¶ = −2, 902 ∈ Região de rejeição de H0 , logo podemos
1 1
4, 4 +
10 7
p − valor : 0, 010947
concluir que, em média, as perdas de peso de pacientes submetidos aos dois tipos de dieta são diferentes.
Em termos práticos, a perda de peso é maior quando os pacientes são submetidos à dieta 2.
6.4.2 Teste z
Um pressuposto importante para aplicar o teste t visto anteriormente é que os dois grupos comparados
tenham a mesma variabilidade, o que nem sempre acontece na prática. No caso de amostras grandes (n1 e
n2 ≥ 30) dispomos de um teste em que não é necessário qualquer suposição adicional sobre σ 21 e σ 22 , ou seja,
as varâncias podem ser iguais ou diferentes.
A estatı́stica teste usada será:
x̄1 − x̄2
Zc = s ∼ N (0, 1).
s21 s22
+
n1 n2
Tabela 6.12: Média e desvio-padrão da pressão sangüı́nea (mmHg) segundo o tipo de anestesia.
Informações Anestesia
sobre a amostra Halotano Morfina
Média 66,9 73,2
Desvio-Padrão 12,2 14,4
n 61 61
isto é, devemos testar a diferença entre as pressões sangüı́neas médias de indivı́duos anestesiados com halotano
ou morfina.
Como as amostras são grandes, podemos usar o teste Z, cujo valor da estatı́stica do teste é:
66, 9 − 73, 2 6, 30
Zc = r = −√ = −2, 61 (p-valor : 0,0103).
2
12, 2 14, 4 2 5, 84
+
61 61
Adotando um nı́vel de siginificância de 5%, o resultado é estatisticamente significativo, já que | − 2, 61| >
1, 96, indicando que os dois anestésicos não são equivalentes.
Estatı́stica teste:
d¯
tc = r ∼ tn−1;α%
s2
n
onde:
d¯ : média das diferenças, di = x2 − x1 : a diferença entre as unidades de cada um dos n pares
P
n
di
d¯ = i=1
n
s2 : variância das diferenças, di .
Toda vez que o valor absoluto de tc for igual ou maior do que o valor tabelado tn−1;α% , conclui-se que o
tratamento tem efeito ao nı́vel α% estabelecido.
O intervalo de confiança para d, será dado por:
S
d¯ ± tn−1;α% . √
n
Exemplo 6.9. São dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento.
Para fazer o teste, é preciso primeiro estabelecer o nı́vel de significância. Seja α = 1%,
30
d¯ = − = −3, 33
9
s2 = 25
logo
−3, 33
tc = r = −2, 0 (p-valor : 0,080516).
25
9
Ao nı́vel de siginificância de 1% com g.l. = 8, o valor de t tabelado para t8;1% .é de 3,36. Como o valor
absoluto de tc (2,0) é menor do que o valor da tabela, concui-se que o tratamento não tem efeito significativo.
Em termos práticos, o experimento não provou que a dieta emagrece.
6.6 Testes Não-Paramétricos ROSSI, Robson M. 71
Exercı́cio 6.1. Avaliação morfoquantitativa dos neurônios mioentéricos nadh-diaforase reativos do estômago
de ratos com diabetes induzido por estreptozootocina e suplementados com ácido ascórbico (Mestrado em
Morfologia-UEM).
Este trabalho teve entre vários objetivos, verificar se existe diferença de tamanho entre as regiões glandular
e aglandular, entre as sub-regiões aglandular (A e B) e glandular (A e B) e entre o estômago como um todo;
e verificar se o diabetes afeta mais a região glandular do que a região aglandular, ou vice e versa. Parte dos
dados estão disponı́veis na Tabela (6.14) a seguir.
Tabela 6.14: Avaliação morfoquantitativa dos neurônios mioentéricos nadh-diaforase reativos do estômago
de ratos com diabetes induzido por estreptozootocina e suplementados com ácido ascórbico.
aglanB aglanA aglanTotal glanB glanA glanTotal Grupos
101,1 92,37 193,47 123,6 123,2 246,8 c
97,24 121,9 219,14 92,83 100,6 193,43 c
146,9 197,2 344,1 138,6 133,5 272,1 c
94,44 96,5 190,94 149,5 114,3 263,8 c
139,5 110,4 249,9 184,4 143,6 328 c
203,3 191,1 394,4 438,1 367,2 805,3 d
232,4 216,1 448,5 290,7 311 520,7 d
237,3 240,3 477,6 271,4 193,4 464,8 d
139,5 158,2 297,7 269,5 159,6 429,1 d
222,9 262,4 485,3 334,6 246,8 581,4 d
234,1 191,9 426 253 231,5 484,5 ds
201,9 207,3 409,2 237,7 186,6 424,3 ds
164,1 213,3 377,4 269,3 214,7 484 ds
- - - 251,1 217,1 468,2 ds
Uc = mı́n{U1 ; U2 }
Obtemos uma estatı́stica tabelada : UT = Uα,n1 ,n2 e concluı́mos para a rejeição de Ho se Uc ≤ UT .
Procede-se à ordenação dos valores para obtenção dos seus postos e posteriormente seu somatório.
Temos então n1 = 8, n2 = 7, T1 = 85 e T2 = 35.
O valor de U1 e de U2 , respectivamente serão:
8(8 + 1)
U1 = 8.7 + − 85 = 7
2
7(7 + 1)
U2 = 8.7 + − 35 = 49.
2
Assim
Uc = mı́n{7;49} = 7
O valor da estatı́stica tabelada será de:
Osteoporose é uma doença esquelética sistêmica caracterizada por baixa massa óssea e alteração da
micro-arquitetura, levando a um aumento da fragilidade óssea e, conseqüentemente, do risco de fratura.
A massa óssea aumenta durante a infância e principalmente adolescência, atingindo seu pico em torno
dos 25 anos na mulher e 30 a 35 anos no homem.
Após a parada do crescimento ósseo, a formação e a reabsorção ocorrem na mesma proporção, em um
processo denominado de remodelação óssea.
Com o avanço da idade cronológica, a formação óssea torna-se menor que a reabsorção, levando a uma
perda de massa óssea em torno de 1% ao ano. A quantidade de osso presente no adulto é proporcional ao
pico de massa óssea atingido.
Na osteoporose pós-menopausa (desencadeada pelo hipoestrogenismo), a reabsorção óssea se manifesta
mais precocemente nas regiões ricas em osso trabecular, levando à fratura na região distal do radio e colapso
central das vértebras dorsais e lombares.
A osteoporose é uma doença assintomática até o paciente apresentar alguma fratura. Os locais mais
comuns são vértebras, região distal do rádio e colo do fêmur. As principais complicações das fraturas são
dor crônica e deformidade óssea. Assim, com objetivo de detectar pacientes com osteoporose coletou-se uma
amostra de 30 pacientes aleatoriamente em um Hospital Universitário. De cada paciente realizou-se um
cadastro onde tinha as seguintes variáveis: idade, peso, altura, atividade fı́sica, história de fratura materna,
ingestão adequada de cálcio, raça e outras como, tabagismo, algumas doenças (hipogonadismo, sı́ndromes
disabsortivas) e drogas (corticóide) são fatores de risco que aceleram a perda óssea.
Exercı́cio 6.3. Utilize o banco de dados em anexo de nome: osteporose ex.stw e verifique se existe diferença
entre os grupos: Tabagismo e Ingestão, com relação entre as variáveis: Altura, Peso e IMC, onde
P eso
IM C = ;
Altura2
* Considere α = 5%.
6.6 Testes Não-Paramétricos ROSSI, Robson M. 74
Os valores obtidos nas diversas amostras diferem entre si e portanto, será uma maneira de verificar se
estas diferenças são devidas ao acaso ou se as amostras provém de populações diferentes.
Da mesma forma que nos outros testes, serão consideradas as hipóteses nula (H0 ) e alternativa (Ha ), isto
é:
12 k T2
P i
HK−W = . − 3(N + 1) tal que H ∼ χ2(k−1)
N (N + 1) i=1 ni
em que:
Ti : é a soma das ordens atribuı́das ao tratamento i;
k : corresponde ao número de tratamentos ou amostras a comparar;
ni : o número de observações em cada tratamento k e,
N : o total de observações em todos os tratamentos k.
Exemplo 6.11. Analisar o tempo de sobrevida, em meses, de pacientes atendidos na clı́nica de abdômen
do hospital X, na cidade de Cabrobó.
Questões: Há diferença sifnificativa entre os tempos de sobrevivência? Qual o tratamento recomendado
baseado no tempo de sobrevida?
Independentemente do número de observações em cada grupo e utilizando os números naturais, procede-
mos à ordenação dos valores. Assim os valores acima receberiam a seguinte numeração, conforme os valores
já entre parênteses.
6.6 Testes Não-Paramétricos ROSSI, Robson M. 75
Então:
12 Pk T2
i
HK−W = . − 3(N + 1)
N (N + 1) i=1 ni
12 3 T2
P i
= . − 3(23 + 1)
23(23 + 1) i=1 ni
· 2 ¸
1 57 69, 52 149, 52
= . + + − 72
46 7 8 8
1
= . (3861, 7) − 72
46
= 11, 95 (p-valor : 0,0025).
Como HK−W ∼ χ2(k−1) , então H ∼ χ2(3−1) ⇒ χ22;5% = 5, 99 e χ22;1% = 9, 21, portanto, considerando que
o valor encontrado de HK−W = 11, 95 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 e conseqüentemente, pela indicação de que o tratamento cirúrgico
se destaca dos demais, pois apresenta maiores valores aos tempos de sobrevida.
Exercı́cio 6.4. Utilize o banco de dados citado no exercı́cio anterior: osteoporose ex.stw para verificar se
existe diferença entre as Raças, considerando as variáveis: Altura, Peso e IMC, ao nı́vel de 5%.
Tc = mı́n{|T− |; |T+ |}
Tα;n
Exemplo 6.12. Foi realizado um ensaio clı́nico em que foram utilizadas duas drogas A e B. Com a droga
A foram tratados oito pacientes e com a droga B, cinco pacientes. Os nı́veis de anticorpos corresponderam
a:
Logo, para
Tc = mı́n{57; 34} = 34
consultando-se a Tabela de Wilcoxon, verifica-se que Tα;n = T5%;5 = 0 > 34 (no Statistica o p-valor : 0,8927).
Assim, podemos afirmar que não rejeitamos H0 , ou seja, que os valores comparados, referentes às drogas A
e B, não apresentam-se com diferença siginificativa. Conclui-se, então, que os valores de nı́veis de anticorpos
em relação aos dois tipos de drogas se comportam de forma semelhante.
Exemplo 6.13. Evolução do tratamento com tianeptina: Escores dos pacientes do grupo tianeptina no
primeiro e no último dia:
Tc = mı́n{99; 6} = 6
Tα;n = T5%;14 = 21
14(14 + 1)
6−
W∗ = r 4 = −2, 92 (p-valor : 0,003).
14(14 + 1)(2.14 + 1)
24
Considerando que o valor de W ∗ = −2, 92 está na área de rejeição de H0 , para o valor de Z5% = ±1, 96,
rejeitamos H0 , ou seja, os valores dos dois conjuntos apresentam diferenças significativas.
6.6 Testes Não-Paramétricos ROSSI, Robson M. 78
12 Pk
HF r = . Ti2 − 3n(k + 1) tal que HF r ∼ χ2(k−1)
nk(k + 1) i=1
Exemplo 6.14. São prescritos quatro procedimentos técnicos para determinação de certa variável. Foram
formados cinco blocos e obtidos os seguintes valores:
12 P4
HF r = . Ti2 − 3.5(4 + 1)
5.4(4 + 1) i=1
12
= . [121 + 196 + 400] − 75
100
= 14, 04 (p-valor : 0,00285).
Como HF r ∼ χ2(k−1) , então HF r ∼ χ2(4−1) ⇒ χ23;5% = 7, 82 e χ23;1% = 11, 34, portanto, considerando que
o valor encontrado de HF r = 14, 04 é maior do que os valores da tabela, tanto para α = 5% como para
α = 1%, concluı́mos pela rejeição de H0 , logo verifica-se que há diferença significativa entre as medidas dos
tratamentos. O tratamento C apresentou melhores resultados em relação aos demais grupos.
6.7 Outros Testes Não-Paramétricos ROSSI, Robson M. 79
Cálculos auxiliares:
Tabela 6.21: Teste Kappa para a concordância entre patologistas quanto ao grau de lesão do tecido hepático.
Cobaia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Patologista 1 + + + + + + - + + + + + + - - + - + + -
Patologista 2 + + - + + + - - + + - + + - - - - - + -
Então temos:
a+d 10 + 5
po = = = 0, 75
n 20
n1 .m1 + n2 .m2 15.10 + 5.10 200
pc = 2
= 2
= = 0, 5
n 20 400
po − pc 0, 75 − 0, 5
Kappa = = = 0, 5.
1 − pc 1 − 0, 5
Conclui-se que existe uma concordância apenas moderada entre os diagnósticos dos patologistas.
Grupo Bloco
P
k P
n
Gj = G1 + G2 + ... + Gk Lj = L1 + L2 + ... + Ln
j=1 i=1
Pn
L2j = L21 + L22 + ... + L2n
i=1
Estatı́stica teste: Ã !2
P
k P
k
(k − 1)k G2j − Gj
j=1 j=1
Q= P
n P
n ∼ χ2k−1 ;
k Lj − L2j
i=1 i=1
Exemplo 6.16. Suponha que estejamos interessados em estudar a influência da atitude de um entrevistador
sobre as respostas das donas de casa a determinada pesquisa de opinião.
Poderemos treinar um entrevistador para efetuar suas entrevistas de três maneiras diferentes: entrevista
tipo 1 – demonstrando interesse, cordialidade, entusiasmo; entrevista tipo 2 – demonstrando formalismo,
reserva e cortesia; entrevista tipo 3 – demonstrando desinteresse, modo abrupto, formalismo áspero.
Exercı́cio 6.5. Comparar quatro técnicas de treinamento aplicadas a seis blocos de funcionários do setor de
marcação de luz de uma empresa cinematográfica. Cada bloco foi formado de modo que os quatro funcionários
que o constituı́am eram equivalentes em seu desempenho atual no cargo. Os resultados obtidos na escala de
avaliação de desempenho, aplicada após o treinamento, foram os que constam no quadro abaixo.
Tabela 6.24: Teste em funcionários do setor de marcação de luz de uma empresa cinematográfica.
Tratamentos
Blocos X1 Escore X2 Escore X3 Escore X4 Escore
A 7 1 9 1 10 1 6 0
B 8 1 12 1 11 1 5 0
C 6 0 7 1 8 1 4 0
D 3 0 5 0 6 0 6 0
E 9 1 10 1 8 1 2 0
F 4 0 7 1 5 0 9 1
Total - 3 - 5 - 4 - 1
Exercı́cio 6.6. Reação em cadeia da polimerase (PCR) em sangue de camundongos infectados com clones
de trypanosoma cruzi pertencentes a diferentes genótipos.
(Banco de dados: Analises Clinicas ex.stw ) O objetivo principal do trabalho foi o de investigar se existe
diferença entre os tratamentos: PCR, ELISA, HEMO e ESF de modo global (para toda a amostra), por
Genótipo: 39, 32, 20 e 19 e por Fase: Aguda ou Crônica.
Exercı́cio 6.7. Utilize o bancos de dados: Pediat ex.stw e Psi1 ex.stw, leia as informações e faça o que se
pede.
Capı́tulo 7
Análise de Variância
Às vezes é preciso comparar médias de mais de duas populações. Por exemplo, para verificar se pessoas
com diferentes nı́veis de renda, isto é, alto, médio e baixo têm, em média, o mesmo peso corporal, é preciso
comparar médias de três populações.
Outras vezes, é preciso comparar várias situações experimentais. Por exemplo, se um pesquisador separa,
ao acaso, um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo, terá que
comparar médias de quatro ”populações”.
Para comparar médias de mais de duas populações normais ou aproximadamente normais, aplica-se o
teste F. Neste caso convém verificar antecipadamente a normalidade dos dados.
Por exemplo, imagine que 4 amostras casuais simples, todas com cinco elementos mas cada uma prove-
niente de uma população, conduziram aos dados apresentados na Tabela 7.1.
Será que as diferenças das médias das amostras são suficientemente grandes para que se possa afirmar
que as médias das populações são diferentes? Para responder a esta pergunta, é preciso um teste estatı́stico.
83
7.1 Análise de Variância para Experimentos ao Acaso ROSSI, Robson M. 84
1. os graus de liberdade:
(a) de tratamento: k − 1
(b) de total: n − 1
(c) de resı́duo: (n − 1) − (k − 1) = n − k
2. o valor C, dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O valor C é
chamado correção. P
( x)2
C=
n
3. a soma de quadrados total: X
SQT = x2 − C
Exemplo 7.1. Para os dados apresentados na Tabela 7.1, proceder uma análise de variância para verificar
se existe diferença significativa entre os tratamentos.
1. os graus de liberdade:
(a) de tratamento: k − 1 = 4 − 1 = 3
(b) de total: n − 1 = 20 − 1 = 19
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 20 − 4 = 16
2. o valor C: P
( x)2 (11 + 8 + ... + 0)2
C= = = 500
n 20
3. a soma de quadrados total:
X
SQT = x2 − C = 112 + 82 + ... + 02 − 500 = 658 − 500 = 158
Exemplo 7.2. Com base nos dados apresentados na Tabela 7.5 abaixo, verifique se existe diferença estatı́stica
entre os grupos. Note que são três grupos em comparação. No grupo operado foi feita a remoção das glândulas
salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cirúrgicos, mas nenhuma
glândula foi removida (Banco de dados: Tukey1 ex.stw).
Tabela 7.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias,
segundo o grupo.
Grupo
Operado Pseudo-operado Normal
96 90 86
95 93 85
100 89 105
108 88 105
120 87 90
110,5 92,5 100
97 87,5 95
92,5 85 95
q3;21 ' 3, 57
e r
53, 247
d.m.s. = 3, 57 = 9, 21.
8
Os valores absolutos das diferenças de médias estão apresentados na Tabela (7.7).
A taxa de glicose é, em média, maior nos operados do que nos pseudo-operados, ao nı́vel de significância
de 5.
7.2 Teste Paramétrico para Comparações Múltiplas ROSSI, Robson M. 88
onde:
dα,(k−1),f está tabelado (Tabela Dunnett) para k − 1 comarações e f : no de observações dos tratamentos
(exceto o controle);
QM R : proveniente da ANOVA (Quadrado Médio dos Resı́duos);
ni : no de observações do tratamento i;
nc : no de observações do controle;
x̄i e x̄c : médias, do tratamento e controle, respectivamente.
Exemplo 7.3. Deseja-se comparar o efeito de cinco drogas na diminuição da pressão arterial. Para isto
utilizou-se cinco grupos distintos e foram comparadas suas médias em relação a média de um grupo controle,
que recebeu placebo. Ao todo, 30 indivı́duos participaram no experimento. A Tabela abaixo apresenta os
valores referentes a diferença entre a pressão arterial no inı́cio e no fim do experimento (mmHg).
Tabela 7.9: ANOVA para os dados de pressão arterial, em milı́metros de mercúrio, segundo o tratamento.
Causas da variação GL SQ QM F p
Grupos 5 2354,17 470,83 13,08 0,000003
Resı́duo 24 864 36
Total 29 3218,17
Como o valor de F apresentado é de 13,08 (p-valor = 0,000003) é significante ao nı́vel de 5%, é razoável
procurar um teste para comparar as médias dos tratamentos. A d.m.s. estabelecida pelo teste Dunnett
(especı́fico para este caso) será:
r r
2.QM R 2.36
d.m.s = d. = 2, 70 = 10, 25
r 5
7.3 Teste Não-Paramétrico para Comparações Múltiplas ROSSI, Robson M. 89
H0 : Mi = Mj (médias)
Ha : Mi 6= Mj , para algum i 6= j.
onde
k(k − 1)
Q= .
2
Intervalo de Confiança via Dunn-Bonferroni para os contrastes:
Desejamos saber se existe evidência suficiente para afirmar, a um nı́vel de significância de 1%, que existe
diferença entre os grupos, e se houver, desejamos saber entre quais.
7.3 Teste Não-Paramétrico para Comparações Múltiplas ROSSI, Robson M. 90
Hipóteses:
Sol.: Utilizando o teste de Kruskal-Wallis para k provas, temos a Tabela 7.12 com os postos das ob-
servações.
A estatı́stica teste:
12 Pk T2
i
HK−W = . − 3(N + 1)
N (N + 1) i=1 ni
12 3 T2
P i
= . − 3(15 + 1)
15(15 + 1) i=1 5
µ 2 ¶
65 + 402 + 152
= (0, 05). − 48
5
= 12, 5
como H ∼ χ2(k−1) ⇒ χ2(1%;2) = 7, 98, e sendo HK−W = 12, 5 > 7, 98, Rejeita-se H0 .
O passo seguinte, será o de determinar qual(is) pares de tratamentos (contrastes) ocasionaram esta
rejeição.
Cálculo do d.m.s.:
k(k − 1) 3(3 − 1)
Q= = =3
2 2
assim,
s µ ¶
15(15 + 1) 1 1
d.m.s. = Z1− 0,01 +
2.3 12 5 5
= 2, 95.(2, 83)
= 8, 35
Contrastes:
Tabela 7.13: Contrastes para os dados de tempo de percurso de um rato até sair do labirinto.
Contraste IC(1 − α)%
L̂1 = x̄1 − x̄2 = 5 5 ± 8, 35 : (−3, 38; 13, 35)
L̂2 = x̄1 − x̄3 = 10 10 ± 8, 35 : (1, 66; 18, 35)
L̂3 = x̄2 − x̄3 = 5 5 ± 8, 35 : (−3, 38; 13, 35)
T12 T2 T2
SQT r = + 2 + ... + k − C
r1 r2 rk
onde C é a correção já definida anteriormente.
É mais fácil entender a aplicação de fórmulas através de um exemplo.
7.4 Análise de Variância com Número Diferente de Repetições ROSSI, Robson M. 92
1. os graus de liberdade:
(a) de tratamento: k − 1 = 3 − 1 = 2
(b) de total: n − 1 = 15 − 1 = 14
(c) de resı́duo: (n − 1) − (k − 1) = n − k = 15 − 3 = 12
2. o valor C: P
( x)2 (15 + 10 + ... + 16)2
C= = = 4001, 67
n 15
3. a soma de quadrados total:
X
SQT = x2 − c = 152 + 102 + ... + 162 − 4001, 67 = 159, 33
Os valores absolutos das diferenças entre as médias estão são apresentados a seguir. Como o valor
absoluto da diferença entre A e B é maior do que a respectiva d.m.s., conclui-se que, em média, A difere de
B, ao nı́vel de significância de 5%.
7.4.2 Teste t
A diferença mı́nima significativa (d.m.s.) é dada pela fórmula:
s µ ¶
1 1
d.m.s. = t + QM R
ri rj
Considerações
A escolha apropriada de um teste é muito flexı́vel. Se o pesquisador quer ter alta chance de rejeitar
H0 : de que as médias são iguais, pode optar pelo teste t ou pelo teste Duncan (Não apresentado neste
material-Ver Vieira, 1999). Estes dois testes têm caracterı́sticas similares, mas o teste t é mais antigo e,
talvez por isso, mais conhecido. Também é de aplicação mais fácil. Entretanto, o pesquisador também pode
optar por aplicar o teste de Tukey ou de Dunnett, com nı́vel de significância mais elevado. Estes testes
teriam, então, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder do que o teste de Tukey
a 5%.
Um pesquisador que pretende somente rejeitar a hipótese de que as médias são iguais com muita confiança,
deve optar pelo teste de Tukey ou de Dunnett, com baixo nı́vel de significância. Esta situação pode ocorrer
quando se comparam novas drogas terapêuticas com uma droga conhecida. Toda droga tem efeitos colaterais.
Então, muitas vezes só é razoável indicar uma nova droga - de efeitos colaterais desconhecidos - quando
existem indicações seguras de que essa nova droga é melhor do que a convencional.
De qualquer forma, fica aqui um alerta: todos os procedimentos para a comparações de médias têm
vantagens e desvantagens. Ainda não existe um teste definitivamente “melhor” que todos os outros.
Capı́tulo 8
Testes Clı́nicos
8.1 Introdução
Uma das experiências mais rotineiras da prática médica é a solicitação de um teste diagnóstico. Os
objetivos são vários, incluindo a triagem de paciente, o diagnóstico de doenças e o acompanhamento ou
prognóstico da evolução de um paciente. Para chegar ao diagnóstico, o médico considera várias possibilidades,
com nı́veis de certeza que variam de acordo com as informações disponı́veis.
Um dos objetivo deste capı́tulo é mostrar como se mede o nı́vel de certeza da ocorrência de um evento,
por exemplo: a presença de uma doença após a observação de um teste positivo. Consideraremos o teste
positivo quando indicar a presença da doença e negativo quando indicar a ausência.
Não existe teste perfeito, aquele que com certeza absoluta determina a presença ou ausência da doença.
Estudaremos os ı́ndices nos quais o conceito de qualidade de um teste diagnóstico é usualmente desmenbrado.
Freqüêntemente, um único teste não é suficiente, e portanto deve-se combinar dois ou mais testes. O
ideal seria que, para cada patologia, fossem determinados os testes a serem incluı́dos no processo diagnóstico
e a melhor forma de combiná-los. Apresentaremos as formas mais comuns de combinações de testes e como
medir a qualidade do teste conjunto.
95
8.2 Testes Diagnósticos ROSSI, Robson M. 96
Tabela 8.2: Resultados da avaliação da aplicação do teste ergométrico de tolerância a exercı́cios em 1465
pacientes.
Doença Teste ergométrico Total
Coronariana Positivo (T+ ) Negativo (T− )
Presente (D+ ) 815 208 1023
Ausente (D− ) 115 327 442
Total 930 535 1465
Tabela 8.3: Probabilidade necessárias para o cálculo dos ı́ndices VPP e VPN.
População Proporção Proporção com resultado
Positivo Negativo
Doente p ps p(1 − s)
Sadia 1−p (1 − p)(1 − e) (1 − p)e
Total p + (1 − p) ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e
Seja p = Pr(D+ ) a prevalência da doença na população de interesse, isto é, a proporção de pessoas
doentes, ou a probabilidade de doença pré-teste.
O valor de predição positiva é obtido dividindo-se a freqüência dos ”verdadeiros-positivos” (oriundos de
pacientes doentes), pelo total de positivos
ps
V PP = .
ps + (1 − p)(1 − e)
(1 − p)e
V PN = .
p(1 − s) + (1 − p)e
Entre as várias tecnologias para detectar a presença do HIV, a primeira a se difundir no Brasil foi o
ELISA (Enzymelinked immunosorbent assay). Em 1985 esta foi simultaneamente comercializada por vários
laboratórios americanos. Alguns deles reportaram, em seus testes preliminares, sensibilidade de 95% e
especificidade de 99,8%. Os valores para os outros laboratórios são parecidos, segundo Marwick (1985).
A Tabela 8.4 apresenta os valores dos ı́ndices VPP e VPN para a implementação do teste ELISA e vários
supostos valores da prevalência.
Tabela 8.4: Valores da VPP, VPN, PFP e PFN para o teste ELISA para a detecção do HIV.
Prevalência VPP(%) VPN(%) PFP(%) PFN(%)
1/100.000 0,47 100,00 99,53 0,00
1/10.000 4,54 100,00 95,46 0,00
1/1.000 32,21 99,99 67,79 0,01
1/500 48,77 99,99 51,23 0,01
1/200 70,47 99,99 29,53 0,01
1/100 82,75 99,99 1725 0,01
1/50 90,65 99,89 9,35 0,11
A associação de testes em série é bastante empregada, tanto em triagens como no diagnóstico individual,
sendo de grande utilidade quando a questão do custo é relevante.
Chamando os testes originais de A e B, o teste em paralelo de Tp e o em série de Ts , e usando a linguagem
de eventos temos:
Tp+ = A+ ∪ B+
e
Ts+ = A+ ∩ B+ .
As sensibilidade e especificidade de Tp e Ts são calculadas com o auxı́lio das regras de cálculo de proba-
bilidades de eventos.
Combinação em Paralelo
Nesse caso, o resultado do teste será considerado positivo, se pelo menos um dos testes apresentar
resultado positivo. É de maior utilidade em casos de urgência, quando se necessita de uma abordagem
rápida, ou por outro tipo de conveniência, como para pacientes provenientes de lugares distantes. A Tabela
8.5 apresenta de forma explı́cita o procedimento proposto.
Tabela 8.5: Resultado do teste em paralelo dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em paralelo
- - -
- + +
+ - +
+ + +
sp = sA + sB − sA × sB .
Admitindo-se que os resultados dos dois testes são independentes, pode-se calcular a especificidade de
um teste em paralelo da seguinte forma:
ep = eA × eB .
Combinação em Série
Nesse caso, os testes são aplicados consecutivamente, sendo o segundo teste aplicado apenas se o primeiro
apresentar resultados positivo. O teste só será considerado positivo, se o resultado dos dois testes for positivo.
Esse procedimento é indicado em situações em que não há necessidade de rápido atendimento e quando o
paciente pode ser acompanhado ao longo do tempo, e se a consideração de custo é importante, seja pela
questão finaceira, pelo risco ou desconforto induzidos pelo exame. A Tabela 8.6 apresenta de forma explı́cita
o procedimento proposto.
8.2 Testes Diagnósticos ROSSI, Robson M. 100
Tabela 8.6: Resultado do teste em série dependendo da classificação dos testes individuais A e B.
Teste A Teste B Teste em série
- desnecessário -
+ - -
+ + +
Como só serão aplicados dos testes se o primeiro for positivo, o custo desse tipo de combinação é menor.
Uma discussão sobre a ordem mais indicada para a aplicação dos testes a serem combinados em série pode
ser encontrada em Soares & Parenti (1995).
Se os dois testes A e B são independentes, a sensibilidade (ss ) e a especificidade (es ) par o teste combinado
em série são obtidos sa seguinte forma:
Portanto,
ss = sA × sB
e
es = eA + eB − eA × eB .
Para os cálculos da sensibilidade e especificidade da associação em série e em paralelo, a independência
dos dois testes é crucial. Entretanto, não se pode garantir que isto ocorra sempre. Quando os testes não
forem independentes, não há uma forma analı́tica simples para se obter tais ı́ndices para um teste composto.
Exemplo 8.4. Diagnóstico de câncer pancreático.
Imagine um paciente idoso com dores persistentes nas costas e no abdomem e perda de peso. Na ausência
de uma explicação para estes sintomas, a possibilidade de câncer do pâncreas é freqüentemente levantada.
É comum para se verificar esta possibilidade diagnóstica, que ambos os testes de ultrasom (A) e tomografia
computadorizada (B) do pâncreas sejam solicitados. A Tabela 8.7 apresenta dados hipotéticos sobre os
ı́ndices s e e dos testes, quando utilizados separadamente e em conjuto (Griner et al., 1981).
Tabela 8.7: Sensibilidade e especificidade dos testes de ultra-som e tomografia computadorizada no di-
agnóstico do câncer de pâncreas individualmente e em conjunto.
Teste Sensibilidade (%) Especificidade (%)
A: Ultra-Som 80 60
B: Tomografia 90 90
C: A ou B positivo 98 54
D: A e B positivo 72 96
Ao contrário, quando o critério para a positividade do teste é que tanto o ultra-som como a tomografia
sejam positivos, a especificidade combinada é maior que o mais especı́fico dos dois, mas a sensibilidade é
menor. Portanto, a sugestão seria o teste em série.
Exemplo 8.5. Sensibilidade e especificidade de testes em paralelo e em série.
Consideremos dois testes A e B com sensibilidade e especificidade apresentados na Tabela 8.7, supondo
uma prevalência de 1%, então teremos os seguintes valores: s, e, VPP e VPN.
Tabela 8.8: Sensibilidade, especificidade e valores de predição de testes individuais A e B e dos testes em
série e em paralelo considerando-se uma prevalência de 1%.
Teste s e VPP VPN
A 0,9500 0,9000 0,0876 0,9994
B 0,8000 0,9500 0,1391 0,9979
Paralelo 0,9900 0,8550 0,0645 0,9999
Série 0,7600 0,9950 0,6056 0,9976
A combinação em paralelo apresenta alta sensibilidade (0,99) mas sua especificidade é menor que a dos
testes isolados. Já a combinação em série apresenta alta especificidade (0,995) enquanto que a sensibilidade
é relativamente baixa comparada com testes isolados.
Como esperado, os valores de predição negativa são altos, tanto para os testes isolados como para as
duas formas combinadas dos testes. Entretanto, os valores de predição positiva não são altos, sendo que a
combinação em série proporcionou o melhor resultado (V P P = 0, 6056).
É importante lembrar que, na maioria das vezes, os testes usados na combinação são dependentes entre
si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ı́ndices dos testes combinados.
Nesse caso, não é possı́vel determinar os valores dos parâmetros de qualidade conhecendo-se apenas os valores
de cada teste em separado. Torna-se necessário um trabalho de pesquisa realizado em um grupo de pacientes
nos quais são utilizados o teste padrão (gold test) e teste combinado (Di Magno et al., 1977).
Tabela 8.9: Valores de predição (VPP e VPN) do teste Gonosticon Dri-Drot para quatro prevalências (p).
População p VPP VPN
A 0,500 0,940 0,830
B 0,100 0,640 0,980
C 0,020 0,250 0,990
D 0,001 0,020 1,00
Suponhamos que p = 0, isto é, ninguém tem a doença, ou que p = 1, isto é, toda a população tem a doença
em questão. Facilmente chagamos nos valores apresentados na Tabela 8.10, para quaisquer valores de s e e.
Tabela 8.10: Valores de predição (VPP e VPN) e proporção de resultados falsos (PFP e PFN) para casos
extremos de prevalências.
p VPP PFP VPN PFN
0 0 1 1 0
1 1 0 0 1
A extensão para o caso mais geral de p pequeno (doença rara) e p grande (doença comum) pode ser feita
pela análise das expressões já estudadas variando-se as quantidades envolvidas (s, e e p), mas nos restringimos
a apresentarmos uma análise numérica. A Tabela 8.11 mostra os valores de predição para prevalências de
1% e 90%.
Tabela 8.11: Valores de predição (VPP e VPN) para alguns valores de sensibilidade e especificidade para
prevalências de 1% e 90%.
Prevalência de 1% Prevalência de 90%
s e VPP VPN VPP VPN
0,99 0,99 0,5000 0,9999 0,9989 0,9167
0,99 0,90 0,0909 0,9999 0,9889 0,9091
0,99 0,80 0,0476 0,9999 0,9780 0,8989
0,90 0,99 0,4762 0,9990 0,9988 0,5238
0,90 0,90 0,0833 0,9989 0,9878 0,5000
0,90 0,80 0,0435 0,9987 0,9759 0,4706
0,80 0,99 0,4469 0,9980 0,9986 0,3548
0,80 0,90 0,0748 0,9978 0,9863 0,3333
0,80 0,80 0,0388 0,9975 0,9730 0,3077
Quando a prevalência é baixa, o valor de predição positiva (VPP) é mais influenciado pela especificidade.
O valor de predição negativa (VPN) é pouco influenciado tanto pela sensibilidade quanto pela especificidade
e é alto, como era de se esperar.
Para a prevalência alta, o VPP é próximo de 1, independente dos valores da sensibilidade e da especifi-
cidade. Além disso, o VPN é influenciado mais pela sensibilidade do que pela especificidade.
Embora este não seja um estudo exaustivo, existem evidências para as seguintes conclusões:
1. Um teste com alta especificidade deve ser usado quando a prevalência da doença é relativamente baixa
(doença rara), mesmo que o teste tenha relativamente baixa sensibilidade.
2. Um teste com alta sensibilidade deve ser usado quando a prevalência da doença é alta (doença comum),
mesmo que o teste tenha relativamente baixa especificidade.
É comum a idéia de que se a doença é rara, um teste com alta sensibilidade dever ser usado para achar
os casos e para uma doença de alta prevalência, um teste com alta especificidade deve ser escolhido.
Esse raciocı́nio não coincide com os argumentos apresentados.
Outro tipo de simulação é apresentado nas Figuras 8.1 e 8.2 para algumas situações especı́ficas:
8.2 Testes Diagnósticos ROSSI, Robson M. 103
Prevalência
0% 10% 20% 30% 40% 50%
100%
VPP
50%
s = 99%; e = 70%
s = 95%; e = 95%
s = 70%; e = 99%
0% s = 99%; e = 99%
Prevalência
0% 20% 40% 60% 80% 100%
100%
VPN
50%
s = 70%; e = 99%
s = 95%; e = 95%
s = 99%; e = 70%
s = 99%; e = 99%
0%
Inicialmente percebe-se na Figura 8.1 que, para qualquer situação, quanto maior a prevalência da doença,
maior o valor preditivo positivo. Para um teste com sensibilidade e especificidade elevadas (s = 99% e e =
99%) o seu valor preditivo positivo será muito alto mesmo em situações de prevalência não muito elevada.
Entretanto, esta situação sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e
especificidade do teste (s = 95% e e = 95%).
Uma outra situação ocorrerá ao se modificar apenas uma das caracterı́sticas do teste. Por exemplo, ao
se diminuir a sensibilidade mantendo-se a especificidade elevada (s = 70% e e = 90%), percebe-se que prati-
camente não houve impacto nos valores preditivos positivos em função da prevalência. Entretanto, quando
essa mesma diminuição ocorre na especificidade, o impacto é bastante grande, diminuindo-se muito o valor
preditivo positivo do resultado mesmo para prevalências mais elevadas. Dessa forma, pode-se afirmar que o
valor preditivo positivo de um teste é função da prevalência da doença, da sensibilidade e fundamentalmente
da especificidade, conforme já fora observado na fórmula anterior.
Note na Figura 8.2 que, ao reduzir apenas a sensibilidade (s = 70% e e = 99%), ocorre uma drástica
redução no VPN, mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir apenas a
especificidade (s = 99% e e = 70%), o impacto no VPN é muito pequeno, menor do que quando se reduz
apenas um pouco a sensibilidade e a especificidade conjuntamente (s = 95 e e = 95%).
Note também que, para um mesmo teste diagnóstico (exceção apenas para s = 70% e e = 99%), o impacto
do aumento da prevalência na redução do VPN é muito pequeno. Esse impacto se acentua nas prevalências
muitos elevadas. Como na prática clı́nica, as doenças estudadas comumente possuem prevalências relati-
vamente baixas, o VPN irá sofrer apenas pequena variação ao se modificar a especificidade de um teste
diagnóstico e mesmo ao se modificar pouco a sensibilidade.
8.2 Testes Diagnósticos ROSSI, Robson M. 104
Note que quanto mais próxima a curva estiver do canto superior esquerdo do gráfico, melhor será o poder
discriminatório do teste diagnóstico e quanto mais distante, até o limite da diagonal do gráfico, pior será o
seu poder de discriminar doentes e não doentes. A curva ROC pode servir como orientação para a escolha
do melhor ponto de corte de um teste diagnóstico que, em geral, se localiza no extremo da curva próximo
ao canto superior esquerdo do gráfico.
As curvas ROC, além de auxiliarem na identificação do melhor ponto de corte, são muito utilizadas para
comparar dois (ou mais) testes diagnósticos para a mesma doença. Nesse caso, o poder discriminatório do
teste, ou seja, a acurácia global, pode se mensurado através do cálculo da área sob a curva ROC; quanto
maior for a área tanto melhor será o teste diagnóstico.
Um teste diagnóstico ideal, com 100% de sensibilidade e 100% de especificidade, a área total seria igual
a 1 (um), ou seja, a “curva” seria coincidente com o lado esquerdo e o topo do gráfico. Neste caso, o teste
não possuiria erro, identificando perfeitamente todos os indivı́duos sadios e doentes (gold test).
Para um teste sem nenhuma utilidade, a “curva” seria uma linha reta em diagonal, partindo do canto
inferior esquerdo até o canto superior direito. Neste caso, o teste diagnóstico não possuiria nenhum poder
para discriminar doentes de não-doentes.
8.2 Testes Diagnósticos ROSSI, Robson M. 105
Tabela 8.12: Trade-off entre Sensibilidade e Especificidade no tratamento de Diabetes (Glicemia pós-prandial
2(h) mg/100 ml).
Glicemia pós-prandial Sensibilidade (%) Especificidade (%) 1 - Especificidade (%)
(2h) mg/100 ml
70 98,6 8,8 91,2
80 97,1 25,5 74,5
90 94,3 47,6 52,4
100 88,6 69,8 30,2
110 85,7 84,1 15,9
120 71,4 92,5 7,5
130 64,3 96,9 3,1
140 57,1 99,4 0,6
150 50,0 99,6 0,4
160 47,1 99,8 0,2
170 42,9 100,0 0
180 38,6 100,0 0
190 34,3 100,0 0
200 27,1 100,0 0
1 - Especificidade
0% 20% 40% 60% 80% 100%
100%
Sensibilidade
50%
0%
Exemplo 8.7. Os dados da Tabela 8.13 foram obtidos na UEM/HU - Hospital Universitário da Universidade
Estadual de Maringá, em um estudo para avaliação de equipamentos para dosagem glicêmica capilar O
objetivo do trabalho foi o de escolher o melhor equipamento entre três analisados: Glucotrend, Precision e
Advantage. Os testes foram realizados em 21 indivı́duos. O teste Colorimétrico foi ser utilizado como
Gold Standard (Teste Ouro), que classifica sem erro doentes e não-doentes.
Obs.: Valores de referência: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hi-
poglicemia) e acima de 120 (hiperglicemia)).
Obs.:
2. Determine a sensibilidade e especificidade de cada testes acima . Baseado nestes resultados qual (quais)
o(s) melhor(es) teste(s) ?
3. Determine os valores de predição positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para
cada um dos testes, usando a prevalência da doença obtida através da Tabela Cruzada. Interprete-os.
4. Considerando que a prevalência para a doença em questão é de 1%, recalcule os itens anteriores.
[1] ARANGO, H.G.. Bioestatı́stica: Teórica e computacional. Guanabara Koogan S.A. RJ, 2001.
[2] CALLEGARI-JACQUES, S. M.. Bioestatı́stica: Princı́pios e Aplicações. Ed. Artmed. RS, 2003.
[6] CENTENO, A. J. Curso de Estatı́stica aplicada à Biologia. Goiânia: Ed. Universidade Federal de Goiás,
1981.
[7] CARVAJAR, S. S. R. Elementos de Estatı́stica (com aplicações às ciências médicas e biológicas). Rio
de Janeiro: UFRJ, 1970.
[8] COLLET, D..Modelling survival data in medical research. Tests in statistical science. 4a Ed. Chapman
& Hall. London, 1994.
[9] DANIEL, W. W. Bioestatistics: a foundation for analysis in the health sciences. 2 Ed. New York: John
Wiley, 1999.
[10] DOWNING, D e CLARK, J.. Estatı́stica aplicada. 2a Ed. Saraiva. SP, 2002.
[11] FORANTTINI, O. P.. Epidemiologia Geral. 1a Ed. Artes Médicas, Ltda., 1980.
[12] GAUVREAU, K. e PAGANO.. Principios de Bioestatı́stica. 2a Ed. Thonson, 2004.
[13] GUEDES, M. L. S. e GUEDES, J. S.. Bioestatı́stica - Para profissionais de saúde. 1a Ed. Ao livro
técnico S.A. RJ, 1988.
107
8.2 Testes Diagnósticos ROSSI, Robson M. 108
[22] STEEL, R.G.D. Principles and Procedures of Statistics a Biometrical Approach. 2. Ed. New York: Mc
Graw-Hill, 1980.
[23] WAYNE, W. D.. Biostatistics. A foundation for analysis in the health sciences. 7a Ed. J&S. NY, 1999.
[24] VIEIRA, S.. Introdução à Bioestatı́stica. 5a Edição Revista e Ampliada. Editora Campus,1980.
[25] VIEIRA, S.. Estatı́stica Experimental. 2a Edição. Ed Atlas S.A. SP,1999.